专栏名称: 深度学习自然语言处理

一个从大三就接触NLP的小小NLPer，本公众号每天记录自己的一点一滴，每篇文章最后也有托福单词等新知识，学技术同时，也一点一滴积累额外的知识。期待与你在知识的殿堂与你相遇！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

AnyGPT | 基于离散表示统一多模态理解与生成：把一种新模态当作一门外语 -- NICE27期

深度学习自然语言处理 · 公众号 · · 2024-09-11 22:49

文章预览

主题基于离散表示统一多模态理解与生成：把一种新模态当作一门外语时间 2024.9.14 20:00-21:00 周六入群论文：AnyGPT: Unified Multimodal LLM with Discrete Sequence Modeling 地址：https://arxiv.org/pdf/2402.12226 大纲首个统一多模态理解与生成的模型SpeechGPT：使大语言模型具有内生的语音对话能力如何获得更适合语言模型建模的语音表示？SpeechTokenizer：语音语义信息和副语言学信息的解耦基于离散表示的Any-to-Any多模态模型AnyGPT：基于离散表示统一文本、图像、语音、音乐四种模态类GPT-4o模型 SpeechGPT2：如何基于语言模型，对多模态信息进行完整的建模引言大语言模型（LLM）通过Decoder Only Transformer的架构和Next Token Prediction任务，在海量文本数据上进行训练，不仅学会了各种NLP任务，并涌现出In Context Learning、Chain-of-Thought等新能力。然而，有人预测互联网上的高质量 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

高太爷 · 定位创业路上的一个很大疑惑，很需要大家解惑

4 小时前

武志红 · 在你的内心深处，藏着哪些未知的欲望｜领免费测试

昨天

不二大叔 · 拿捏人性的12个小技巧

3 天前

武志红 · 在废品站，捡回一个知识女性的生平

5 天前

笔吧评测室 · 抗刮防指纹，Optitune 公司纳米涂层将应用于超百万台笔记本 / 平板电脑

5 天前

中国科学报 · “七下八上”的汛期，天气预报如何跑赢时间

3 月前

GIS前沿 · 该省水利厅所属事业单位公开招聘！含测绘、地信、地理等专业

2 月前