注册
登录
专栏名称:
机器之心
专业的人工智能媒体和产业服务平台
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
雪球动态RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
爱可可-爱生活
·
【Node.js + JavaScript ...
·
2 天前
黄建同学
·
浏览器里的LLM: ...
·
3 天前
越山集
·
AI做动画视频,直接出两分钟讲故事的那种
·
4 天前
越山集
·
AI做动画视频,直接出两分钟讲故事的那种
·
4 天前
爱可可-爱生活
·
【AntiSlop:高级文本生成工具,旨在提 ...
·
4 天前
爱可可-爱生活
·
《爱可可微博热门分享(9.29)》 ...
·
5 天前
今天看啥
›
专栏
›
机器之心
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA
机器之心
·
公众号
·
AI
· 2024-10-02 10:20
文章预览
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。 投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com 本文作者来自香港科技大学、香港大学和华为诺亚方舟实验室等机构。其中第一作者陈铠、苟耘豪、刘智立为香港科技大学在读博士生,黄润辉为香港大学在读博士生,谭达新为诺亚方舟实验室研究员。 随着 OpenAI GPT-4o 的发布,大语言模型已经不再局限于文本处理,而是向着全模态智能助手的方向发展。这篇论文提出了 EMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
爱可可-爱生活
·
【Node.js + JavaScript 参考客户端库,用于连-20241002141327
2 天前
黄建同学
·
浏览器里的LLM: web-llm,高性能浏览器内 LLM 推理-20241001133218
3 天前
越山集
·
AI做动画视频,直接出两分钟讲故事的那种
4 天前
越山集
·
AI做动画视频,直接出两分钟讲故事的那种
4 天前
爱可可-爱生活
·
【AntiSlop:高级文本生成工具,旨在提高语言模型输出的质量-20240930135033
4 天前
爱可可-爱生活
·
《爱可可微博热门分享(9.29)》 爱可可微博热门分享(9.2-20240929224917
5 天前