专栏名称: AI算法与图像处理

考研逆袭985，非科班跨行AI，目前从事计算机视觉的工业和商业相关应用的工作。分享最新最前沿的科技，共同分享宝贵的资源资料，这里有机器学习，计算机视觉，Python等技术实战分享，也有考研，转行IT经验交流心得

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

腾讯开源VITA！全方位对标GPT4o，全能多模态交互大模型！

AI算法与图像处理 · 公众号 · · 2024-08-12 23:32

文章预览

腾讯优图实验室联合南京大学、厦门大学和中国科学院自动化研究所推出了VITA，一个开源的多模态大型语言模型。该模型擅长同时处理和分析视频、图像、文本和音频模态，并通过非唤醒交互和音频中断交互实现先进的多模态交互体验。作者表示：所有训练代码、部署代码和模型权重即将发布！已经提交了开源代码，但还在进行内部审查。 VITA 3个月前，OpenAI发布最新的大模型GPT4-o，支持听、看、说，全程丝滑的想在和真人互动。 VITA 全方位的对标 GPT4-o，具体内容如下所示： 1、实时和大模型语言交互（例如询问，当前视频内容中主体所处的环境；询问传递建议等） 2、实时视频交互，给大模型展示一道数学题，让大模型帮忙解答（同时demo中也展示了sony的耳机以及一本书等，让大模型回答，都争取回复） 3、实时让让AI变换语音回复的音色更多 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

能源电力说 · 五大发电集团，2025年重点工作路线图！

21 小时前

南方能源观察 · 高比例新能源电力市场试验：大流行期间结构变化与启示

昨天

先进能源科技战略情报研究中心 · 美国能源部投入22亿美元支持部署区域氢中心

2 天前

先进能源科技战略情报研究中心 · 美国能源部投入22亿美元支持部署区域氢中心

2 天前

南方能源观察 · 四川火电竞价现货市场申报价格上限为0.51元/千瓦时

3 天前

六道笔记 · 新奇特老人手机，1.6万粉丝卖了380万

7 月前

光大证券研究 · 【光大研究每日速递】20240902

4 月前

72物候元气生活 · 限量秒杀 | 暖屁屁的“黄土坐垫”，坐着就能扶阳气

2 月前