专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

商汤破解世界模型秘诀，「日日新」实现AI大一统！原生融合模型破纪录双冠王

新智元 · 公众号 · AI · 2025-01-14 12:55

主要观点总结

商汤推出的原生融合大模型“日日新”在CES大会上引起关注。该模型实现了多模态的融合，成为业界在这一领域的领跑者。“日日新”在实际任务中表现出色，能识别多种模态的信息，包括手写诗、俄文诗歌、图像、代码等。它还能分析出电脑的具体配置，甚至通过一张游戏的截图就能识别出游戏中的错误。商汤通过融合模态数据合成和融合任务增强训练两项关键技术，实现了单一模型同时训练和处理多模态的能力。这种原生融合多模态的技术路线被认为是通向世界模型的必经之路。

关键观点总结

关键观点1: 商汤推出原生融合大模型“日日新”，实现多模态融合。

“日日新”模型能识别多种模态的信息，包括手写诗、俄文诗歌、图像、代码等，表现出强大的综合能力。

关键观点2: “日日新”模型在实际应用中的表现。

“日日新”模型能帮助学生解决拍题作业，识别出题目中的错误并给出解答。它还能分析画作的特点、提升画技，识别出图片中的历史人物和历史典故，甚至通过游戏截图分析电脑配置。

关键观点3: 商汤通过融合模态数据合成和融合任务增强训练实现单一模型多模态融合。

商汤采用融合模态数据合成和融合任务增强训练两项关键技术，使模型能够在统一的框架内处理文本、图像、视频等多种模态的信息。这种技术路线被认为是通向世界模型的必经之路。

关键观点4: 商汤的多模态融合大模型在多个实际场景中取得突破。

基于“日日新”融合大模型，商汤在办公、金融、自动驾驶、视频交互、城市治理和园区管理等多个实际场景中取得了突破性的成果。

文章预览

新智元报道编辑：编辑部 HYZ 【新智元导读】大模型下一个突破口在哪？商汤「日日新」原生融合大模型一举拿下双料冠军，给出了最好的答案。一个模型精通「看」与「想」，原生多模态融合让AI迈入「大一统」新纪元。大模型发展到今天，下一步该走向何方？就在刚刚，商汤给出了答案——原生融合模态！最近的CES大会上，英伟达提出能理解世界的「世界模型」Cosmos，能够将文本、图像、视频作为输入。英雄所见略同，凭借着十年的深耕和AI赋能场景的经验，商汤也认为，原生融合是世界模型的必经之路。或者说，多模态模型，是AI 2.0进行场景落地的必由之路。就在最近，商汤「日日新」融合大模型上线了！一个模型，就实现了多模态的融合。这是商汤率先在原生融合模态上取得了实质性突破，成为业界在这一领域的领跑者。这一 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博