今天看啥  ›  专栏  ›  腾讯科技

国产大模型重磅更新:你可以随时给AI“打个视频电话”,全自研版“Her”走进现实

腾讯科技  · 公众号  · 科技媒体  · 2024-08-30 08:14

主要观点总结

本文主要介绍了智谱AI的C端产品智谱清言的新功能——视频语音通话,以及智谱AI在模型技术方面的进展。作者通过实际体验,描述了智谱清言的识别能力,包括识别真实世界物体、分辨颜色、理解人类情绪、识别图表等。同时,也介绍了智谱AI的基座大模型更新和多个面向不同领域的大模型推出情况。

关键观点总结

关键观点1: 智谱清言的新功能——视频语音通话

智谱清言即将上线的视频语音通话功能,能够让用户与AI进行更流畅的对话,无需唤醒词,具备实时反馈能力。

关键观点2: 智谱AI的产品与模型技术进展

智谱AI在模型技术上取得了显著进展,推出了多个面向不同领域的大模型,包括面向C端的智谱清言App和基座大模型GLM-4-Plus等。

关键观点3: 智谱清言的识别能力

智谱清言具备强大的识别能力,能够识别真实世界物体、分辨颜色、理解人类情绪、识别图表等,并通过实际体验展示了其准确度和实用性。

关键观点4: 多模态大模型GLM-4V-Plus的推出

GLM-4V-Plus能够理解并分析复杂的视频内容,具备时间感知能力,提供了国内首个通用视频理解模型API。

关键观点5: 文生图模型的最新版本CogView-3-Plus的效果

CogView-3-Plus的生成效果接近目前最佳的MJ-V6及FLUX等模型,通过一系列生成图片和对应的提示词展示了其强大生成能力。


文章预览

腾讯科技作者 郭晓静、郝博阳 编辑 郑可君 不知你幻想中最完美的AI助手什么样子,但我曾对Siri动过心思。 当我有如下疑问:“这是什么”、“中午吃什么”、“为什么我昨天已经上过班了,今天还要上班”等问题时,我只需“嘿,Siri!”就可以有一个完美答案。 显然,“对话”是人类沟通和表达的基本方式之一。但当我想给这位AI助理展示我正看见的图片/场景,并继续进行提问时,它就没这么顺畅了。 实际操作是:我得放下手机,给它发送图片/视频,然后再继续进行对话。 智谱则想让这样的体验变得更加流畅。智谱AI的C端产品智谱清言即将在8月30日上线一个重磅新功能——视频语音通话,使用起来就像正在给你的好朋友,一直保持着“视频通话模式”,当你想提问或者聊天时,它便会出现。 它和我幻想的“完美Siri”的不同点是: 1、它会 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览