专栏名称: 硅星GenAI
比一部分人更先进入GenAI。
今天看啥  ›  专栏  ›  硅星GenAI

智谱清言上线类4o 视频通话功能,竟然还能充当 1818 黄金眼?|AI 鲜测

硅星GenAI  · 公众号  · AI 科技自媒体  · 2024-08-29 21:17

主要观点总结

文章主要介绍了智谱清言app新推出的实时视频通话功能,以及其语音和视觉识别能力。文章还提到了小智能识别黑神话悟空中的角色、辅导作业的能力,以及其在化妆品、手表鉴别和动物情绪识别方面的表现。最后,文章提到了智谱清言的语音和视觉能力在国内处于领先地位,但还存在一些延迟问题,并展望了其未来的发展。

关键观点总结

关键观点1: 智谱清言app推出实时视频通话功能

成为国内首个面向C端开放的视频通话,具备实时打断功能,可观察周围环境。该功能明天正式上线,首批面向清言部分用户开放,并开放外部申请。

关键观点2: 小智能识别黑神话悟空中的角色

小智能精准识别和描述黑神话悟空中的经典角色和形象,语言表达富有情绪感。

关键观点3: 小智能在作业辅导方面的表现

小智能通过实时通话功能识别试卷题目,辅导小朋友功课,更倾向于循循善诱的方式,最终得出正确答案后会给予鼓励。在补充诗句的辅导过程中也会给出提示,引导小朋友回忆诗句。

关键观点4: 智谱清言的视觉和语音能力

智谱清言的语音对话能力可以表达出各种情绪,视觉能力可以精准识别各种物品、标签、文字、图片等,并可通过视频进行推理。但实时打断后存在2-3秒的延迟,语音对话有时语速较慢。


文章预览

三个月前OpenAI推出了ChatGPT-4o支持实时语音视频对话,紧接着谷歌就在I/O大会上也开启了Gemini Live语音助手的实时演示。 但是…… 这么久过去了,咱是一个也用不上,而且还不知道要等到何年何月才能开放使用,主打一个反复被鸽的状态。 虽然国外的用不上,但是你永远可以相信国产的发展速度!这不,智谱清言app刚刚更新了 实时视频通话 功能 ,也是国内首个面向 C 端开放的视频通话,可以随时打断,还可以观察到周围环境的一切,该功能将于30 号也就是明天正式上线,首批面向清言部分用户开放,同时开放外部申请。 至于它的能力到底如何,当然还是得试了才知道,全网首测,看看实力! #黑神话:悟空 角色识别                # 黑神话悟空最近也是非常火爆,算得上是现象级的国产游戏了。考考小智能不能认出黑神话悟空里的人物。 小 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览