今天看啥  ›  专栏  ›  数智前线

当我和大模型做了一次视频通话

数智前线  · 公众号  · 科技自媒体  · 2024-08-30 12:10

主要观点总结

国内首个面向C端开放的AI视频通话功能在清言App上线。该功能由智谱公司推出,支持实时音视频交互,具有操作简便、识别准确等优点,并可以进行个性化的智能问答和交互。此外,智谱公司还推出了GLM-4-Plus大模型技术,并在国际知识发现与数据挖掘大会上进行了展示。此外,文章还提到了其他AI技术的发展和开源模型的进展。

关键观点总结

关键观点1: AI视频通话功能在清言App上线。

该功能是首个面向国内普通用户的AI视频通话应用,支持实时音视频交互,操作简单易用。

关键观点2: 清言App的智能助理“小智”表现优秀。

“小智”能够理解摄像头拍摄的内容,听懂指令并准确执行,能够在短时间内回复用户,并且在多次打断后仍能迅速反应。

关键观点3: 智谱公司推出了GLM-4-Plus大模型技术。

该技术使用合成数据提升模型性能,并利用PPO算法增强模型推理能力。在语言理解、指令遵循、长文本处理等方面性能有所提升。

关键观点4: 开源模型的进展和认知。

文章提到了智谱公司开源模型的发展情况,包括CogVideoX-5B模型的开源和GLM-4-Flash模型的免费开放。此外,国际知识发现与数据挖掘大会也展示了全球数据挖掘领域的最新进展。


文章预览

我的智能助手又get了一项新技能。 ‍ ‍ ‍‍ ‍‍‍‍ 文|周享玥 ‍ ‍ ‍ ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍ ‍‍‍ ‍‍‍‍‍‍ 编|牛慧 OpenAI带着GPT-4o的 AI实时视频通话 功能深夜炸场三个月后,国内首个面向C端开放的AI视频通话终于要来了。 8月29日,智谱宣布,清言App将于8月30日正式上线“视频通话”功能,首批面向清言部分用户开放,并同时开放外部申请。“我们会持续迭代并逐步放开规模,尽快让全员都可以使用。”智谱方面表示。 今年5月,OpenAI率先掀起波浪,其全新一代旗舰生成模型 GPT-4o,无需借助语音转文字功能,即可直接通过实时音视频,实现“真人般”地丝滑交互。随后,多家国内外大模型厂商纷纷迅速跟进,开始推出各种支持端到端实时多模态的AI功能。 6月,AI初创公司Character.AI推出一项通话功能,允许用户与其 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览