今天看啥  ›  专栏  ›  腾讯科技

OpenAI发布高级语音视觉功能 还有一个圣诞节彩蛋|OpenAI直播第六天

腾讯科技  · 公众号  · 科技媒体  · 2024-12-13 08:04
    

主要观点总结

本文介绍了OpenAI在12天发布会中的第六天推出的高级语音视觉功能,该功能允许ChatGPT通过视觉和听觉与用户互动,提供实时的视觉互动体验。文章还提到了OpenAI在此之前的发布的新产品如ChatGPT Pro计划、强化微调技术、Sora、交互界面Canvas等。在高级语音视觉功能的演示中,ChatGPT展现了其在视频、语音和文本记忆方面的显著进步,包括屏幕共享、视觉识别、指导制作咖啡等。此外,文章还提到了谷歌的Project Astra项目与OpenAI的高级语音视觉功能的相似之处,以及新功能对模拟人类日常对话的扩展能力。最后,文章提到了新功能推出的具体时间和推广范围。

关键观点总结

关键观点1: OpenAI推出高级语音视觉功能

OpenAI在第六天发布会上推出了高级语音视觉功能,允许ChatGPT通过视觉和听觉与用户进行实时互动,提供真实的视觉互动体验。

关键观点2: 高级语音视觉功能的特点

该功能包括屏幕共享、视觉识别、指导制作咖啡等,展现出了ChatGPT在视频、语音和文本记忆方面的显著进步。

关键观点3: 高级语音视觉功能与谷歌Project Astra项目的相似之处

OpenAI的高级语音视觉功能与谷歌的Project Astra项目在某些方面存在相似之处,且都在不断扩展模拟人类日常对话的能力。

关键观点4: 新功能的推广时间和范围

最新的移动应用将逐步向所有Team用户及大部分Pro和Plus订阅者推出高级语音视觉功能。对于欧洲的Pro和Plus用户,OpenAI将尽快提供这项服务。企业用户和教育用户将在明年年初获得访问权限。


文章预览

12月13日,OpenAI在其12天发布会的第六天,重磅推出了高级语音视觉功能(Advanced Voice with Vision)。这意味着ChatGPT现在能够通过视觉和听觉与用户互动,提供实时的视觉互动体验,就像与真人视频聊天一样自在。 自当地时间12月5日起,OpenAI开启了一个密集的新功能发布周期,计划在接下来的12天内通过12场直播活动陆续推出新产品和功能。在此之前,OpenAI已经陆续发布了多项创新,包括ChatGPT Pro计划、强化微调技术、Sora、交互界面Canvas,以及如何在iPhone或Mac上的Siri中以多种方式集成ChatGPT。 值得注意的是,OpenAI在第六天发布的高级语音视觉功能,其实在5月份已经展示过。该项技术随着GPT-4o模型的发布而一同展示,允许ChatGPT在进行语音对话时同时处理视觉信息,例如通过视频输入设备识别图像。此外,该技术还提供了更加自然、实时的对话体验,并且 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览