今天看啥  ›  专栏  ›  硅星GenAI

用了 ChatGPT 最新语音功能之后,真的越来越像《Her》了

硅星GenAI  · 公众号  · 科技自媒体  · 2024-09-27 17:10

主要观点总结

本文介绍了GPT-4o的语音交互能力,包括其高级语音模式的特点和实用功能,如逼真的情绪表现力、支持中文方言、为盲人描述画面等。文章还提到了AI技术的不断迭代和广泛的应用前景。

关键观点总结

关键观点1: GPT-4o的语音交互能力令人震惊,具有高级语音模式,表现出强大的情感表现力。

GPT-4o的全量推出,展示了其在语音交互方面的技术实力。其情感表现力丰富,能够根据用户的语速、语气和词汇做出相应的调整,使对话更加自然和贴合情感氛围。

关键观点2: GPT-4o支持多种语言和中文方言,为用户带来地道的语言体验。

GPT-4o的语音功能支持50多种语言,包括中文方言,如北京话和粤语等。虽然方言的语音数据相对有限,但GPT-4o已经能够表现出一定的方言能力,让人感受到其技术的进步。

关键观点3: GPT-4o的高级语音模式具有实用功能,如为盲人描述画面等。

GPT-4o的高级语音模式不仅具有娱乐性质,还具有实用功能,如为盲人用户描述画面等。其描述方式有感情,能够照顾到盲人的感受,展现出AI技术在多个场景中的广泛应用前景。

关键观点4: AI技术的不断迭代使得GPT-4o的语音交互越来越像人类。

随着AI技术的不断迭代,GPT-4o的语音交互能力越来越强大,让人惊叹。未来,我们与AI的对话可能会涉及情感、文化和个性等方面的互动,展现出科技在让AI越来越‘懂人’的同时,也让我们逐渐‘懂得’AI的世界。


文章预览

在 GPT-4o 的发布会上,最令人震惊的就是它的语音交互能力,像人一样对话的节奏感、超逼真的语气,在期货了 4 个月之后终于来了。这项功能会在一周内全量推出,多亏社群里近日点科技的阿茶老师提供账号,让我们能第一时间能上手玩到。 使用后第一感受就是: 未来感 :感觉就是《Her》电影里的场景被直接搬到了我面前! 人味儿 :这语音可真够“贴心”,完全不再像机械冷冰冰的回答了。 速度 :不用再盯着转圈圈看天花板了,几句话就能拉起一场对话。 仍然是个不完全体,跟当时发布会演示的功能还有差距。 #01 演技一流:情绪说来就来 人生如戏,全靠演技。 连 AI 都能有这么逼真的情绪了,演员们看看! 在高级语音模式下,ChatGPT 的情感表现力有了大幅提升。 以前,AI 和你对话的情绪可能只是表面上的,现在则 能根据你的语速、语气 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览