主要观点总结
文章介绍了AI语音技术的最新发展,包括创企融资、技术突破和新产品涌现。文章通过甄嬛传台词测试了四款AI语音生成产品的情感表达能力,并讨论了AI语音技术在实现实时交互和有情感输出方面的潜力。最后,文章指出了AI语音技术在情感表达方面的挑战和未来的发展方向。
关键观点总结
关键观点1: AI语音技术发展迅速,创企融资活跃,引领技术快速发展。
文章介绍了AI语音领域的投融资情况和技术发展,指出语音模型的种类、性能在过去一年中大有提升,使用成本也大大降低。
关键观点2: AI语音模型在情感表达方面取得进展,但仍面临挑战。
文章通过甄嬛传台词测试了四款AI语音生成产品的情感表达能力,并讨论了这些产品在表达高兴、悲伤和愤怒等情绪时的表现。虽然有一些产品能够表现出一定的情感,但整体而言,AI语音技术在情感表达方面仍面临挑战。
关键观点3: AI语音技术的应用广泛,市场上涌现大量产品。
文章提到AI语音技术进步实现了实时交互和有情感输出,市场上涌现大量AI语音技术产品。同时,从业者预测2025年将是AI语音拥有情绪的元年。
文章预览
过去一年,AI语音爆发,但距离有情感,还有多远呢? 出品 | 白鲸出海编辑部 作者 | 张凯然 2024 年,AI 发展势头迅猛。在多模态中,语音又是很“显眼”的一个。 2024 年 AI 语音创企融资情况|图片来源:a16z 在投融资方面,根据 a16z 的统计,去年一年中, 就有 30 多家与 AI 语音技术相关的创企融资。 而今年一开年,1 月 31 日,头部的 AI 语音生成平台 ElevenLabs 又完成了 C 轮 1.8 亿美元的融资,总估值达到了 30 亿美元。 2024 年 5-12 月 AI 语音领域 的技术突破|图片来源:a16z 投融资的活跃,也引领着技术的快速发展。语音模型的种类、性能在过去一年中大有提升,而使用成本也大大降低。其中, 最明显的是 TTS(语音合成)能力的提升及其落地应用,尤其是在 2024 年 4 月 OpenAI 首发 4o 实时语音能力之后。 例如,2023 年下半年,我们曾经观察过当时讨
………………………………