刚刚，OpenAI 一口气发布三个新模型！还为此做了一个新网站

爱范儿 · 公众号 · 科技媒体 · 2025-03-21 08:49

文章预览

就在刚刚，OpenAI 宣布在其 API 中推出全新一代音频模型，包括语音转文本和文本转语音功能，让开发者能够轻松构建强大的语音 Agent。新产品的核心亮点概述如下 gpt-4o-transcribe (语音转文本)：单词错误率(WER)显著降低，在多个基准测试中优于现有 Whisper 模型 gpt-4o-mini-transcribe (语音转文本)：gpt-4o-transcribe 的精简版本，速度更快、效率更高 gpt-4o-mini-tts (文本转语音)：首次支持「可引导性」(steerability)，开发者不仅能指定「说什么」，还能控制「如何说」据 OpenAI 介绍，新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练，能更好地捕获语音细微差别，减少误识别，大幅提升转录可靠性。因此，gpt-4o-transcribe 更适用于处理口音多样、环境嘈杂、语速变化等挑战场景，比如客户呼叫中心、会议记录转录等领域。 gpt-4o-mini-transcribe 则 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新浪科技 · 【#国际黄金续创历史新高# 】现货黄金涨0.88%，报3084.-20250329074050

6 小时前

现代财经 · 《现代财经-早读早分享》2025年3月29日周六（第3326期）

14 小时前

现代财经 · 《现代财经-早读早分享》2025年3月29日周六（第3326期）

14 小时前

36氪 · 品牌的未来，藏在这些细节里

15 小时前

新浪科技 · #曝直播拆卡变新型赌场#【顶流主播卖假货、食品变“神药”、“围猎-20250328210000

17 小时前

新浪科技 · 【#曝京东多名高管晋升#】微信公众号“申妈的朋友圈”今日发文，曝-20250326142024

2 天前

游戏陀螺 · 还有3天！陈星汉对话郭炜炜，你想听他们聊什么？

8 月前

懂财帝 · 中国指数基金20年浮沉：华夏基金为何总能“立潮头”？

4 月前

浩然文史 · 张仲景在冬至发明了饺子？当然不是，西汉人已经吃上了饺子！

3 月前

77度 · LAZBOY英国业绩跳水：营收跌35%，利润缩水25%

2 月前