专栏名称: 多知
专注于报道培训教育领域,有意思,有价值,有细节,有深度
今天看啥  ›  专栏  ›  多知

字节跳动推出大模型同传智能体,“接近人类同声传译水平”

多知  · 公众号  ·  · 2024-07-30 09:52

文章预览

多知7月30日消息,近日,字节跳动 ByteDance Research 团队的研究人员推出了端到端同声传译智能体:CLASI(Cross Language Agent - Simultaneous Interpretation) ,效果已接近专业人工水平的同声传译。 此前,市面上传统的同声传译软件通常采用级联模型(cascaded model)的方法,即先进行自动语音识别(Automatic Speech Recognition, ASR),然后再进行机器翻译(Machine Translation, MT)。这种方法存在一个显著的问题——错误传播。ASR 过程中的错误会直接影响到后续的翻译质量,导致严重的误差累积。此外,传统的同声传译系统由于受限于低延时的要求,通常只使用了性能较差的小模型,这在应对复杂多变的实际应用场景时存在瓶颈。 而CLASI 采用了端到端的架构,规避了级联模型中错误传播的问题,依托于豆包基座大模型和豆包大模型语音组的语音理解能力,同时具备了从外部获取知识 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览