文章预览
导读 同声传译员在联合国大会、新闻发布会等国际交流场景中扮演着不可或缺的角色。如何使用人工智能模型自动、高质量地完成同声传译任务,当前已成为众多科研机构关注的热点。 本文介绍了中国科学院计算技术研究所开发的语音到语音翻译模型 NAST-S2X 。该模型实现了高质量的同声传译功能,能够与演讲者同步生成翻译语音,并提供了 28 倍的离线解码加速能力。该工作已被 ACL 2024 收录。 论文题目: A Non-autoregressive Generation Framework for End-to-End Simultaneous Speech-to-Any Translation 论文链接: https://arxiv.org/abs/2406.06937 项目链接: https://github.com/ictnlp/NAST-S2x NAST-S2X 进行同声传译的示例如下: ▲ 左声道输入语音;右声道为同传系统的实时输出语音; 更多样例请在 https://github.com/ictnlp/NAST-S2x 查看 背景 相较于离线语音到语音翻译,同声传译系统不
………………………………