专栏名称: GitHubStore

分享有意思的开源项目

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

旁门左道PPT · 这4个不起眼的PPT丑形状，竟是排版神器！ · 昨天

旁门左道PPT · 一页PPT上放5个美女，1个圆让关晓彤美绝！ · 2 天前

国家数据局 · 关于《数据领域名词解释》公开征求意见情况的通告 · 3 天前

秋叶PPT · 年终总结PPT这样做，奖金翻倍不是梦!（送5 ... · 5 天前

秋叶PPT · 只添加一个文本框，PPT封面页瞬间高大上起来 ... · 5 天前

今天看啥 › 专栏 › GitHubStore

同声传译StreamSpeech!

GitHubStore · 公众号 · · 2024-06-26 13:42

文章预览

项目简介 “一体化”无缝模型，同步执行语音识别、语音翻译和语音合成。 StreamSpeech可以同时提供ASR、翻译和合成结果同步语音到语音翻译（Simul-S2ST，又名流式语音翻译）在接收流式语音输入的同时输出目标语音，这对于实时通信至关重要。除了完成语音之间的翻译之外，Simul-S2ST 还需要一个策略来控制模型在语音输入的适当时刻生成相应的目标语音，从而提出了翻译和策略的双重挑战。在本文中，我们提出了 StreamSpeech，这是一种直接 Simul-S2ST 模型，可以在多任务学习的统一框架中联合学习翻译和同时策略。StreamSpeech 是一种用于语音识别、语音翻译和语音合成的“一体化”无缝流式模型，它可以有效地识别流式语音输入中开始翻译的合适时机。CVSS 基准测试表明 StreamSpeech 在离线 S2ST 和 Simul-S2ST 任务中均实现了最先进的性能。此外，StreamSpeech能 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

旁门左道PPT · 这4个不起眼的PPT丑形状，竟是排版神器！

昨天

旁门左道PPT · 一页PPT上放5个美女，1个圆让关晓彤美绝！

2 天前

国家数据局 · 关于《数据领域名词解释》公开征求意见情况的通告

3 天前

国家数据局 · 关于《数据领域名词解释》公开征求意见情况的通告

3 天前

秋叶PPT · 年终总结PPT这样做，奖金翻倍不是梦!（送50套PPT模板）

5 天前

秋叶PPT · 只添加一个文本框，PPT封面页瞬间高大上起来！震撼全场！

5 天前

CSDN企业招聘 · 不是，哥们，谁教你这样处理生产问题的？

2 月前

中国基金报 · 比特币大跌，超14万人爆仓！

1 月前