专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
今天看啥  ›  专栏  ›  DeepTech深科技

科学家用AI模型研发脑-声神经假体,将失语症患者脑信号转为人声,语音解码能力媲美Siri

DeepTech深科技  · 公众号  · 科技媒体  · 2025-04-02 19:24
    

主要观点总结

该文章介绍了一项新技术,能让患有失语症的瘫痪人士通过脑机接口进行口语交流。研究团队开发了一种流式处理方法,能将脑信号解码为语音,实现了低延迟的自然口语交流。这项技术的原理是通过采集神经数据,利用AI将大脑功能解码为言语。实验结果显示,该技术能够近乎实时地合成语音和文本解码。

关键观点总结

关键观点1: 技术概述

新技术能让患有失语症的瘫痪人士通过脑机接口进行口语交流,解决了一直存在的延迟问题,使交流更加自然流畅。

关键观点2: 实验方法和原理

研究团队使用深度学习模型和AI技术,从大脑活动中解码副语言特征,实现流式处理方法。通过采集神经数据,利用AI将大脑功能解码为言语。

关键观点3: 实验结果

实验结果显示,新技术能够近乎实时地合成语音和文本解码。合成语音的自然度和流畅度得到了提高,延迟问题得到了解决。

关键观点4: 技术的潜在影响和应用

这项技术对于改善严重瘫痪且言语受影响患者的生活质量具有巨大潜力,可以助力开发适合失语者日常使用的语音神经假体。

关键观点5: 未来研究计划

研究团队将继续优化算法,探索如何更好、更快地生成语音,为开发适合失语者日常使用的语音神经假体奠定基础。


文章预览

图片中的女子是一名患有失语症的瘫痪人士,她最近作为受试者参与了一项基于新技术的实验,在不依赖任何发声的前提下,该技术能够直接与她的发声意图同步合成语音。 (来源:Noah Berger) 在深度学习模型的帮助之下,本次技术能在 80 毫秒内合成语音,并能同时进行文本解码,语音解码能力媲美和 Siri 和 Alexa。利用受试者在无声尝试“模仿”或“张嘴”时的神经活动,无需任何发声即可合成来自于 1024 个单词词汇表的句子。即便在离线状态之下,解码器也能连续运行数分钟之久。相关论文于近日发表在  Nature Neuroscience 。 (来源: Nature Neuroscience ) 语音解码能力媲美和 Siri 和 Alexa 这名女子所参与的实验,由来自美国加州大学伯克利分校和加州大学旧金山分校的一组研究人员完成。实验中,研究人员借助脑-声神经假体技术以及基于 AI 的模型 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览