文章预览
我们的大脑在处理声音信息时有一个特长: 可以将注意力集中在感兴趣的对话或声音上,忽略其它无关的声音或者噪音。 我们每天都在不知不觉地运用这种特长,在通勤的地铁上、嘈杂的餐厅里,广播声、音乐声、多人同时说话的声音,都不会妨碍你与同伴进行交流。早在70多年前,神经科学家就注意到大脑的这种神奇能力,并将其称为“ 鸡尾酒会效应 ”。 尽管我们可以轻松地在混合的声音中识别特定的目标声音,计算机要做到这一点却非常困难。在人工智能(AI)领域,要设计出与人类一样强大的语音分离系统是巨大挑战。 日前,来自清华大学的神经科学家和计算机科学家联手, 基于哺乳动物丘脑和皮层整合多模态感觉信息的工作原理,构建了一款新的脑启发AI模型(CTCNet),实现了混合语音分离技术突破 ,让计算机进一步学会像人脑一样
………………………………