编辑丨王多鱼
排版丨水成文
自然的口语交流是瞬间完成的。超过几秒钟的言语迟缓就会打断对话的自然流畅。这使得瘫痪者难以参与有意义的对话,从而可能会导致他们产生孤立和沮丧的感觉。
近年来,脑机接口(BCI)领域取得了许多突破性进展,例如,2023 年 8 月,加州大学旧金山分校张复伦(Edward Chang)团队在Nature期刊发表论文【1】,通过新型脑机接口(BCI),将因脑干中风而严重瘫痪的患者在大脑中尝试的无声说话转化为文字、语音和图像,从而帮助严重瘫痪者恢复沟通能力。
然而,这种面相言语的脑机接口一般在患者尝试无声说话与计算机输出之间会有几秒钟的延迟,这种延迟会在聆听者与患者之间造成交流不畅和困扰。而一个实时系统有望恢复自然对话交流,或能提高失语患者的生活质量。
2025 年 3 月 31 日,加州大学旧金山分校张复伦团队与加州大学伯克利分校Gopala Anumanchipalli团队合作,在Nature Neuroscience期刊发表了题为:A streaming brain-to-voice neuroprosthesis to restore naturalistic communication 的研究论文。
该研究开发了一种新型脑机接口设备,在 AI 模型训练的帮助下,能够将瘫痪失语患者大脑中想象的言语活动实时转换成他的声音输出,从而帮助失语者恢复实时流畅交流的能力。
在这项研究中,研究体开发了一款无声脑机接口,并作为一个临床试验的一部分,将它植入了一名 47 岁的四肢麻痹(四肢和躯干瘫痪)女性患者的大脑中,这名女性在一次中风发作后已有 18 年无法说话或发声。
研究团队让她在大脑中用意念讲出包含 1024 个独特词汇的完整句子,同时用她的大脑活动训练了一个深度学习神经网络,这些大脑活动利用植入该患者言语感觉运动皮质的电极进行记录。
研究团队随后使用该模型以 80 毫秒递增的速度解码在线语音,与受试者的发声意图同步,再生成用受试者受伤前说话片段训练的模拟她声音的音频。这个脑机接口还可以推广至该受试者训练中没有接触过的词汇,而且,该设备可以连续不间断使用,而不是每次运行几秒。
总的来说,这项研究引入了一种言语-神经假体范式,有望恢复瘫痪失语患者的自然言语交流,让他们更自然流畅地实时说话,从而提高他们的生活质量。
论文链接:
https://www.nature.com/articles/s41593-025-01905-6