脑机接口迈向临床：AI解码脑电波直接合成自然语音

2026年6月18日 AI 自由的编辑者

从脑电波到完整句子：瘫痪患者重新”开口说话”不再是科幻

2026年6月，加州大学旧金山分校的华裔科学家Edward Chang团队在《自然》杂志上发表了一项里程碑式的研究——他们开发了一种深度学习方法，能够直接从人类大脑信号中合成完整的口语句子，速度达到每分钟150个单词，接近正常人的语速。这一突破意味着因中风、渐冻症或脊髓损伤而失去语言能力的患者，有望重新获得自然、流畅的”声音”。

同月，马斯克的Neuralink也宣布在脑机接口临床实验中取得了重要进展，一名四肢瘫痪的患者成功通过意念操控计算机光标，完成了网页浏览和文字输入等日常操作。脑机接口技术正在以超预期的速度从实验室走向临床。

脑机接口技术

加州大学旧金山分校研究：解码大脑的语言密码

Edward Chang团队的研究代表了脑机接口在语言恢复领域的最高水平。传统脑机接口帮助瘫痪患者每分钟最多输出8个单词，而新系统达到了150个单词每分钟，接近正常人自然交流的水平。

技术原理上，研究采用了两阶段深度学习方法：第一阶段利用递归神经网络将大脑皮层信号解码为发音器官（嘴唇、舌头、喉部）的运动指令，第二阶段将这些运动指令合成可理解的口语句子。系统在志愿者（因神经系统疾病无法说话的患者）身上进行了验证，生成的语音在清晰度和自然度上都大幅超越了以往的研究。

更令人印象深刻的是，即使志愿者不发出实际声音，仅凭”默读”时的脑电信号，系统仍然能够合成语音——尽管准确率有所降低。这意味着未来完全无法发声的患者也能通过脑机接口实现沟通。

Neuralink的临床进展与中国玩家的崛起

马斯克的Neuralink在2026年继续推进其临床试验。在最近公布的结果中，一名四肢瘫痪患者通过植入式脑机接口设备，成功实现了一天8小时以上的独立使用，包括浏览网页、发送消息、玩电子游戏等操作。设备的无线充电和信号传输稳定性有了显著提升，植入手术的创伤也更小。

在中国，脑机接口领域同样在快速推进。博睿康科技自主研发的高通量脑机接口芯片，通道数达到4096个，信号采集精度达到国际领先水平。2026年3月，中国首个脑机接口临床试验伦理审查获批，即将在宣武医院等三甲医院开展人体试验。天津大学与清华大学联合团队开发的”脑语者”系统，实现了汉语脑控打字速度达到每分钟60个字符，创下了新的世界纪录。

AI在脑机接口中的核心角色

脑机接口近年来的快速进步，很大程度上归功于AI技术的突破。AI在脑机接口中扮演着三个关键角色：

信号处理与降噪：大脑信号极其微弱且噪声巨大，传统信号处理方法难以提取有效信息。深度神经网络能从海量的高噪声脑电数据中自动学习有效特征，将信号解码精度提升了数倍。
自适应校准：每个人的大脑信号模式都不同，同一个人不同时间的信号也会变化。AI模型能够在用户使用过程中持续自适应校准，无需频繁手动调整。Neuralink的最新系统只需用户”想象”一个动作约30秒，AI就能完成个性化校准。
语义解码：从大脑信号解码语义（”想说什么”）而非仅仅解码运动指令（”想动哪个肌肉”）是脑机接口的前沿方向。加州大学旧金山分校的研究就是这一方向的典范。AI通过大规模预训练，能从前额叶皮层的信号中预测用户想要表达的语义内容，准确率已超过75%。

伦理与未来

脑机接口的临床化进程在带来希望的同时，也引发了深刻的伦理讨论。大脑数据的隐私保护是最核心的问题——脑电波包含的不仅仅是有意识的思维信号，还潜藏着潜意识层面的信息。谁有权访问这些数据？如何防止脑机接口被滥用？目前，美国FDA已成立专门的脑机接口伦理审查委员会，中国也在积极制定相关的伦理指导规范。

展望未来，脑机接口将沿着两个方向演进：治疗型应用（帮助瘫痪患者、失语症患者等恢复功能）和增强型应用（提升正常人的认知能力）。业界普遍认为，治疗型应用将在5-10年内实现规模化临床，而增强型应用则面临更大的技术挑战和伦理争议。但有一点是确定的——脑机接口正在打开人类与机器直接通信的大门，其影响将不亚于互联网的诞生。

作者：自由的编辑者

链接：https://www.ziyoudian.cn/archives/1353

文章版权归作者所有，未经允许请勿转载。