问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

AI让失语者重新说话，纽约大学发布全新“神经-语音”解码器

创作时间:

作者:

@小白创作中心

AI让失语者重新说话，纽约大学发布全新“神经-语音”解码器

引用

澎湃

1.

https://m.thepaper.cn/newsDetail_forward_27285903

背景介绍

脑机接口（BCI）技术在科研和应用领域的进展备受关注，特别是在帮助失语症患者恢复交流能力方面。随着深度学习和脑机接口技术的快速发展，科学家们正致力于通过神经语音假肢来辅助失语者重新获得交流能力。

研究进展

最近，纽约大学VideoLab和Flinker Lab联合在《Nature Machine Intelligence》杂志上发表了一项突破性研究。研究团队开发了一个创新的可微分语音合成器，该合成器结合了轻量级卷积神经网络，能够将语音编码为一系列可解释的语音参数，如音高、响度和共振峰频率等，并利用可微分的技术重新合成语音。

研究团队收集了48位受试者的数据，并在这一基础上进行了语音解码的尝试，为高精度脑机接口技术的实际应用和发展打下了坚实的基础。图灵奖得主Yann LeCun也转发了这项研究进展。

主要模型框架

研究团队展示了一种创新的从脑电（ECoG）信号到语音的解码框架。他们构建了一个低维度的潜在表示空间，该空间通过一个轻量级的语音编解码模型，仅使用语音信号来生成。

这一框架包含两个核心部分：首先是ECoG解码器，它负责将ECoG信号转换为一系列可理解的声学语音参数，如音高、是否发声、响度及共振峰频率等；其次是语音合成器部分，负责将这些参数转换为频谱图。

通过构建一个可微分的语音合成器，研究人员实现了在训练ECoG解码器的同时，也对语音合成器进行优化，共同减少频谱图重建的误差。这种低维度潜在空间的可解释性强，结合轻量级的预训练语音编码器生成的参考语音参数，使得整个神经语音解码框架高效且适应性强，有效解决了该领域中数据稀缺的问题。

研究结果

时序因果性语音解码：研究者对不同模型架构（包括ResNet、LSTM和Transformer）进行了直接比较，发现即使是因果版本的ResNet模型，其性能也能与非因果版本相媲美。
左右大脑神经信号语音解码：研究发现右脑半球同样能够有效地进行语音解码，其效果与左脑半球相近。这一发现为那些左脑受损且失去语言功能的患者提供了一种可能的语言恢复方案。
脑区贡献度研究：研究显示，无论在大脑的左半球还是右半球，传感运动皮层特别是腹部区域对语音解码的贡献度都相似。这一发现表明，在右半球植入神经假肢来恢复语音可能是一个可行的方案。

未来展望

尽管取得了显著进展，研究者也指出了模型当前的一些局限性，如解码过程依赖于与ECoG记录配对的语音训练数据，这对于失语症患者可能不适用。未来，研究团队希望建立能够处理非网格数据的模型架构，并更有效地利用多病人、多模态的脑电数据。

随着硬件技术的持续进步和深度学习技术的快速发展，脑机接口领域的研究仍处于早期阶段，但随着时间的推移，科幻电影中的脑机接口设想将逐步成为现实。

参考资料：

论文链接：https://www.nature.com/articles/s42256-024-00824-8
代码开源地址：https://github.com/flinkerlab/neural_speech_decoding
更多生成的语音例子：https://xc1490.github.io/nsd/

本文原文来自澎湃

热门推荐

手部外伤吃什么伤口好得快一点

手部外伤吃什么伤口好得快一点

手部外伤吃什么伤口好得快

手部外伤吃什么伤口好得快

中秋佳节必学：湘韵全家福的做法

中秋佳节必学：湘韵全家福的做法

牢记！安全用药很重要，这份科学指南你“药”掌握

牢记！安全用药很重要，这份科学指南你“药”掌握

寒冷的冬季骑摩托车为何先要预热发动机几分钟呢？

寒冷的冬季骑摩托车为何先要预热发动机几分钟呢？

泰剧《爱与罚》：一部海岛浪漫爱情故事

泰剧《爱与罚》：一部海岛浪漫爱情故事

肺腑‘结’密——肺结节这点事

肺腑‘结’密——肺结节这点事

小米汽车用铝线束引发争议，揭秘汽车行业线束材料变革

小米汽车用铝线束引发争议，揭秘汽车行业线束材料变革

如何根据电流选择合适的铜线规格？别踩坑！

如何根据电流选择合适的铜线规格？别踩坑！

BV型铜线：家庭装修中的安全用电之选

BV型铜线：家庭装修中的安全用电之选

北京航源高科教你如何选择合适的铜线规格

北京航源高科教你如何选择合适的铜线规格

河南少林寺四天三夜旅游行程攻略

河南少林寺四天三夜旅游行程攻略

上海开发公厕APP解决女厕排队难题

上海开发公厕APP解决女厕排队难题

春节必备：全家福的家常做法大揭秘！

春节必备：全家福的家常做法大揭秘！

春节营销新玩法：从集五福到蓝包战，数字化营销正当时

春节营销新玩法：从集五福到蓝包战，数字化营销正当时

从需求到试驾：二手车选购全攻略

从需求到试驾：二手车选购全攻略

双十一商务宴请，这些敬酒词让你成为焦点！

双十一商务宴请，这些敬酒词让你成为焦点！

贝伐珠单抗注射液的功效与副作用

贝伐珠单抗注射液的功效与副作用

教你轻松查手机号归属地，再也不怕陌生来电！

教你轻松查手机号归属地，再也不怕陌生来电！

手机号码归属地查询：如何保护你的隐私？

手机号码归属地查询：如何保护你的隐私？

喝酒以后，绝对不能做的7件事，谨记！

喝酒以后，绝对不能做的7件事，谨记！

Silk Charm：高端纺织品品牌的命名艺术

Silk Charm：高端纺织品品牌的命名艺术

如何为你的纺织品公司起一个既有文化内涵又现代时尚的名字？

如何为你的纺织品公司起一个既有文化内涵又现代时尚的名字？

如何用《高效海綿閱讀法》增加閱讀效率？

如何用《高效海綿閱讀法》增加閱讀效率？

武威年味美食大赏：从三套车到菜锅子，品味千年古城的春节味道

武威年味美食大赏：从三套车到菜锅子，品味千年古城的春节味道

北方年夜饭必备：饺子的传承与创新

北方年夜饭必备：饺子的传承与创新

四个蛋黄做出超有年味的小食！

四个蛋黄做出超有年味的小食！

东海龙王敖光：哪吒续集中最具魅力的反派

东海龙王敖光：哪吒续集中最具魅力的反派

雷雨来袭！职场应急指南出炉

雷雨来袭！职场应急指南出炉

广西雷击悲剧后，如何在雷雨天保护家人？

广西雷击悲剧后，如何在雷雨天保护家人？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号