AI解码动物语言获新进展,数据不足成研究瓶颈
AI解码动物语言获新进展,数据不足成研究瓶颈
近日,Coller-Dolittle奖的设立为解码动物声音的研究提供了可观奖金,体现了科学界对AI破解动物语言的乐观态度。这一奖项的设立,无疑将为相关研究注入新的动力,推动人类对动物交流方式的理解进入新的阶段。
Project Ceti:破解鲸鱼语言的先驱
在众多研究项目中,Project Ceti(鲸类翻译计划)无疑是最受关注的之一。该计划致力于破解抹香鲸的点击声和座头鲸的歌声,已经取得了令人瞩目的进展。
研究团队发现,抹香鲸的语言类似于莫尔斯电码,由长短不一的嗒嗒声组成。更令人惊讶的是,抹香鲸之间似乎还有“名字”的概念,不同群体的抹香鲸甚至发展出了各自的“方言”。幼年抹香鲸从不会“说话”开始,由成年的抹香鲸教“说话”。
然而,这些发现也揭示了研究面临的巨大挑战。与大型语言模型动辄500GB的训练数据相比,Project Ceti目前仅收集到不到8000个抹香鲸的录音样本。数据量的严重不足,成为制约研究进展的关键瓶颈。
AI技术:破解动物语言的关键
AI技术,尤其是深度学习和机器学习算法,为破解动物语言提供了前所未有的机遇。然而,这一过程并非一帆风顺。
首先,动物声音数据的收集和标注是一个巨大的挑战。与人类语言不同,动物的交流往往包含声音、表情、姿势、气味等多种模态的信息。例如,蜜蜂在交流时会将不同的嗡嗡声和身体姿态结合起来使用。这要求研究人员必须收集多模态的数据,才能完整捕捉动物交流的全貌。
其次,动物的某些概念可能在人类认知中并不存在对应物,这为数据标注和模型验证带来了额外的困难。此外,出于道德伦理的考虑,研究人员不能随意让动物试听AI生成的声音,这也限制了研究的进展。
尽管如此,一些研究团队已经取得了令人鼓舞的进展。例如,Earth Species Project(地球物种项目)团队开发了多种声音分析工具和评测基准,为动物行为数据分析提供了有力支持。他们发现,针对不同抹香鲸发出的声音,可以识别出是哪一条抹香鲸发出的声音。从大自然的各种声音、以及多个动物同时发出的叫声中,基于cocktail party problem(鸡尾酒会问题)算法,分离出单个动物的叫声。
2025:突破之年?
2025年,被认为是AI和机器学习领域取得突破性进展的关键一年。科学家们普遍认为,这一年将在理解动物交流方面迎来重要突破。
加拿大Carleton University的鲸鱼生物学家Shane Gero的研究表明,同一家族的鲸鱼会发出特定的声音,而不同区域的抹香鲸甚至有自己的“方言”。这些声音,特别是称为尾音的咔嗒声,是鲸鱼在水面上与其他鲸鱼保持联系的方式。通过AI的帮助,研究人员能够更快地分析这些声音的节奏和速度,揭示了鲸鱼之间共享复杂信息的基础。
行为生态学家Mickey Pardo通过AI发现,野生非洲象有自己的“名字”。大象使用低沉的隆隆声进行交流,AI模型学习了这些“呼叫”的声学特征,并预测了接收者。这项研究不仅揭示了大象对特定叫声的反应,还表明了大象叫声中包含的个体信息,如性别、年龄和生理状况。
地球物种项目的AI研究主管Olivier Pietquin正在使用AI解码动物物种的交流,特别是乌鸦。他们创建了一个名为Voxaboxen的神经网络,应用于研究西班牙北部腐肉乌鸦种群的交流。这些乌鸦通过语音沟通协调共同照顾幼崽的任务。
展望未来:理解与共存
尽管AI在解码动物语言方面取得了显著进展,但要实现真正的跨物种交流,还有很长的路要走。动物是否具备类似人类语言的结构化语言,仍然是一个悬而未决的问题。目前的研究更多地停留在对动物叫声的识别和分类上,距离真正理解动物的“思想”还有很大差距。
然而,这些研究的意义不容小觑。理解动物的语言和交流模式,不仅有助于保护濒危物种,还能为人类与动物的和谐共处提供新的思路。随着技术的不断进步,我们有理由相信,人类与动物之间的沟通障碍终将被打破,一个更加和谐共生的未来正在向我们招手。