AI解码动物语言:从鲸鱼歌声到狗吠情感识别
AI解码动物语言:从鲸鱼歌声到狗吠情感识别
2025年,人工智能(AI)有望在动物交流研究中迎来重大突破。近期设立的Coller-Dolittle奖项,为解码动物声音的研究提供了可观的资金支持,这标志着科学界对AI在这一领域应用前景的乐观预期。
在鲸鱼交流研究方面,CETI(鲸类翻译计划)项目的研究团队使用水听器记录水下声音。通过机器学习算法,研究人员不仅能够快速分析鲸鱼的叫声,还能识别出每个声音来自哪只鲸鱼。AI帮助研究人员发现,鲸鱼通过调整咔嗒声之间的间隔(称为“rubado”)和偶尔添加一个咔嗒声(称为“装饰音”)来产生大量不同的密码。
行为生态学家Mickey Pardo和他的同事们使用机器学习发现,野生非洲象似乎也有“名字”。它们会用特定的叫声来称呼其他大象。研究人员训练了一个机器学习模型来识别这些叫声,并发现计算机能够正确匹配叫声和接收者27.5%的时间。以色列耶路撒冷希伯来大学的神经学家David Omer则在狨猴中发现了类似的现象。
在另一项研究中,Pardo和他的同事们记录了肯尼亚两个象群的叫声,并使用机器学习展示了两个象群之间存在明显的vocal差异。这对比结果对于保护工作具有重要参考价值。如果能够通过被动声学监测(在周围放置麦克风)来了解特定的象群,就可以帮助保护者判断某个群体的数量是在增长还是在减少。
在狗叫声识别方面,密歇根大学和墨西哥国家天体物理、光学和电子研究所(INAOE)合作开发的AI模型,能够以高达70%的准确率识别狗的情感和意图。这一突破性研究的背后,是科学家们对人类与动物沟通的不懈探索。研究团队精心记录了74只不同品种、年龄和性别的狗在各种情况下的叫声。这些狗在玩耍、生气、警觉等不同情绪状态下的吠叫、咆哮和呜呜声都被详细记录下来。这一过程不仅需要耐心和细心,更需要科学的方法和精准的设备来确保数据的准确性和可靠性。
然而,AI在动物交流研究中也面临一些挑战。目前,高质量的动物声音数据仍然有限。例如,Ceti计划在研究抹香鲸的声音时,仅获得了不到8000个录音样本,而大型语言模型的训练数据量则超过500GB的文本信息。此外,动物叫声的解读充满了不确定性,区分狼的不同嚎叫所代表的意义仍然是一个巨大的挑战。
尽管如此,AI在动物保护中的应用前景仍然令人兴奋。通过图像识别技术,可以协助执法人员识别互联网平台上的非法野生动植物制品。同时,利用卫星追踪技术,结合大模型分析,可以实时监测野生动物的迁徙路线、生活习性与种群分布状况。此外,通过构建野生动物图像数据库,并利用大模型进行智能比对,可以快速识别个体野生动物,如大熊猫等。这种技术不仅有助于科研监测,还能在野生动物保护和管理中发挥重要作用。
AI研究的局限性与未来展望
加州大学圣克鲁兹分校的动物行为生态学家Caroline Casey指出,AI并不是解决动物交流研究中所有问题的“魔法棒”。她强调,高质量的实地工作仍然是必不可少的,AI不能取代细致的现场观察和实验。
研究人员谨慎地表示,AI模型最终可能不会给我们带来与动物对话的能力。Pardo的主要目标不是与野生动物和宠物对话,而是了解它们的思维以及它们如何感知自己和世界。如果科学家能够证明动物拥有这样的语言,那么他们就可以尝试找出如何与它们交流的方法。
即使直接交流仍然遥不可及,许多参与这项研究的科学家仍将改善保护工作作为主要目标。展示动物拥有自己的思维可以增加人们对它们的同情。Gero希望通过了解鲸鱼的需求,可以重新规划船只航线以避免碰撞。Pardo则希望了解大象对人类对待它们的方式的感受。