大脑如何为世界建模?从无监督学习到预测加工
大脑如何为世界建模?从无监督学习到预测加工
大脑如何为世界建模?这是一个涉及认知科学、神经科学和人工智能等领域的核心问题。由伦敦大学学院教授卡尔·弗里斯顿(Karl Friston)基于"自由能原理"搭建的预测加工框架,试图为这一问题提供一个统一的解释。哲学家与认知科学家安迪・克拉克(Andy Clark)将这套框架与具身认知理论相结合,为我们描绘了一幅关于心智现象的全新图景。本文节选自《预测算法:具身智能如何应对不确定性》一书,深入探讨了大脑如何通过预测加工机制理解世界。
1. 自下而上,与自上而下的信息加工
当我们在办公室里看到桌上的热咖啡时,大脑是如何处理这一视觉信息的?一种传统的解释是,大脑通过自下而上的信息加工过程,从基本的视觉特征(如线条、边缘和色块)逐步构建出完整的知觉体验。然而,另一种观点认为,大脑在接收到视觉信号之前,就已经形成了关于环境的预期。这些预期与传入的感知信号相互作用,通过预测和误差修正的过程,最终产生稳定的知觉体验。这种观点强调了预测在知觉过程中的核心作用,认为知觉本质上是一种"受控的幻觉"。
2. 采用动物的视角
要理解大脑如何形成这些预期,我们需要从"动物的视角"来思考问题。这意味着我们不能简单地将大脑视为一个被动接收外界刺激的系统,而是要理解大脑如何主动构建对外部世界的理解。这种理解不是基于外部观察者的视角,而是基于动物自身能够获取的感官信息。通过这种方式,大脑能够学习如何预测未来的感知输入,并据此做出适应性的行为反应。
3. 自举式学习
预测驱动的学习提供了一个强大的解决方案,使大脑能够在没有外部教师的情况下进行自我学习。这种学习方式不需要预先分类的训练数据,而是利用环境本身提供的持续变化的感知信号作为训练数据。通过不断尝试预测下一个感知状态,并根据预测误差调整内部模型,大脑能够逐步构建起对世界的复杂理解。这种自举式学习机制在婴儿学习语言和认知发展过程中表现得尤为明显。
4. 多层架构的学习
多层架构的预测驱动学习是理解大脑如何处理复杂信息的关键。这种学习方式允许大脑在多个时空尺度上同时处理不同类型的信息,从简单的视觉特征到复杂的语义概念。通过使用下行和横向连接,大脑能够构建起一个层次化的预测模型,这个模型能够捕捉到环境中的统计规律,并据此生成对未来的预测。这种机制不仅适用于感知任务,也适用于决策和行动规划等更高级的认知功能。
5. 预测加工
预测加工是将上述所有概念整合在一起的核心机制。它通过一个多层的预测编码系统,尝试使用已有的世界知识来生成感知数据的虚拟版本。在这个系统中,自上而下的预测信号与自下而上的感知信号相互作用,只有那些无法被预测的误差信号才会在系统中传播。这种机制不仅能够高效地处理感知信息,还能够灵活地适应环境的变化,使大脑能够在不确定的环境中做出最优的决策。
《预测算法:具身智能如何应对不确定性》一书通过深入探讨预测加工机制,为我们提供了一个理解大脑工作原理的新视角。这个视角不仅有助于我们更好地理解人类认知,也为开发更智能的机器学习系统提供了重要的启示。