第1章:概览
Thomas Parr, Giovanni Pezzulo, Karl J. Friston
出自:Active Inference: The Free Energy Principle in Mind, Brain, and Behavior (MIT Press, 2022)
📖 章节总结
本章提出了Active Inference(主动推理)框架要解决的核心问题:生物体如何在与环境的适应性交互中持续存在?作者从规范性(normative)视角出发,认为尽管生物适应策略千差万别——从细菌的趋化性到人类的远期规划——但这些现象可以从第一性原理得到统一解释。
Active Inference的核心主张是:所有生物行为和认知都遵循同一个命令式——最小化感觉观测的惊奇(surprise)。这里的”惊奇”是技术术语,衡量当前感觉观测与生物体偏好观测(即维持其完整性的观测)之间的差异。由于直接最小化惊奇在技术上不可行,生物体转而最小化一个代理量——变分自由能(variational free energy)。
本章介绍了理解Active Inference的两条路径:
- 高路(high road):从生物体如何持续存在的问题出发,将Active Inference作为规范性解决方案,强调”为什么”(why)
- 低路(low road):从贝叶斯大脑假说出发,将Active Inference视为一种特定的变分近似推理方案,强调”如何”(how)
全书分为两部分:理论篇(第1-5章)帮助读者理解Active Inference,实践篇(第6-10章)帮助读者使用它构建模型。
🧩 核心概念
Active Inference(主动推理)
一个规范性框架,用于刻画生物体的贝叶斯最优行为和认知。其核心是通过主动控制行动-感知循环来最小化感觉观测的惊奇。
Surprise(惊奇)
技术术语,衡量智能体当前感觉观测与其偏好观测之间的差异。对鱼来说,”在水里”是低惊奇状态;”在陆地上”是高惊奇状态。
Variational Free Energy(变分自由能)
惊奇的可计算代理量。生物体无法直接计算惊奇(因为需要知道所有可能状态的概率),但可以通过神经计算最小化自由能,从而间接最小化惊奇。
Generative Model(生成模型)
生物体内部的概率模型,编码关于感觉观测如何生成的信念。包含可观测变量(感觉输入)和隐变量(世界状态)的概率分布。
Action-Perception Loop(行动-感知循环)
生物体与环境的递归交互:行动改变环境 → 环境产生新的感觉观测 → 观测影响下一个行动决策。维持这个循环的适应性控制是生存的核心挑战。
Expected Free Energy(期望自由能)
用于规划的目标函数,包含两个部分:探索(exploration,解决不确定性)和利用(exploitation,实现目标)。Active Inference自动平衡这两者。
Markov Blanket(马尔可夫毯)
将生物体与环境分隔开的统计边界。维持这个边界是生物体自组织(autopoiesis)的核心。
Neats vs. Scruffies(整洁派 vs. 凌乱派)
两种科学研究态度:整洁派寻求从第一性原理统一解释异质现象(自上而下的规范模型);凌乱派拥抱异质性,为不同现象设计专门解释(自下而上的数据驱动模型)。Active Inference属于整洁派。
🔬 理论基础
第一性原理推导路径
Active Inference的理论基础建立在自由能原理(Free Energy Principle, FEP)之上。推导逻辑如下:
1. 存在即自证(self-evidencing):生物体的存在本身意味着它必须维持某种统计上的稳定性,即停留在其特征状态空间内。
2. 惊奇最小化:为了维持存在,生物体必须避免那些与其完整性不兼容的感觉观测,即最小化惊奇 S = -ln P(o|m),其中 o 是观测,m 是生物体的生成模型。
3. 变分近似:由于直接计算 P(o|m) 需要对所有隐状态积分(计算上不可行),引入变分自由能 F 作为惊奇的上界:F ≥ S。最小化 F 等价于间接最小化 S。
4. 感知与行动的统一:最小化自由能可以通过两种方式实现:
- 感知:更新内部信念使其与观测一致(改变你的想法)
- 行动:改变世界使观测与信念一致(改变世界)
5. 规划即推理:选择未来行动序列(策略)也是推理问题,目标是最小化期望自由能 G,它自然地平衡了信息增益(探索)和目标实现(利用)。
与贝叶斯大脑假说的联系
低路视角将Active Inference置于贝叶斯大脑假说的传统中:大脑是推理引擎,试图优化关于感觉输入成因的概率表征。Active Inference的特殊性在于:
- 采用特定的变分近似方案(有生物学合理性)
- 将推理扩展到行动选择和规划领域
- 在某些假设下,其动力学对应于预测编码(predictive coding)和Helmholtz机器等成熟模型
数学形式化预览
虽然本章未展开数学细节,但提示了关键量:
- 变分自由能:F = E_q[ln q(s) – ln P(o,s|m)],其中 q(s) 是关于隐状态的近似后验
- 期望自由能:G = E_q[ln q(s|π) – ln P(o,s|π,m)],其中 π 是策略
- 自由能分解:F = 复杂度 – 准确度(对应贝叶斯模型证据的负对数)
💡 认知启示
统一的认知架构
Active Inference提供了一个罕见的统一视角:感知、行动、规划、学习不再是独立的认知模块,而是同一个自由能最小化过程在不同时间尺度和方式上的体现。这挑战了传统认知科学的模块化假设。
主动性的本质
“主动”不仅指外显的运动行为,更指生物体主动构建其感觉输入的过程。看不是被动接收光子,而是主动采样视觉场景;听不是被动接收声波,而是主动定向注意。这与被动刺激-反应模型形成鲜明对比。
目标导向的自然涌现
传统强化学习需要外部定义奖励函数,而Active Inference中的目标导向行为自然涌现于生成模型的先验偏好。生物体不是”被奖励驱动”,而是”实现先验预测”——这更接近控制论的设定点概念,也更符合现象学直觉。
探索-利用困境的自动解决
期望自由能的双重结构(信息增益 + 目标实现)意味着智能体无需外部元控制器来平衡探索与利用,这个平衡自动涌现于推理过程。这为理解好奇心、信息寻求等现象提供了原则性解释。
神经科学的桥梁
Active Inference不仅是抽象的计算理论,还提供了与神经生物学的明确映射:
- 感知推理 ↔ 突触活动变化
- 学习 ↔ 突触效能变化
- 预测精度 ↔ 预测误差单元的突触增益
- 策略精度 ↔ 多巴胺活动
这使得框架可以产生可检验的神经科学预测,而不仅仅停留在计算层面。
对人工智能的启示
Active Inference为构建自主智能体提供了不同于传统AI的路径:不是设计专门的感知模块、规划模块、学习模块,而是设计一个生成模型,让所有智能行为涌现于自由能最小化。这可能为认知机器人学和具身AI开辟新方向。
哲学意涵
框架触及深层哲学问题:生物体的存在本身就是一种推理过程(self-evidencing),感知即行动(enactivism),心智的预测性本质。这与现象学、具身认知等哲学传统产生共鸣,同时提供了形式化的数学语言。