第10章:主动推理作为有感知行为的统一理论
Thomas Parr, Giovanni Pezzulo, Karl J. Friston
出自:Active Inference (MIT Press, 2022)
📖 章节总结
本章是全书的综合性收束,将Active Inference与心理学、神经科学、人工智能、哲学中的主要理论逐一对照,展示其作为统一框架的整合力量。核心论点是:传统认知科学将感知、行动、注意、情绪、决策、学习视为独立模块,而Active Inference从自由能最小化这一单一原理出发,将所有这些功能推导为同一过程的不同面向。
整合视角
作者借用Dennett的比喻——与其分别建模认知的各个子系统,不如尝试建模”整只蜥蜴”(the whole iguana)。Active Inference的规范性特征使其能做到这一点:不是先拼装各个认知模块再寻找统一,而是从第一性原理出发提供完整解决方案,然后分析其对各认知功能的具体含义。
与主要理论的对比
本章系统对比了Active Inference与以下理论框架:
- 预测处理(Predictive Processing):PP是更宽泛的哲学框架,有时借用Active Inference的概念(生成模型、预测编码),有时引入不兼容的构件(如逆-正向模型对)。Active Inference提供了更受约束的形式化。
- 贝叶斯大脑假说:Active Inference提供了比一般贝叶斯大脑更整合的视角——它连接了规范原理和过程理论,且将行动纳入同一推理框架,而贝叶斯大脑通常只处理感知。
- 最优控制理论:关键分歧在于运动控制的机制。最优控制需要逆模型(从期望状态计算运动指令)和正向模型的配合;Active Inference只需要正向(生成)模型加反射弧。运动皮层发送的不是”运动命令”而是”本体感觉预测”。
- 强化学习:Active Inference用先验偏好替代奖励函数,用策略推理替代策略学习,用期望自由能替代价值函数。习惯行为不是独立于目标导向行为的平行系统,而是反复执行目标导向策略后的缓存结果。
- 贝叶斯决策理论:贝叶斯决策理论将概率和效用分开处理,Active Inference将效用吸收进先验。完全类定理(Complete Class Theorems)表明,对于任何决策和代价函数的组合,总存在某个先验使其为贝叶斯最优——Active Inference通过将效用并入先验消解了这种退化性。
认知功能的统一解释
- 行动控制:行动源自本体感觉预测而非运动命令(观念运动理论),需要瞬时的感觉衰减来启动。精度控制决定先验信念(”我握住了杯子”)是被更新(感知)还是被执行(行动)。
- 有界理性:审慎(期望自由能最小化)、惯性(变分自由能最小化)和习惯(策略先验价值)三种行为成分共存且可组合,而非双系统的竞争。信念精度提升的代价产生了自然的有界理性。
- 情绪与效价:情绪效价可概念化为自由能随时间的变化率——自由能下降=正效价,上升=负效价。策略信念的精度与多巴胺信号关联,反映了动机的激励显著性。
- 内感受与稳态:Active Inference将稳态调节视为内感受推理——对体内感觉流的预测编码。它自然地扩展到异稳态(allostasis):预测性地在偏差发生前就调整生理参数。
- 注意与显著性:注意=感觉输入的精度;显著性=期望信息增益。前者是关于信念的属性,后者是关于行动/策略的属性。高精度数据=低歧义=值得注意,获取它们的行动=高显著性。
- 因果推理与泛化:学习深层生成模型能捕获环境的潜在因果结构,实现从有限经验的快速泛化。模型简化(裁剪不必要参数)是学习隐藏规则的有效方式,可能在离线期间(如睡眠)发生。
🧩 核心概念
Self-evidencing(自证存在)
生物体的存在本身就是在为其生成模型积累证据。感知、行动、学习都是self-evidencing的不同方式。这不是隐喻而是形式化的数学关系:最小化自由能 ≈ 最大化模型证据。
Prior as Identity(先验即身份)
在Active Inference中,有机体的先验偏好定义了它是什么样的存在。鱼的先验说”在水中”,人的先验编码了体温37°C。改变先验就改变了有机体的身份。这使得先验不只是”对世界的预期”,而是存在论层面的自我定义。
Sensory Attenuation(感觉衰减)
行动启动时对感觉预测误差的瞬时下调。这是必要的——如果不降低感觉精度,当前的感觉证据(”我还没有握住杯子”)会推翻运动先验(”我正在握杯子”),导致无法启动动作。感觉衰减失败与运动障碍相关。
Deliberative/Perseverative/Habitual(审慎/惯性/习惯)
Active Inference中三种行为成分:审慎行为由期望自由能驱动(前瞻性规划),惯性行为由变分自由能驱动(当前信念的确认),习惯行为由策略先验价值驱动(经验的缓存)。三者共存而非竞争。
Emotional Valence as dF/dt(情绪效价=自由能变化率)
正效价=自由能下降(事情在变好),负效价=自由能上升(事情在变糟)。二阶导数可以捕获更复杂的情绪:从负到正=释然,从正到负=失望。
Interoceptive Inference(内感受推理)
对身体内部状态的推理,与外感受推理结构相同。自主神经反射类似于运动反射——都是消除预测误差的方式。内感受流为外部事件赋予情感维度,信号化它们对异稳态和生存的意义。
🔬 关键理论对比
Active Inference vs. 强化学习:5个关键区别
| 维度 | Active Inference | 强化学习 |
|——|—————–|———|
| 目标函数 | 期望自由能(含认识性+实用性) | 累积奖励 |
| 策略含义 | 控制状态的推理 | 刺激-反应映射的学习 |
| 习惯形成 | 目标导向策略的缓存 | 独立于目标导向的无模型学习 |
| 价值概念 | 先验偏好(信念的泛函) | 价值函数(状态的函数) |
| 探索机制 | 自动(期望自由能的组成部分) | 需要额外机制(ε-贪心、好奇奖励) |
Active Inference vs. 最优控制:运动控制的根本分歧
- 最优控制:感觉→逆模型→运动命令→正向模型→预测感觉
- Active Inference:生成模型→本体感觉预测→反射弧消除预测误差
- 关键区别:Active Inference不需要逆模型,运动命令就是预测
💡 认知启示
Jamesian范畴的解构
心理学教科书中的认知功能分类(感知、注意、记忆、决策……)可能不对应独立的认知或神经过程。Active Inference暗示这些”范畴”可能只是我们的生成模型用来解释自身状态的假说——”我在感知”不是一个事实,而是大脑对当前信念更新过程的最佳解释。
情感不是认知的附加物
传统框架往往先构建”冷认知”(感知、推理、决策),然后把情绪作为”调制因素”加上去。Active Inference中,情绪、效价、动机是自由能动力学的固有属性——它们不是认知的干扰或修饰,而是认知的核心成分。
睡眠的计算功能
模型简化——裁剪生成模型中不必要的参数以发现隐藏规则——可能发生在离线期间(如睡眠)。这提供了一个从第一性原理出发的”为什么需要睡眠”的计算理论:觉醒时积累模型复杂度,睡眠时进行模型压缩。
AI的根本局限性
当前机器学习的”越大越好”趋势与Active Inference的统计方法形成张力。Active Inference强调模型简约性——准确度和复杂度之间的平衡。真正的智能可能不在于积累更多参数,而在于发现更简洁的因果结构。
社会认知的涌现
多个Active Inference智能体的交互可以产生涌现的社会现象——协调预测、轮流行为、认知生态位构建。这为从个体层面的自由能最小化推导群体层面的社会动力学提供了原则性路径。