第8章:连续时间中的主动推理
Thomas Parr, Giovanni Pezzulo, Karl J. Friston
出自:Active Inference (MIT Press, 2022)
📖 章节总结
本章讨论主动推理在连续时间中的表述方式,核心目标是说明:当系统状态以连续方式演化时,知觉、动作、学习与社会互动依然可以统一地理解为自由能最小化。与离散时间的 POMDP 框架相比,连续时间模型更适合刻画运动控制、非线性动力系统、感觉—运动延迟,以及多主体之间的实时耦合。
章节首先从动作生成出发,指出在连续时间框架下,行动不是由额外的逆模型计算出的”控制指令”,而是通过履行本体感觉预测实现的。换言之,主体只需预测身体将处于某种状态,动作便通过反射回路与误差消除机制将身体带到该状态。运动控制由此被重写为”预测的实现”,从而避免了传统控制理论中从目标到命令的单独逆映射问题。
在此基础上,本章进一步引入更复杂的动力系统。最简单的吸引子模型可以描述状态被拉向某一目标点,但在更符合牛顿力学的情形中,力改变的是速度而非位置,因此生成模型需要同时表征位置与速度。随后,作者展示两类具有代表性的连续动力系统:其一是广义 Lotka–Volterra 动力学,它能够在连续时间中产生时序性峰值结构,为条件反射、时序学习和连续书写轨迹等行为提供动力学基础;其二是 Lorenz 系统,它表现出游走性的、近似混沌的轨迹,适合刻画鸟鸣之类富有内在生成性与复杂性的行为。
本章另一条主线是广义同步(generalized synchrony)。若一个系统的内部状态能够与外部世界中的隐变量实现同步,就可以把这种同步理解为推断的动力学实现;当外部世界中最关键的对象是另一个主体时,同步便具有社会认知含义。通过合成鸟鸣的例子,作者说明两个具有相似生成模型的主体能够在交替发声中共享同一首”歌”的轨迹,并在参数学习后把各自的高层内部状态压缩到共同的同步流形上。这里,同步不仅意味着听懂对方,也意味着双方在某种意义上共享了叙事结构。
最后,本章讨论混合模型(hybrid models),即把第7章的离散 POMDP 与本章的连续状态空间模型结合起来。高层离散系统负责时序决策与类别性选择,低层连续系统负责把这些选择落实为具体运动轨迹。以眼动延迟任务为例,模型需要先在离散层推断”目标在哪、何时该动”,再在连续层把”向上看”这样的类别决策转换为具体的扫视轨迹。由此,主动推理完成了从决策到运动、再由连续感觉反馈反过来更新离散信念的闭环。
🧩 核心概念
1. 连续时间生成模型
连续时间模型假定隐状态 x 随时间平滑演化,其变化率由动力学函数 f(x, v) 给出,而观测由映射 g(x) 生成。这里的 v 可以理解为外部原因、吸引点或控制性的隐藏因素。与离散模型逐时刻跳转不同,连续模型更强调状态流形上的轨迹、速度、加速度及其局部稳定性。
2. 动作即本体感觉预测的实现
本章最关键的思想是:动作不是对世界施加一个外在命令,而是对本体感觉输入的预测误差进行最小化的结果。生成模型预测身体”将处于”某一位置,动作改变身体状态,使实际感觉输入符合预测。于是,动作被纳入与知觉同一套预测误差最小化机制之中。
3. 精度、注意与感觉衰减
精度(precision)在连续模型中直接表现为对预测误差的增益控制。高精度意味着某通道误差对信念更新的影响更大,因此精度与注意在主动推理中可视为同义表达。但动作生成又要求暂时降低某些感觉输入的精度,尤其是与正在执行动作相关的本体感觉或外感觉误差精度,否则”我尚未移动”的高精度证据会立即压制”我正在移动”的预测。作者将这种对感觉证据精度的暂时下调称为感觉衰减(sensory attenuation),它是运动得以发起的必要条件。
4. 广义 Lotka–Volterra 动力学
Lotka–Volterra 系统原本用于捕食者—猎物建模,但在这里被推广为连续时间中的序列生成器。多个状态变量轮流达到峰值,形成近似周期性的顺序结构。与离散序列不同,这种顺序不是由外加时钟逐格推进,而是由系统内部动力学自发涌现,因此特别适合解释节律、时序条件化与序列动作。
5. Lorenz 系统
Lorenz 吸引子提供一种具有复杂、游走、近混沌特征的动力系统。它能在多个吸引区域间不规则切换,因此特别适合模拟具有丰富时间纹理的自然行为,如合成鸟鸣。其价值不只在于”复杂”,更在于它为推断提供了一个挑战性对象:主体必须实时追踪一个本身高度动态、难以线性预测的生成过程。
6. 广义同步
广义同步不是指两个系统在数值上逐点相等,而是指它们的联合轨迹被限制在一个低维流形上。若内部状态与外部状态之间存在这种低维约束关系,就可将其视为推断性耦合的标志。在社会情境里,这意味着一个主体的内部动态能够与另一个主体的动态保持可追踪的一致性。
7. 混合模型
混合模型将离散与连续两种表征机制统一起来。离散层负责”哪一个目标””哪一个阶段””选择何种策略”,连续层负责”如何具体实现这个选择”。它表明认知与运动实现不是两套彼此断裂的系统,而是通过层级消息传递相互耦合的单一生成架构。
🔬 关键公式与推导
1. 从简单吸引子到牛顿运动模型
章节先提出最简单的吸引子形式,再进一步采用更符合物理直觉的二阶系统:
f(x, v) = [x₂, κ/m · (v − x₁)]
其中 x₁ 表示位置,x₂ 表示速度。第一项 ẋ₁ = x₂ 表明位置变化率等于速度;第二项 ẋ₂ = κ/m · (v − x₁) 表明加速度取决于当前位置与目标点 v 之间的距离。若两边乘以 m,则有:
m·ẋ₂ = κ·(v − x₁)
这正是胡克定律与牛顿第二定律的结合:弹簧力把肢体拉向目标位置。其主动推理含义在于,主体不必计算显式运动命令,只要在生成模型中预测”若身体被拉向 v,会产生何种本体感觉输入”,动作就会沿着误差最小化方向把身体推向该轨迹。
2. 广义 Lotka–Volterra 动力学
作者给出的形式为:
f(x, v) = x ∘ (v + Ax)
其中 ∘ 表示逐元素乘积。若 x 是多个种群或多个隐藏状态的活动强度向量,则每个分量的变化都依赖其当前幅度以及与其他分量的相互作用。矩阵 A 编码了促进或抑制关系,v 编码内禀增长或衰减趋势。
该式的重要性不在生态学含义,而在其时序性质:不同分量会依次成为主导峰值,于是连续动力系统内部自然生成 p → h → c 之类的顺序。这个顺序可被重新解释为”隐藏状态的轮替激活”,因而能支持时序生成。与第7章的离散状态转移相比,这里没有显式的 τ → τ+1 跳转规则,序列是从耦合动力学中涌现出来的。
3. 连续时间中的参数学习
对参数 θ 的学习被写成随时间积累证据的过程:
ln p(ỹ, θ) = ln p(θ) + ∫ ln p(y(t) | θ) dt
在自由能近似下,可写为:
S(θ) ≈ ∫ F[y(t) | μ_θ] dt − ln p(μ_θ)
并据此得到参数均值的梯度流:
μ̇_θ = ∂_μθ ln p(μ_θ) − ∫ ∂_μθ F[y(t) | μ_θ] dt
作者进一步用累积变量 α 表示时间积分的自由能梯度:
μ̇_θ = ∂_μθ ln p(μ_θ) − α
α̇ = ∂_μθ F[y(t) | μ_θ]
这组表达说明,连续时间中的学习不是离线批量估计,而是证据随时间流入、梯度逐渐积累的在线过程。其思想与知觉更新一致:都是在梯度下降意义上优化后验信念,只不过优化的对象从隐状态转为模型参数。
4. Lorenz 系统
Lorenz 动力学写作:
ẋ₁ = σ(x₂ − x₁)
ẋ₂ = x₁(ρ − x₃) − x₂
ẋ₃ = x₁x₂ − βx₃
参数 σ、ρ、β 决定系统轨迹的几何性质。其关键特征是轨迹在不同区域间游走,却并非纯随机噪声,而是受确定性非线性规律约束。对于主动推理来说,这种系统能够生成具有复杂时序结构的感官模式,因此是测试主体如何追踪复杂隐藏原因的理想对象。
5. 广义同步的动力学含义
若两个主体分别对某首鸟鸣的高层状态形成估计 μ₁ 与 μ₂,则理想同步情形可表现为联合轨迹近似束缚在 μ₁ = μ₂ 的低维子空间上。更一般地,不要求严格恒等,只要求二者联合轨迹限制在某个低维流形中。这说明同步的本质不是”完全相同”,而是”存在稳定的低维耦合关系”。从推理角度看,这意味着一方的内部状态足以预测另一方内部状态的变化结构。
6. 离散—连续混合模型的桥接公式
为把离散层中的结果 o_τ 转换为连续层中的隐藏原因 v,作者设定:
P(ṽ | o_τ) = N(η̃_{o_τ}, Π̃_v)
若高层对不同离散结果的后验信念为 Q(o_τ),则连续层先验均值由贝叶斯模型平均给出:
η̃ = E_{Q(o_τ)}[η̃] = Σᵢ o_τⁱ η̃ᵢ
因此:
P(ṽ) ≈ N(η̃, Π̃_v)
这意味着,高层”目标在上方”或”目标在左侧”等离散判断,会被翻译成连续空间中的坐标先验。连续层据此生成具体轨迹,而来自连续感觉流的数据又反过来为高层的离散假设提供模型证据。该桥接机制是混合模型的技术核心。
💡 认知启示
首先,本章把运动控制从”命令执行”重构为”预测实现”,这对理解身体、自我与行动具有深刻意义。主体并不是先在脑中形成一个抽象命令,再把它下发给身体;相反,身体运动是通过不断缩减感觉预测误差而涌现的。行动因此不是认知的附属输出,而是认知本身的延伸形式。
其次,精度与感觉衰减的讨论揭示了一个重要思想:有效行动并不总是依赖更精确的感觉输入。在某些时刻,系统恰恰需要暂时”忽略”部分证据,才能让预测先行并驱动动作。由此可见,理性并非单纯增加对外界的敏感度,而是在适当时刻调节对误差的信任水平。这一思想对于理解注意、能动性、幻觉、精神病性症状以及自我生成的运动经验都非常关键。
再次,Lotka–Volterra 与 Lorenz 系统的引入说明,认知科学不应把时间仅仅理解为离散步骤的排列。许多行为——尤其是运动、节律、交互和发声——本质上具有连续动力学结构。若忽略这一点,就很难解释为什么行为会表现出自然的流动性、相位关系、节奏迁移与自发序列生成。连续时间主动推理的意义,正在于把认知嵌入动力系统的框架中。
进一步地,广义同步为社会认知提供了不同于传统表征主义的视角。理解他人,并不一定意味着在脑中构造一个明确的命题性”他人模型”;它也可以表现为两套动力系统在交互中逐步耦合、共享轨迹、形成共同流形。鸟鸣中的轮流唱和因此不仅是通信行为,也是共同推理和相互建模的过程。这个视角对解释话轮交替、语言互动、模仿、共同注意乃至自闭症中的社交困难都具有启发性。
最后,混合模型强调认知层级之间并不存在绝对断裂。高层规划往往需要离散表示,如目标、策略、阶段;低层执行则依赖连续动力学,如轨迹、速度、肌群耦合。真正成熟的理论必须说明两者如何互译。本章给出的答案是:通过层级生成模型与往返消息传递,把”我该做什么”与”我如何做到”整合进同一个推断架构。就此而言,主动推理不只是一个知觉理论或行动理论,而是一种连接规划、控制与社会协调的统一框架。