《Active Inference: The Free Energy Principle in Mind, Brain, and Behavior》第9章：Chapter 9: Model-Based Data Analysis

第9章：基于模型的数据分析

Thomas Parr, Giovanni Pezzulo, Karl J. Friston

出自：Active Inference (MIT Press, 2022)

📖 章节总结

本章讨论如何将主动推理从理论模型转化为经验研究中的数据分析工具，即通过基于模型的数据分析（model-based data analysis）对被试的选择行为进行反演，以推断其内部生成模型的关键参数。作者强调，这一过程本质上是一种”关于推断的推断”，即元贝叶斯推断（meta-Bayesian inference）：实验对象依据其主观模型进行推断与行动，而研究者则基于一个更高层的客观模型，对实验对象所使用的先验、精度与偏好结构进行反推。

章节首先明确了主观模型与客观模型的关系。被试的主观模型生成其对感觉输入、隐状态与策略的后验信念，并据此产生行为；实验者的客观模型则把这些未知参数 θ 视为待估变量，在已知刺激序列 õ 与观测行为 ũ 的条件下，评估 P(ũ | θ, m, õ)，再结合参数先验 P(θ | m) 得到后验分布。换言之，研究者不是直接解释行为表面特征，而是把行为视为潜在认知参数的可观测结果，由此实现计算表型刻画（computational phenotyping）。

在方法层面，本章介绍了变分拉普拉斯（variational Laplace）作为个体层级模型反演的基本方案。其核心思想是：给定一组参数 θ，将其嵌入被试的 POMDP 或连续状态生成模型中，求解该模型以获得对策略或动作的后验信念，再计算观测到的动作序列在该信念下出现的概率。这个概率就是行为数据的似然。随后，通过高斯先验与拉普拉斯近似，可近似求得模型证据与参数后验模式 μ，从而实现参数估计与模型比较。

在群体层级，本章引入参数经验贝叶斯（Parametric Empirical Bayes, PEB）。个体参数反演完成后，可将每位被试的参数视为二级线性模型的输出，例如考察年龄、疾病状态、药物干预等变量对参数的影响。PEB 的意义不只在于提高统计效率，更在于使研究者能够以层级贝叶斯的方式，把单个被试的计算表型与群体差异联系起来，从而回答”哪些认知参数随年龄变化””哪些病理条件改变了先验精度”等科学问题。

作者进一步给出一个六步式实践流程：收集行为与刺激数据；构建参数化的生成模型；定义似然函数；设定参数先验；用变分拉普拉斯进行个体反演；最后以 PEB 或其他二级分析考察群体效应。这一流程将实验设计、模型构造、参数估计与统计推断整合为统一方法论。作者还特别指出，在真实数据分析前，应进行表面效度检查（face validity）与参数恢复测试（parameter recovery），以验证模型是否能够生成合理行为，以及参数是否具有可辨识性。

章节后半部分通过两个经典案例展示该方法的实际应用。一类是 Adams 等人对平滑追踪眼动（smooth pursuit eye movements）的研究，他们用连续时间生成模型推断个体的精度参数，并将其与神经成像中的突触增益联系起来；另一类是 Mirza 等人基于 POMDP 的视觉搜索任务，通过离散眼跳序列反演偏好精度、认知驱动等参数，并检验期望自由能中认知成分对行为的解释力。这些案例表明，主动推理不仅能拟合行为，还能桥接行为、神经生物学与实验操控。

最后，本章简要延伸到精神病理学。作者指出，许多精神病理现象可以被理解为错误推断（false inference），其根源通常不在于推断机制本身失效，而在于生成模型中先验、精度或结构假设发生异常。由此，基于模型的分析方法的价值不仅在于描述正常认知差异，也在于通过恢复异常先验来刻画幻觉、妄想、成瘾、忽视等病理状态的计算机制。

🧩 核心概念

元贝叶斯推断（meta-Bayesian inference）：研究者对被试的推断过程再做一次贝叶斯推断。被试在其主观模型内推断世界，研究者则在客观模型内推断被试的参数。
主观模型与客观模型：前者是被试实际或假定使用的生成模型；后者是实验者用于解释行为、估计参数并比较模型的统计模型。
行为似然：行为似然不是直接规定的经验分布，而是通过求解被试的主动推理模型后间接得到，即 P(ũ | θ, m, õ)。
计算表型刻画（computational phenotyping）：把个体差异表述为可估计的模型参数差异，例如先验偏好精度、策略精度、似然精度等。
变分拉普拉斯（variational Laplace）：一种基于局部二次近似的变分推断方法，用于估计参数后验模式、后验协方差与模型证据。
模型证据（model evidence）：模型对数据的整体解释力，兼顾拟合优度与复杂度，可用于比较不同理论假设是否更能解释行为。
参数经验贝叶斯（Parametric Empirical Bayes, PEB）：层级贝叶斯分析框架，把个体层参数作为群体层线性模型的因变量，用于评估年龄、组别、药物等因素对计算参数的影响。
贝叶斯模型约简（Bayesian model reduction）：在已完成一次模型反演的基础上，通过修改先验快速比较简化模型，避免重复执行多次完整反演。
表面效度（face validity）：模型生成的虚拟行为在质性上是否像真实被试，是否符合任务结构与理论预期。
参数恢复与可辨识性（parameter recovery / identifiability）：若用已知参数生成模拟数据，再做反演，能否恢复原参数；这是检验模型是否适合经验研究的关键。
错误推断（false inference）：病理行为可视为在异常先验或异常精度结构下产生的”最优推断”，而非简单的随机错误。

🔬 关键公式与推导

1. 行为似然的定义

本章将观测动作序列 ũ 的对数似然写为：

L(θ) = ln P(ũ | θ, m, õ)

其含义是：在给定参数 θ、模型 m 与实验刺激序列 õ 的条件下，观测到行为序列 ũ 的概率。这里的关键点在于，P(ũ | θ, m, õ) 不是预先指定的简单分布，而是由主动推理求解过程导出。

作者进一步指出，动作概率来自对策略的后验信念：

π = arg min F

即被试通过最小化自由能形成对不同策略的后验信念 π。再把策略概率映射到具体动作空间 U，得到动作分布 u。最后再施加一个 softmax 温度或精度参数 θ_α，以刻画模型未解释的行为随机性。θ_α 较小时，行为更接近后验匹配；θ_α 很大时，行为更接近确定性地选择最可能动作。

2. 拉普拉斯近似下的模型证据

在参数先验满足高斯分布时：

θ ∼ N(η, Π⁽¹⁾)

其中 η 是先验均值，Π⁽¹⁾ 是先验精度矩阵。拉普拉斯近似用后验模式 μ 附近的局部二次展开近似后验与模型证据。模型对数证据可写成：

ln P(ũ | m, õ) ≈ L(μ) + ½ εᵀΠ⁽¹⁾ε + ln |∇_μμ L(μ) − Π⁽¹⁾|

其中：

ε = η − μ

这一表达体现了模型证据的三个要点：

L(μ) 反映数据拟合度，即在最优参数附近模型对行为的解释能力；
先验偏差项 ½ εᵀΠ⁽¹⁾ε 体现参数偏离先验的代价；
海森矩阵相关项 ln |∇_μμ L(μ) − Π⁽¹⁾| 体现后验曲率，对应复杂度修正。

与仅做参数估计不同，若要进行模型比较，就必须保留这些与复杂度有关的项，因为一个更复杂的模型虽然可能提高拟合，却未必提高证据。

3. 后验模式更新

为了求得使自由能近似最大化的 μ，本章给出在二次假设下的梯度上升形式：

μ̇ = ∇_μ L(μ) + Π⁽¹⁾ε

这说明参数更新同时受两部分驱动：

∇_μ L(μ)：数据提供的似然梯度，推动参数朝更好解释行为的方向变化；
Π⁽¹⁾ε：先验约束项，推动参数回到先验期望附近。

其思想与预测编码十分类似：后验模式是在”数据误差驱动”与”先验约束”之间取得平衡。若缺少显式梯度，可用有限差分做数值近似；海森矩阵则给出后验精度估计。

4. PEB 的二级线性模型

在群体分析中，个体参数 θ 被视为设计矩阵 X 与回归系数 β 的线性函数：

P(θ | β, X) = N(Xβ, Π⁽²⁾)

这里：

X 的每一行对应一个被试；
第一列常为 1，表示总体均值；
其余列可为年龄、组别、药物状态、训练轮次等解释变量；
β 表示这些变量对参数 θ 的效应大小；
Π⁽²⁾ 表示二级残差精度。

例如，若 θ 是先验偏好精度，则 β 的第一项表示全体被试的平均精度，第二项可表示年龄每增加一单位精度的平均变化量。于是，原本隐藏在行为中的认知参数便被纳入标准但层级化的统计推断框架。

5. 六步反演流程的逻辑结构

作者提出的六步法并非经验性清单，而是完整生成模型的层级展开：

第一步：获得 ũ 与 õ，即观测行为和刺激；
第二步：构造参数化模型 m(θ)；
第三步：用模型求解得到 P(ũ | θ, m, õ)；
第四步：给 θ 指定先验 P(θ | m)；
第五步：由 P(θ | m)P(ũ | θ, m, õ) 反演得到 P(θ | m, õ, ũ)；
第六步：把多个个体的后验参数输入二级模型 θ = Xβ + ω。

其本质是把”个体如何生成行为”与”群体变量如何生成个体差异”连接为一个层级贝叶斯架构。

💡 认知启示

本章最重要的启示，在于它把认知科学中的”解释行为”转化为”反演生成行为的内在模型”。传统行为分析往往停留在反应时、正确率、选择频次等表层指标，而基于模型的数据分析追问的是：这些行为背后，是哪些先验信念、精度设定与认知驱动在起作用。也就是说，真正可解释的对象不是行为本身，而是生成行为的计算结构。

由此，主动推理获得了作为实验方法论的独特价值。它不再只是一个描述性理论，而是一个可用于参数估计、模型比较与群体推断的可操作框架。研究者能够借此区分：某个被试表现差，是因为偏好精度低、状态转移不确定、信息增益驱动弱，还是因为动作选择中的随机性较高。这种区分使”同样的错误行为”能够被分解为不同计算来源。

第二个启示是，认知差异与病理差异可以被统一表述为参数差异。年龄、教育、药物、训练、疾病状态等因素，并不只是外部标签，而是通过改变生成模型的某些精度、偏好或结构，具体地影响行为。这使计算精神病学成为可能：精神病理不再只被描述为症状集合，而可被理解为异常先验、失衡的精度加权、或受损的信息采样策略。

第三个启示是，认知模型的科学价值取决于其可反演性。一个理论模型若只能生成有趣模拟，却不能稳定恢复参数、不能比较替代理论、不能外推到群体差异，那么它在经验研究中的用途有限。因此，本章特别强调参数恢复、表面效度与基于证据的模型比较，实际上是在提出一种更严格的理论评估标准：好模型不仅要”讲得通”，还要”反推得回”。

最后，本章也深化了主动推理的统一性主张。此前章节主要说明有机体如何利用生成模型感知、行动与学习；本章则反过来展示，科学家也可以用同样的贝叶斯机制去推断有机体所使用的生成模型。换言之，主动推理不只是一种行为理论，也是一种研究行为的元理论。它使实验科学家能够以结构同构的方式研究主体本身：被试在做推断，研究者也在做推断；差别只在层级不同。正是在这一意义上，基于模型的数据分析成为主动推理从哲学框架迈向可检验科学程序的关键桥梁。

相关文章：