Dynamic Patterns 读书笔记 · 第7章:Perceptual Dynamics

Chapter 7: Perceptual Dynamics

J. A. Scott Kelso

From: Dynamic Patterns: The Self-Organization of Brain and Behavior (MIT Press, 1995)

📖 总结

本章的核心问题,不是”知觉的内容是什么”,而是:知觉本身是否服从动力学。Kelso 要把知觉研究从”表征了什么”的静态追问,转向”知觉如何在时间中形成、维持、失稳与切换”的动态追问。换言之,知觉不是一个终端结果,而是一个完整经历稳定(stability)→ 失稳(instability)→ 跃迁(transition)→ 再组织(reorganization)的自组织过程。

开篇引用洛克的名言——”心灵无法长久固定于一个不变的观念”——已点出全章基调:知觉天然就是流动的。

作者首先架起一座理论之桥:一端是 Gibson 的生态心理学(ecological psychology),强调环境中可直接获取的高阶信息与可供性(affordance);另一端是格式塔(Gestalt)传统,强调神经系统自身把刺激组织为”整体”的内在倾向。Kelso 的立场不是折中调停,而是提出:动物—环境耦合是动力学的,支撑知觉的神经组织同样也是动力学的。因此,知觉研究既不能只盯着刺激,也不能只盯着脑内表征,而必须研究跨尺度的模式形成。他坦言,任何试图统一两大理论阵营的尝试注定失败,但他相信双方共享本质性的动力学特征。


知觉动力学 I:意义的屏障——环境中的信息

前半部分可称为”Perceptual Dynamics I”,主题是”意义如何跨越刺激与行动之间的鸿沟”。Kelso 先讨论表征主义的困境——Ulam 痛恨那种把世界属性存进头脑中的”小人模型”,Gibson 则用”可供性”直接绕开了内部表征的需求。两人殊途同归地认为:知觉不是从无意义的感觉素材中拼凑意义,而是在动物—环境关系中直接获取意义。

光流场/optic flowfield。 Kelso 沿 Gibson 的路线展开:当观察者在环境中移动时,视觉阵列中会形成整体流动结构——向前走时所有向量从一个点辐射扩张,后退时向一个点汇聚收缩。这就是光流场。它包含了关于运动方向、速度、障碍物和碰撞的高阶信息,而且这些信息是被指定的(specified)而非被表征的(represented)。他引用《星球大战》中穿越森林的追逐场景来说明:那就是纯粹的光流体验。

τ/tau(接触时间)。 Lee 与 Reddish 对塘鹅(gannet)俯冲入水的经典研究,是全章最精彩的例子之一。塘鹅从巡航高度俯冲,时速可达 55 英里,入水前一瞬间把翅膀急速后掠,形成流线型”矛头”姿态。原理上,鸟可以利用高度、速度、加速度等众多物理变量来监控行为。但 Lee 和 Reddish 发现,即使从不同高度起跳,塘鹅始终只依赖一个光学参量——τ(t)——来精确计时。τ 的几何定义非常简洁:在恒定逼近速度下,τ = r/v(r 为视网膜上某纹理元素到光流中心的距离,v 为其光学速度)。从极其丰富的微观描述中,压缩出一个宏观变量,鸟对它极其敏感。

τ̇(tau dot)。 光流的另一个宏观参量是 τ 的变化率 τ̇,它区分接触的”软硬”。τ̇ > −0.5 意味着柔和着陆;τ̇ < −0.5 意味着硬碰撞——因为减速不够快,就会撞上去。Kelso 把 τ̇ 类比为 Bénard 对流中的 Rayleigh 数:不同的 τ̇ 值划分出不同的行为情境。任何恒定 τ̇ 在 −1.0 ≤ τ̇ ≤ 0 范围内的逼近方式都能以零速度到达目标,但 τ̇ < −0.5 的方案要求指数级增加的制动力,实际上不可行。

Kelso 把塘鹅的行为明确纳入协调动力学(coordination dynamics):翼位姿态可视为序参量(order parameter),具有两个稳定态——巡航的张翼姿态与俯冲的矛头姿态;光流扩张率则充当信息性控制参量(control parameter)。当 τ 达到临界值,系统发生相变(phase transition),从一种姿态切换到另一种。行为动力学在光流扰动(如阵风)或行为变量扰动下保持稳定。这里真正值得注意的不是某个实验细节,而是方法论:知觉—行动耦合可以像步态转换一样,被写成稳定态与分岔的问题。

摇摆房间/swinging room。 房间墙壁仅以 6 毫米的幅度、约 4 秒的周期轻微摆动(地板不动),就能在受试者身上诱发同步的姿势摆动。这个经典实验通常被用来证明光流对运动控制的强影响,但 Kelso 看到更深的一层:这里并非简单的”视觉输入→运动输出”因果链,而是形成了一个行动—知觉模式(action-perception pattern)。在这个模式中,真正有解释力的变量不是单独的身体位移或单独的房间位移,而是环境振荡与身体摆动之间的相对相位(relative phase)——又是我们的老朋友序参量。遗憾的是,这项经典研究使用的不稳定性指标仅仅是躯干平均速度(只参考了行动者一侧),也没有系统操纵控制参量(如摆动频率和幅度)来揭示完整的协调动力学。但方向已经清楚:前几章发展出的所有方法——波动、弛豫时间、切换时间——都可以拿来量化视觉与行动之间的耦合。

两个核心要点:第一,稳定性这一动力学概念再次处于理解动物—环境关系的核心;第二,知觉侧和行动侧各自的海量自由度,可以被压缩为一个任务特异的宏观集体变量——相对相位——来刻画两者之间的耦合。

直接知觉的神经支持。 Gibson 主张”直接知觉”不需要神经表征的中介——知觉是从环境阵列中获取信息的活动,而非对脑状态的内省。但这不意味着神经系统不”支持”知觉,只是这种支持功能不是”加工视觉信息”。Kelso 认为值得注意的是,多种动物确实拥有对逼近碰撞选择性响应的专门神经结构——鸽脑的圆核(nucleus rotundus)、灵长类视觉皮层的内侧上颞区(MST)——这些发现在他看来恰好为 Gibson 学派所强调的知觉事实提供了神经层面的支持。他呼吁 Gibson 学派的新一代研究者全面拥抱知觉的神经基础,否则将错失良多。

可供性动力学/affordance dynamics。 Kelso 欣赏 Gibson 把”可攀爬、可穿越、可抓握”等性质理解为动物—环境关系而非纯客体属性的思路,但他指出:既有研究大多停留在功能描述层面,尚未真正建立可供性的动力学。

William Warren 关于楼梯可攀爬性(climbability)的研究因此格外关键。如果用踏步高度 R 与腿长 L 的比值 P = R/L 来刻画楼梯与身体的匹配关系,那么”可正常迈步攀登”和”不得不四肢并用攀爬”之间的边界就不取决于绝对高度,而取决于这个无量纲比值。用生物力学模型计算:当 P 值过高、攀爬者无法将重心移过支撑脚上方时,双足步行就必须切换为四肢攀爬——临界值 Pᶜ = 0.88。实验验证了这一点:两组身高差异悬殊的受试者(163 cm vs 193 cm),用绝对高度衡量时判断差异显著,但换算为无量纲比值后完全一致,且临界值恰好是 0.88。

更进一步,Warren 问:人能否感知攀爬的代谢成本?用可调节的电动阶梯测量不同踏步高度的能量消耗,找到最低代谢成本对应的最优比值 P₀ = 0.26。当受试者被要求判断哪种楼梯”爬起来最舒服”时,其判断——只有在按腿长归一化后——精确吻合实际代谢测量的最优值。

这些结果意义重大:知觉分类不是把世界映射进某套抽象坐标系,而是围绕身体尺度与行动能力形成的。感知到的类别边界对应系统的临界点;感知到的偏好对应系统的最优点。 两者都具有尺度无关性。此后,坐、抓握、够取等活动中也发现了类似的、与行动成分相关的临界不变关系。

但 Kelso 也坦承一个未完成的任务:可供性研究至今仍是静态的功能描述,给出了候选控制参量(如 P 比值),却还没有识别出序参量,也没有系统考察波动、弛豫、分岔与滞后。真正的分岔研究——系统性操纵控制参量、识别集体变量及其动力学——仍有待开展。

他在这一节的结尾写道:光学阵列中充满了活的结构——表面的增生与删除、物体的创建与摧毁。知觉系统对光流场的几何结构及其动力学性质(不动点、临界值等)极其敏感。我们人类和所有能看的生物,都像河中的石头一样沉浸在光流场中。正如涡流、涟漪在流体运动中涌现和消逝,光流场也在我们有意地移动时揭示出意义深远的事件——断崖、通道、开口、碰撞。


知觉动力学 II:知觉系统自身的内在组织

本章中段进入”Perceptual Dynamics II”,主题从”环境中的意义”转向”知觉系统自身的组织”。这里 Kelso 重新接通格式塔传统,但不满足于”整体大于部分之和”的经典口号,而是要把格式塔现象改写为可实验、可建模的动力学问题。

格式塔心理学的核心主张是:知觉不是原始感觉的拼接,而是场景或物体的各部分按照邻近性、相似性、闭合性、良好延续等分组规则被组织为整体(Wertheimer、Köhler 的经典图示)。Rock 和 Palmer 还新增了”共同区域”和”连通性”规则。Kelso 认为这些现象确实指向知觉中的自发秩序形成,但格式塔学派的解释并未超越现象本身——需要用自组织动力系统的概念来提供形式化框架。

核心判断是:知觉分类(categorization)不是静态归类,而是多稳态(multistability)支撑的模式选择过程。类别就是吸引子(attractor),类别边界就是吸引盆(basin of attraction)之间的分界。 正如马的不同步态构成范畴性不同的协调模式——我们看到一匹马在动,就能立刻把它的行为识别为慢步、快步或飞奔——知觉分类也是一种把连续变化的信号分拣进稳定模式的动态过程。

Glass pattern(随机点莫尔纹)。 在一张布满随机墨点的透明片上叠加同一张纸的复制品,再施加微小变换(旋转、平移、缩放),就能看到全局图案从随机中涌现:旋涡、螺旋、辐射、鞍点……这些基本原型可由一组简单的微分方程生成:

dx/dt = ax + cy

dy/dt = dx + by

通过指定不同的参数组合(如 a=1, b=−1, c=d=0 得到鞍点;a=b=1, c=d=0 得到退化节点;等等),可以产生四种基本原型。有趣的是,这些静态图案会给人强烈的运动印象,而且它们的全局形式恰好对应光流的分量,暗示着共同的数学起源。Kelso 提出一个引人入胜的问题:顶叶皮层中对径向运动选择性放电的神经元群,是否也会对仅仅给出运动印象的静态图案放电?

Kelso 与 Horvath 通过顺序呈现”从无序到有序”与”从有序到无序”的刺激序列,每帧显示约半秒后要求受试者判断”随机还是有序”,发现了三类截然不同的知觉现象:

  • 临界边界(critical boundary):知觉仅取决于当前呈现的图案,与呈现方向无关。出现频率约 7%。
  • 滞后(hysteresis):从无序走向有序时,需要更大的参数值才能感知到秩序(反向则更容易保留秩序感)——体现路径依赖与非线性多稳态。这是最主要的效应,出现频率约 72%。
  • 增强对比(enhanced contrast):边界向反向偏移,使两类知觉的差异被放大,而非保守地维持原类别。出现频率约 21%。

这三种现象的重要性在于:它们不是刺激本身的属性,而是知觉过程的属性。尤其滞后现象意味着:同一物理刺激在不同历史路径下会落入不同吸引子,直接反驳了把知觉视为对当前输入一次性、无记忆映射的观点。

视动四元组/motion quartet(表观运动)。 Hock 等人使用另一个经典范式进一步推进了论证。四个点光源排列成矩形的四角,对角线上的两对交替闪烁,在适当的时间参数下会产生两种知觉:水平运动或垂直运动。通过改变矩形的宽高比(aspect ratio)作为控制参量,知觉会从一种状态切换到另一种。

七组精心设计的实验揭示了两条关键证据。第一,在类别边界附近固定控制参量、让显示”空转”,自发切换的概率急剧上升——这是原有知觉稳定性下降的直接体现。第二,滞后区间的大小依赖于控制参量的变化速率:变化越慢,系统在双稳区停留越久,受波动驱动的自发切换概率越高,滞后反而减弱。这与非线性动力系统的预测高度一致:稳定态的持续、稳定性的丧失、噪声诱发的跃迁——构成了知觉形成与切换的基本机制。

不久前,知觉中的滞后还被当作不明原因的”顺序效应”或”近因效应”而受到回避。如今看来,滞后与多稳态非但不是难以处理的异常,反而打开了检测人脑中与知觉及知觉转换相对应的神经事件的全新可能。

语音分类/speech categorization。 Tuller、Ding 与 Kelso 把同样的动力学思路推广到语音知觉。他们使用 “say—stay” 连续体:逐步改变辅音 “s” 之后的静音时长(以 4 毫秒为步长,从 0 增加到 76 毫秒再减回 0),考察受试者何时把听到的音节从 “say” 判为 “stay”。与 Glass pattern 和 motion quartet 的结果完全平行,三种分类模式再次出现:临界边界(17%)、滞后(41%)、增强对比(42%)。

势函数模型。 作者据此提出一个统一的理论模型:

V(x) = kx − x²/2 + x⁴/4

其中 x 表示被感知到的类别形式,k 是控制参量——随实验操纵的刺激参数(如静音时长、宽高比、Glass pattern 的演化位置)而连续变化,倾斜势阱(potential landscape)。

随着 k 改变,势景观经历以下过程:当 k 很小时,只有一个稳定极小值,对应单一知觉类别;k 增大后,通过鞍结分岔(saddle-node bifurcation)出现新的吸引子——一个点吸引子和一个点排斥子同时诞生,两种知觉共存;k 继续增大至临界值 kc 时,原有吸引子通过反向鞍结分岔消失,只剩下新类别。

随机扰动(对应疲劳、注意、无聊等因素)使得系统在双稳区内可能发生自发切换——吸引子越浅越平,切换概率越高。这就解释了为什么在边界附近重复呈现同一刺激时,类别变化的概率会增大。

k 对实验参数的依赖并非简单的线性关系,而受到初始条件、已感知刺激的数量 n、以及认知因素 ε(学习经验、注意等)的调节。在 ε − λ(λ 与静音时长线性相关)参数空间中,可以画出完整的相图:临界边界对应 ε = εc 的特殊值;ε > εc 时出现增强对比;ε < εc 时出现经典滞后。若受试者同时表现出滞后和增强对比,重叠区应当较小;若只表现其中一种,区间应较大——实验证实了这一预测。模型还预测:自发类别切换只应发生在双稳区内;重复呈现同一刺激会使切换更早出现——这些预测同样被实验验证。

这个模型的意义非常大:它表明视觉与语音这些看似迥异的知觉任务,服从同一套通用动力学机制


分类脑:滞后效应打开的神经科学窗口

滞后效应提供了一个极其珍贵的实验机会:物理刺激完全相同,知觉却不同。 这意味着可以把与刺激本身相关的脑活动,从真正对应”知觉类别”的脑活动中分离出来。

Kelso 团队使用多传感器 SQUID(超导量子干涉器件)阵列记录人脑神经活动。SQUID 直接拾取脑内细胞内树突电流产生的磁场信号,无需植入电极,也无需在头皮上贴电极——因为颅骨和头皮对脑内磁场透明。阵列放置在左侧听觉诱发电位场上方(由磁共振图像引导确定位置)。

在 “say—stay” 范式中,当静音时长为 32 毫秒时,同一声学刺激被 50% 感知为 “say”、50% 感知为 “stay”。对 37 个传感器分别按两种应答进行平均,结果发现:直到元音结束(vowel offset)之前,两种知觉对应的脑场分布差异极小。但元音结束后数毫秒,阵列后部出现了显著的场幅差异——同一物理刺激,不同的知觉类别,不同的脑活动模式。到刺激末尾,场分布又趋于一致。

这一结果虽属初步,但据作者所知,这是首次直接发现与语音知觉类别变化相对应的脑活动模式。更广泛地说,在输入恒定而知觉切换的条件下研究大脑——无论用大型 SQUID 阵列、多通道 EEG 还是功能性 MRI——都是理解知觉组织神经基础的强大范式。


相关理论模型:随机共振、神经网络与协同计算机

Kelso 简要对比了几类模型:

随机共振(stochastic resonance)。 Frank Moss 阐明的核心思想是:在多稳态非线性系统中,适量的噪声反而能增强弱信号的检测。想象双阱势被轻轻周期性倾斜,幅度始终低于势垒——没有噪声时系统不会跳转;噪声太大则响应随机化;在两者之间存在一个最优噪声水平,使切换与周期调制最大化地同步。螯虾的单个机械感受神经元已被证实具有此效应。Chialvo 和 Apkarian 用 Fisher 的”男人—女孩”双关图序列作为噪声双稳系统研究知觉,发现驻留时间的统计特征与随机共振模型一致。但 Kelso 指出:神经系统是否真的能自主控制和优化自身的噪声水平以服务知觉,目前缺乏充分证据。此外,随机共振模型还需要解释临界边界和增强对比等效应。

神经网络。 Anderson 的”盒中脑态”(brain-state-in-a-box, BSB)模型:神经元通过可修改的突触权重反馈连接,激活模式被限制在超立方体内,稳定的角(corner)对应分类结果——本质上是提取最大特征值和特征向量的分类算法。通过修改权重可模拟多稳态知觉和滞后效应。Carpenter 和 Grossberg 的自适应共振理论(adaptive resonance theory)以及 Williams 等人的合作神经网络也属于此类。

协同计算机(synergetic computer)。 Ditzinger 和 Haken 从协同学的自上而下路径出发,将模式识别类比为模式形成。原型模式构成低层特征空间中的吸引子,系统接收到输入后被拉向最近的吸引子——识别即完成。控制方程与激光、对流流体等自组织系统完全同构。特别值得注意的是:通过引入时间依赖的注意参量及其随机波动,该模型能重现大量已知的知觉现象——包括可逆图形的振荡知觉、Necker 立方体切换时间分布等。虽然作者不声称生物相关性,但协同学能从其方程中反向重建实现这些效应的底层神经连接网络(含耦合强度),这本身就很有启发性。

Kelso 留下一个意象:想象一片由复杂交织的神经组织编织而成的、不断演化的吸引子景观。网的张力和纤维位置受激活与抑制模式的调控,不断塑造着吸引子布局——而这个布局代表着脑中大尺度、亚稳态的神经元活动模式。


心智的亚稳态:双关图形与间歇性

如果说前面的工作揭示的是”知觉如何在多个吸引子之间切换”,那么全章最具前瞻性的部分则转向一个不同的问题:当刺激恒定不变时,知觉为何仍会自发切换?

Necker 立方体实验。 Kelso 与 Holroyd 系统研究了 Necker 立方体的知觉翻转行为。这个二维线框图可以被看成”前面朝上”或”前面朝下”两种三维取向,持续注视时知觉会在两者间来回切换。实验的关键操纵是:改变立方体的取向角,使它逐渐接近平面(近乎扁平的六边形或正方形),从而降低图形的歧义性。

结果发现:随着图形接近平面,切换时间(驻留时间/dwell time)的分布发生显著变化——尾部明显拉长。也就是说,偶尔会出现很长时间不切换的情形,但更频繁的是短暂驻留后快速切换。时间序列呈现一种特征模式:成簇的快速切换与延长的静止期交替出现,没有明显的周期规律。

早期研究者(如 Borsellino 等人)注意到受试者会”卡住”(在一种知觉上停留很久),因此将超过均值三个标准差的驻留时间作为离群值丢弃。Kelso 认为这种做法十分危险——这些”离群值”恰恰可能是在告诉我们知觉动力学最有价值的信息。

间歇性模型。 Kelso 不满足于用”随机噪声”来解释这些分布,而是用前几章发展出的相位吸引映射(phase attractive map)来建模。其核心思想是:把刺激参数(Necker 立方体的取向)映射为映射函数距 45° 对角线的间距。当函数曲线接近但不穿过对角线时——也就是系统接近但不进入频率和相位锁定态——迭代轨道被困在窄通道中缓慢移动,然后突然逃逸、重新注入。这就是间歇性(intermittency),发生在切触分岔(tangent bifurcation)或鞍结分岔边缘。

系统越接近锁定态(对应于一个无歧义的、稳定的知觉),在通道中驻留的时间就越长,分布尾部就越重——与实验数据的吻合相当有说服力。

这一机制的深刻含义在于:知觉切换不需要外力把系统从一个牢固稳态推出——切换本身就内建于神经协调动力学之中。 系统并非住在刚性吸引子里偶尔被噪声弹出,而是天然处于亚稳态(metastability)——吸引与排斥力量精细平衡的边缘。因此,系统既能短暂维持一个知觉,又能灵活退出并切换。


知觉的四种图景:计算、沉降、共振、闪烁

在全章的理论收束中,Kelso 对比了几种知觉机制:

  • Calculating(计算):建构主义(constructivism)路径——通过表征、推断和假设检验来”算出”知觉。Marr 是最显明的代表,以计算机实现作为理论有效性的证据。但它面临无穷回归的困境:假设需要被解释,解释又需要被解释……
  • Settling(沉降):格式塔与能量极小化网络——知觉是大规模神经网络中达到能量极小平衡态的过程。Köhler 强调”等终性”(equifinality):从不同初始条件出发达到同一终态。无需特殊的执行者。
  • Resonating(共振):Gibson 式对环境不变量的”共振”——知觉系统像调谐收音机一样与光学阵列中的不变量共振。巧合的是,脑中确实有一种被提议的知觉机制与之呼应——视觉皮层中属于同一物体的特征通过相位与频率同步(神经共振)来绑定。
  • Twinkling(闪烁):Kelso 自己提出的核心图景——依靠间歇性与亚稳性维持灵活性。

沉降和共振分别对应动力系统中的不动点吸引子和极限环吸引子。但本章引入的新维度是:知觉动力学还可以是亚稳的。在这种状态下,吸引(稳定化)和排斥(去稳化)的影响以精细平衡的方式共存,严格来说系统根本不存在渐近稳定性。这是必要的——否则心灵要么会被卡住,要么会飞散。

知觉之所以能够灵活、敏感、依赖上下文,又不至于崩解,正因为神经系统不追求绝对稳定,而是停留在稳定与不稳定之间的边缘。


从全章来看,Kelso 要做的不是提出一个封闭的知觉总理论,而是改写知觉科学的问题提法:不要再把知觉看作输入→编码→表征→解码的静态流水线,而要把它看作一个多尺度自组织系统——其中环境不变量、身体约束、行为模式与神经动力学共同塑造知觉的生成与切换。若用本书一贯的语言说:知觉不是世界在脑中的复制品,而是动物—环境—神经系统共同形成的动态模式。

🔑 概念速查

  • 知觉动力学/perceptual dynamics:把知觉理解为随时间演化的模式形成过程,而非静态表征结果;核心问题是稳定性、切换、分岔与历史依赖。
  • 集体变量/collective variables:从高维刺激与高维神经活动中压缩出来的、对功能最关键的低维变量,如 τ、相对相位等。
  • 序参量/order parameter:表征系统整体组织形态的宏观变量。在知觉—行动耦合中,它刻画模式本身,而非局部成分。
  • 控制参量/control parameter:外部或内部缓慢变化、驱动系统失稳与重组的变量,例如光流扩张率、矩形宽高比、语音静音时长。
  • 光流场/optic flowfield:观察者与环境相对运动时在视觉阵列中形成的整体流动结构,包含关于方向、速度、障碍与碰撞的高阶信息。
  • τ/tau(接触时间/time-to-contact):由光流几何直接指定的”接触剩余时间”变量;恒定逼近速度下 τ = r/v。
  • τ̇/tau dot:τ 的变化率,区分接触的”软硬”——τ̇ > −0.5 为柔和着陆,τ̇ < −0.5 为硬碰撞。Kelso 将其类比为光流中的 Rayleigh 数。
  • 可供性/affordance:环境对特定机体而言”可做什么”的性质(可攀爬、可穿越、可抓握等),本质上是动物—环境关系,不是客体单独属性。
  • 无量纲比值/dimensionless ratio:如 P = R/L(踏步高度/腿长),按机体尺度归一化环境属性,揭示真正的临界边界。Pᶜ = 0.88 为可攀爬性临界值,P₀ = 0.26 为最优舒适值。
  • 临界点/critical point:系统从一种知觉或行动模式跃迁到另一种的边界位置。
  • 多稳态/multistability:同一刺激条件下,系统存在两个或多个可维持的知觉状态。
  • 滞后/hysteresis:知觉切换点依赖参数变化方向,体现路径依赖与系统记忆。
  • 增强对比/enhanced contrast:类别边界向相反方向偏移,使两类知觉差异被放大。
  • 吸引子/attractor:系统动力学长期趋向的稳定状态;在本章中常对应一个可感知类别。
  • 吸引盆/basin of attraction:初始条件位于此区域的轨道最终会收敛到对应的吸引子。
  • 鞍结分岔/saddle-node bifurcation:一对稳定/不稳定不动点同时生成或湮灭——类别形成与消失的核心机制。
  • 势景观/potential landscape:用势函数 V(x) 形象化表示类别吸引子的深浅、共存与消失。
  • 类别化/categorization:在连续刺激维度上,系统落入某个稳定知觉模式的过程——不是静态贴标签,而是动态的模式选择。
  • 亚稳态/metastability:系统既有局部凝聚倾向,又不会永久锁死于单一稳态;能短暂停留,也能快速切换。
  • 间歇性/intermittency:系统在近稳定驻留与快速逃逸之间交替出现的动力学机制,产生长尾驻留时间分布。对应切触分岔或鞍结分岔边缘的行为。
  • Twinkling(闪烁):Kelso 对知觉/神经系统亚稳动态的核心隐喻——不是”死在稳态里”,而是在临界边缘灵活地组织与解组织。
  • Settling / Resonating / Twinkling:分别对应”沉降到稳态””对不变量共振””在亚稳边缘闪烁切换”的三种知觉动力学图景。
  • 随机共振/stochastic resonance:多稳态非线性系统中,适量噪声反而增强弱信号检测的现象。
  • 协同计算机/synergetic computer:Ditzinger 和 Haken 基于协同学、将模式识别视为模式形成的自上而下计算模型。

金句

  • 🧠 知觉不是世界在脑中的复制,而是动物—环境—神经系统共同生成的动态模式。
  • 🌊 光流场之于视觉,正如涡流之于流体:不是杂乱刺激的堆积,而是充满结构、临界点与不变量的活动介质。
  • 🪜 “可攀爬”不是楼梯的属性,也不是身体的属性,而是楼梯与身体按尺度耦合后显现出来的关系属性。
  • 🔁 同一刺激可导向不同知觉——这不是实验噪声,而是知觉系统本身具有历史依赖与多稳态的证据。
  • 🎧 类别边界不只是刺激阈值,更是吸引子布局变化时稳定性丧失的位置。
  • ⚖️ 真正灵活的知觉系统,不住在绝对稳定里,而住在稳定与不稳定之间。
  • Kelso 所谓的 twinkling,实质是说:心智若想不僵死,就必须保持亚稳。
  • 🔬 丢弃”离群值”可能正是把最有理论价值的动力学窗口扔进了垃圾桶。

🔗 跨学科联系

  • 与生态心理学/ecological psychology 的联系

本章最直接延续 Gibson 的思想:信息不是贫乏的、等待内部补全的,而是以高阶结构存在于环境中。但 Kelso 比 Gibson 更进一步:他要求把”直接知觉”写成真正可实验检验的动力学,而不仅仅停留于哲学立场。他也呼吁 Gibson 学派拥抱神经科学——用 Gibson 自己的话说,”除了神经系统,没有别的通道去接触或认识环境。”

  • 与格式塔心理学/Gestalt psychology 的联系

格式塔强调整体先于部分、组织先于元素,Kelso 则用吸引子、多稳态、分岔、滞后为这套直觉提供形式化框架。Köhler 的”脑作为趋向平衡的热力学系统”被拓展为更丰富的非线性动力学图景——不止是沉降,还有间歇与闪烁。

  • 与认知科学中的表征主义/representationalism 之争

传统建构主义认为知觉靠内部表征、推断和心理模拟来弥补输入的不确定性。Kelso 的批评不是”表征一定不存在”,而是:若只从表征计算角度理解知觉,就会忽略稳定性、路径依赖、历史效应和自发切换这些一等现象。这对今天的预测加工(predictive processing)与主动推断(active inference)也有启发:若要做得更完整,必须把”预测误差最小化”与真正的多稳态动力学结合起来。

  • 与动力系统理论/dynamical systems theory 的联系

本章把知觉正式纳入前几章建立的统一框架:序参量、控制参量、分岔、吸引子、临界波动、间歇性。这意味着知觉、行动、学习、发展并非彼此分裂的模块,而同属自组织系统的不同表现层级。

  • 与神经科学/neuroscience 的联系

作者讨论了 MST 等对逼近运动敏感的脑区、V2/V4 和颞下皮层对复杂图案的选择性响应、SQUID 记录揭示的”同刺激、异知觉”脑活动差异。更前瞻的是其对神经同步(neural synchrony)与亚稳态的强调——猴视觉皮层中的相位锁定振荡被解读为绑定刺激特征的方式——这些观点后来在大尺度脑网络研究、MEG/EEG 微状态、功能连接动态重构中都成为关键议题。

  • 与人工神经网络/ANN 和模式识别的联系

Kelso 对比了 BSB(盒中脑态)、自适应共振理论(ART)、协同计算机等模型,指出知觉可以被建模为吸引子景观中的模式识别。但他的标准比”能分类就行”更苛刻:模型能否解释滞后、增强对比、自发切换、长尾驻留时间这些动力学现象?

  • 与机器人学/具身智能/embodied intelligence 的联系

τ、光流、可供性、尺度归一化这些概念,对机器人导航、避障、抓取与环境交互极具启发性。特别是可供性的无量纲表述提醒我们:智能体不该只学习”世界模型”,还应学习”世界对我可做什么”的关系结构。

  • 与复杂系统和临界性/criticality 的联系

Kelso 的 twinkling 实际上预示了一种近临界工作机制:系统不在僵硬秩序中,也不在无序噪声中,而在两者边界维持高灵敏度与高可塑性。这与后来复杂脑理论中关于混沌边缘(edge of chaos)、临界脑假说(critical brain hypothesis)的讨论高度呼应。

  • 与哲学中的意义问题/meaning 的联系

本章小标题 “The Barrier of Meaning” 很关键。Kelso 想说明:意义不是知觉完成后再附会上的解释,而是在动物—环境耦合与神经组织中被动态生成的。钥匙之所以是钥匙,不在于脑中存储了它的图像,而在于它在使用情境中的功能角色——正如 Ulam 所强调的。这使知觉研究从”如何从无意义刺激中提取意义”转向”意义如何在关系与动力学中直接显现”。

  • 与方法论的联系

本章反复强调:不要把”顺序效应””近因效应””离群值”当作实验噪声草率剔除。Borsellino 等人丢弃超过三个标准差的驻留时间,也许正好扔掉了间歇性动力学最有价值的证据。如果只追求平均值和稳态,往往会把最有理论价值的时间结构抹掉。


一句话收束: 第七章的真正贡献,是把知觉从”被动接受刺激”或”内部计算表征”的二元框架中解放出来,改写为一个跨越环境、身体与大脑的自组织、可分岔、具亚稳性的动态过程——知觉系统最本真的状态,不是稳定,而是闪烁。

滚动至顶部