《Choices, Values, and Frames》第36章 Economic Preferences or Attitude Expressions?

Chapter 36: Economic Preferences or Attitude Expressions?

Daniel Kahneman, Ilana Ritov & David Schkade

From: Choices, Values, and Frames (Cambridge University Press, 2000)

📖 总结

1）问题意识：公共物品的“美元价值”究竟测到什么

本章直面一个在环境经济学与公共政策评估中极具分量的难题：在条件价值评估法（CVM）中，人们被要求对公共物品（尤其是非使用价值，例如“濒危物种的继续存在”）给出以美元计的陈述愿付意愿（SWTP/WTP）。传统（新古典）经济学立场倾向于把这些美元回答视为个体偏好序中可读出的“经济偏好”，从而可以纳入消费者理论与成本—收益分析。

作者提出相反的核心论断：在公共议题上，美元回答通常更像是态度（attitude）的表达，而不是对稳定经济偏好的测量。也就是说，受访者并非在做“像市场购买那样”的权衡，而是在把对议题的好恶、道德情感与政治立场，翻译成一种看似精确的货币语言。

2）理论转换：从“偏好”到“态度—情感性估价”

作者借用社会心理学中的态度概念，将其定义为“以一定程度的赞成/反对来评价某实体的心理倾向”。态度的核心是情感性估价（affective valuation）：对对象产生自动化的正/负情绪反应，并带有强度。

这一框架的重要含义在于：

态度的对象远超“商品束”，包括抽象理念、社会群体、公共事件、道德评价等。
态度针对的是心理表征而非客观状态，因此天然具有框架效应与非外延性（violations of extensionality）：同一事实的不同描述可唤起不同情感价值。
态度并不要求像经济偏好那样形成全局一致、可加总、可外推的偏好序。

3）核心解释策略：把CVM“异常”视为态度表达的必然产物

在CVM研究中长期困扰经济学家的若干“异常”（scope不敏感、不同提问格式给出不同WTP、偏好反转、回答噪声极大）在作者看来并非“技术瑕疵”，而是态度表达的心理规律在美元量表上投射出的系统后果。

作者进一步用陪审团惩罚性赔偿金（punitive damages）的研究作为类比：陪审员同样被要求把对企业行为的愤怒/道德谴责转译为美元金额。两类情境在经济分析中毫不相干，但在“态度表达—美元标度”框架下却高度同构，且出现高度相似的心理现象，这增强了论证的一般性。

🧪 关键实验与发现

1）“评价因子”：多种态度指标与美元回答高度相关

作者首先展示一个核心经验事实：对同一组公共议题，重要性评分、政治支持、道德满足感预测、WTP等看似不同的指标，往往共享一个强的共同因子——评价/好恶（evaluation）。

Kahneman & Ritov（1994）研究37个公共议题：以新闻标题+干预方案呈现，分别用四种反应量表测量（SWTP、政治支持、贡献的满足感、问题重要性）。结果显示：以均值排序后的秩相关在不同量表间很高，接近各量表自身信度。
Payne et al.（1999）对5个环境议题，用SWTP与多种0–10评分量表交叉测量，得到类似的高秩相关。

关键解释：这些指标之所以一致，不是因为都在测同一个“效用函数”，而是因为都在表达同一个情感性估价。

2）惩罚性赔偿的类比证据：美元只是“愤怒/谴责”的另一种表达

Kahneman, Schkade & Sunstein（1998）构造28个产品责任案例，分别测：

“行为有多离谱/令人愤慨”（7点评分）
“应当多严厉惩罚”（7点评分）
“应判多少惩罚性赔偿”（美元）

三者在案例层面的排序相关很高，表明愤怒（outrage）这一情绪反应支配了不同表达形式，包括美元。

但与此同时，细分实验也显示：

伤害严重程度会影响“惩罚意图/美元赔偿”，但未必影响“愤怒评分”（因为愤怒可独立于后果）。
公司规模会影响美元赔偿（“多大金额才算惩罚”），却不影响愤怒或惩罚意图。

含义：美元回答既受情感核心驱动，也受表达形式特有因素（如“惩罚需要多大钱”）影响。

3）嵌入/范围不敏感（scope insensitivity）：数量变化巨大，WTP几乎不变

作者把CVM中的范围问题解释为“原型估价”导致的“外延忽视（extension neglect）”。

经典例子（Desvousges et al., 1992）：

每年淹死在油池中的候鸟数量分别为2,000 / 20,000 / 200,000；若用网覆盖可避免死亡。
平均WTP约为80、78、$88，几乎不随数量增长而增长。

类似发现也出现在：

清理部分湖泊 vs 全省湖泊（WTP差异很小）
保护一个荒野区 vs 保护57个荒野区（WTP仅小幅增加）
伤害预防数量成倍上升，WTP仅轻微上升

作者强调：即便在某些设计中范围信息变得更显著（例如被试内设计反复比较）会出现一定范围效应，其组合方式也常呈近似加性（原型情感 + 数量作为额外特征），仍难满足经济学的“加总检验（add-up test）”。

4）情境依赖与偏好反转：孤立定价 vs 显式比较/选择

作者用“唤起集合（evoked set）/规范参照”解释情境效应：对象在孤立评估时会自动唤起同类参照集，使得情感强度与评价标准呈相对性。

实验展示：

生态议题（如珊瑚礁受损）与公共健康议题（如老年多发性骨髓瘤）在孤立评估与比较评估时的相对位置会发生系统变化。
在选择任务中，人们更倾向于把公共健康置于优先级，但在孤立WTP任务中，这种跨类别优先性可能被抑制，导致WTP与选择之间的反转。

关键点：若WTP真是偏好序的读数，则与选择应一致；反转表明所谓“偏好”并不稳定，而是由情境塑形的态度表达。

5）美元量表的心理物理学：无模数的“幅度标度”导致巨大噪声

作者将美元回答视为一种特殊的心理物理测量：

美元是无上界、有意义零点的幅度标度；
但在问卷与陪审任务中通常缺乏共同模数（modulus），个体会自发采用不同“标尺”。

因此出现幅度标度典型现象：

分布强烈正偏（近似对数正态）
均值与标准差高度相关（反映个体模数差异）
与评分量表相比，美元回答的信噪比显著更差：对象差异解释的方差比例很低；而个体差异与残余噪声占比极高。

作者指出：对美元做对数/秩转换可显著提高统计效率，说明美元里确有态度信息；但这恰恰意味着美元更适合“排序/相对比较”，而不适合“绝对货币计量”。

6）锚定效应：公投式二元问题会系统性抬高估计

在CVM从开放式WTP转向“公投/二元选择（referendum）”格式后，研究常发现后者推断出的WTP更高。作者用经典的锚定效应统一解释：当个体不确定合适数值时，只要被诱导考虑某个候选数（即使任意），回答会向该数靠拢。

Green et al.（1998）显示：对数量估计与WTP问题均存在强锚定；高锚会使二元问题中“锚太低”的比例远高于开放式分布所预期，从而使由二元回答推断的WTP分布整体上移（随机占优）。

作者借此反驳“这主要是激励相容性改进”的解释：因为同样的模式也发生在纯估计任务中，根本无所谓激励相容。

🧩 核心概念与模型

1）嵌入效应（embedding effect）与外延忽视（extension neglect）

嵌入效应：对某公共物品的WTP会随其被置于更大集合/更一般目标中而发生巨大变化；通过“先总后分配”的提问方式推得的分项价值常远低于直接提问值。
外延忽视：当评价由原型情感主导时，集合规模/数量（scope）在心理上权重很低，导致对范围变化不敏感。

心理机制：人在理解问题时更容易生成“典型情境/典型实例”的表征（如一只被油污困住的鸟），情感强度主要绑定在该原型上，而非绑定在“2,000 vs 200,000”的外延数量上。

2）态度表达 vs 经济偏好：两套“价值”的逻辑

经济偏好：关于可交换商品束的稳定偏好序；强调一致性、公理化、可加总（如add-up test）。
态度表达：关于心理表征的情感价值；允许框架、参照集、类别差异、比较方式改变而改变；并不承诺跨情境的全序一致。

作者并非否认人会为公共物品付费，而是主张：在CVM这类假设性问答中，人们的“价值”更接近政治—道德态度的表达。

3）WTP的心理机制：情感核心 + 表达通道噪声

作者提出把任何态度表达分解为：

`A`：共享的情感性估价（核心信号）
`S`：表达方式特有成分（例如惩罚需要考虑后果、公司规模；捐款需要考虑自我形象等）
`e`：误差/噪声

美元量表的特殊问题在于：S与e都被放大（无共同模数、对数态分布、锚定等），使得绝对金额极不稳定。

💡 现实启示

1）对环境政策与成本—收益分析：谨慎对待“货币化民意”

如果CVM的美元回答主要是态度表达，那么将其直接当作社会福利函数的输入，会面临结构性风险：

范围不敏感使得“边际变化”难以用WTP刻画，可能导致资源配置扭曲。
情境/表述改变会显著改变结果，使政策评估对问卷措辞与议题组合高度脆弱。
二元公投格式可能因锚定而系统高估WTP。

因此，作者的立场更接近：问题不在“测量误差”，而在“理论错配”。

2）对公共物品估值：从“直接问多少钱”转向“建立基准尺度”

作者提出一种替代设想：

构建一套覆盖不同损害强度与对象重要性的基准情境（benchmark scenarios），在其中争取较高公共共识，并争取专业/政治上可接受的货币标定。
新议题的评估不再要求受访者凭空报出金额，而是让其与基准情境做显式比较；优先使用心理计量上更可靠的指标（重要性、政治支持）而非SWTP。
货币值通过“在基准尺度上的位置”间接映射获得。

这实质上承认：货币化需要制度化标尺，而不能指望个体在孤立情境下自发给出可加总的绝对价格。

3）对法律与惩罚性赔偿：让陪审团做他们擅长的事

本章对惩罚性赔偿的讨论提示：

陪审团在“愤慨/惩罚意图”的等级判断上可能较一致；
但在把这种意图翻译为美元时噪声巨大且易受锚定影响。

因此更合理的制度设计可能是：让陪审团给出分级的惩罚严重性判断，由法官或规范化规则把等级映射为金额（类似“损害赔偿表/量刑指南”的思想）。

4）方法论层面：把“跨领域同构”作为识别工具

作者反复使用一个策略：当某一现象在经济解释框架下显得“异常”，如果能在与经济激励无关的领域（如数量估计、陪审赔偿）中发现同形现象，则更支持心理机制解释。这一跨领域对照为政策争论提供了更坚实的证据结构。

个人评注（可供写作/研究引用）

本章的锋利之处在于：它把CVM争论从“问卷技术是否足够精致”提升为“价值观念与心理机制是否允许被当作偏好测量”的层级；同时用心理物理学（幅度标度、无模数）解释了美元回答为何天然噪声巨大。
“范围不敏感”在此不被视为被试无知或不认真，而被视为原型驱动的情感估价在公共议题中的常态，这对任何试图用单一货币标量压缩复杂公共价值的做法都构成方法论挑战。