诅咒均衡
本文介绍诅咒均衡 (Cursed Equilibirum), 它由 Eyster and Rabin (2005)
提出.
诅咒均衡的主要动机来自行为经济学:
参与人有时会忽视对手策略和类型的相关性.
诅咒均衡可以用来解释部分经典理论无法解释的行为经济学异象 (eg,
赢家诅咒).
诅咒均衡适用于贝叶斯博弈. 作为热身,
我们先定义贝叶斯博弈和贝叶斯均衡.
有限贝叶斯博弈
有限贝叶斯博弈的规范表示如下:
参与人构成集合
,
其中
为自然的编号;
:
参与人
的行动集;
:
参与人
的类型集;
记
,
为共同先验分布
为参与人
的效用函数
注: 除参与人行动
外, 参与人
的效用还取决于所有参与人 (包括自然) 类型
用
表示贝叶斯博弈. 我们可以按照如下动态博弈的方式 (ie, 海萨尼转换)
来理解博弈
:
自然按照先验分布
决定
;
每个参与人
私下观察到
,
随后选择行动
博弈结束, 参与人
效用为
.
下面我们定义随机行动和策略, 并约定一些记号:
,
其中
表示从
中移除
后的
维向量;
表示
上所有概率分布构成的集合. 参与人
的混合策略为其类型集到
的映射:
联合分布
在
上的边缘分布记为:
给定所有参与人策略
后, 定义
如下:
令
.
贝叶斯均衡
事中信念:
私下看到
后, 参与人
会根据贝叶斯法则更新信念, 他的 (事中) 信念可表示为条件分布
:
上式的分母
为联合分布
在
上的边缘分布.
确定事中信念后, 参与人
会分别计算其在每个可能
下的效用, 然后按照信念
进行加总计算期望效用.
计算期望效用时, 理性的参与人
会注意到对手的类型和对手行动具有相关性: 给定
,
对手行动的分布为
给定
和对手行动
,
行动
带给参与人
的期望效用为:
参与人
选择行动
最大化上述期望效用
定义 (贝叶斯均衡). 称策略组合
构成贝叶斯均衡, 若对所有参与人
的所有可能类型
,
其任意可能行动
都是对
的最优反应:
诅咒均衡:
忽略类型和行动相关性
贝叶斯均衡要求每个参与人都是 “理性人”. 具体地:
参与人
能通过自己的类型推断对手类型:
参与人
能准确利用对手行动和类型的相关性, 计算对手类型
下自己选择行动
的期望效用
诅咒均衡放宽了上述限制 2. Eyster and Rabin
称忽略了类型和行动相关性的参与人是被诅咒的, 其诅咒程度可用参数
量化.
诅咒程度为
的参与人
会按如下表达式计算对手类型
下选择行动
的期望效用:
其中
为类型
时对手行动的平均分布:
当诅咒程度为
时, 参与人行为退化为理性人情形
假设所有参与人诅咒程度均为
.
对每个参与人
,
给定其他参与人策略
,
他会按照如下方式计算事中期望效用:
定义
(诅咒均衡).
对任意
,
称策略组合
构成
诅咒均衡, 若对所有参与人
的所有可能类型
,
其所有可能行动
均为如下最优化问题的解:
对于有限贝叶斯博弈,
诅咒均衡总存在. 因为原始博弈中的每个
诅咒均衡都对应着某个新博弈的贝叶斯均衡. 我们下面介绍这个新博弈.
虚拟博弈
为了简化论述, 假设下面的论述中所有参与人都使用分离策略 (分离策略下,
可以从参与人行动直接确定其类型):
对诅咒程度为
的参与人
,
当对手行动为
时, 参与人
会推测对手类型依概率
一定为真实类型
,
依概率
由分布
决定
参与人
会选择行动
最大化如下效用:
称
为参与人
的虚拟效用.
对于非分离策略的情形, 将虚拟效用中的
替换为
即可.
如果将原博弈
中的参与人效用替换为对应的虚拟效用
,
称该博弈为原博弈的
虚拟博弈:
命题. 若
为原博弈
的
诅咒均衡, 则
为虚拟博弈
的贝叶斯均衡.
When 诅咒均衡 ==
贝叶斯均衡?
诅咒均衡和贝叶斯均衡何时等价? 首先,
若均衡中所有参与人的行动总是独立于其类型 (ie, 混同策略),
诅咒均衡自然退化为贝叶斯均衡.
一般而言, 若对任意类型
的参与人
,
固定任意行动
时, 知道对手类型
都对参与人
计算其期望效用无益,
诅咒均衡即为贝叶斯均衡. (命题 2, Eyster and Rabin)
竞标者估值独立的一价密封拍卖模型符合上述条件,
此时贝叶斯均衡即为诅咒均衡.
共同价值拍卖模型不符合上述条件, 因为知道对手的类型可以帮助参与人
更好地估计标的真实价值.
诅咒均衡和保守信念更新
问: 诅咒程度为正的参与人, 其信念更新服从贝叶斯规则么?
然而, 在很多贝叶斯均衡 (尤其是纯策略贝叶斯均衡) 的求解中,
直接用到的并非参与人
对对手
行动的信念, 而是参与人
在给定对手行动
时对对手类型
的信念.
用
表示参与人
在知道对手行动
时对对手类型
的后验信念. 如果
,
参与人
的后验信念为:
对一般的
,
参与人
的后验信念会更接近看到
前的 “先验信念”
:
当我们用后验信念
来求解均衡时, 参与人
的行为也可以解读为其信念更新有误: 相比于完全由贝叶斯法则确定的后验,
他的实际后验会更接近先验 (ie, 更保守), 接近程度取决于诅咒程度
和对手策略
.
这类后验信念会靠近先验的非贝叶斯更新方式被称为保守更新
(或先验偏误 prior-biased 更新).
它是行为经济学中很常见的一种信念偏差: 人有时很保守, 即使看到了新证据,
也不愿大幅度改变信念.
信念
的表达式披露了诅咒均衡和保守后验信念的内在联系. 很多时候,
诅咒均衡可以解读为参与人对对手类型的后验信念过于保守, 反之亦然.
广义诅咒均衡
上面的分析假设所有参与人的诅咒程度
都是相同且非随机的. 下面讨论
随机的情形.
记参与人
的诅咒程度为
.
函数
表示诅咒程度和类型的联合分布. 参与人
在私下观察到
后, 使用贝叶斯法则得到更新后的信念:
.
我们仍然用
表示参与人
选择行动
的概率, 注意此时参与人
的策略为诅咒程度和类型到随机行动的映射. 对手的策略和平均策略分别为
和
.
对诅咒程度为
的参与人
,
其认知中对手的策略为
;
策略组合
构成广义诅咒均衡, 若每个诅咒程度为
的参与人
的行动
都是对
的最优反应.
小结
贝叶斯均衡中, 理性参与人能利用对手行动和对手类型的相关性,
准确计算每个行动对应的期望效用.
诅咒均衡中, 参与人可能会忽视对手行动和对手类型的相关性.
除了上述 “忽略相关性” 解读外, 诅咒均衡还可以从 “效用偏差” 和
“信念偏差” 的角度来解读:
效用偏差: 诅咒程度
的参与人
会按照虚拟效用
而非其真实效用
来最大化期望收益.
信念偏差: 诅咒程度
的参与人
会按照错误的后验信念来推测对手类型,
其后验信念为先验信念和贝叶斯后验的加权平均.
上述虚拟效用解读可用于求解诅咒均衡: 先把原博弈
转化为对应的虚拟博弈
,
再求解虚拟博弈的贝叶斯均衡即可.
诅咒均衡假设每个参与人
的诅咒程度均为确定的
,
这个设定可以推广为参与人
诅咒程度
随机的情形, 此时
为参与人
的私人信息.
应用: 逆向选择中的赢家诅咒
作为行为经济学解概念, 诅咒均衡可以解释一些经典理论无法解释的实验异象.
相比其它行为经济学理论, 诅咒均衡的主要优势在于它没有非常偏离经典理论,
并且相对 “简约” (parsimonious).
我们以一个简单的逆向选择问题为例, 来说明诅咒均衡中的赢家诅咒现象.
这个例子属于逆向选择问题, 因为卖家有信息优势.
博弈基本设定:
参与人: 卖方和买方
商品价值:
商品对卖方的价值
,
对买方的价值为
,
其中
外生给定
服从区间
上的均匀分布
博弈过程如下:
卖方私下观察到
买方报价
卖方选择接受
()
或拒绝
().
求解贝叶斯均衡:
卖方策略
:
若报价
则接受; 若报价
则拒绝
给定卖方策略
,
买方选择
时的期望收益为
.
买方期望收益关于
的一阶导是线性的, 最优报价只可能是
或
均衡结果:
若
,
买方最优报价为
,
交易一定失败; 若
,
买方最优报价为
,
交易一定成功
均衡结果中不会出现赢家的诅咒. 因为一旦交易发生, 买方的支付
一定小于等于其估值
.
诅咒均衡结果中的赢家诅咒
我们接下来求解诅咒均衡. 由于买方没有私人信息,
不需要考虑卖方被诅咒的情形.
记买方诅咒程度为
,
其认知中卖方的策略为:
按概率
使用最优策略
,
按概率
使用如下随机行动:
若
,
买方认为其报价
时的期望效用为
.
当
时, 买方选择报价
.
当
时, 买方选择报价
.
若
,
买方会选择正的报价, 此时均衡结果中有正概率出现赢家诅咒 (ie
买方的出价高于其估值
).
当
时, 赢家诅咒一定发生.
另一方面, 当
时, 买方的报价偏低:
.
对于
的一般情形, 下面的结论仍然成立:
实验结果
对
时, 贝叶斯均衡预言买方报价为 0, 但实验中买方仍会选择正的报价
.
Samuelson and Bazerman (1985): 大部分实验参与人的报价落在区间
Ball, Bazerman, and Carroll (1991): 重复实验 20 次,
参与人的报价没有明显下降, 平均报价从
下降到
.
相比于贝叶斯均衡, 实验结果更接近
时的诅咒均衡.
除了这个例子外, Eyster & Rabin 还讨论了共同价值拍卖中的诅咒均衡.
如果读者对这个问题感兴趣并且了解这类博弈的求解套路 (eg, Milgrom &
Weber 1982), 建议阅读论文原文.
参考文献
P. Milgrom, and R. Weber, 1982. “A Theory of Auctions and Competitive
Bidding.” Econometrica, 50, 1089–1122.
Erik Eyster and Matthew Rabin, 2005. “Cursed Equilibrium.”
Econometrica.
Larry Epstein, 2006. “An axiomatic model of non-Bayesian updating.”
Review of Economic Studies.
Lee, Y.-J., W. Lim, and C. Zhao (2023). “Cheap-Talk with Prior-biased
Inferences.” Games and Economics Behavior.