前文提到,
完备信息博弈的相关均衡可以表示为博弈结果的概率分布. 相比于纳什均衡,
相关均衡这一概念有许多优点.
一个很自然的问题是, 如何将相关均衡这个概念进行推广,
使得它适用于不完备信息博弈. 这个问题的答案很大程度上取决于如何描述不完备信息博弈.
很多时候, 我们用 Harsanyi 的类型空间 (type space)
来描述不完备信息博弈.
- Harsanyi 的类型既包括参与人关于收益的不确定性,
也包括参与人关于其他参与人信念的不确定性.
- 这种描述给推广相关均衡带来了一定阻碍.
后面的处理和符号参考自 Bergemann and Morris (2016, TE).
我们不直接使用 Harsanyi 的类型空间, 而是用基本博弈 G 和信息结构 S
来描述不完备信息博弈.
基本博弈 G
基本博弈 G 在完备信息博弈的基础上加入了状态空间和先验分布.
完备信息博弈包括 (1) 参与人集合: {1, 2,..., n} (2)
每个参与人的行动集合: \(A_1\), ...,
\(A_n\) (3) 每个参与人的效用函数.
基本博弈 G 在此基础上加入了状态空间, 并且参与人的效用取决于状态.
具体地:
- 状态空间包括所有可能状态构成的集合 \(Θ\) 及其上的概率分布 \(ψ\).
- 后面我们用 \(θ\)
指代某个具体的状态, 其先验概率为 \(ψ(θ)\)
- 参与人 i 的效用函数为: \(u_i (a_1, ...,
a_n, θ)\).
注: 这里的状态 θ 只描述了关于参与人效用的信息,
没有涉及到关于参与人(高阶)信念的描述. 参与人的信念会另外用信息结构 S
表示.
信息结构 S
信息结构 S 由两部分组成:
- 每个参与人 i 的信号集合 (或类型集合) \(T_i\).
- 记联合信号集合为 \(T = T_1 \times ...
\times T_n\).
- 联合信号向量 \(t=(t_1,...,t_n)\)
的分布函数 \(π : Θ \to Δ(T)\)
- 注意, \(t\)
的生成方式取决于真实状态 \(θ\):
不完备信息博弈 (G, S)
不完备信息博弈可表示为二元组 \((G,
S)\). 这是一个静态博弈, 但可以借用如下动态过程来理解:
- 自然按照分布 \(ψ\) 选择状态 \(θ \in Θ\)
- 给定状态 \(θ\), 自然进一步按照分布
\(π ( ⋅ | θ)\) 选择联合信号 \(t=(t_1,...,t_n) \in T\).
- 每个参与人 i 私下观察到 \(t_i \in
T_i\), 在对其他人的信号 \(t_{-i}\) 和状态 \(θ\) 进行推断后, 选择行动 \(α_i\).
- 博弈结束, 参与人 i 的收益为 \(u(α_1,...α_n,θ)\).
基本博弈+信息结构这种描述方式的主要优势在于,
研究人员可以固定基本博弈不变,
专门讨论信息结构的变化会如何影响博弈均衡.
贝叶斯相关均衡 (BCE)
完备信息博弈的相关均衡为某个博弈结果的分布 \(α \in Δ(A)\).
相对应地, 不完备信息博弈由于加入了状态空间和信息结构,
它的(贝叶斯)相关均衡可表示为状态空间和信号空间到博弈结果分布的映射:
\[
σ: T × Θ \to Δ(A)
\] \[
σ: t × θ ↦ σ(t,θ) \in Δ(A)
\]
B&M (2016) 将 σ 称为决策规则.
这里的决策规则可以理解为信使的决策规则:
- 信使私下观察到真实状态 \(θ\)
和所有博弈方的类型 \(t\)
- 给定 (t,θ), 信使按照分布 \(σ( a |
t,θ)\) 决定行动向量 \(a =
(a_1,...,a_n)\).
- 信使私下将 \(a_i\) 告知参与人 \(i\)
自然地, σ 是贝叶斯相关均衡 (BCE), 当且仅当每个参与人 \(i\) 在收到信使的建议 \(a_i^*\) 后, 行动 \(a_i^*\) 确实是参与人 i 的最优选择.
- 这句话的意思是: 参与人 i 在收到 \(a_i^*\) 后, 对状态 \(θ\) 和其他参与人的类型和信号进行推断,
发现行动 \(a_i^*\)
确实是他的最优反应.
- 这个判断对应如下条件: \[
a_i^* \in \arg\max_{a_i \in A_i} ∑_{θ, a_{-i}, t_{-i}} ψ (θ) π (t|θ) σ
(a_i, a_{-i} | t,θ) u_i (a_i, a_{-i}, θ)
\]
理解贝叶斯相关均衡
B&M (2016) 讨论了贝叶斯相关均衡这个概念和博弈论中其他概念的联系,
最有价值的解读是这篇文章的定理 1,
它证明了贝叶斯相关均衡和"稳健均衡"的等价性.
对 Blackwell 决策定理有一定了解的读者, 可以进一步阅读 B&M (2016)
的定理2和定理3. 作者将信使的决策规则 σ 和 Blackwell
实验下的单人决策进行对比, 给出了单人决策中的 Blackwell 定理在 n
人博弈中的对应版本.
最后,
贝叶斯相关均衡可视为贝叶斯说服博弈在包含多个信号接收者情形下的推广.
- 假设博弈只包含一个参与人,
但信使希望选择某个特定的贝叶斯相关均衡.
- 信使的目标函数为 \(v(a,θ)\),
信使在决策规则 \(σ\) 下的期望收益为
\(V(σ)\).
- 信使选择某个贝叶斯相关均衡 \(σ^*\)
来最大化 \(V(σ)\) ⟺
信使选择某个信息披露策略来最大化 \(V(σ)\).
- 要理解这里为什么等价, 读者需要先理解 B&M (2016) 的定理 1.
小结
- 不完备信息博弈可以表示为: 基本博弈 G + 信息结构 S.
- 基本博弈 G 在完备信息博弈的基础上加入了状态空间和关于状态的先验信念.
这里的状态只和博弈方的收益相关.
- 信息结构 S 指每个参与人能看到一个私人信号,
这个信号同状态以及其他参与人信号都是相关的.
- 贝叶斯相关均衡表示为某个满足服从约束的决策规则,
这个决策规则可以表示为从状态空间和信号空间到联合行动分布的映射.
- 贝叶斯相关均衡的三种解读: 稳健均衡, Blackwell 定理的推广,
说服博弈的推广.
相关文献
- Bergemann, Dirk; Morris, Stephen (2019). "Information Design: A
Unified Perspective". Journal of Economic Literature.
- Bergemann, Dirk; Morris, Stephen (2016). "Bayes correlated
equilibrium and the comparison of information structures in games".
Theoretical Economics.