贝叶斯相关均衡

前文提到, 完备信息博弈的相关均衡可以表示为博弈结果的概率分布. 相比于纳什均衡, 相关均衡这一概念有许多优点.

一个很自然的问题是, 如何将相关均衡这个概念进行推广, 使得它适用于不完备信息博弈. 这个问题的答案很大程度上取决于如何描述不完备信息博弈.

很多时候, 我们用 Harsanyi 的类型空间 (type space) 来描述不完备信息博弈.

后面的处理和符号参考自 Bergemann and Morris (2016, TE). 我们不直接使用 Harsanyi 的类型空间, 而是用基本博弈 G 和信息结构 S 来描述不完备信息博弈.

基本博弈 G

基本博弈 G 在完备信息博弈的基础上加入了状态空间和先验分布.

完备信息博弈包括 (1) 参与人集合: {1, 2,..., n} (2) 每个参与人的行动集合: \(A_1\), ..., \(A_n\) (3) 每个参与人的效用函数. 基本博弈 G 在此基础上加入了状态空间, 并且参与人的效用取决于状态.

具体地:

注: 这里的状态 θ 只描述了关于参与人效用的信息, 没有涉及到关于参与人(高阶)信念的描述. 参与人的信念会另外用信息结构 S 表示.

信息结构 S

信息结构 S 由两部分组成:

  1. 每个参与人 i 的信号集合 (或类型集合) \(T_i\).
  2. 联合信号向量 \(t=(t_1,...,t_n)\) 的分布函数 \(π : Θ \to Δ(T)\)

不完备信息博弈 (G, S)

不完备信息博弈可表示为二元组 \((G, S)\). 这是一个静态博弈, 但可以借用如下动态过程来理解:

  1. 自然按照分布 \(ψ\) 选择状态 \(θ \in Θ\)
  2. 给定状态 \(θ\), 自然进一步按照分布 \(π ( ⋅ | θ)\) 选择联合信号 \(t=(t_1,...,t_n) \in T\).
  3. 每个参与人 i 私下观察到 \(t_i \in T_i\), 在对其他人的信号 \(t_{-i}\) 和状态 \(θ\) 进行推断后, 选择行动 \(α_i\).
  4. 博弈结束, 参与人 i 的收益为 \(u(α_1,...α_n,θ)\).

基本博弈+信息结构这种描述方式的主要优势在于, 研究人员可以固定基本博弈不变, 专门讨论信息结构的变化会如何影响博弈均衡.

贝叶斯相关均衡 (BCE)

完备信息博弈的相关均衡为某个博弈结果的分布 \(α \in Δ(A)\).

相对应地, 不完备信息博弈由于加入了状态空间和信息结构, 它的(贝叶斯)相关均衡可表示为状态空间和信号空间到博弈结果分布的映射: \[ σ: T × Θ \to Δ(A) \] \[ σ: t × θ ↦ σ(t,θ) \in Δ(A) \]

B&M (2016) 将 σ 称为决策规则. 这里的决策规则可以理解为信使的决策规则:

  1. 信使私下观察到真实状态 \(θ\) 和所有博弈方的类型 \(t\)
  2. 给定 (t,θ), 信使按照分布 \(σ( a | t,θ)\) 决定行动向量 \(a = (a_1,...,a_n)\).
  3. 信使私下将 \(a_i\) 告知参与人 \(i\)

自然地, σ 是贝叶斯相关均衡 (BCE), 当且仅当每个参与人 \(i\) 在收到信使的建议 \(a_i^*\) 后, 行动 \(a_i^*\) 确实是参与人 i 的最优选择.

理解贝叶斯相关均衡

B&M (2016) 讨论了贝叶斯相关均衡这个概念和博弈论中其他概念的联系, 最有价值的解读是这篇文章的定理 1, 它证明了贝叶斯相关均衡和"稳健均衡"的等价性.

对 Blackwell 决策定理有一定了解的读者, 可以进一步阅读 B&M (2016) 的定理2和定理3. 作者将信使的决策规则 σ 和 Blackwell 实验下的单人决策进行对比, 给出了单人决策中的 Blackwell 定理在 n 人博弈中的对应版本.

最后, 贝叶斯相关均衡可视为贝叶斯说服博弈在包含多个信号接收者情形下的推广.

小结

相关文献