相关均衡

本文以会车博弈和鹰鸽博弈为例, 介绍了两种相关均衡. 前一种只涉及到公开信号, 后一种必须引入私人信号. 这两个例子中, 引入相关均衡的主要动机, 是它的福利性质好于纳什均衡.

最后, 本文介绍了如何从博弈结果分布的角度来思考相关均衡.

会车博弈

考虑如下会车博弈. 两车在路口交会, 必须一方退让后, 另一方才能通过. 每位车主的可选策略为"让"和"不让", 该博弈的矩阵表示如下:

        让          不让
让      (0, 0)     (1,  5) 
不让    (5, 1)     (-1, -1)

不难看出, 这个会车博弈和之前的约会博弈的分析完全相同. 它包含两个纯策略均衡: (让,不让) 和 (不让,让), 这两个均衡也代表了社会福利最大化的结果.

会车博弈也有一个混合策略均衡: 两位车主按一定概率在"让"和"不让"之间进行随机. 但这个混合策略均衡的福利性质不好: 两位车主可能协调失败, 均衡中可能出现 (让,让) 甚至 (不让,不让) 的结果.

纯策略均衡也有弊端: 均衡结果不公平. 最好的公平结果, 应该是每位车主的效用均为 3.

相关均衡: 交通信号灯

为了兼顾效率和公平, 现实中使用的方法是在路口安装交通信号灯 🚥. 两车交会时, 可以通过信号灯 🚥 这个公开信号来决定谁停谁走. 信号灯 🚥 可以让参与人在两个纯策略均衡---(让,不让) 和 (不让,让)---之间进行随机.

交通信号灯实现了如下相关均衡. 为简化分析, 假设交通信号灯随机产生了一个公开信号 s \(\in\) {红, 绿}.

由于(让,不让) 和 (不让,让)都是纳什均衡, 上面这个借由公开信号 s 实现的协议是激励相容的: 当车主1看到红灯时, 他知道车主2不会让, 这时选择让是最优的; 车主2的分析类似.

当信号 s 为红灯或绿灯的概率均为 1/2 时, 博弈的结果是一个概率分布:

这个结果中, 两位车主的期望效用均为 3.

如果允许引入私人信号, 相关均衡可以使得某些不是纳什均衡的结果在均衡中发生.

鹰鸽博弈

考虑如下鹰鸽博弈. 博弈方为国家 A 和国家 B, 它们同时决定是选择"战争" (鹰策略, Y) 还是"和平" (鸽策略, G).

       Y        G
Y    (0,0)    (5,1)
G    (1,5)    (4,4)

该博弈包含两个纯策略均衡: (Y,G) 和 (G,Y). 这两个结果中的社会总福利均为 6.

最好的结果是双方和平共处 (G,G), 社会总福利为 8, 但它不是纳什均衡.

仿照前面交通信号灯的处理, 我们可以引入一个公开信号, 使得两个博弈方在 (Y,G) 和 (G,Y) 这两个均衡之间进行随机. 比如, 双方约定如果看到红灯信号就玩 (Y,G), 否则玩 (G,Y). 通过调整红灯信号的概率, 均衡收益向量可以是 (1,5) 和 (5,1) 这两个向量的任意凸组合.

包含私人信号的相关均衡

如果要使均衡中的社会总福利大于 6, 均衡结果中必须出现 (G,G). 我们可以用包含私人信号的相关均衡来实现福利改进.

Claim: 存在相关均衡, 其均衡收益向量为 \((3\frac 13, 3\frac 13)\)

该相关均衡可通过某个信使 M, 分别向博弈方 A 和 B 私下传讯实现.

信使向每个博弈方同时私下发送信息 \(m \in \{ y,g \}\), 当博弈方收到信息 y 时, 鹰策略 Y 会是它的最优反应; 收到信息 g 时的最优反应则为鸽策略 G. 具体构造如下.

当 A 收到信号 y 时, A 认为 B 收到信号 y 的概率记为 \(q\):

当 A 收到信号 g 时, A 认为 B 收到信号 g 的概率记为 \(p\):

考虑 \(q=0, p=0.5\) 对应的信使策略, 它可以导致如下关于博弈结果的概率分布:

       Y        G
Y      0       1/3
G     1/3      1/3

另一种视角: 博弈结果的概率分布

上面的讨论中, 我们的分析重点是博弈方和信使的策略. 实际在定义和计算相关均衡时, 直接着眼于博弈结果的概率分布更为方便. Aumann 最早提出相关均衡的定义时, 就是使用的博弈结果的概率分布, 而非参与人的策略组合.

博弈结果的概率分布可以看成是每个参与人混合策略的联合分布, 而单个参与人的混合策略则是这个联合分布的边缘分布.

回到前面鹰鸽博弈的例子. 信使通过私下传讯, 在不考虑参与人激励的前提下, 可以实现所有满足 p1+p2+p3+p4=1 的概率分布, 其中每个概率 p 的含义如下:

       Y         G
Y      p1        p3
G      p2        p4

为了使得 (p1, p2, p3, p4) 构成相关均衡, 这四个概率还需要使得每个博弈方在收到信号 y (g) 时的最优策略为 Y (G). 这对应四组不等式约束.

类似可写出其它三个不等式约束. 请读者思考并计算, 所有相关均衡中博弈方收益组合构成的集合.

answer:

顶点为 (5,1), (1,5), (10/3,10/3) 和 (2,2) 构成的四边形以及其内部.

总结

  1. 相关均衡可以表示为博弈结果的分布: \(σ(a_1, ..., a_n)\).

  2. 给定博弈结果的分布 \(σ\), 博弈方 i 的混合策略为 \(σ_i = ∫_{a_{-i}} σ(a_1, ..., a_n) d a_{-i}\), 即 \(a_i\)\(σ\) 下的边缘分布.

  3. 不同于纳什均衡, 相关均衡中每个参与人的策略 \(σ_i\) 可以是互相依赖的. 对 \(σ\) 的一种解读方式是引入信使, 信使可以向每个参与人私下传讯.

  4. \(σ\) 是相关均衡, 当且仅当每个参与人 i 在收到 信使的信号 \(m_i\), 并对其他参与人的收到的信号和行动进行推断后, 行动 \(a_i\) 构成参与人 i 的最优反应.