寡头合谋: Green & Porter (1984)

我们讨论关于厂商同时定产的寡头模型.

单期模型

单期的寡头同时定产模型一般被称为古诺模型.

古诺均衡中, 所有厂商的总产量 QcQ^c 高于垄断产量 QmQ^m.

在单期的古诺博弈中, 合谋不构成纳什均衡, 否则每家厂商都会有单方面提高产量的激励.

我个人不喜欢这个类比, 因为古诺博弈均衡和囚徒困境均衡很不同:

重复博弈下的寡头合谋

如果考虑无穷期重复博弈, 合谋就有可能成为均衡结果. Friedman (1971) 使用重复博弈的框架讨论了寡头合谋问题, 并提出了 “冷酷触发策略” 这一概念.

冷酷触发策略涉及两个阶段: 正常阶段和惩罚阶段

上述策略的 “冷酷” 之处在于:

对每个厂商而言, 如果当期增产所带来的边际收益小于因未来永久陷入低利润的古诺产量所带来的边际损失, 厂商就不会增产, 合谋就能得以维持.

冷酷触发策略只是一种维持合谋的方式. 不过, 它是 (子博弈精炼) 均衡下能采用的最严厉惩罚机制. 如果我们的目标是求解厂商最优均衡, 考虑冷酷触发策略就是合理的.

从完美监督到不完美监督

冷酷触发策略下合谋均衡的成立, 依赖于厂商总能及时察觉任何对合谋产量的偏离.

上述假设一般被称为 “完美监督” 假设, 我们可以从如下两个情形来理解完美监督:

  1. 每期博弈结束后, 厂商能直接观测到竞争对手的产量.

  2. 每期博弈结束后, 厂商不能直接观测竞争对手的产量, 但可以通过当期价格这个公开信号来推断是否有人偏离合谋.

然而, 现实中的寡头厂商往往无法观测到竞争对手的产量, 也无法通过价格来完美推断是否有厂商发生偏离.

Green 和 Porter (1984) 使用贝尔曼方程的技巧, 给出了存在不完美监督时的合谋均衡例子.

为简化分析, Green–Porter 只考虑了所有厂商使用公共策略的均衡, 并且也无法证明使用触发策略能实现厂商最优均衡收益.

模型设定

Green & Porter (1984) 考虑了包含如下特征的无穷期厂商定产模型:

  1. 产量不可观测: 每个厂商私下选择产量, 并且无法观测到竞争对手的产量

  2. 存在需求冲击: 市场价格由总产量以及随机需求冲击共同决定

上述设定下的合谋问题存在不完美监督:

Green & Porter 构造了一个对称的合谋均衡, 其中每个厂商均使用如下触发策略:

上述触发策略下的均衡结果中:

  1. 惩罚会依概率 1 在均衡路径上触发.

  2. 惩罚只会由低需求冲击触发, 不会由厂商私下增产触发.

上述第二点看起来很没有道理: 既然没有人作弊, 为什么还要设置惩罚期?

模型具体参数:

假设成本为零, 厂商 ii 在时期 tt 的利润为: πi(xit,pt)=ptxit=θtp(Qt)xit.\pi_i(x_{it}, p_t) = p_t x_{it} = \theta_t p(Q_t) x_{it}.

不完美监督:

tt 期博弈进行如下:

  1. 所有厂商 ii 同时选择产量 xitx_{it}, i=1,2,...,ni=1,2,...,n. 同时, 自然根据密度函数 ff 决定需求冲击 θt\theta_t;

  2. 所有厂商同时观测到价格 pt=θtp(Qt)p_t = \theta_t \cdot p(Q_t), QtQ_t 为当期总产量

  3. 该期博弈结束, 厂商 ii 的当期利润为 πi=θtp(Qt)xit.\pi_i = \theta_t p(Q_t) x_{it}.

厂商的目标是最大化跨期贴现利润, 厂商的贴现系数为 δ(0,1)δ \in (0, 1).

解概念

对于包含不完美监督的重复博弈而言, 均衡定义的 “前摇” 如下:

Green & Porter (1984) 原文使用的解概念是 (某种修改后的) 纳什均衡.

为了方便定义完美公共均衡, 先引入 (重复博弈中) 公共策略和私人策略的概念.

定义. 完美公共均衡 (PPE) 是一种特殊的序贯均衡 (或完美贝叶斯均衡), 其中每个参与人都使用公共策略.

和子博弈精炼均衡类似, PPE 具有递归结构:

我们可以把每个可能的公共历史 (eg, Green–Porter 模型中过去的价格序列 p0,p1,...p_0,p_1,...) 之后的博弈环节类比为 “子博弈”:

Q&A: 公共策略, 私人策略和 PPE

下面以 Q&A 的形式介绍一些 PPE 的性质, 它对于理解 Green–Porter 模型不是必须的, 可以跳过.

Q: PPE 的定义中, 要求参与人行动只和公共历史有关. 为什么不考虑私人策略, 这难道不会有失一般性吗?

A: 不会.

Q: 给定其它厂商使用公共策略, 厂商 ii 的最优反应可以是公共策略, 这一点很好理解. 但为什么当其他人使用私人策略时, 厂商 ii 的最优反应可能必须是私人策略?

A:

Q: 考虑更一般的均衡概念 (如完美贝叶斯均衡或序贯均衡), 并且允许厂商使用私人策略. 如果我们的研究目标是刻画厂商最优均衡或所有均衡收益, 只考虑完美公共均衡会不会有失一般性?

A: 会.

Q: 如果研究目标是刻画所有均衡收益, 什么时候使用 PPE 是不失一般性的, 什么时候不是? 能不能给一些具体例子?

A: 可以

触发策略

回到 Green–Porter 模型, 考虑如下厂商 ii 的触发策略:

  1. 正常阶段: 生产合谋产量 yiy_i.

  2. 触发条件: 如果当期价格 ptp_t 低于某个门槛值 p\bar{p}, 博弈切换到惩罚阶段, 惩罚阶段时长为 TT 期.

  3. 惩罚阶段: 无论此期间的最终价格如何, 厂商均生产某惩罚产量 ziz_i.

  4. 恢复: 在 TT 期惩罚之后, 博弈回到正常阶段.

上述触发策略包含四个参数:

(yi,zi,T,p)(y_i, z_i, T, \bar p) 表示厂商 ii 的触发策略. 为简化分析, 我们只关注如下对称情形:

价值函数与贝尔曼方程

QQ 表示当期总产出, 博弈保持在正常阶段 (即 ptpp_t \ge \bar{p}) 的概率为: Pr(未触发惩罚)=Pr(ptp)=Pr(θtp(Q)p)=Pr(θtpp(Q))=1F(pp(Q))1ρ(Q) \begin{aligned} \text{Pr}(\text{未触发惩罚}) &= \text{Pr}(p_t \ge \bar{p}) = \text{Pr}(\theta_t p(Q) \ge \bar{p}) \\ &= \text{Pr}\left(\theta_t \ge \frac{\bar{p}}{p(Q)}\right) \\ &= 1 - F\left(\frac{\bar{p}}{p(Q)}\right) \equiv 1 - ρ(Q) \end{aligned}

其中 ρ(Q)F(p/p(Q))\rho(Q) \equiv F\left({\bar{p}} / {p(Q)}\right) 表示总产量为 QQ 时会触发惩罚的概率.

触发策略下, 厂商 ii 的单期收益为:

给定其它厂商都使用触发策略, 厂商 ii 的最优化问题可以用贝尔曼方程描述. 具体而言:

将上述 VpunishV_{punish} 的表达式代入贝尔曼方程 (1): Vi(r)=γi(r)+δ(1ρ(r+w))Vi(y)+δρ(r+w)[1δT1δdi+δTVi(y)].V_i(r) = \gamma_i(r) + δ (1 - \rho(r+w)) V_i(y) + δ \rho(r+w) \left[ \frac{1-δ^T}{1-δ}d_i + δ^T V_i(y) \right].

上式对于 r=yr=y 也成立, 因此: Vi(y)=γi(y)+δρ(Q)1δT1δdi1δ+δρ(Q)(1δT).(2)V_i(y) = \frac{\gamma_i(y) + δ \rho(Q) \frac{1-δ^T}{1-δ} d_i}{1 - δ + δ \rho(Q) (1-δ^T)}.\qquad{(2)}

式 (2) 给出了当所有竞争对手均使用触发策略时, 厂商 ii 的价值函数. 其直觉解释如下:

均衡求解

均衡条件: 给定其它厂商使用触发策略, 厂商 ii 使用触发策略构成最优反应. 因此, yiy_i 必须最大化 Vi(r)V_i(r).

代入价值函数的表达式 (2) 可得: γi(y)作弊的边际收益=δγi(y)di1δ+(δδT+1)ρ1δT1δρr作弊的边际损失.\underbrace{ γ_i'(y) }_{\text{作弊的边际收益}} = \underbrace{δ \cdot \frac{\gamma_i(y) - d_i}{1-δ + (δ-δ^{T+1})\rho} \cdot \frac{1-δ^{T}}{1-δ} \cdot \frac{\partial \rho}{\partial r}}_{\text{作弊的边际损失}}.