期望效用: vNM 公理化模型

信息经济学
湖南大学课程

vNM 期望效用模型

本讲介绍冯·诺依曼–摩根斯坦 (von Neumann-Morgenstern) 期望效用模型.

vNM 模型是一个公理化模型, 它的主要内容如下:

上述 “合理的要求” 可以概括为两个公理: 独立性公理和连续性公理

二元关系 \succeq

XX 表示决策者张三的选择集. 二元关系 \succeq 概括了张三对如下问题的回答:

注: 在上面的描述中, 我们没有对二元关系 给出任何限制: xyx ⪰ y 不过是用来描述张三对选项 xxyy 偏好的记号.

完备性和传递性

定义.XX 上的二元关系 满足完备性和传递性, 则称 XX 上的偏好关系.

关于 “偏好关系” 的补充说明:

L(Z)L(Z): 彩票集 (或彩票空间)

大写字母 ZZ 表示结果集, 小写字母 zZz \in Z 表示某个可能的结果

彩票 p(z)p(z) 为集合 ZZ 上的概率分布

L(Z)|Z|L(Z) \subseteq ℝ^{|Z|}: 集合 ZZ 上所有彩票构成的集合.

例: 结果集为 Z={z1,z2}Z = \{ z_1,z_2 \} 时的彩票空间

例: 结果集为 Z={z1,z2,z3}Z = \{ z_1,z_2,z_3 \} 时的彩票空间

退化彩票

如果某个彩票 pp 下, 获得特定结果 zZz \in Z 的概率为 1 (即 p(z)=1p(z) = 1), 则称该彩票是退化的.

一般用符号 δzδ_z 表示退化彩票的概率分布函数 (Dirac’s delta), 它满足 δz(x)={1 if x=z0 if xz δ_z(x) = \begin{cases} 1 &\text{ if } x = z \\ 0 &\text{ if } x \ne z \end{cases}

练习 (非常容易). 符号 (αx,(1α)y)(α \circ x, (1 - α) \circ y) 表示的彩票对应的概率分布是? 什么时候该彩票是退化的?

关于彩票的偏好

本讲讨论的是包含不确定性的决策问题, 即彩票集 L(Z)L(Z) 上的偏好关系.

下面我们给出几类定义在 L(Z)L(Z) 上, 且满足完备性和传递性的二元关系 \succeq.

L(Z)L(Z) 上的偏好: 追求平等型偏好

例 (追求平等型偏好). 对任意两个彩票, 决策者总偏好其中分散程度较低的彩票.

请验证, 上例中的 \succeq 确实是一个偏好关系, 即它满足完备性和传递性.

L(Z)L(Z) 上的偏好: 追求极端型偏好

例 (追求极端型偏好). 对任意两个彩票 ppqq, 若 maxzZp(z)\max_{z \in Z}p(z) 大于 maxzZq(z)\max_{z \in Z}q(z), 则决策者认为彩票 pp 严格优于彩票 qq.

问: 你觉得上述两个偏好关系 (追求极端型和追求平等型) “合理” 吗?

上面这两个例子中, 偏好关系忽略了结果本身的好坏, 仅依赖于概率向量.

真实的决策过程中, 偏好会包含对每个具体结果的评估.

当结果集为 Z={iPhone, 茶颜悦色, nothing}Z = \{ \text{iPhone, 茶颜悦色, nothing}\} 时:

最坏可能结果偏好

接下来的偏好例子包含了决策者对每个具体结果 zz 好坏的评估, 这个评估可以表示为某个效用函数 u:Zu: Z \to ℝ.

例 (最坏可能结果偏好). 考虑如下决策流程:

  1. 为每个结果 zZz \in Z 赋予一个效用值 u(z)u(z)
  2. 对任意彩票 p,qp, q, 若决策者认为彩票 pp 下的最坏可能结果弱优于彩票 qq 下的最坏可能结果, 即 min{u(z)|p(z)>0}min{u(z)|q(z)>0} \min\{u(z)|~{}p(z)>0\}\geq \min\{u(z)|~{}q(z)>0\} 则决策者认为彩票 pp 弱优于彩票 qq (pqp ⪰ q).

上述决策过程对应的偏好为最坏可能结果偏好 (也叫 “悲观偏好”)

悲观偏好在计算机科学领域中很常用:

悲观偏好只关注最坏的可能情形, 你可以仿照这种方式构造其它的偏好例子:

期望效用偏好

定义 (期望效用偏好). 期望效用偏好对应如下决策流程: 为每个结果 zZz \in Z 赋予一个效用值 u(z)u(z), 并基于彩票下效用的期望值来评估彩票: pq 若且唯若 zZp(z)u(z)zZq(z)u(z). p ⪰ q \text{ 若且唯若 } ∑_{z\in Z}p(z)u(z) \geq ∑_{z\in Z}q(z)u(z).

说明:

期望效用偏好和悲观偏好都不是唯一的, 而是一类偏好:

公理化方法

对于彩票的 “合理” 偏好不存在唯一的标准:

要评判哪一种偏好关系更适用于经济决策, 首先需要明确什么是 “合理”, 即我们希望偏好关系满足哪些基本要求.

公理化方法: 抽象地陈述适用于彩票空间 L(Z)L(Z) 上偏好的一般性要求, 并在此基础上推导出满足这些要求的偏好关系

vNM 模型是对期望效用偏好的公理化: 除了偏好关系本身必须满足的完备性和传递性公理外, vNM 模型还用到了独立性公理和连续性公理.

连续性公理的引入动机

考虑如下两个彩票:

α=1α=1, 决策者认为彩票 1 严格优于彩票 2;
α=0.99α=0.99, 决策者认为彩票 1 严格优于彩票 2;
\vdots
α=0.01α=0.01, 决策者认为彩票 2 严格优于彩票 1;
α=0α=0, 决策者认为彩票 2 严格优于彩票 1.

直觉上, 应该存在某个 α(0,1)α \in (0,1), 使得决策者对彩票 1 和彩票 2 无差异.

连续性公理

定义 (连续性). 为彩票集 L(Z)L(Z) 上的偏好关系. 若对于 ZZ 中任意三个满足 δaδbδcδ_a \succ δ_b \succ δ_c 的结果 aabbcc, 总存在实数 α(0,1)\alpha \in (0,1) 使得 (1b)(αa,(1α)c) (1 \circ b) \sim (\alpha \circ a , (1-\alpha)\circ c) 则称 连续的.

练习 (中等难度).

  1. 请说明, 当集合 ZZ 至少包含三个元素时, 悲观偏好不是连续的.

  2. 请说明, 期望效用偏好是连续的.

复合彩票

在正式陈述独立性公理之前, 我们先定义复合彩票.

复合彩票对应如下包含两个阶段的不确定性消解过程:

复合彩票: 定义

定义 (复合彩票). 给定 KK 个彩票 p1,p2,...,pKp_1, p_2, ..., p_KKK 个和为 11 的非负实数 (α1,...,αK)(\alpha_1, ..., \alpha_K), 若存在彩票 p̂L(Z)\hat {p} \in L(Z) 使得 p̂(z)=k=1Kαkpk(z), \hat {p}(z)=∑_{k=1}^{K}\alpha_{k}p _ {k}(z), 则称 p̂\hat {p}复合彩票.

练习: 验证上述定义中的 p̂\hat {p} 确实是彩票, 即 p̂\hat {p}ZZ 上的概率分布.

复合彩票的记号: k=1Kαkpk:=p̂\oplus_{k=1}^{K}\alpha_{k}p _ {k} := \hat {p}.

复合彩票: 记号说明

注:

独立性公理的引入动机

考虑如下两个复合彩票: αp(1α)qα p \oplus (1 - α)qαp(1α)qα p' \oplus (1 - α)q

直觉上, 若决策者觉得彩票 pp 优于 pp', 应该也会认为复合彩票 αp(1α)qα p \oplus (1 - α)q 优于 αp(1α)qα p' \oplus (1 - α)q; 反之亦然.

独立性

定义 (独立性). 对任意彩票 p,p,qL(Z)p, p', q \in L(Z) 和任意概率权重 α(0,1)α \in (0,1), pp 若且唯若 αp(1α)qαp(1α)q. p ⪰ p' \text{ 若且唯若 } α p \oplus (1 - α) q ⪰ α p' \oplus (1 - α) q.

独立性的推论: pp 若且唯若 αp(1α)qαp(1α)q. p \sim p' \text{ 若且唯若 } α p \oplus (1 - α) q \sim α p' \oplus (1 - α) q.

vNM 定理

定理 (冯·诺依曼–摩根斯坦定理). 彩票集 L(Z)L(Z) 上的偏好关系 \succeq 为期望效用偏好, 当且仅当偏好关系 \succeq 满足独立性和连续性.

说明:

vNM 定理证明思路

vNM 效用的唯一性

定义 (正仿射变换). 称函数 v(z)v(z) 是函数 u(z)u(z)正仿射变换, 若存在正数 α>0α > 0 和常数 ββ 使得 v(z)=αu(z)+βv(z) = \alpha u(z)+\beta (即乘以一个正数并加上任意常数).

命题. vNM 效用函数 u:Zu : Z \to ℝ正仿射变换的意义上是唯一的:

注: 期望效用偏好仅对于效用函数的正仿射变换具有不变性, 对于一般的正单调变换不具有不变性.

阿莱悖论

如下两个彩票, 你更愿意选谁?

如下两个彩票, 你更愿意选谁?

阿莱悖论与独立性公理

实验中, 大多数人同时选择了彩票 2 以及彩票 3, 即: L1L2,L3L4 L_{1}\prec L_{2}, \quad L_{3}\succ L_{4}

这种偏好关系违反了独立性公理:

框架效应