期望效用: vNM 公理化模型

信息经济学
湖南大学课程

vNM 期望效用模型

本讲介绍冯·诺依曼–摩根斯坦 (von Neumann-Morgenstern) 期望效用模型.

一般简称为 vNM 期望效用模型

vNM 模型是一个公理化模型, 它的主要内容如下:

如果定义在彩票上的偏好关系满足一些合理的要求 (即公理), 那么这个偏好关系一定是期望效用型偏好.

上述 “合理的要求” 可以概括为两个公理: 独立性公理和连续性公理

二元关系 $⪰$

令 $X$ 表示决策者张三的选择集. 二元关系 $⪰$ 概括了张三对如下问题的回答:

给定两个选项 $x,y \in X$ , 你更愿意选择谁?
若张三认为 $x$ 弱优于 $y$ , 记作 $x ⪰ y$
若张三认为 $x$ 严格优于 $y$ , 记作 $x ≻ y$
若张三对 $x$ 和 $y$ 无差异, 记作 $x \sim y$

注: 在上面的描述中, 我们没有对二元关系 $⪰$ 给出任何限制: $x ⪰ y$ 不过是用来描述张三对选项 $x$ 和 $y$ 偏好的记号.

完备性和传递性

定义. 若 $X$ 上的二元关系 $⪰$ 满足完备性和传递性, 则称 $⪰$ 为 $X$ 上的偏好关系.

完备性: 对任意选项 $x,y \in X$ , 一定有 $x ⪰ y \,\text{ 或 }\, y ⪰ x$
传递性: 对任意选项 $x,y,z \in X$ , $\text{ 若 } x ⪰ y \text{ 且 }\, y ⪰ z, \text{ 则 }\, x ⪰ z.$

关于 “偏好关系” 的补充说明:

部分文献将同时满足完备性和传递性的二元关系 $⪰$ 定义为 “理性的” 偏好关系, 否则视为 “非理性的” 偏好关系.
本讲中所有涉及的偏好关系均满足完备性与传递性. 因此, 我们不采用 “理性偏好关系” 这样的叫法, 直接称它为偏好关系即可.

$L(Z)$ : 彩票集 (或彩票空间)

大写字母 $Z$ 表示结果集, 小写字母 $z \in Z$ 表示某个可能的结果

为简化分析, 总假设结果集 $Z$ 是有限的

彩票 $p(z)$ 为集合 $Z$ 上的概率分布

具体而言, $p (⋅)$ 是一个函数, 它为每个可能结果 $z$ 赋予一个概率 $p(z) \in [0,1]$ , 并且满足 $\sum_{z\in Z}p(z)=1$
由于 $Z$ 是有限的, 该概率分布可以理解为一个高维向量: $p \in ℝ^{|Z|}$ .

$L(Z) \subseteq ℝ^{|Z|}$ : 集合 $Z$ 上所有彩票构成的集合.

不确定性下的偏好考虑的是集合 $X := L(Z)$ 上的偏好关系.

例: 结果集为 $Z = \{ z_1,z_2 \}$ 时的彩票空间

例: 结果集为 $Z = \{ z_1,z_2,z_3 \}$ 时的彩票空间

退化彩票

如果某个彩票 $p$ 下, 获得特定结果 $z \in Z$ 的概率为 1 (即 $p(z) = 1$ ), 则称该彩票是退化的.

$(1 \circ z)$ 即表示某个退化彩票;

一般用符号 $δ_z$ 表示退化彩票的概率分布函数 (Dirac’s delta), 它满足 $δ_z(x) = \begin{cases} 1 &\text{ if } x = z \\ 0 &\text{ if } x \ne z \end{cases}$

练习 (非常容易). 符号 $(α \circ x, (1 - α) \circ y)$ 表示的彩票对应的概率分布是? 什么时候该彩票是退化的?

结果 $x$ 发生的概率为 $\alpha$ , 结果 $y$ 的发生概率为 $1-\alpha$
若 $α = 1$ 或 $0$ , 该彩票是退化的, 对应的概率分布函数分别为 $δ_x$ 和 $δ_y$ .

关于彩票的偏好

本讲讨论的是包含不确定性的决策问题, 即彩票集 $L(Z)$ 上的偏好关系.

$L(Z)$ 上满足完备性和传递性的二元关系 $⪰$ 有很多, 但并非所有这些关系都能用期望效用来表示.

下面我们给出几类定义在 $L(Z)$ 上, 且满足完备性和传递性的二元关系 $⪰$ .

$L(Z)$ 上的偏好: 追求平等型偏好

例 (追求平等型偏好). 对任意两个彩票, 决策者总偏好其中分散程度较低的彩票.

假设结果集为 $Z = (z_1, ..., z_K)$ , 其大小为 $K := |Z|$ .
彩票 $p$ 的分散程度可以用系数 $∑_{k=1}^{K} [p(z_k) - \frac 1 K ]^{2}$ (平方偏差) 或 $∑_{k=1}^{K} \big| p(z_k) - \frac 1 K \big|$ (绝对偏差) 来衡量.

请验证, 追求平等型偏好确实是偏好关系, 即它满足完备性和传递性.

$L(Z)$ 上的偏好: 追求极端型偏好

例 (追求极端型偏好). 对任意两个彩票 $p$ 和 $q$ , 若 $\max_{z \in Z}p(z)$ 大于 $\max_{z \in Z}q(z)$ , 则决策者认为彩票 $p$ 严格优于彩票 $q$ .

问: 你认为上述两个偏好关系 (追求极端型和追求平等型) “合理” 吗?

上面这两个例子中, 偏好关系忽略了结果本身的好坏, 仅依赖于概率向量.

真实的决策过程中, 偏好会包含对每个具体结果的评估.

决策者往往对每个具体结果 $z \in Z$ 存在 “天然的” 偏好关系

当结果集为 $Z = \{ \text{iPhone, 茶颜悦色, nothing}\}$ 时:

决策者一般会最喜欢退化彩票 $(1 \circ \text{iPhone})$ , 最不喜欢退化彩票 $(1 \circ \text{nothing})$ .
但在 “追求平等型偏好” 和 “追求极端型偏好” 下, 决策者对这两个退化彩票无差异.

最坏可能结果偏好

接下来的偏好例子包含了决策者对每个具体结果 $z$ 好坏的评估, 这个评估可以表示为某个效用函数 $u: Z \to ℝ$ .

例 (最坏可能结果偏好). 考虑如下决策流程:

为每个结果 $z \in Z$ 赋予一个效用值 $u(z)$
对任意彩票 $p, q$ , 若决策者认为彩票 $p$ 下的最坏可能结果弱优于彩票 $q$ 下的最坏可能结果, 即 $\min\{u(z)|~{}p(z)>0\}\geq \min\{u(z)|~{}q(z)>0\}$ 则决策者认为彩票 $p$ 弱优于彩票 $q$ ( $p ⪰ q$ ).

上述决策过程对应的偏好为最坏可能结果偏好 (也叫 “悲观偏好”)

悲观偏好在计算机科学领域中很常用:

若算法 A 在最坏情况下的表现 (如计算复杂度) 优于算法 B, 则称算法 A 优于算法 B.
悲观偏好在计算机科学领域的广泛使用, 说明其具有一定的合理性与实用性.

悲观偏好只关注最坏的可能情形, 你可以仿照这种方式构造其它的偏好例子:

乐观偏好: 决策者只关注彩票 $p$ 下最好的结果, 并依此评估彩票的好坏.
最可能结果偏好: 决策者只关注彩票 $p$ 下最可能的结果, 并依此评估彩票的好坏.
但据我所知, 没有哪个领域的研究者会使用乐观偏好或最可能结果偏好.

期望效用偏好

定义 (期望效用偏好). 期望效用偏好对应如下决策流程: 为每个结果 $z \in Z$ 赋予一个效用值 $u(z)$ , 并基于彩票下效用的期望值来评估彩票: $p ⪰ q \text{ 若且唯若 } ∑_{z\in Z}p(z)u(z) \geq ∑_{z\in Z}q(z)u(z).$

说明:

期望效用偏好是经济学领域中最常使用的偏好类型, 此时的效用函数 $u : Z \to ℝ$ 被称为 vNM 效用函数.
一般用 $U(p) := ∑_{z\in Z}p(z)u(z)$ 表示彩票 $p$ 的期望效用; 期望效用偏好下, 当且仅当 $U(p) \ge U(q)$ 时, 决策者认为彩票 $p$ 弱优于彩票 $q$ .

期望效用偏好和悲观偏好都不是唯一的, 而是一类偏好:

决策者对彩票的偏好取决于其结果集上的效用函数 $u: Z \to ℝ$ , 不同的效用函数对应不同的期望效用偏好和悲观偏好.

公理化方法

对于彩票的 “合理” 偏好不存在唯一的标准:

经济学领域常用期望效用偏好, 而计算机科学领域常用最坏可能结果偏好

要评判哪一种偏好关系更适用于经济决策, 首先需要明确什么是 “合理”, 即我们希望偏好关系满足哪些基本要求.

公理化方法: 抽象地陈述适用于彩票空间 $L(Z)$ 上偏好的一般性要求, 并在此基础上推导出满足这些要求的偏好关系

“一般性要求“的意思是, 它必须对 $L(Z)$ 中所有彩票都成立.
这些 “一般性要求” 通常被称为公理.

vNM 模型是对期望效用偏好的公理化: 除了偏好关系本身必须满足的完备性和传递性公理外, vNM 模型还用到了独立性公理和连续性公理.

连续性公理的引入动机

考虑如下两个彩票:

彩票 1: 依概率 $α$ 获得 100 元, 依概率 $1-α$ 获得 0 元
彩票 2: 一定获得 10 元

若 $α=1$ , 则决策者认为彩票 1 严格优于彩票 2;
若 $α=0.99$ , 则决策者认为彩票 1 严格优于彩票 2;
$\quad \quad \vdots$
若 $α=0.01$ , 则决策者认为彩票 2 严格优于彩票 1;
若 $α=0$ , 则决策者认为彩票 2 严格优于彩票 1.

直觉上, 应该存在某个 $α \in (0,1)$ , 使得决策者对彩票 1 和彩票 2 无差异.

连续性公理

定义 (连续性). 令 $⪰$ 为彩票集 $L(Z)$ 上的偏好关系. 若对于 $Z$ 中任意三个满足 $δ_a \succ δ_b \succ δ_c$ 的结果 $a$ 、 $b$ 和 $c$ , 总存在实数 $\alpha \in (0,1)$ 使得 $(1 \circ b) \sim (\alpha \circ a , (1-\alpha)\circ c)$ 则称 $⪰$ 是连续的.

练习 (中等难度).

请说明, 当集合 $Z$ 至少包含三个元素时, 悲观偏好不是连续的.
请说明, 期望效用偏好是连续的.

复合彩票

在正式陈述独立性公理之前, 我们先定义复合彩票.

复合彩票对应如下包含两个阶段的不确定性消解过程:

阶段1: 根据概率分布 $(\alpha_1, ..., \alpha_K)$ , 从彩票集合 $\{ p _ 1, ..., p _ K \}$ 中抽取一个彩票;
阶段2: 给定上一阶段抽取的彩票 $p \in \{ p _ 1, ..., p _ K \}$ , 再按概率分布 $p$ 从集合 $Z$ 中抽取最终结果 $z \in Z$ .

复合彩票: 定义

定义 (复合彩票). 给定 $K$ 个彩票 $p_1, p_2, ..., p_K$ 和 $K$ 个和为 $1$ 的非负实数 $(\alpha_1, ..., \alpha_K)$ , 若存在彩票 $\hat {p} \in L(Z)$ 使得 $\hat {p}(z)=∑_{k=1}^{K}\alpha_{k}p _ {k}(z),$ 则称 $\hat {p}$ 为复合彩票.

练习: 验证上述定义中的 $\hat {p}$ 确实是彩票, 即 $\hat {p}$ 为 $Z$ 上的概率分布.

复合彩票的记号: $\oplus_{k=1}^{K}\alpha_{k}p _ {k} := \hat {p}$ .

复合彩票: 记号说明

一般形式: 用 $\oplus_{k=1}^{K} \alpha_k p_k$ 表示 $K$ 个彩票的复合
当只涉及两个彩票 $p _ {1}$ 和 $p _ {2}$ 时, 使用符号 $\alpha_{1}p _ {1}\oplus(1-\alpha_{1})p _ {2}$ 表示其对应的复合彩票.

注:

如果你用 LaTeX, 可在数学模式中用 \oplus 输入符号 $\oplus$
如果你不喜欢引入新的符号, 请自行在脑海中将所有 $\oplus$ 替换为加号 $+$ .
确实也有部分文献使用加号来表示复合彩票, 如 $\alpha_{1}p _ {1}+(1-\alpha_{1})p _ {2}$ . 大部分情况下, 读者可以看出这里的 $+$ 表示的不是加法, 而是彩票的复合.

独立性公理的引入动机

张三认为彩票 $p$ 优于彩票 $p'$ .
往彩票 $p$ 和彩票 $p'$ 中以相同比例掺入另一个彩票 $q$ , 分别得到复合彩票 $α p \oplus (1 - α) q$ 和 $α p' \oplus (1 - α) q$
直觉上, 张三应该会认为前一个复合彩票优于后一个.

关于独立性公理的一个 (非常不严格的) 类比:

如果决策者觉得牛肉比鸡肉好吃, 决策者也会认为牛肉炒饭比鸡肉炒饭好吃
牛肉 $=$ 彩票 $p$ , 鸡肉 $=$ 彩票 $p'$ , 饭 $=$ 彩票 $q$
$α$ 则是炒饭里牛肉 (或鸡肉) 的比例

独立性

定义 (独立性). 令 $⪰$ 为彩票集 $L(Z)$ 上的偏好关系. 称 $⪰$ 满足独立性公理, 若对任意彩票 $p, p', q \in L(Z)$ 和任意概率权重 $α \in (0,1)$ , $p ⪰ p' \iff α p \oplus (1 - α) q ⪰ α p' \oplus (1 - α) q.$

独立性的推论: 若 $⪰$ 满足独立性公理, 则 $p \sim p' \iff α p \oplus (1 - α) q \sim α p' \oplus (1 - α) q.$

说明: 独立性公理的合理性, 在于我们隐含假设了决策者只关心最终的结果 $z \in Z$ , 而不关心结果 $z \in Z$ 的具体生成过程.

vNM 定理

定理 (冯·诺依曼–摩根斯坦定理). 彩票集 $L(Z)$ 上的偏好关系 $⪰$ 为期望效用偏好, 当且仅当偏好关系 $⪰$ 满足独立性和连续性.

说明:

上述定理一般被称为 vNM 定理. 我们不要求会证, 但要求理解这个定理的含义: 对于期望效用偏好而言, 独立性和连续性既是充分的、也是必要的.

vNM 定理证明思路

必要性部分较为直接: 通过偏好的期望效用表示就可以证明其满足独立性和连续性
充分性部分则相对复杂, 有兴趣的同学可参考课程网站上发布的补充材料, 其中给出了详细的推导步骤:
- 首先, 证明独立性公理蕴涵单调性（引理 3.1）
- 然后, 利用连续性公理，将每一个彩票对应到某个位于对角线上的等效用彩票
- 最后, 通过这一对应关系构造出所需的 vNM 效用函数

vNM 效用的唯一性

定义 (正仿射变换). 称函数 $v(z)$ 是函数 $u(z)$ 的正仿射变换, 若存在正数 $α > 0$ 和常数 $β$ 使得 $v(z) = \alpha u(z)+\beta$ (即乘以一个正数并加上任意常数).

命题. vNM 效用函数 $u : Z \to ℝ$ 在正仿射变换的意义上是唯一的; 也就是说, 若 $u(z)$ 和 $v(z)$ 均为同一期望效用偏好 $⪰$ 的 vNM 效用函数, 则 $v(z)$ 一定是 $u(z)$ 的正仿射变换.

注: 期望效用偏好仅对于效用函数的正仿射变换具有不变性, 对于一般的正单调变换不具有不变性.

$f(x) = \sqrt{x}$ 是一个正单调变换, 也是一个严格凹变换. 对决策者的效用函数施加凹变换 $f$ , 会改变决策者的风险态度.

阿莱悖论

如下两个彩票, 你更愿意选谁?

彩票一: 25% 概率得 3000 元, 75% 概率得 0 元
彩票二: 20% 概率得 4000 元, 80% 概率得 0 元