跳转至

混合策略

策略式博弈的混合扩展

混合策略扩展的效用函数是多重线性函数

\(G = (N,(S_i)_{i\in N},(u_i)_{i\in N})\) 为一个策略式博弈,每个参与人的策略集 \(S_i\) 是有限的,\(\Gamma = (N,(\Sigma_i)_{i\in N},(U_i)_{i\in N})\) 是其混合扩展。那么对于每个参与人 \(i \in N\),函数 \(U_i\)\(n\) 个变量 \((\sigma_i)_{i \in N}\) 的多重线性函数,即对于每个参与人 \(i\),对每个 \(\sigma,\sigma' \in \Sigma_i\) 和每个 \(\lambda \in [0,1]\),有

\[U_i(\lambda \sigma_i + (1-\lambda)\sigma'_i,\sigma_{-i}) = \lambda U_i(\sigma_i,\sigma_{-i}) + (1-\lambda)U_i(\sigma'_i,\sigma_{-i}),\forall \sigma_{-i} \in \Sigma_{-i}\]

证明

只需要注意到 \(U_i(\sigma) = \sum\limits_{(s_1,\cdots,s_n)} u_i(s_1,\cdots,s_n) \prod\limits_{j=1}^n \sigma_j(s_j)\),然后展开即可。

下面的引理表明,多重线性函数一定是连续函数,因此结合上述定理可以得到,混合策略下每个参与人的的效用函数都是连续函数:

引理

如果 \(f\)\(n\) 个变量的多重线性函数,那么 \(f\) 是连续函数。

证明

首先证明以下事实:存在一个常数 \(C > 0\) 使得 \(||f(x_1,\cdots,x_n)|| \leqslant C \prod\limits_{i=1}^n ||x_i||\) 对所有 \((x_1,\cdots,x_n)\) 成立。事实上 \(f\) 的定义域 \(\mathbb{R}^n\) 是一个线性空间,因此我们可以取自然基 \(e_1,\cdots,e_n\),则任意 \((x_1,\cdots,x_n) = \sum\limits_{i=1}^n x_i e_i\),因此

\[\begin{align} ||f(x_1,\cdots,x_n)|| & = ||f(\sum\limits_{i=1}^n x_i e_i)|| = ||\sum\limits_{i=1}^n x_i f(e_i)|| \leqslant \sum\limits_{i=1}^n ||x_i|| \cdot ||f(e_i)|| \\ & \leqslant C\sum\limits_{i=1}^n ||x_i|| \end{align}\]

其中 \(C = \max\limits_{i=1}^n ||f(e_i)||\)。基于这一结果,根据 \(||f(x_1) - f(x_2)|| = ||f(x_1 - x_2)|| \leqslant C \prod\limits_{i=1}^n ||x_{1i} - x_{2i}||\),我们可以得到 \(f\) 是连续函数。

纳什定理

对于任意一个策略式博弈 \(G\),如果参与人的个数有限,每个参与人的策略集是有限的,那么必然存在一个混合策略纳什均衡。

定理的证明较为困难,并且有很多值得讨论的地方,我们留到博弈论进阶的相关章节给出。