混合策略¶

策略式博弈的混合扩展¶

混合策略扩展的效用函数是多重线性函数

令 \(G = (N,(S_i)_{i\in N},(u_i)_{i\in N})\) 为一个策略式博弈，每个参与人的策略集 \(S_i\) 是有限的，\(\Gamma = (N,(\Sigma_i)_{i\in N},(U_i)_{i\in N})\) 是其混合扩展。那么对于每个参与人 \(i \in N\)，函数 \(U_i\) 是 \(n\) 个变量 \((\sigma_i)_{i \in N}\) 的多重线性函数，即对于每个参与人 \(i\)，对每个 \(\sigma,\sigma' \in \Sigma_i\) 和每个 \(\lambda \in [0,1]\)，有

\[U_i(\lambda \sigma_i + (1-\lambda)\sigma'_i,\sigma_{-i}) = \lambda U_i(\sigma_i,\sigma_{-i}) + (1-\lambda)U_i(\sigma'_i,\sigma_{-i}),\forall \sigma_{-i} \in \Sigma_{-i}\]

证明

只需要注意到 \(U_i(\sigma) = \sum\limits_{(s_1,\cdots,s_n)} u_i(s_1,\cdots,s_n) \prod\limits_{j=1}^n \sigma_j(s_j)\)，然后展开即可。

下面的引理表明，多重线性函数一定是连续函数，因此结合上述定理可以得到，混合策略下每个参与人的的效用函数都是连续函数：

引理

如果 \(f\) 是 \(n\) 个变量的多重线性函数，那么 \(f\) 是连续函数。

证明

首先证明以下事实：存在一个常数 \(C > 0\) 使得 \(||f(x_1,\cdots,x_n)|| \leqslant C \prod\limits_{i=1}^n ||x_i||\) 对所有 \((x_1,\cdots,x_n)\) 成立。事实上 \(f\) 的定义域 \(\mathbb{R}^n\) 是一个线性空间，因此我们可以取自然基 \(e_1,\cdots,e_n\)，则任意 \((x_1,\cdots,x_n) = \sum\limits_{i=1}^n x_i e_i\)，因此

\[\begin{align} ||f(x_1,\cdots,x_n)|| & = ||f(\sum\limits_{i=1}^n x_i e_i)|| = ||\sum\limits_{i=1}^n x_i f(e_i)|| \leqslant \sum\limits_{i=1}^n ||x_i|| \cdot ||f(e_i)|| \\ & \leqslant C\sum\limits_{i=1}^n ||x_i|| \end{align}\]

其中 \(C = \max\limits_{i=1}^n ||f(e_i)||\)。基于这一结果，根据 \(||f(x_1) - f(x_2)|| = ||f(x_1 - x_2)|| \leqslant C \prod\limits_{i=1}^n ||x_{1i} - x_{2i}||\)，我们可以得到 \(f\) 是连续函数。

纳什定理

对于任意一个策略式博弈 \(G\)，如果参与人的个数有限，每个参与人的策略集是有限的，那么必然存在一个混合策略纳什均衡。

定理的证明较为困难，并且有很多值得讨论的地方，我们留到博弈论进阶的相关章节给出。