混合策略¶
策略式博弈的混合扩展¶
混合策略扩展的效用函数是多重线性函数
令 \(G = (N,(S_i)_{i\in N},(u_i)_{i\in N})\) 为一个策略式博弈,每个参与人的策略集 \(S_i\) 是有限的,\(\Gamma = (N,(\Sigma_i)_{i\in N},(U_i)_{i\in N})\) 是其混合扩展。那么对于每个参与人 \(i \in N\),函数 \(U_i\) 是 \(n\) 个变量 \((\sigma_i)_{i \in N}\) 的多重线性函数,即对于每个参与人 \(i\),对每个 \(\sigma,\sigma' \in \Sigma_i\) 和每个 \(\lambda \in [0,1]\),有
证明
只需要注意到 \(U_i(\sigma) = \sum\limits_{(s_1,\cdots,s_n)} u_i(s_1,\cdots,s_n) \prod\limits_{j=1}^n \sigma_j(s_j)\),然后展开即可。
下面的引理表明,多重线性函数一定是连续函数,因此结合上述定理可以得到,混合策略下每个参与人的的效用函数都是连续函数:
引理
如果 \(f\) 是 \(n\) 个变量的多重线性函数,那么 \(f\) 是连续函数。
证明
首先证明以下事实:存在一个常数 \(C > 0\) 使得 \(||f(x_1,\cdots,x_n)|| \leqslant C \prod\limits_{i=1}^n ||x_i||\) 对所有 \((x_1,\cdots,x_n)\) 成立。事实上 \(f\) 的定义域 \(\mathbb{R}^n\) 是一个线性空间,因此我们可以取自然基 \(e_1,\cdots,e_n\),则任意 \((x_1,\cdots,x_n) = \sum\limits_{i=1}^n x_i e_i\),因此
其中 \(C = \max\limits_{i=1}^n ||f(e_i)||\)。基于这一结果,根据 \(||f(x_1) - f(x_2)|| = ||f(x_1 - x_2)|| \leqslant C \prod\limits_{i=1}^n ||x_{1i} - x_{2i}||\),我们可以得到 \(f\) 是连续函数。
纳什定理
对于任意一个策略式博弈 \(G\),如果参与人的个数有限,每个参与人的策略集是有限的,那么必然存在一个混合策略纳什均衡。
定理的证明较为困难,并且有很多值得讨论的地方,我们留到博弈论进阶的相关章节给出。