一种完全对抗、强烈竞争的对策。最初由美国数学家约翰·冯·诺伊曼提出,后由美国麻省理工学院经济学家莱斯特·瑟罗加以推广。即每次结局时,局中人的支付总和是零(或某个常数),一个局中人的所得恰是另一局中人的所失。
零和对策zero-sum games
在有些对策中,对策双方形成完全的冲突,一个对策者的所得就是另一对策者的所失,反之亦然,这就是零和对策。例如,在抛硬币的例子中,局中人P和Q同时各抛一硬币,硬币或者正面朝上,或背面朝上。如果两枚硬币落下后都是正面朝上,或背面朝上,则P给Q一美元,否则Q给P一美元。
零和对策通常可用2维的赢得矩阵来表示。因为一方P之得即为另一方Q之失,所以不必是2个数的数组,只写P或Q的赢得即可。
下面的赢得矩阵B表示,P有m种纯策略抉择,Q有n种纯策略抉择(不由随机试验决定取舍的策略称纯策略)。如果P取第i种策略而Q取第j种策略进行一局对策,则P的赢得为bij,而Q的赢得为—bij。
| | Q1 | Q2 | … | Qn |
| P1 | b11 | b12 | … | b1n |
| P2 | b21 | b22 | … | b2n |
| · | B= | · | · | | · |
| · | · | · | | · |
| · | · | · | | · |
| Pm | bm1 | bm2 | … | bmn |
可见,零和对策可以由赢得矩阵表示。
为了使对方不知道自己将采取什么策略,每个人都不会固定采取某种纯策略,而是各采取一种所谓的混合策略。对P来说是P=(p
1,…p
m),即以概率p
i采取策略p
i,这里p
1,p
2…p
m≥0,p
1+…+p
m=1。如果p
5=0.17,就是表示P将随机地按照17%的几率采用他的第5个纯策略。对于Q来说,则有q=(q
1,…q
n),即以概率q
i采用策略Q
i。