略納什均衡點，而有混合策略均衡點。這個混合策略均衡點下的策略選擇是每個參與人的最優（混合）策略選擇。

小偷（1）

警察

襲擊A地

襲擊B地

巡邏A地

3，0

2，1

巡邏B地

1，2

3，0 對於這個例子，警察的一個更好的策略是，警察用擲骰子的方法決定去A地還是B地。假定警察規定擲到1—4點去A地，擲到5、6兩點去B地，這樣警察有2/3的機會去A地進行巡邏，1/3的機會去B地。

而小偷的最優選擇是：以同樣擲骰子的辦法決定去A地還是去B地偷盜，如擲到1—4點去B地，擲到5、6兩點去A地，那麼，小偷有1/3的機會去A地，2/3的機會去B地。

此時警察與小偷所採取的便是混合策略。

假如按這種策略，我們看一下雙方的收益。警察的期望得益是：7/3萬大於2。警察按此辦法比只巡邏A地的收益更高。

一旦警察採取混合策略，小偷也採取混合策略，其最優混合策略下的收益為2/3萬元。小偷的收益比警察只巡邏A地的收益要低。

因為：當警察去A地巡邏時，小偷有1/3的機會去A地，2/3的機會去B地，此時警察去A地的得益為：萬元；當警察去B地時，同樣，小偷有1/3的機會去A地，2/3的機會去B地，此時警察A地的得益為：萬元。

警察總的得益為：萬元。

同理，我們可得小偷的總的得益為2/3萬元。

這裡我們“讓”警察和小偷擲骰子以確定去A地還是去B地，目的是要去A地和去B地之間確定一個機率分佈，他們當然可用其他方式來確定這個機率分佈。

宰割博弈中警察與小偷所用的混合策略，如同小孩子之間玩“剪刀—石頭—布”的遊戲時所用的策略。在“剪刀—石頭—布”這樣的遊戲中，不存在純策略均衡，對每個小孩來說，自己採取出“剪刀”、“布”還是“石頭”的策略應當是隨機的，不能讓對方知道自己的策略，哪怕是傾向性的策略。如果對方知道你出其中一個策略的可能性大，那麼你在遊戲中輸的可能性就大。因此，每個小孩的最優混合策略是採取每個策略的可能性是1/3。在這樣的博弈中，每個小孩各取三個策略的1/3是納什均衡。

由此可見：純策略是參與人一次性選取的，並且堅持他選取的策略；而混合策略是參與人在各種備選策略中採取隨機選取的。在博弈中，參與人可以改變他的策略，而使得他的策略選取滿足一定的機率分佈。

若博弈是零和博弈，即若博弈參與人為兩人，一方所得是另外一方的所失，或者若博弈是常和博弈，即若博弈參與人為兩人，一方所得的增加等於另外一方的損失，此時，對於任何一個參與人而言，都不可能有純策略的佔優策略。博弈參與人採取混合策略是合適的，均衡為混合策略均衡。如在當前的“反恐”博弈中，由於力量的有限，反恐方往往“更多地”將力量放在重點區域，如人口密集的大城市，“一定程度地”關注不太危險的區域，如人口稀疏的農村。這就是混合策略。而恐怖分子同樣在玩混合策略：對攻擊物件的選擇是隨機的，對攻擊方式的選擇也是隨機的。

在競爭性的博弈中，該採取混合策略而不採取混合策略將會帶來失敗。田忌賽馬是人人熟悉的故事。齊王與田忌賽馬，但齊王的馬平均來說要比田忌的馬要跑得快，但田忌採納了孫臏的策略，田忌用下等馬對齊王的上等馬，上等馬對齊王的中等馬，中等馬對齊王的下等馬。田忌以三比二獲勝，贏了齊王。賽馬是零和博弈，齊王的失敗在於他使用了純策略；若齊王使用混合策

第3部分 (第2/5頁)