略納什均衡點,而有混合策略均衡點。這個混合策略均衡點下的策略選擇是每個參與人的最優(混合)策略選擇。

小偷(1)

警察

襲擊A地

襲擊B地

巡邏A地

3,0

2,1

巡邏B地

1,2

3,0 對於這個例子,警察的一個更好的策略是,警察用擲骰子的方法決定去A地還是B地。假定警察規定擲到1—4點去A地,擲到5、6兩點去B地,這樣警察有2/3的機會去A地進行巡邏,1/3的機會去B地。

而小偷的最優選擇是:以同樣擲骰子的辦法決定去A地還是去B地偷盜,如擲到1—4點去B地,擲到5、6兩點去A地,那麼,小偷有1/3的機會去A地,2/3的機會去B地。

此時警察與小偷所採取的便是混合策略。

假如按這種策略,我們看一下雙方的收益。警察的期望得益是:7/3萬大於2。警察按此辦法比只巡邏A地的收益更高。

一旦警察採取混合策略,小偷也採取混合策略,其最優混合策略下的收益為2/3萬元。小偷的收益比警察只巡邏A地的收益要低。

因為:當警察去A地巡邏時,小偷有1/3的機會去A地,2/3的機會去B地,此時警察去A地的得益為:萬元;當警察去B地時,同樣,小偷有1/3的機會去A地,2/3的機會去B地,此時警察A地的得益為:萬元。

警察總的得益為:萬元。

同理,我們可得小偷的總的得益為2/3萬元。

這裡我們“讓”警察和小偷擲骰子以確定去A地還是去B地,目的是要去A地和去B地之間確定一個機率分佈,他們當然可用其他方式來確定這個機率分佈。

宰割博弈中警察與小偷所用的混合策略,如同小孩子之間玩“剪刀—石頭—布”的遊戲時所用的策略。在“剪刀—石頭—布”這樣的遊戲中,不存在純策略均衡,對每個小孩來說,自己採取出“剪刀”、“布”還是“石頭”的策略應當是隨機的,不能讓對方知道自己的策略,哪怕是傾向性的策略。如果對方知道你出其中一個策略的可能性大,那麼你在遊戲中輸的可能性就大。因此,每個小孩的最優混合策略是採取每個策略的可能性是1/3。在這樣的博弈中,每個小孩各取三個策略的1/3是納什均衡。

由此可見:純策略是參與人一次性選取的,並且堅持他選取的策略;而混合策略是參與人在各種備選策略中採取隨機選取的。在博弈中,參與人可以改變他的策略,而使得他的策略選取滿足一定的機率分佈。

若博弈是零和博弈,即若博弈參與人為兩人,一方所得是另外一方的所失,或者若博弈是常和博弈,即若博弈參與人為兩人,一方所得的增加等於另外一方的損失,此時,對於任何一個參與人而言,都不可能有純策略的佔優策略。博弈參與人採取混合策略是合適的,均衡為混合策略均衡。如在當前的“反恐”博弈中,由於力量的有限,反恐方往往“更多地”將力量放在重點區域,如人口密集的大城市,“一定程度地”關注不太危險的區域,如人口稀疏的農村。這就是混合策略。而恐怖分子同樣在玩混合策略:對攻擊物件的選擇是隨機的,對攻擊方式的選擇也是隨機的。

在競爭性的博弈中,該採取混合策略而不採取混合策略將會帶來失敗。田忌賽馬是人人熟悉的故事。齊王與田忌賽馬,但齊王的馬平均來說要比田忌的馬要跑得快,但田忌採納了孫臏的策略,田忌用下等馬對齊王的上等馬,上等馬對齊王的中等馬,中等馬對齊王的下等馬。田忌以三比二獲勝,贏了齊王。賽馬是零和博弈,齊王的失敗在於他使用了純策略;若齊王使用混合策