個策略,我的這個策略總是顯出優勢。
◎收益矩陣:由著名經濟學家托馬斯?謝林教授提出,用矩陣的形式直觀地表示兩個參與者在博弈中的得失。收益矩陣在博弈論中至關重要,在本書的許多章節中都會涉及。
■囚徒困境:忠誠還是背叛?這是一個問題
在瞭解“囚徒困境”之前,讓我們先看一下發生在我國古代的一個小故事。
春秋時期,貧士玉戭生與三烏從臣二人相交甚好,由於沒有錢,他們就以品性互勉。玉戭生對三烏從臣說:“我們這些人應該潔身自好,以後在朝廷做官,絕不能趨炎附勢而玷汙了純潔的品性。”三烏從臣說:“你說得太有道理了,巴結權貴絕不是我們這些正人君子所為。既然我們有共同的志向,何不現在立誓明志呢?”於是二人鄭重地發誓:“我們二人一致決心不貪圖利益,不被權貴所誘惑,不攀附奸邪的小人而改變我們的德行。如果違背誓言,就請明察秋毫的神靈來懲罰背誓者。”
後來,他們二人一同到晉國做官。玉戭生又重申以前發過的誓言,三烏從臣說:“過去用心發過的誓言還響在耳邊,怎能輕易忘呢!”當時趙盾在執掌晉國朝政,人們爭相拜訪趙盾,以期能得到他的推薦,從而得到國君的賞識。趙盾的府邸前車子都排出了很遠。這時三烏從臣已經後悔,他很想結識趙盾,想去趙盾家又怕玉戭生知道,幾經猶豫後,決定起早去拜訪。為避人耳目,當雞剛叫頭遍,他就整理衣冠,匆匆忙忙去拜訪趙盾了。進了趙府的門,卻看見已經有個人端端正正地坐在正屋前東邊的長廊裡等候了,他走上前去舉燈一照,原來那個人是玉戭生。
這則頗具意味的故事出自明代學者宋濂的《宋文獻公全集》。宋濂在作品中評論道:“二人貧賤時,他們的盟誓是真誠良好的,等到當了官走上仕途,便立即改變了當初的志向,為什麼呢?是利害關係在心中鬥爭,地位權勢使他們在外部感到恐懼的緣故。”或許我們要問,地位和權勢是怎樣使他們感到恐懼的?或許博弈論中的“囚徒困境”理論可以給出合乎情理的解答。
1950年的一天,美國斯坦福大學客座教授、普林斯頓大學數學系主任阿爾伯特?塔克給一些心理學家做講演,為了避免使用繁雜的數學手段而能更加形象地說明博弈的過程,他提出了囚徒困境的理論模型。
塔克以下面這則小故事作為開始:
鮑勃和埃爾兩個竊賊在偷盜地點附近被警察抓獲,分別關押。每個竊賊必須選擇是否供認並指證同夥。如果二人都不供認,將被指控非法攜帶武器,入獄1年。如果二人都供認並指證同夥,將入獄10年。如果一人供認,一人不供認,則鑑於供認者與警方合作的表現,無罪釋放,其同夥將遭到嚴懲,判入獄20年。
第2章 囚徒困境:傻作精時精亦傻,輸為贏處贏還輸(2)
我們用收益矩陣分析囚徒困境的情況(如下表):
埃爾
供認 不供認
鮑伯 供認 10年,10年 0年,20年
不供認 20年,0年 1年,1年
收益矩陣可以這樣解釋:囚犯的戰略是供認或不供認,每個囚犯選擇其中一種戰略。豎列代表埃爾的戰略,橫行代表鮑勃的戰略。矩陣中的每組數字是兩個囚犯選擇不同戰略得到的相應結果,逗號左邊的數字為鮑勃的收益,右邊數字為埃爾的收益。以第一列為例,若兩囚犯都認罪,都被判入獄10年;若埃爾認罪,鮑勃不認罪,鮑勃入獄20年,埃爾獲釋。
那麼,到底應該如何解決這一博弈問題呢?如果二人都想入獄時間最短,什麼樣的戰略才是理性的呢?埃爾可能作如下思考:“有兩種可能性會發生:鮑勃認罪或保持沉默。假定鮑勃認罪,則我不認罪將入獄20年