本文..林理裕老師所撰寫..
生活到處充滿著矛盾與兩難的困境,有時候甚至會讓人覺得生活的本質就是經歷不同的矛盾情境。雖然大多數的矛盾都是相當抽象,或是具哲學意味;但也有些是非常實際,甚至於與日常生活息息相關。囚犯兩難問題(Prisoner,s Dilemma)就是一個很具體的例子。它於一九五0年為蘭德公司(RAND Cooperation)的德雷修與富拉德(Melvin Dresher and Merrill Flood)所發現,而被塔克(Albert Tucker)定名。本文將依據艾克西羅德(Robert Axelrod)所設計的電腦競賽及結果,探討人性社會的實況。
在進入主題之前,茲就相關的概念做一簡介,以期讀者能深入體會其中的奧妙。首先,囚犯兩難問題是一種理性選擇模式(Rational Choice Model)。所謂「理性」,主要是引自經濟學的追求最大的利益或最小的成本(profit maximization or cost minimization)。它是建立在一個基本假設:在這個模式下的行為者,知道什麼是有利的,什麼是有害的;而在做抉擇時,必然選擇他所認為能夠達到最大利益或最小成本的選擇項。所謂「兩難囚境」是指這個理性行為者在一特定的環境下,依據他的最大利益或最小成本的原則,無法從中選擇一項以達到他的目的。
接下來就讓我們來看什麼是囚犯兩難問題。假設兩嫌疑犯因犯同一案件而被分別關在不同的囚房準備接受審判。檢察官分別向他們勸說:「我們掌握有許多證據證明你們犯此案,卽使你們兩個矢口不招供,我們有辦法起訴你們,並使你們各被判兩年罪刑;如某你能招供並幫助我們釐清案情,我們可以把罪過都歸到你的同伴,讓他被判五年刑,而把你釋放。但是如果你們兩個都招供,那就要各被判四年刑。」在這裡我們暫且在假設沒有「報復」這觀念。
此時,兩個囚犯都知道彼此都處於相同的情境,但卻不知對方會做如何的決定。聰明的你,假設你們是其中的一個,你會怎麼做?每個人的結果有四種,第一是你招供而你的朋友保持沉默,那麼你將被無罪開放,你的朋友被判刑五年-結果一。
第二是你和你的朋友都保持沉默,那麼你們將各被判刑兩年-結果二。第三是你們都招供了,結果都被判刑四年-結果三。第四是你當了冤大頭,被你的朋友出賣了,你被判刑五年,你的朋友被釋放-結果四。
從結果一與結果二和結果三與結果四可以發現,不管你的朋友的反應如何,你的最好策略是招供(結果一優於結果二,結果三優於結果四)。但是經過同樣的推理過程,你那有「理性」的同伴也會選擇招供一途。這也是說你們兩個都要在監獄裡待四年。多可憐的結果!要是你們都能保持沉默,你們將可少待在監獄兩年。可是你敢這樣做嗎?你確定你的朋友也會這樣想嗎?這就是著名的囚犯兩難問題。
讓我們再建構一更具體的例子。假設你與一個陌生人從事一項交易,你付錢,他交貨。然而因故你們無法當面交易,於是約好兩人同時把錢或貨品放在不同的地方,然後再去同時去拿取對方所放的貨品或錢。而且假設事後誰也找不到對方(無從報復)。在這樣的情況下,你會部會把錢放在那?
現在我們在把前面的假設稍做修改。假設你們兩很想持續這樣的秘密交易方式,所以相互約定每月交易一次,直到終生。當然如果兩個人都死了,交易就無法在進行下去了。在這樣的情形下,你能想出一套致富的策略嗎?讓我們再假設幾個月或幾年後你不小心意外地獲得情報,你的對手很可能在下個月就要死了。那麼再這假設的最後一次交易,你會怎麼做?當然你的對手也會猜想你是否也得到將死的傳聞。再者,如果你的對手就那麼不聲不響地悄悄「去了」,你將會如何進行這項交易?你會停止它嗎?
根據上述的推理,密西根大學的艾克西羅德設計了一套電腦程式的競賽規則。他要求各參與競賽的電腦程式專家、囚犯兩難問題專家,和其他有興趣的人,設計一組程式 一連串的反應,一組由「合作」與「變節」,它可以是全部「合作」或「變節」,或是任何數量的「合作」與「變節」的組合,甚至是可以隨機的組合(由丟銅板來決定)。只要你想的道的策略,都可以參加。然後他把所有的程式兩兩配對「廝殺」兩百回合,把兩百回合的得分加起來就是這次比賽的分數。而所有比賽分數的總合就是競賽的總分,也就是判斷輸贏的依據。
經過前後兩次的競賽(第一次有十四人參加,第二次有六十二人參加)其結果都是由同一個程式獲勝,姑且稱它「以牙還牙」程式(TIT FOR TAT)。
它也是所有程式中最短的一個,只有兩行 第一回合:「合作」,然後做對方前一回合所做的事。更令人驚訝的是在所有捉對廝殺中,它從來沒有贏過對方。最多只是與對方打成平手,其它則是小輸幾分,不過累積的總分卻是最高。為什麼?
實際上再設計程式時至少有三階段的考慮程度。第一階段是一個選擇項的直接效果。如同前面所討論過的,「變節」將比「合作」獲利多。第二階段是一個選擇項的間接效果。也就是必須考慮對方對你的「變節」時是否會加以處罰 報復。一般人都只有想到這裡而已。而第三階段是一般人在面對對方「變節」時,很可能會重複或加以先前的「剝削」策略。忽略了這一點,常常會使遊戲陷入僵局,在懲罰別人的同時,也嚴重的損害到自以的利益。
經過仔細的分析「以牙還牙」程式,不難發現它有以下四點優點:
一、 他展示出「合作」的誠意。實際上在所有與賽的程式裡,前十五名中只第八名不是以「合作」為第一步棋;而最後十五名中也只有一個是以「合作」開始。只有在合作的誠意下,對方才肯放心地合作。
二、 及時的憤怒。當對手「變節」以後,馬上還以顏色,讓對手知道它「生氣」了。
三、 及時原諒對方。當對方恢復「合作」後馬上顯示出他的風度,並教導對方它是很重視「合作」的。
四、 清楚的表示自已的意向。也就是二和三的結合。讓對方明白它的「恩仇必報」的原則,一方面即時保護自已,一方面又積極爭取「合作」的機會。
就以上所述的優點下,「以牙還牙」程式脫穎而出,成為眾多矚目的焦點;而其優點更是發人深省。在人類社會中,人與人的互動關係,不正就是這種「合作」與「變節」的組合,永無止境地進行著。善良的出發點,配合著與人共享、共同成長的胸懷,而不求勝過或「剝削」對方,終於造就出輝煌的成果,傲視群倫。反觀社會中的種種變亂不也就是不斷的「變節」,「出賣」、「剝削」所造成的?
譬如勞工問題。如果雇主能妥善照顧勞工的權益,並與勞工共享公司成長的利潤;而勞工們也能克盡本分,戮力為公司的成長與發展而奮鬥。如此,勞資雙方不能和諧相處,共同獲利,共同成長。但是,實際情形又是如何?資方一方面想要公司的快速成長,一方卻又想要獨享成長的果實,一眛地漠視與剝削勞工的利益。而勞工也想高工資,低工時,和好的工作環境,但卻不把心力放在工作上。如此的相互「出賣」最後只是落得公司倒閉關門,而勞工失業回家吃自已的下場。
再如兩家相互交易的公司,彼此對對方的價錢或貨品很感滿意。如果兩者能持續「合作」,彼此都能在這好環境下共同成長。如果一方因忌妒對方獲利而想「剝削」他,比如說,不如期交款。此舉將引起對方的報復行動,如延期交貨、降低品質…等。如此,原本相互成長、相互獲利的情形不見了。惡性循環的結果,彼此受到嚴重的損害,而致拆夥與各覓新伴。這又何苦來哉?
這以國際政治舞台的例子更能說明其間的利害關係。在國際間,各國就像一個獨立而自利的個體,生活在一無政府的社會下。國與國之間的合作能提昇全人類的福祉,但是相互衝突就可能導致全人類的毀滅,至少也會減緩或降低發展的速度。就以美蘇的軍備競賽與限武談判為例。兩國的對峙,雖然表面上維持著和平均勢,但背地裡確隱藏著毀滅對方的強大武器。雙方從二次世界大戰後不斷地舉行高峰限武或裁武會議。但是四十餘年來,武器卻未見減少,反而以驚人的速度在增加,而武器的品質更是一日千里。從裁減軍備、核武嚇阻、相互毀滅,第二擊能力,到所謂的星戰計畫。或許在不久的將來,大家都要到外太空中去流浪,而高唱「地球不是我的家」(如果那時還有人類存在)。再看看台海兩岸的對峙。四十年來,我們花費在國防上的金錢與心血又是多麼的龐大。這一切的一切,又是為什麼?
很諷刺的,這種連低等生物都在「嘗試錯誤」的過程中學到的「金玉良言」,號稱萬物之靈的人類,卻仍舊依恃著那所自詡的「理性」大反其道而行。聰明的妳,我們該怎麼做阿?
文章定位: