Nov 11 2019 · 14 min read

為甚麼我應道德？— 從博弈論的觀點看

柏拉圖的《理想國》 (Republic) 中載有一個居格斯戒指 (Ring of Gyges) 的故事：居格斯是牧羊人，有一次牧羊時遇上暴風雨及地震，跟著地面裂開，下面有一深洞，他走下去，看到有一具放在空心銅馬內的屍體，他取去了屍體手上的戒指。有一次他碰巧把戒指底座轉向他自己，其他人就看不到他了。他發現了這戒指具有令人隱形的力量後，就設法當上國王的傳令，到國王身邊，然後勾引了皇后，跟她同謀，殺掉國王並奪取其權力。 (2:359a–2:360d) 假若居格斯提出「為甚麼我應道德？」這個問題，那麽我們應如何回答呢？

中國式回答：這樣厚顏無恥的問題虧你說得出口，你還是人嗎？人身攻擊通常是反智的開端，搞不好甚至引起打鬥。另一種既智性又文明的回答是：「道德」意謂「應該要做的事」，因此「為甚麼我應道德？」的意思，等於「為甚麼我應該要做應該要做的事？」，很清楚，這問題還用問嗎！可惜，這答案說服不了居格斯，因為前面說的「應該」可以是精明上的應該。例如，甲超級市場的雞蛋比乙超級市場的便宜一半，剛巧你要買雞蛋，並且你是精打細算的人，假設這兩家超級市場的其他條件相同，你自然「應該」到甲超級市場買雞蛋。顯然，這個「應該」是基於精明 (prudence) 而發，而非出於道德考慮。

如果單從精明的角度考慮，通常我們遵從道德規條的理由，一方面是避免他人責備，又或者不想面對法律的懲罰；另一方面是為了得到一些好處，例如童叟無欺，為的是生意興隆。當然，現實上没有居格斯戒指，不過，如果你遇上可以逃過責罰的情況，那麼你仍有（精明的）理由遵守道德要求嗎？「公地悲劇 (Tragedy of the commons)」正好就是這類情況。例如保持郊野清潔，如果你在四野無人的郊野丟棄垃圾，沒有人會知道是你丟棄的，因此你可以逃過責罰；那麽，精明的你仍會做個良好公民，保持郊野清潔嗎？如果你是理性的話，大抵不會，因為你會這樣思考：如果大多數人是良好公民，這次我丟棄垃圾，根本不會危害到郊野的清潔；如果這次我不丟棄垃圾，反而會白白浪費了我找垃圾桶的氣力。如果其他人跟我一樣，都貪圖方便亂丟垃圾，那麼效野污染的問題，根本不是我丟不丟垃圾可以解決，就算我不丟垃圾，最終也是浪費氣力。所以，如果我是理性的話，不管其他人是否丟棄垃圾，我也會貪圖方便亂丟垃圾。

除非我們假定精明理性的人本質上是欲求道德的，或本性上就具有對道德的喜好，而遵從道德規範去行事又是唯一有效的途徑，否則，我們很難說做道德行為是理性的。不過，這些假定看來都隱含了「我們有（精明的）理由接受道德規條」的意思，因此有竊取論點 (begging the question) 之嫌。似乎我們並沒有理由去說遵從道德規範行事是理性的。然而，當代道德哲學家大衛．高契爾 (David Gauthier) 卻肯定地回答：「理性地去選擇，人必道德地去選擇。」 (“To choose rationally, one must choose morally.") (MA: 4) [1] 本文的目的在於闡釋他的論證，展示出個人如何「從非道德 (non-moral) 的前提推論出，他的選擇 (choices) 應受道德的約束 (the constraints of moraity)」。 (MA: 5)

高契爾從廣為社會科家接受的「經濟人 (homo economicus) 」這個非道德的概念開始。用新古典式經濟理論 (neoclassical economic theory) 來說，經濟人就是追求效益 (utility) 的最大化者 (maximizer)。他僅依據工具理性 (instrumental rationality) 去作選擇，選擇效益最大化 (maximization of utility ) 的行動：他會選取在他自己偏好順序中居於最高位置的行動或結果。例如我具有一個偏好順序 X>Y>Z，如果我是一個經濟人，我便會選擇達致結果 X 的行動。

以上對工具理性的界定只適用於具確定性 (certainty) 的選擇情況，當不是所有被選擇的行動都會引致某單一的特定結果時，上述所說的工具理性便有可能失效。例如我有一萬元，如果只容許我選擇投注六合彩或賽馬其中一項，而六合彩的獎金有三百萬元，賽馬的獎金只有一百萬元。如果按上述的工具理性行動，那麼選擇投注六合彩是理性的；但假設六合彩的中獎機會只有千萬份之一，而賽馬中獎的機率是千分之一，那麼選擇投注六合彩便未必是理性的了。日常生活中的選擇情況大多是不確定的，我們要將機會率也計算在內，因此，以預期效益 (expected utililty) 來界定工具理性更準確，唯有選擇最大預期效益 (maximization of expected utililty) 的行動才是合符工具理性的。

那麼，怎樣論證經濟人遵從道德要求是理性的呢？我們可借用囚徒的兩難 (prisoner’s dilemma) 來釐清這問題。先說一個典型的故事，以幫助我們理解囚徒的兩難。有兩個積犯被捕，檢察官確定這兩個犯人曾合伙做了一件嚴重的罪案，但除非他們自己認罪，否則沒有充份證據判他們重刑，而只能改控其他輕微的罪名。檢察官於是想出一個辦法來使他們認罪，就是將兩人隔離審訊，使他們不能互通消息，然後告知所有可能的選擇及結果。所有可能的選擇只有兩個，認罪或不認罪，如果兩人都不認罪，只判各人兩年刑期；如果兩人都認罪，則各判五年。然而，如果其中一人認罪而另一人不認罪，認罪者可獲釋，不認罪者將被判十年。假如這兩個犯人被捕前互相承諾不認罪供出對方，但他們又都是追求自己最大效益的經濟人，那麼他們有理由遵守承諾嗎？先看看下圖，以幫助分析：

在這對局 (game) 中，局中人 A 和 B 分別代表上述兩犯人，他們有擁有完全 (complete) 的但不完美 (imperfect) 的資訊；之所以是完全，是因為大家都知道所有可能的策略及後果，而不完美，是因為作出決定之後才會知道其他局中人的選擇是如何。

首先，在這對局中，方格內右上角的數字是 B 的後果，而左下角的數字是 A 的後果。A 的理性推想是：如果選擇認罪 (I1) ，那麼可能得到的後果是入獄 5 年 (-5) 或無罪釋放 (0) ；如果不認罪 (I2) ，那麼可能入獄 10 年 (-10) 或入獄 2 年 (-2) ；而 -5 > -10 及 0 > -2 ，所以認罪這策略優於不認罪這策略。同理， B 亦會得出認罪 (II1) 是理性的策略這個結論。同樣的這結論，亦可由小中取大規則 (the maximin rule) 求出，因為對於 A 來說認罪 (I1) 的最高效益是 0 （如果 B 不認罪 (II2) ），最低也有 -5 的效益（如果 B 認罪 (II1) ）；但採取不認罪 (I2) 這策略，則最高效益只有 -2 ，然而最低效益卻是 -10 ，所以最穩健的做法是，假定 B 同樣理性，那麼他會選 II1 ，而 A 的理性回應也就只能是 I1 。故此， (I1, I2) 便是均衡對，代表的是均衡的狀態，即假如兩方中只有一方改動而另一方保持不變，則改動的一方不能獲取比原有的狀態更大的效益，這稱為「尼斯均衡態 (Nash equilibrium) 」。

囚徒兩難中的兩難之處就在於尼斯均衡態並不是帕雷妥佳態 (Pareto optimality)。所謂帕雷妥佳態，就是一個給定體系的某一狀態是帕雷妥佳態，當且僅當 (if and only if) 該體系中沒有另一種可行的可供選擇狀態，能令體系中至少一個人的境況變好而不令體系中任何其他人的境況變壞。 [2] 上述例子顯示，如果 A 和 B 皆遵守承諾不認罪，則每人只得兩年刑期；但現在卻每人得到五年刑期，所以在此囚徒的兩難中，策略對 (I2，II2) 所達致的狀態才是帕雷妥佳態。如果一個人具有的是工具理性，顯然最想達致的是帕雷妥佳態，而非接受次一等的佳態；但難處就在於選擇達致帕雷妥佳態的策略，大有可能使自己處於最劣的狀態，即是十年牢獄之苦。

依據上述的分析，由於這兩個犯人只有工具理性，所以不遵守承諾才是理性的選擇；然而，如果大家都講信用守承諾，雖不是理性的選擇，卻對大家都是得到最大效益的做法。此即表示，講信用守承諾不是不合理的，但如何在只講工具理性的條件下，顯示選擇講信用守承諾是理性的呢？高契爾認為只要將焦點從個人的個別選擇，轉移著眼於個人的意向 (disposition) ，就可以逃出這兩難；而「意向」這概念，可理解為：如果某君 A 具有 X 的意向，即當 A 君處於 Y 類型的境況中， A 君將會做 Z 類型的行為。

在理性選擇理論 (rational choice theory) 中，個人預期效益的最大化原則是應用於個人的「個別選擇」之上，這是工具理性應用的基本單位 (fundamental unit)，所以一個選擇是合理的，當且僅當它達致該行動者的最大預期效益。現在，高契爾將理性應用的基本單位改為選擇的意向，而「一個意向是理性的，當且僅當擁有此意向的行動者能預期，他的選擇所產生之效益，不少於他基於任何其他意向所做出的選擇會產生的效益。」(MA: 182-183) 如果意向是理性的基本單位，則某個別的選擇是理性的，當且僅當該項選擇表達出是由一個理性的意向所選擇的。在高契爾的理性觀下，一個行為是否理性就不再以它是否達致最大化預期效益來斷定，而是由它所顯示的意向是否理性來確認。

那麼，甚麼意向在囚徒兩難境況中是既理性又講信用守承諾的呢？試比較以下兩種在囚徒兩難中的意向：第一種是率直的最大化 (straightforward maximization)，具有這種意向的人稱為 SM ；這些人在囚徒兩難中，無論在甚麼時候都會選擇那些將會獲致最大預期效益的行為。第二種是受約束的最大化 (constrained maximization)，具有這種意向的人稱為 CM ；這些人在囚徒兩難中體現出一個條件性策略 (conditional strategy)：如果一個 CM 相信其他人將會合作，則這 CM 也將會合作；否則便不合作。先以一個囚徒兩難圖表來考察 SM 及 CM 有甚麼結局：

X,Y 的偏好順序都是 A>B>C>D 。如果 X,Y 都是 SM ，則是典型的囚徒兩難結局，即大家都選擇不合作 (X1,Y1) ，這表示一個尼斯均衡態只是一個柏雷妥次佳態 (sub-Pareto optimality) （以後簡稱為 “sub-Pareto O”），但明顯的是 (X2,Y2) 所達致的狀態才是柏雷妥佳態（以後簡稱為"Pareto O”）。

如果 CM 比 SM 更理性，便要 CM 在囚徒兩難的選擇都不會比 SM 的選擇所達致的預期效益少；而 CM 在囚徒兩難中可能會面對兩種情況：或是遇上 CM ，或是遇上 SM 。如果 CM 遇上 CM ，則大家選擇的結果將會是 (X2,Y2) ，達致 Pareto O ；如果 CM 遇上 SM ，則大家選擇的結果將會是 (X1,Y1) ，即達致 sub-Pareto O 。 SM 相比於 CM ，他們可達致的都是 sub-Pareto O 。結論很明顯， CM 比 SM 更符合理性要求。

假設某個人處在囚徒兩難中，如果他是理性的，他會選擇甚麼意向呢？是率直的最大化，還是受限制的最大化？這是一個第二序 (second-order) 的選擇，他選擇的對象不是個別行為，而是某個意向，然後由這個意向規定出選擇甚麼行動：合作或不合作。然而，他選擇甚麼意向，取決於他怎樣判斷其他人的意向；如果他誤認其他人是 CM ，因而也選擇 CM ，但原來他們是 SM ，就會使自己陷於最差的結果 (D)。

為了清楚地理解高契爾的論證，我們先討論辨認不發生問題的情況。在這情況中各人都是通透的 (transparent) ，即他們各自都欺騙不了對方。我們可用以下列的對局來表示他們的選擇：

在這對局中，所謂相互合作的結局，是指在他們選擇其意向後在囚徒兩難中會達致 Pareto O 的結局，相互不合作是指在囚徒兩難中會達致 sub-Pareto O 的結局。所以 X 和 Y 的偏好順序都是（相互合作＞相互不合作）。

在這對局中， X 和 Y 依據最大預期效益原則作選擇，便會得出 (X1,Y1) 這均衡對，即達致一個尼斯均衡態，而且這尼斯均衡態又是 Pareto O 。因此，如果 X 和 Y 都是理性的話，便會合理地選擇成為 CM ，而選擇成為 SM 則是不合理的。由於 CM 是講信用守承諾的意向，故此在囚徒兩難類型的互動中，個人要作理性的選擇便

要選擇講信用守承諾，所以高契爾得出他的結論：道德原則就是理性的選擇原則。

可是，以上是假定了個人是通透的，這明顯地是不符合現實的，因為有些人可能裝扮到自己是 CM ，誘使其他人遵從道德原則，然後自己違反道德原則以求達致最大的效益。正如德里克．帕爾非特 (Derek Parfit) 指出，「對我最有利的情形是，使我（看起來像）是值得信任的人，但實際上永遠不自我克制。」 [3] 為了應付這問題，高契爾假設個人是半通透 (translucent) 的，即是介乎通透 (transparent) 與晦暗 (opaque) 之間：通透的人總是能被他人辨認到其意向，而晦暗的人只有僅僅有一半機會能被他人辨認到其意向；至於半通透的人，有大於一半機會能被他人辨認到其意向，不過判斷者不能完全免於失誤。這個假設較符合現實的人，但在這假設下，高契爾如何論證我們選擇 CM 比 SM 更合理呢？

高契爾的基本思路是這樣：假定大家不合作的效益是 u'，大家合作的效益是 u"，而出賣其他合作者的效益是 1 （即自己不合作而其他人合作），而被其他人出賣的效益是 0。又假設偏好順序是 0< u'< u"<1，即是最好利用到其他人，第二好是合作，第三好是不合作，最差是被人利用。最後，再假定 CMs 達致相互確認 (mutual recognition) 因而成功合作的機會率是 p；而 CMs 辨認不出 SMs，反而被 SMs 辨認出自己是 CM，因而被 SMs 出賣的機會率是 q；隨機地從人口中選出的一名成員是 CM 的機率是 r（假定任何一個人不是 CM 就是 SM，那麽隨機地從人口中選出的一名成員是SM 的機率是 (1-r) ），而 p, q, r 的值必落入 0 與 1 之間。(MA:175) [4]

從某位 CM 角度思考，他的預期效益 (expected utilities) 是 u' ，除非以下兩個情况其中之一出現：

　(i) 遇上 CMs 並互相確認，那麼就會成功合作。
　(ii) 遇上 SMs 並且誤以為 CMs ，那麼就會被出賣。

(i) 的機率是 (rp)，即遇上 CM 的機率 (r) ，以及他們互相確認的機率 (p) 。在 (i) 的情況中，他多得的效益是 (u"-u')，因此， (i) 的效果是通過 [rp(u"-u')] 的值增加其預期效益。

(ii) 的機率是 (1-r)q ，即遇上某位 SM 的機率 (1-r) ，以及認不出其是 SM 而又被其辨認出自己是 CM，因而被該 SM 出賣的機會率 (q) 。在此情況，他被該 SM 出賣，因而效益是 0 ，損失了預期效益 u' 。因此， (ii) 的效果是通過 [(1-r)qu'] 的值減低其預期效益。將 (i) 和 (ii) 計算在內，得出 CM 的預期效益是 {u'+ [rp(u"-u')] - (1-r)qu'} 。(MA: 175-176)

從某位 SM 角度思考，他的預期效益是 u'，除非他出賣遇上的某位 CM。這情況發生的機率是 rq ，即遇上 CM 的機率 (r)，以及認出他是 CM 而又沒被對方認出自己的機率 (q)。在這情況中，他多得的效益是 (1-u') ，因此，這情況的效果是通過 [rq(1-u') ] 的值增加其預期效益。將這情況計算在內，得出 SM 的預期效益是{u' + [rq(1-u')]} 。 (MA: 176)

當且僅當 CM 的預期效益大於SM的預期效益，採納 CM 的意向是理性的。即：

　CM：{u'+ [rp(u"-u')] - (1-r)qu'} ＞ SM：{u' + [rq(1-u')]}

我們不妨賦予一些具體數值，好讓當中的消息更清楚地顯示。依據上面設定的偏好順序： 0< u' < u"<1 ，可以賦值如下：

　出賣其他合作者的效益：1
　大家合作的效益 (u") ：0.66
　大家不合作的效益 (u') ：0.33
　被其他人出賣的效益：0

將數值代入CM：{u'+ [rp(u"-u')] - (1-r)qu'}＞SM：{u' + [rq(1-u')]} 可得出：

　CM：{(0.33)+ [rp(0.33)] - (1-r)q(0.33)} ＞ SM：{(0.33) + [rq(0.67)]}

為了方便比較，可簡化成：

　CM：{ [rp(0.33)] - (1-r)q(0.33)} ＞ SM：{ [rq(0.67)]}

r 是隨機地從人口中選出的一名成員是 CM 的機率，試賦予一些數值以作觀察：

從上表可觀察到，如果 CM 的預期效益要比 SM 的預期效益大，那麼 p 必須至少是 q 的兩倍。這意味 CM 在總人口中的所佔比例增加，即 r 值增高，就 p 比 q 的比率也可降低。高契爾更準確地說，一般而言， p/q 必須大過 2 + (1-r)/r 。 (MA: 176-177) 就以 r=0.5 為例， SM 和 CM 各半。如果 CM 能有 0.667 機率成功合作，而且成功地避開 SM 出賣的機率是 0.8，那麼， CM 的預期效益 0.077 比 SM 的預期效益 0.067 為大。既然 CM 的預期效益比 SM 的預期效益為大， SM 轉而選擇 CM 意向是理性的，因而 SM 和 CM 各佔一半人口的狀態也會改變， CM 在總人口中的所佔比例增加，進一步誘使 SM 改變其意向。

再者，半通透的人基本上有大於一半機會能被他人辨認到其意向，這意味 p 的機率賦值應該比 0.5 大；至於假定 SM 能輕易避過 CM 認出，這並不現實。還有，如果一個社會有足夠數目的 CM，便會令 SM 更難騙到人；令 SM 更不堪設的是，被他人揭發後，會被排斥於社會合作性活動之外，損失更加慘重。如果一個社會的 CM 的數目不多， SM 遇上 CM 的機會也不多，而 CM 也會提高防範，不輕信他人，SM 自然難以成功出賣他人多賺效益。

除非出賣 CM 多賺的效益很巨大，否則出賣 CM 並非理性的行為；可是，現實的囚徒兩難類型的互動，通常涉及的是公共物品，出賣他人所多賺之效益不會太大，好像上面提到的「公地悲劇」例子。再者，囚徒兩難類型的互動是重複地發生的，正所謂上得山多終遇虎，在現實社會中的選擇，SM 意向被 CM 揭發的機率很大，因而長期利益損失必大於 CM；故此，高契爾認為選擇 CM 的意向比 SM 的意向更符合工具理性的要求。除此之外，我們也可以考慮一些影響 p, q, r 機會率的現實因素，例如道德風氣、教育水平、防避騙子的宣傳、民智高低等，限於篇幅，這些因素就不一一討論了。總之，正如高契爾所言：「理性地去選擇，人必道德地去選擇」。我雖然不同意他的結論，但是很欣賞他把社會科學的研究成果引入倫理學的討論中去，因為我深信「道德信念如果得不到一種可在社會科學中找到根據的支持，便似乎是幼稚或者自欺欺人的了。」 [5] 至於我不同意他的理由是什麼，這留待讀者細心思考好了。

註：

MA 代表大衛．高契爾的 Morals by Agreement (Oxford:Oxford University Press),1986 一書，後面的數字代表頁數。
Allen E. Buchanan, Ethics, Efficiency, and the Market (Totown, N.J: Rowman & Allanheld), 1985, p.4.
Derek Parfit, Reasons and Persons (Oxford: Oxford University Press), 1986, p.18.
當然有可能 CM 遇上另一 CM ，但誤認之為 SM 而意外地出賣了該位 CM ，但高契爾認為可略而不論 MA:175 。
Mary Warnock, 陸曉禾譯,《一九○○年以來倫理學》（北京:商務印館）, 1987 年, 第 143 頁。