首頁 > 科學

科玄新論丨理解人類道德，演化博弈論是種好工具嗎

2024-01-03 16:04:21 來源：中國科學報

觀看：211

編者按

人是道德動物，但人類道德從何起源，又如何演化？這些問題，無論是先賢，還是近現代哲學家一直都在追問，并尋找答案。

近幾十年來，作為一種跨學科理論框架，演化博弈論蓬勃發展，它能為我們更加精確地研究道德的起源與演化提供一種新的理論工具嗎？本文中，復旦大學哲學學院講師張明君從道德行為、道德規范、道德感和道德原則4個方面，討論了演化博弈論所發揮的作用。

今年是“科玄論戰”100周年，本報與中國科學院哲學研究所合作開設了“科玄新論”專欄，就科學與價值觀、當代科學中的形而上學問題等新話題展開討論，專欄得到科學家、哲學家、科學人文學者等的積極支持，對促進科學在中國的健康發展具有重要現實意義。

本文為此專欄最后一篇，歡迎大家繼續關注本報科學文化報道。

■張明君

無論我們如何理解道德，不可否認的一點是——人是道德動物。如果我們相信人不是由某種超自然力量，如上帝所創造，而是地球演化的產物，那么為人類道德的起源找到一種基于自然過程和社會過程的非神秘化解釋，至少從原則上來講并非天方夜譚。

早在1871年，達爾文就在《人類的由來》一書中表達了類似的想法。在他看來，產生人類道德所需要的基本能力，比如感受痛苦以及共情的能力，在其他動物中也有所體現。因此，人類的道德系統完全有可能是在這些基本能力的基礎之上發展起來的。

近幾十年來，作為一種跨學科理論框架，演化博弈論蓬勃發展，為更加精確地研究道德的起源與演化提供一種新的理論工具。那么，什么是演化博弈論？演化博弈論是否以及在什么意義上能夠幫助我們理解道德？本文將嘗試給出一個初步的答案。

1.什么是演化博弈論

演化博弈論起源于研究人的經濟行為的博弈論。在經典的博弈論中，一場博弈至少包含三個要素：博弈者、策略和收益。

以著名的“囚徒困境”為例，假設兩個人合伙作案，被逮捕后分別關在不同的房間里接受審問。每個犯罪嫌疑人都面臨著兩種選擇：要么保持沉默，要么揭發同伙。不同的選擇會帶來不同的后果：如果兩個人都選擇保持沉默，由于證據有限，只能判他們各自入獄1年；如果一個選擇保持沉默，而另一個選擇揭發同伙，那么保持沉默、被檢舉揭發的人要入獄7年，揭發同伙的人則因為戴罪立功可以無罪釋放；如果兩個人互相揭發，則各自被判入獄4年。

我們可以將這一場景理解為一場博弈：兩名犯罪嫌疑人是這場博弈的參與者（博弈者）；“保持沉默”或“揭發同伙”是兩名博弈者可以選擇的策略；最終因入獄而失去的自由時間則是他們的收益，這里的收益可以為負。這些信息可以通過表1收益矩陣的形式呈現。

早期的博弈論假設博弈者是具備完全理性的行動者，這一假設在博弈論后來的發展中有所松動。相應的，它所要解決的核心問題是：理性的行動者應該選擇什么樣的策略才能使自己在博弈中的收益最大化？在“囚徒困境”式博弈中，無論博弈的對手選擇何種策略，揭發同伙的收益總是高于保持沉默的收益，因此，一個理性的行動者應該總是選擇揭發同伙。

博弈論后來被生物學家引入演化生物學，用來研究生物性狀的演化，逐漸發展出了演化博弈論的理論體系。然而，要實現這種理論工具的遷移，必須要對傳統博弈論進行一定的改造。

第一個調整是改變對于“收益”的理解。在經典博弈論中，收益被統稱為“效用”，可以用博弈者所偏好的任何東西來衡量。因此，經典博弈論中的收益既可以是物質的，比如經濟收入的多少，也可以是精神的，比如博弈者感受到的快樂和滿足感。而在研究生物性狀演化的演化博弈論中，收益被理解為生物個體經過博弈后適應度的改變。生物的適應度大致可以理解為生物生存并繁殖后代的能力，通常用后代數量的期望值來估計。

第二個調整是放松了對博弈者的要求。前面提到，早期的博弈論假設博弈者是具備完全理性的行動者。而在生物學領域的演化博弈論中，包含各種生物的博弈者可以僅具備較低理性甚至完全沒有理性，它們會采取何種策略也不必是理性選擇的結果，而是可以理解為生物個體所攜帶的基因型在一定環境條件下所表達的性狀。

第三個調整是以上兩個調整的自然結果。生物學中的演化博弈論所關注的問題不再是“理性的行動者應該選擇何種策略才能使自己在博弈中的收益最大化”，而是“采取不同策略（即性狀）的生物之間的博弈如何影響這些生物的適應度，進而影響這些策略在后代種群中的分布”。

演化博弈論最初的應用領域是生物學，用于研究自然界中生物性狀的演化。近幾十年來，越來越多的社會科學家開始將演化博弈論重新引入社會科學，用于研究包括道德的起源在內的各種文化現象。然而，要實現這種理論的遷移，需要再一次對演化博弈論的某些假設進行調整。

首先是對策略傳遞方式的調整。在生物演化中，生物個體的策略，即性狀，是通過繁殖的方式遺傳給后代的；而在文化演化中，人類個體所采取的很多策略，如某種道德行為，本身并不直接通過繁殖的方式傳給后代，而是通過學習和模仿等過程傳遞給他人，并且傳遞的對象也不限于自己的生物后代。

相應的，演化博弈中的“收益”概念所對應的也不再是生物適應度的改變，而是被詮釋為某種“文化適應度”。如何準確理解和定義“文化適應度”仍然是學界有待進一步研究的話題。但不管用什么具體指標來衡量某種策略的“文化適應度”，它都必須是人際間可比較的，并且它的高低能夠影響到該策略在群體中的傳播力。

2道德的諸多方面及其演化博弈論解釋

介紹完演化博弈論的基本知識，接下來我們討論如何利用這一理論工具解釋道德的起源。由于“道德”是一個非常寬泛的概念，因此有必要區分與道德有關的不同方面，進而分別討論演化博弈論在解釋這些方面時所發揮的作用。

（1）道德行為

為了便于討論，我們將道德行為定義為“與我們的道德原則相一致的行為”。例如，在與資源分配有關的博弈中，當兩個博弈者處于對稱的地位時，選擇平均分配是一種道德行為。需要注意的是，這里的道德行為是一個很“薄”的概念，它不要求個體在做出該行為時必須基于某種在道德上恰當的動機或者原則，只要求該行為與道德原則所指示的行為結果相一致。

以關于資源的公平分配為例。經濟學家設計過這樣的實驗：被試者們兩兩一組，共同完成對一份資源的分配。要求兩位被試者在不知道對方決定的情況下獨立地提出自己想要的份額。如果兩者之和未超過資源總量，那么兩位被試者都將獲得各自想要的份額；如果兩者之和超過了資源的總量，那么兩位被試者都將空手而歸。研究結果發現，絕大部分被試者會索要一半或者接近一半的份額。

為了解釋這一現象，演化博弈論學者構建了如下的模型：假設在一個種群中，個體之間隨機配對，進行上述實驗中關于資源分配的博弈。每個人索要的資源份額，就是他們在博弈中采取的策略；一輪博弈結束后，每個人可以根據自己和他人的收益情況，按照某種更新規則來調整自己的策略。建模的結果發現，當種群按照復制子方程所刻畫的動力學過程進行演化時，大部分情況下都會演化到所有人都要求平均分配的均衡狀態。當然，也存在一定的概率，使得種群最后演化到兩種非平均分配策略（如1/3和2/3）以一定比例共存的均衡狀態；但是，假設采用相同策略的個體之間有更高的概率發生博弈，那么演化到非平均分配的多態均衡的情況就幾乎消失了，種群幾乎總是會演化到所有人都要求平均分配的均衡狀態。

以上的模型雖然簡單，但對于回答“演化博弈論模型如何幫助我們解釋道德行為的起源”這一問題，可以起到窺斑見豹的作用。如果與我們的道德原則相一致的行為能夠在種群中持續存在甚至占據主流，那么在此基礎上發展出更加豐富的道德內容就具備了可能性。

（2）道德規范

道德規范是社會規范的一種。如果一個群體中的個體傾向于按照某種行為規則行事，是因為他們預期其他人也會按照同樣的行為規則行事，并且他們知道其他人對自己也有相同的預期，那么這樣的行為規則就成為一種社會規范。對于道德規范而言，當該規范被打破時，往往伴隨著一定的懲罰，比如道德上的譴責。

演化博弈論是否能夠解釋道德規范的形成呢？至少對于上一部分所介紹的關于資源分配的演化博弈論模型來說，還尚未涉及道德規范的層面。這是因為該模型中的博弈者在選擇采取何種策略時，所參照的標準是如何提高自己在博弈中的收益，而不是某種道德規范。例如，如果博弈者是通過模仿最成功的鄰居來更新自己的策略，那么在這一過程中，他既不需要關心其他人是否按照平均分配的規則行事，也不會因為自己的策略偏離了平均分配的規則而受到他人的懲罰。這樣一來，即使最終種群中的所有個體都要求平均分配，也與公平分配的道德規范無關。

要解決這一問題，很重要的一步是引入“懲罰”，即當其他人違反某種行為規則時，要對其進行懲罰；相應的，當自己違反某種行為規則時，也會受到別人的懲罰。然而，對別人實施懲罰是有成本的，這就帶來了另一個需要解決的問題：需要付出額外成本的懲罰行為如何能夠在種群中持續存在甚至占據主流？

對此，演化博弈論學者們開展了大量的研究工作，試圖尋找能夠使懲罰行為得以演化的機制。其中，一個很重要的發現是懲罰與聲譽有關。對違反道德規范的行為進行懲罰，雖然在短期內需要付出一定代價，但同時也會幫助自己提高聲譽，從而促進未來他人與自己的合作，進而帶來長遠的收益。研究者發現，如果把這一因素納入演化博弈模型的構建當中，懲罰的行為是有可能在種群中持續存在甚至擴散的。以上研究表明，除了解釋道德行為的起源外，演化博弈論在解釋道德規范的形成方面也有望發揮積極的作用。

（3）道德感

很多人遵守道德規范并不是因為內心認可這些規范，而是迫于外部的道德壓力不得已而為之。但與此同時，也有很多人是因為內心的道德感而主動選擇遵守某些道德規范。對于這些人而言，選擇遵守道德規范并不是迫于外部的壓力，而是因為他們覺得這在道德上是正確的選擇。這樣一種道德信念往往是基于樸素的道德直覺，而不是基于某種道德原則進行道德推理所作出的判斷。道德感與某些特定的情感之間往往存在著密切的聯系：有道德感的人會因為自己未能遵守某些道德規范而感到羞愧、自責，也會因為別人不遵守道德規范而感到厭惡、憤怒等。

演化博弈論能否幫助解釋道德感的產生？答案并不像之前對于道德行為和道德規范的討論那樣明顯。主要的困難在于，作為一種理論工具，演化博弈論并不擅長對博弈者的心理狀態進行表征。

兒童發展心理學的研究表明，一歲的嬰兒已經具備了初步的道德感。當然，這樣一種道德感只能體現在非常簡單的道德場景中，而且具有很高的可塑性。換言之，所謂的道德感很大程度上是個體在社會化的環境中通過后天的發育過程逐漸培養起來的。由于演化博弈論并不擅長對個體發育的過程進行建模，因此很難為個體道德感的形成提供直接的解釋。

盡管如此，演化博弈論仍有可能通過間接的方式為我們理解道德感的形成提供幫助。很多時候，人們對于道德規范的內化是逐漸完成的：也許一開始，我們確實是迫于外部壓力而選擇遵守某些道德規范，但隨著這種遵守成為一種習慣，我們開始將這種規范內化并且自覺遵守，與此同時，對于破壞這種規范的行為則逐漸發展出了厭惡、憤怒等情感。在這一過程中，某種道德感就逐漸形成了。而演化博弈論恰恰可以通過解釋某些道德規范的形成和穩定存在，從而為進一步通過發展心理學的研究解釋道德感的形成奠定基礎。

由此可見，雖然演化博弈論本身很可能無法充分解釋道德感的形成，但是仍有可能與其他學科的研究相結合，共同解釋道德感的起源與演變。

（4）道德原則

對于演化博弈論的一種常見批評是，它無法解釋我們用于評價各種行為的道德概念和道德原則。這常常跟“自然主義謬誤”的批評聯系起來：基于演化博弈論模型的分析最多告訴我們“是什么”或者“為什么”，但是不能告訴我們“應該如何”。

另外，當越來越多的人開始基于道德原則進行道德推理，從而作出道德判斷，進而采取某種道德行為時，演化博弈論對于道德行為的解釋力便逐漸消退。因為在這一過程中，某種道德行為的普遍存在，既不是因為采取這種行為的個體在生物性的演化博弈中具有較高的生物適應度，從而通過繁殖的方式擴大了該行為在下一代中的比例；也不是因為采取這種行為的個體在文化性的演化博弈中獲得了某種意義上更大的成功，從而成為被模仿和學習的對象。換言之，博弈的結果對于某種道德行為的傳遞變得越來越不重要。甚至嚴格來講，當每個個體基于某種道德原則而做出道德行為時，這種行為已經不再從一個個體“傳遞”給另一個個體，而是在每一個個體中被“生成”了。

盡管如此，依然有演化博弈論學者嘗試在我們的道德理論和演化博弈之間建立某種聯系。例如，一種觀點認為，我們目前廣泛接受的道德理論和道德原則為我們提供了一套啟發式的方法。在我們每個人的一生中，如果遵循這套方法，就能在社會生活的種種限制下產生最佳的預期結果。雖然我們很可能不是因為這樣的原因而接受某種道德理論和原則，但這并不妨礙這些道德理論和原則在我們的生活中真實地發揮著上述作用。這種觀點在哲學上提出了一種很有趣的假設，但要對其進行檢驗卻十分困難，因為它涉及每個人基于某種道德理論和原則在一生中所作出的所有道德判斷和道德行為。

3總結與展望

筆者在這里無法窮盡與道德有關的所有方面，但以上對于“道德”諸多方面的區分，對于我們回答“演化博弈論是否以及在什么意義上可以幫助我們理解道德的起源與演化”這一問題，依然是很有幫助的。

我們看到，對于道德的不同方面，演化博弈論的解釋潛力存在差別。對于解釋道德行為和道德規范的起源而言，演化博弈論已經發展出了較為成熟的建模策略，并且可以發揮較為直接的解釋作用。當然，對于相關演化博弈論模型中所采取的基本假設，仍然需要進一步的經驗研究來為其合理性提供辯護。對于解釋道德感的形成而言，演化博弈論目前只能通過解釋一些背景性條件的形成而發揮間接作用。至于道德理論和道德原則的形成，演化博弈論的解釋力則受到質疑。

盡管存在著種種局限，演化博弈論在幫助我們理解道德的起源與演化方面仍然可以發揮重要作用。與其將演化博弈論看成是一種可以單槍匹馬解決所有問題的萬能理論，不如將其當作人類在理解復雜的道德現象時所使用的諸多研究工具中的一種。演化博弈論自身很可能無法充分解釋道德的起源與演化，但是它完全有潛力與其他的理論和研究資源相結合，共同豐富我們對于道德的理解。

《中國科學報》 (2023-12-29 第4版文化)

本文鏈接：科玄新論丨理解人類道德，演化博弈論是種好工具嗎http://m.lensthegame.com/show-11-2002-0.html

聲明：本網站為非營利性網站，本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇：趙東元：做科研要有愛化學家要充滿想象力

下一篇：趙東元院士：教師引導學生獨立思考最重要

科玄新論丨理解人類道德，演化博弈論是種好工具嗎

熱門資訊

推薦資訊

科學最熱文章