|
樓主 |
發表於 2018-5-11 00:53
|
顯示全部樓層
| | | | 一般形式整理囚徒困境的基本博弈結構,可更清楚地分析囚徒困境。 實驗經濟學常用這種博弈的一般形式分析各種論題。以下是實現一般形式的其中一例:
有兩個參與者和一個莊家。參與者每人有一式兩張卡片,各印有“合作”和“背叛”。參與者各把一張卡片文字面朝下,放在莊家面前。文字面朝下排除了參與者知道對方選擇的可能性。然後,莊家翻開兩個參與者卡片,根據以下規則支付利益:
- 一人背叛、一人合作:背叛者得5分(背叛誘惑),合作者0分(受騙支付)。
- 二人都合作:各得3分(合作報酬)。
- 二人都背叛:各得1分(背叛懲罰)。
用支付矩陣表格展示支付如下(以紅和藍分別表示二參與者): 一般形式囚徒困境的支付矩陣 | 以“T、R、P、S”符號表示 | 以“勝-負”術語表示 |
簡單博弈獲得的點數可以得出一些一般化的結論。
T、R、P、S符號表符號 | 分數 | 英文 | 中文(非術語) | 解釋 | T | 5 | Temptation | 背叛誘惑 | 單獨背叛成功所得。 | R | 3 | Reward | 合作報酬 | 共同合作所得 | P | 1 | Punishment | 背叛懲罰 | 共同背叛所得 | S | 0 | Suckers | 受騙支付 | 被單獨背叛所獲 |
若以T(Temptation)=背叛誘惑,R(Reward)=合作報酬,P(Punishment)=背叛懲罰,S(Suckers)=受騙支付,以個人選擇得分而言,可得出以下不等式。 T>R> P>S (解:從5>3>1>0獲得以上不等式) 2R>T+S或2R>2P (解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及單獨背叛的共得5分,顯然合作獲分比背叛高。合作在團體而言是支配性策略。)
而重覆博弈或重覆的囚徒困境將會使參與者從註重T>R> P>S轉變成註重2R>T+S。就是說將使參與者脫離困境。 以上理論是道格拉斯·霍夫施塔特創建的。
| | | | |
|
|