热门问题
时间线
聊天
视角

無名氏定理

来自维基百科,自由的百科全书

Remove ads

博弈論中,無名氏定理(英語:folk theorem)是一類描述重複博弈納殊均衡的定理。[1][註 1]起初,無名氏定理僅關注無窮博弈的納殊均衡。在1950年代,這類定理已經廣受博弈論學者知曉,但並沒有人發表它,所以稱為無名氏定理。1971年發表的Friedman定理考慮了無窮博弈的一系列子博弈精煉納殊均衡英語Subgame perfect equilibrium(SPE),把定理的初始版本推廣到了更強的均衡概念上。[2]

無名氏定理指出,如果參與者對未來足夠有耐心(也即貼現因子),對於任意可行、滿足個人理性假設的一組收益,都存在着一個子博弈精煉納殊均衡,使得第個參與者的平均收益就是[3]換言之,任何程度的合作(只要是可行的且滿足個人理性)都可以通過一個子博弈精煉納殊均衡來達成。

例如,在只有一期的囚徒困境中,兩個參與者都選擇合作並非納殊均衡,唯一的納殊均衡就是兩個人都選擇背叛。根據無名氏定理,如果囚徒困境重複無窮多次,並且參與者足夠有耐心,就會存在兩個參與者都合作的納殊均衡。但在有限期囚徒困境中,最後一期一定會雙方都背叛,從而倒數第二期雙方也會背叛,以此類推,唯一的子博弈精煉納殊均衡就是雙方一直背叛,不會有合作出現。

Remove ads

前提

重複博弈中的納殊均衡應該滿足以下兩個性質:

  • 個人理性:最終支付至少要大弱佔優於參與者能得到的最大收益的最小值(即最小最大收益),否則他還不如選擇最小最大化策略。
  • 可行性:最終支付必須是一系列可能策略的凸組合,因為重複博弈中參與者的最終支付就是單個博弈中收益的加權平均。

無名氏定理有若干種,有些考慮有限重複博弈,有些考慮無限重複博弈。[4]

不考慮貼現的無窮博弈

在不考慮貼現的無窮博弈中,參與者都是有耐心的。在任何時間點,相同的效用帶來的收益都是相同的。所以在無窮博弈中,每個參與者的收益就等於每一期博弈獲取效用的總和。

就無窮博弈而言,總收益的計算通常是平均效用取極限以後的下確界。假設第期參與者選擇的行動是,那麼他的總收益就是:

其中表示每個階段博弈中,參與者的效用函數。

這種情況下,無名氏定理指出:階段博弈中滿足個人理性且可行的行動在無窮博弈中都是納殊均衡。

考慮冷酷戰略英語Grim trigger。所有參與者都按照預定的策略進行每一期博弈。如果在某一期中有人沒有使用預定策略,從下一期開始所有人永遠選擇讓這個人只能拿到最小最大收益的策略。這樣,出偏差的人的總收益也只能是最小最大收益,所以所有人都願意按照預定策略行事。[5][6][7]:139[8]

Remove ads

子博弈精煉均衡

上述納殊均衡不一定是一個子博弈精煉均衡。如果實施懲罰對其他人的收益影響也很大,那麼懲罰就是不可信的。

要想達到子博弈精煉均衡,每次有人偏離預定策略時,懲罰不應該一直實施下去,而只應持續到出偏差的人在那一期博弈帶來的額外收益得到抵消為止。之後,大家依舊按照預定策略繼續博弈。[5][7]:146–149

因為計算總收益的方法是平均收益取極限,所以有限期的懲罰並不會影響總收益。這樣,這就是一個子博弈精煉納殊均衡。

考慮貼現的無窮博弈

設貼現因子滿足,無窮博弈的總收益為:

貼現因子的大小反映出參與者的耐心高低。

這種情況下的無名氏定理指出,每個人的總收益將嚴格大於最小最大收益。

Remove ads

註釋

參考文獻

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads