热门问题
时间线
聊天
视角
無名氏定理
来自维基百科,自由的百科全书
Remove ads
Remove ads
在賽局理論中,無名氏定理(英語:folk theorem)是一類描述重複賽局納許均衡的定理。[1][註 1]起初,無名氏定理僅關注無窮賽局的納許均衡。在1950年代,這類定理已經廣受賽局理論學者知曉,但並沒有人發表它,所以稱為無名氏定理。1971年發表的Friedman定理考慮了無窮賽局的一系列子賽局精煉納許均衡(SPE),把定理的初始版本推廣到了更強的均衡概念上。[2]
無名氏定理指出,如果參與者對未來足夠有耐心(也即貼現因子),對於任意可行、滿足個人理性假設的一組收益,都存在著一個子賽局精煉納許均衡,使得第個參與者的平均收益就是。[3]換言之,任何程度的合作(只要是可行的且滿足個人理性)都可以通過一個子賽局精煉納許均衡來達成。
例如,在只有一期的囚犯困境中,兩個參與者都選擇合作並非納許均衡,唯一的納許均衡就是兩個人都選擇背叛。根據無名氏定理,如果囚犯困境重複無窮多次,並且參與者足夠有耐心,就會存在兩個參與者都合作的納許均衡。但在有限期囚犯困境中,最後一期一定會雙方都背叛,從而倒數第二期雙方也會背叛,以此類推,唯一的子賽局精煉納許均衡就是雙方一直背叛,不會有合作出現。
Remove ads
前提
重複賽局中的納許均衡應該滿足以下兩個性質:
- 個人理性:最終支付至少要大弱占優於參與者能得到的最大收益的最小值(即最小最大收益),否則他還不如選擇最小最大化策略。
- 可行性:最終支付必須是一系列可能策略的凸組合,因為重複賽局中參與者的最終支付就是單個賽局中收益的加權平均。
無名氏定理有若干種,有些考慮有限重複賽局,有些考慮無限重複賽局。[4]
不考慮貼現的無窮賽局
在不考慮貼現的無窮賽局中,參與者都是有耐心的。在任何時間點,相同的效用帶來的收益都是相同的。所以在無窮賽局中,每個參與者的收益就等於每一期賽局獲取效用的總和。
就無窮賽局而言,總收益的計算通常是平均效用取極限以後的下確界。假設第期參與者選擇的行動是,那麼他的總收益就是:
其中表示每個階段賽局中,參與者的效用函數。
這種情況下,無名氏定理指出:階段賽局中滿足個人理性且可行的行動在無窮賽局中都是納許均衡。
考慮冷酷戰略。所有參與者都按照預定的策略進行每一期賽局。如果在某一期中有人沒有使用預定策略,從下一期開始所有人永遠選擇讓這個人只能拿到最小最大收益的策略。這樣,出偏差的人的總收益也只能是最小最大收益,所以所有人都願意按照預定策略行事。[5][6][7]:139[8]
Remove ads
上述納許均衡不一定是一個子賽局精煉均衡。如果實施懲罰對其他人的收益影響也很大,那麼懲罰就是不可信的。
要想達到子賽局精煉均衡,每次有人偏離預定策略時,懲罰不應該一直實施下去,而只應持續到出偏差的人在那一期賽局帶來的額外收益得到抵消為止。之後,大家依舊按照預定策略繼續賽局。[5][7]:146–149
因為計算總收益的方法是平均收益取極限,所以有限期的懲罰並不會影響總收益。這樣,這就是一個子賽局精煉納許均衡。
考慮貼現的無窮賽局
設貼現因子滿足,無窮賽局的總收益為:
貼現因子的大小反映出參與者的耐心高低。
這種情況下的無名氏定理指出,每個人的總收益將嚴格大於最小最大收益。
Remove ads
注釋
參考文獻
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads