热门问题
时间线
聊天
视角
沙普利-福克曼引理
凸幾何的引理 来自维基百科,自由的百科全书
Remove ads
沙普利-福克曼引理是凸幾何的一條引理,其於數理經濟學有應用。引理描述向量空間子集的閔可夫斯基和有何性質。若干個集合的閔可夫斯基和,即從各集合分別取一個元素相加,組成的集合:例如,將整數和組成的集合,與自身相加,得到由組成的集合,以符號可寫成:

「許多個集合的閔氏和,是否必定近似凸集?」沙普利-福克曼引理和相關的結果表明,問題的答案為肯定。[2]集合稱為凸,意思是連接其中任意兩點的線段,必為該集合的子集:舉例,實心圓盤 為凸集,但圓 則不然,因為連接相異兩點的線段 並不是圓的子集。沙普利-福克曼引理大致斷言,若求和項的數目超出向量空間的維數,則其閔氏和將近凸。[1]
沙普利-福克曼引理引入時,是作為證明沙普利-福克曼定理的一步,該定理斷言閔氏和與其凸包的距離不超過某個上界。所謂集合的凸包,是包含的最小凸集。而當且僅當和為凸時,上述距離為零。定理中,距離的上界取決於維數及求和項的形狀,但不取決於求和的項數,而只需。只要其中個求和項的形狀,就足以確定個集合的閔可夫斯基平均集
與其凸包的距離的上界。當趨向無窮時,該上界遞減至零(需要各求和項的大小一致有界)。[3]斯塔(Starr)的推論將沙普利-福克曼定理的上界壓得更低,故又稱為沙普利-福克曼-斯塔定理。
勞埃德·沙普利和強·福克曼的引理,最先由經濟學家羅斯·斯塔發表,其時斯塔正在肯尼斯·阿羅門下,研究經濟均衡的存在性。[1]斯塔在論文中,研究凸化(convexified)經濟體,即將非凸集換成其凸包。斯塔證明,凸化之後,有些均衡由原經濟體的「準均衡」(quasi-equilibria)逼近;還證明,每個準均衡都具有真均衡的許多最優性質,而凸經濟體中則必定存在真均衡。斯塔1969年的論文發表後,沙普利-福克曼-斯塔的結果得到廣泛應用,用作證明(凸)經濟理論的若干核心結果,儘管不適用於有非凸部分的大經濟體,但在此等經濟體中,仍是良好的近似。羅歇·蓋內里評論:「這些結論的一般形式的推導,是戰後經濟理論的重大成就。」[4]許多諾貝爾獎得主都曾研究經濟學中的非凸集,除了前述的勞埃德·沙普利(2012年獲獎)外,還有:阿羅(1972)、羅伯特·約翰·奧曼(2005)、傑拉德·德布魯(1983)、特亞林·科普曼斯(1975)、保羅·克魯曼(2008)、保羅·薩繆爾森(1970)。至於互補的主題「經濟學中的凸集」,除以上得主著重外,還有里奧尼德·赫維克茲、列昂尼德·維塔利耶維奇·康托羅維奇(1975)、羅伯特·索洛(1987)都著重。
沙普利-福克曼引理在優化論和概率論皆有應用。[3]優化論中,可以引理解釋,在求多個函數之和的最小值時,為何一些解法可以成功。[5][6]概率論中,引理適用於證明隨機集的「大數定律」。此定理先前僅在凸集的情況得證。[7]
Remove ads
簡單例子
考慮凸的實數區間,其包含整數子集,且是其凸包(添加了兩點所連線段上的所有點)。僅得兩個元素的集合,複製成三份,並按元素求和,得到
(此處集合的和,是從各集合分別取一個元素相加,得到的可能結果的集合,稱為閔氏和。)和集的凸包則為區間。
區間中,每個數都可以寫成區間中某三個實數(允許重複)之和,例如將等分成三份即可。但使用沙普利-福克曼引理,則有更強的結論:的每個數,都可以寫成中某兩個整數(允許重複),與中某一個實數之和。[8]
凸包中的點,到的距離,至多為:
然而,考慮三個區間的閔氏平均
與其凸包的距離,僅為,即未平均前與距離()的三分之一。越多個集合相加,其閔氏平均就將凸包填得越滿:由閔氏平均至凸包的最遠距離,隨被加項數增加,而趨向於零。[8]此為沙普利-福克曼定理的結論。
Remove ads
前置概念
沙普利-福克曼引理需要用到凸幾何的若干定義和定理,本節將作簡介。
二維的實向量空間上,有笛卡兒坐標系,將每點視為一對實數,稱為「坐標」,按慣例記為。笛卡兒平面上的兩點,可以逐個坐標相加:
此外,點也可以逐個坐標與實數相乘:
更一般而言,任何維(有限維)實向量空間,均可視為個實數組成的D元組的集合,並配備兩種運算:向量加法和標量乘法。有限維實空間的此兩種運算,皆定義成逐個坐標運算,與笛卡兒平面上的運算類似。[9]
實向量空間中,非空子集稱為凸集,意思是,對於的任意兩個點,連接兩點成一線段,其上的所有點仍在中。例如,實心圓盤 為凸,但圓 則不然,因為連接相異兩點的線段 並不是圓的子集。三個整數的集合非凸,但其為區間的子集,而該區間為凸。又例如,實心立方體為凸,然而任何空心或凹陷的圖形,如彎月形,則非凸。空集也是凸集,視乎作者偏好,這可能是專門的定義[10],也可能是因為要滿足的條件是空真命題。
更嚴謹而言,集合稱為凸,意思是,對中任意兩點,和單位區間中的任意實數,點
仍是的元素。
由數學歸納法,集合為凸,當且僅當其任意多個元素的凸組合仍在中。所謂向量空間子集的凸組合,是其元素的任意加權平均,而各可以是總和為的任意非負實數,即只需。[11]
凸集的定義推出,兩個凸集的交集仍是凸集。更甚者,任意一族凸集的交也是凸集。作為特例,若取兩個不交的凸集,則其交集為空集,故應當稱空集為凸。[10]
Remove ads

對於實向量空間的每個子集,其凸包是包含的最小凸集。所以,是所有覆蓋的凸集的交。等價地,可以將定義成的點的所有凸組合的集合。[12]作為例子,整數集合的凸包,是實數閉區間,其兩端為原有的整數。[8]單位圓的凸包則是閉單位圓盤,其包含單位圓。
Remove ads

在任何向量空間(或有定義加法的代數結構)中,兩個非空子集的閔可夫斯基和,定義為其元素之和的集合,即 (參見[13])。例如:
此運算定義在非空子集族上,且滿足結合律和交換律。既然有結合律和交換律,就可以遞歸定義多個被加項的運算結果。由數學歸納法,可見[14]
Remove ads
閔可夫斯基和與凸包運算可以交換。具體而言,對實向量空間的任意子集,其閔氏和的凸包等於其凸包的閔氏和。換言之,
故由數學歸納法得
Remove ads
各命題的敍述

由前一段的恆等式,對和的凸包中的每點,都存在各凸包的(取遍至),使得。各點的位置取決於。
Remove ads

有了以上背景,沙普利-福克曼引理斷言,的表示法
中,僅需要不多於個被加項取自凸包,而其他被加項,則只需取自原來的集合。以符號復述,即有以上方法表示,且滿足。不妨將下標重新排序,然後就有
其中對,有,而對,則有。注意,倘若重排,則排序的方式也取決於點。[17]再精簡,沙普利-福克曼引理可以寫成
舉例,集合中的每個點,根據引理,必定可以寫成的某個元素,與的某個元素之和。[8]
Remove ads
反之,沙普利-福克曼引理刻劃了有限維實向量空間的維數。具體而言,若某向量空間,對於某個自然數滿足引理的結論,但對小於的數不滿足,則其維數恰好為。[18]引理僅對有限維向量空間成立。[19]

沙普利與福克曼運用其引理,證明沙普利-福克曼定理,給出集合的閔氏和與其凸包(稱為凸化(convexified)和)的距離上界。定理的敍述如下:
凸化和的任一點,到(未凸化)和集的歐氏距離平方,不超過各集合的外接半徑中,最大個的平方和。(所謂外接半徑,定義為包圍該集合的最小球面的半徑。)[20]此上界與求和項數無關(但要求,且集合不能越來越大)。[21]
上述定理給出閔氏和及其凸包之間距離的上界。當且僅當閔氏和為凸集時,此距離為零。該上界取決於維數及各被加項的形狀,但只要,就不取決於項數。[3]
通常,外接半徑會大於內半徑,而無論如何,外接半徑總不能小於內半徑。集合的內半徑定義為:[22]
最小的正實數,滿足:若在凸包中,則在若干點的凸包中,而該些點皆在同一個半徑為的球內。
斯塔將沙普利-福克曼定理中的外接半徑換成內半徑,從而壓低沙普利-福克曼定理的上界:
沙普利-福克曼定理的斯塔推論:
斯塔的推論確定,個集合的閔氏和與其凸包之間,歐氏距離的上界。此距離可以衡量閔氏和非凸的程度,故為簡單起見,下文稱為非凸度。於是,斯塔對非凸度的上界,僅取決於個最大內半徑之值,但不取決於求和的項數(假設)。
例如,非凸集的非凸度為,因為與其凸包(區間)的距離為
所以,既然的非凸度有不取決於項數的上界,就知平均集
非凸度上界,會隨增加而遞減。例如,平均集
和其凸包的距離僅為,等於被加項與其凸包的距離()之半。僅要最大個求和項的形狀,已足以計算和集與凸包的距離的上界,故除以後,平均集與凸包的距離,在趨向無窮時,會遞減至零(對均勻有界的求和項成立,即各個求和項的大小需有同一個上界)。[3]若使用斯塔的上界,則前一句結論的條件可以放寬,只需各求和項的內半徑有同一個上界。[3]
Remove ads
沙普利-福克曼引理的原證明,僅確定存在該種表示法,而無說明如何構造。阿羅與哈恩[24]、蓋士利[25]、斯奈德(Schneider)[26]和其他人都曾給出類似的證明。阿特斯泰因(Artstein)擴展了埃科蘭德的簡潔抽象證明。[27][28]也有未經出版的另證。[2][29]1981年,斯塔發表一種疊代法,可以計算給定點的表示法,然而,此計算方法給出的上界,較非構造性證明的上界差。[30]博賽卡斯的書有講述有限維空間沙普利-福克曼引理的初等證明,[31]並將引理應用於估計可分優化(separable optimization)問題與零和賽局的對偶間隙。
應用
有沙普利-福克曼引理,學者就得將有關凸集閔氏和的結果,套用到(無需凸的)一般集合之和。此種和見於經濟學、最優化理論、概率論。此三領域的應用中,非凸性起到重要作用。

經濟學中,消費者對每一「籃子」商品(basket,即商品的組合)有其偏好程度。每籃子可用一個非負向量表示,其坐標為籃中各商品的量。所有籃子組成的集合中,每個消費者有自己的一族無差異曲線,滿足:在同一條曲線上的各籃子,對該消費者是等價的,即消費者並不覺該曲線上有籃子勝於另一個籃子。每籃子恰好處於一條無差異曲線上。消費者相對於一條無差異曲線的偏好集,定義為該無差異曲線與其更偏好的區域的並集。稱消費者的偏好為凸,意思是其所有偏好集皆為凸。[32]
如圖所示,消費者認為的最優籃子,是在預算線支撐某個偏好集時取到,因為此時,所選的籃子是整條預算線上,達到最高的無差異曲線的一點。所謂預算線,是由商品的價格向量與消費者的收入計算得出的限制,消費者無足夠收入購買高於此線的籃子。所以,最優籃子的集合是各價格的函數,稱為消費者的需求。若偏好集為凸,則不論價格為何,消費者認為的最優籃子總是組成凸集,例如可能是單元集,或是一條線段。[33]

然而,若有偏好集非凸,則某些價格確定的預算線,可能在兩個分開的最優籃子支撐該偏好集。例如,可以設想,動物園購買獅子或鷹的價錢一樣,且其預算恰好夠買一隻獅子或一隻鷹。此外,假設園主亦認為兩隻動物價值相同,則動物園有可能買獅子,也可能買鷹,但當然不可能買半隻獅子加半隻鷹(獅鷲)。所以,園主的偏好非凸:買兩隻動物中的任一隻,勝於兩者的嚴格凸組合。[34]
若消費者有非凸偏好集,則對於某些價格,需求不連通。不連通的需求,會導致消費者的行為出現不連續的間斷。引述哈羅德·霍特林的話(宜配合所附動圖理解):
若考慮波浪形的無差異曲線,即在某些區域向原點凸,而在其他區域向原點凹,則我等被迫推論,僅有向原點凸的部分需要理會,因為幾乎不可能觀測到其他部分。要偵測該些部分,唯一方法是,觀察價格之比率變化時,需求的不連續變化。此變化的效果是,當直線旋轉時,切點會突然躍過某凹陷。雖然此種不連續的表現,揭示有凹陷,但卻不可能量度缺口的深度。倘若無差異曲線,或其高維推廣,有凹陷部分,則定必因永遠無法測量,而不為人知。[35]
瓦爾特·迪韋爾特[36]書中,稱赫爾曼·沃爾德[37]有強調研究非凸偏好的困難,也引述保羅·薩繆爾森稱凹陷處「被永恆的黑暗遮蔽」[38]。
儘管有上述困難,《政治經濟期刊》(JPE)在1959年至1961年間,刊登一系列的論文,解明非凸偏好。投稿人包括:法雷爾(Farrell)[39]、巴托爾[40]、科普曼斯[41]、羅森博格(Rothenberg)[42]。其中,羅森博格討論非凸集和的近似凸性。[43]該些JPE論文,促使勞埃德·沙普利和馬丁·舒比克也合著論文,研究凸化的消費者偏好,並引入「近似均衡」(approximate equilibrium)的概念。[44]JPE論文和沙普利-舒比克論文又啟發了羅伯特·奧曼提出另一個概念,稱為「準均衡」(quasi-equilibrium)。[45][46]

肯尼斯·阿羅收集前人研究經濟學中的非凸集的文獻,列成表,並加入註解,交給羅斯·斯塔。斯塔當時仍是本科生,但已在修讀阿羅開設的高等數理經濟學(研究生)課程。[47]斯塔在學期論文中,考慮將非凸偏好換成其凸包所得的假想經濟體,研究其一般均衡。凸化經濟體中,在每個價位,總需求皆是各消費者需求的凸包之和。斯塔的想法吸引數學家勞埃德·沙普利和強·福克曼參與,兩人「在私人通信中」證明現以兩人命名的引理和定理,到1969年,斯塔才於論文報告此事。[1]
斯塔1969年的論文中,應用沙普利-福克曼-斯塔定理,證明「凸化」經濟體有一些一般均衡,只要參與者足夠多,能以原經濟體的「準均衡」近似。具體而言,斯塔證明,至少存在一個價格向量為的準均衡,滿足下列條件:
- 對每個準均衡,所有消費者都可以選到其最優的籃子(在預算限制內,且最偏好)。
- 在該價格,凸化經濟體中,每種商品的市場皆均衡,即供給等於需求。
- 每個準均衡的價格,皆「幾乎出清」原經濟體的市場:凸化經濟體均衡組成的集合,與原經濟體的準均衡集合,兩者的距離有上界。此結論是根據沙普利-福克曼定理的斯塔推論得到。[48]
斯塔確立以下結論:
「總體中,[取各消費及生產集的凸包]所得的假想經濟體的分配,與真實經濟體的某個分配,兩者的差異,有不取決於參與者數目的上界。因此,當參與者數目趨向無窮時,平均參與者感受到,與擬作行動的偏差,近乎可以忽略不計。」[49]
斯塔1969年論文發表後,沙普利-福克曼-斯塔的結論,在經濟理論獲廣泛應用。羅歇·蓋內里如此總結該結論對經濟學的意義:「假設凸性,所得的若干重要結果,在不具凸性的情況下,仍(近似)適用。例如,若經濟體具有大消費側,則偏好的非凸性不影響適用標準結果」[50],還稱「這些結論的一般形式的推導,是戰後經濟理論的重大成就。」[4]許多諾貝爾獎得主都曾研究經濟學中的非凸集,除了前述的勞埃德·沙普利(2012年獲獎)外,還有:阿羅(1972)、羅伯特·約翰·奧曼(2005)、傑拉德·德布魯(1983)、特亞林·科普曼斯(1975)、保羅·克魯曼(2008)、保羅·薩繆爾森(1970)。至於互補的主題「經濟學中的凸集」,除以上得主著重外,還有里奧尼德·赫維克茲、列昂尼德·維塔利耶維奇·康托羅維奇(1975)、羅伯特·索洛(1987)都著重。[51]
沙普利-福克曼-斯塔的結論,在經濟學各分支的文獻都經常出現,包括微觀經濟學[52]、一般均衡理論[53][54]、公共經濟學[55](包括市場失靈)[56]、博弈論[57]、數理經濟學[58]、經濟學中的應用數學[59][60]。沙普利-福克曼-斯塔的結論,也使經濟學更多使用測度論和積分理論。[61]

沙普利-福克曼引理可以解釋,為何大規模的最小化問題,即使非凸,仍可用迭代法近似求解(僅對於凸問題,有證明疊代法收斂到最優解)。沙普利-福克曼引理,促使學者將凸優化方法,用於優化多個(無需凸的)函數之和。[62]
- 實值函數的蓋圖是圖像上方的點的集合:

許多優化問題中,目標函數可分離變數(可分),即是多個函數之和,而各個函數的參數不同,如:
又例如,線性規劃問題就可分離變數。考慮一個可分問題,及一個最優解
在該點取到最小值。對此可分問題,同時考慮其「凸化問題」的最優解,即將每個求和項的圖像換成其凸包。此種最優解,會是凸化問題的某點列的極限,其中
當然,因為此點是個圖像凸包的點之和,由沙普利-福克曼引理,就可以寫成原圖像的點與少數圖像凸包的點之和。
以上分析,1974年由埃科蘭德發表,以解釋為何可分問題有許多項時,即使各項非凸,總問題仍看似凸。對非線性最小值問題而言,對偶問題的解,不一定就是原問題的解(但若已知原問題為凸,且滿足特定條件,則兩者的的最優解相等),但是,1973年,青年數學家克勞德·勒馬雷沙爾詫異,對已知非凸的問題使用凸問題的方法,竟然也成功。勒馬雷沙爾的問題,正是上段加性可分離變數的形式,而每個和項皆非凸函數,但對偶問題的解,仍近似原問題的最優解。[65][5][66]埃科蘭德的分析說明,「大而可分」的最小值問題,即使各和項有凹陷,仍可運用凸優化的方法。埃科蘭德及其後的作者主張,因為變數可以加性分離,所得的總問題近似凸。該等著作以沙普利-福克曼引理為關鍵一步。[5][66][67]沙普利-福克曼引理促使學者將凸優化方法,應用到目標函數為多個函數之和的情況。[5][6][59][62]
凸集常與概率論一同研究。卡拉西奧多里定理說明,維空間的(非空)子集凸包中的點,是取值於的簡單隨機向量的期望值,而所謂簡單,意思是僅在不多於個點處有非零概率。所以,對非空集,取值自的簡單隨機向量組成的集合,等於的凸包。由此便可在概率論中,套用沙普利-福克曼-斯塔的結果。[68]反之,藉期望值與凸包之間的聯繫,概率論亦能用作研究凸集,尤其可用作分析沙普利-福克曼-斯塔的結果。[69]沙普利-福克曼-斯塔的結果,廣泛用於隨機集的概率論[70],例如證明隨機集的大數定律[7][71]、中央極限定理[71][72]、大離差原理[73]。要證明前列概率極限定理,可以使用沙普利-福克曼-斯塔的結果,來避免假設隨機集為凸。
概率測度是有限的測度,而沙普利-福克曼引理還可以應用到非概率的測度論,如體積或向量測度的理論。沙普利-福克曼引理可以加強布倫-閔可夫斯基不等式。該不等式斷言,閔氏和的體積,相較於各和項的體積不能太大,即閔氏和的體積有上界,以各和項的體積的表示。[74]歐氏空間子集的體積,此處定義為其勒貝格測度。
高等測度論中,沙普利-福克曼引理適用於證明李亞普諾夫定理,即向量測度的值域為凸。[75]值域(或像集)是函數所有可能取值的集合,而向量測度則將測度推廣到允許取向量值。例如,若某測度空間有兩種概率測度和,則可定義一個向量測度,是對每個事件,將其兩個概率結合為一個二元組,即
李亞普諾夫定理在經濟學[45][76]、(砰砰)控制論、統計理論皆有應用。[77]李亞普諾夫定理是沙普利-福克曼引理的連續版[3],而沙普利-福克曼引理是李亞普諾夫定理的離散類比。[78]
註
參考文獻
外部鏈結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads