热门问题
时间线
聊天
视角

沙普利-福克曼引理

凸幾何的引理 来自维基百科,自由的百科全书

沙普利-福克曼引理
Remove ads

沙普利-福克曼引理凸幾何英語Convex geometry的一條引理,其於數理經濟學有應用。引理描述向量空間子集閔可夫斯基和有何性質。若干個集合的閔可夫斯基和,即從各集合分別取一個元素相加,組成的集合:例如,將整數組成的集合,與自身相加,得到由組成的集合,以符號可寫成:

Thumb
此處以四個集合的閔可夫斯基和為沙普利-福克曼引理的例證。在左邊,四個非凸集中的點(+)之和,就是右邊,其閔氏和凸包中的點(+)。左邊四點之中,有兩點位於相應的非凸集中,另有兩點位於非凸集的凸包中。各凸包以淺粉紅色畫出。原來的集合各只有兩點(以紅點表示)。[1]

「許多個集合的閔氏和,是否必定近似凸集?」沙普利-福克曼引理和相關的結果表明,問題的答案為肯定。[2]集合稱為,意思是連接其中任意兩點的線段,必為該集合的子集:舉例,實心圓盤  為凸集,但  則不然,因為連接相異兩點的線段  並不是圓的子集。沙普利-福克曼引理大致斷言,若求和項的數目超出向量空間的維數,則其閔氏和將近凸。[1]

沙普利-福克曼引理引入時,是作為證明沙普利-福克曼定理的一步,該定理斷言閔氏和與其凸包距離不超過某個上界。所謂集合凸包,是包含的最小凸集。而當且僅當和為凸時,上述距離為零。定理中,距離的上界取決於維數及求和項的形狀,但不取決於求和的項數,而只需。只要其中個求和項的形狀,就足以確定個集合的閔可夫斯基平均

與其凸包的距離的上界。當趨向無窮時,該上界遞減至零(需要各求和項的大小一致有界)。[3]斯塔(Starr)的推論將沙普利-福克曼定理的上界壓得更低,故又稱為沙普利-福克曼-斯塔定理

勞埃德·沙普利強·福克曼英語Jon Folkman的引理,最先由經濟學家羅斯·斯塔英語Ross Starr發表,其時斯塔正在肯尼斯·阿羅門下,研究經濟均衡的存在性。[1]斯塔在論文中,研究凸化(convexified)經濟體,即將非凸集換成其凸包。斯塔證明,凸化之後,有些均衡由原經濟體的「準均衡」(quasi-equilibria)逼近;還證明,每個準均衡都具有真均衡的許多最優性質,而凸經濟體中則必定存在真均衡。斯塔1969年的論文發表後,沙普利-福克曼-斯塔的結果得到廣泛應用,用作證明(凸)經濟理論的若干核心結果,儘管不適用於有非凸部分的大經濟體,但在此等經濟體中,仍是良好的近似。羅歇·蓋內里英語Roger Guesnerie評論:「這些結論的一般形式的推導,是戰後經濟理論的重大成就。」[4]許多諾貝爾獎得主都曾研究經濟學中的非凸集英語Non-convexity (economics),除了前述的勞埃德·沙普利(2012年獲獎)外,還有:阿羅(1972)、羅伯特·約翰·奧曼(2005)、傑拉德·德布魯(1983)、特亞林·科普曼斯(1975)、保羅·克魯曼(2008)、保羅·薩繆爾森(1970)。至於互補的主題「經濟學中的凸集英語Convexity in economics」,除以上得主著重外,還有里奧尼德·赫維克茲列昂尼德·維塔利耶維奇·康托羅維奇(1975)、羅伯特·索洛(1987)都著重。

沙普利-福克曼引理在優化論概率論皆有應用。[3]優化論中,可以引理解釋,在求多個函數之和的最小值時,為何一些解法可以成功。[5][6]概率論中,引理適用於證明隨機集英語Stochastic geometry的「大數定律」。此定理先前僅在凸集的情況得證。[7]

Remove ads

簡單例子

考慮凸的實數區間,其包含整數子集,且是其凸包(添加了兩點所連線段上的所有點)。僅得兩個元素的集合,複製成三份,並按元素求和,得到

(此處集合的和,是從各集合分別取一個元素相加,得到的可能結果的集合,稱為閔氏和。)和集的凸包則為區間

區間中,每個數都可以寫成區間中某三個實數(允許重複)之和,例如將等分成三份即可。但使用沙普利-福克曼引理,則有更強的結論:的每個數,都可以寫成中某兩個整數(允許重複),與中某一個實數之和。[8]

凸包中的點,到的距離,至多為

然而,考慮三個區間的閔氏平均

與其凸包的距離,僅為,即未平均前距離()的三分之一。越多個集合相加,其閔氏平均就將凸包填得越滿:由閔氏平均至凸包的最遠距離,隨被加項數增加,而趨向於零。[8]此為沙普利-福克曼定理的結論。

Remove ads

前置概念

沙普利-福克曼引理需要用到凸幾何英語convex geometry的若干定義和定理,本節將作簡介。

實向量空間

向量空間上,有笛卡兒坐標系,將每點視為一對實數,稱為「坐標」,按慣例記為。笛卡兒平面上的兩點,可以逐個坐標相加

此外,點也可以逐個坐標與實數相乘

更一般而言,任何維(有限維)實向量空間,均可視為個實數組成的D元組的集合,並配備兩種運算向量加法標量乘法。有限維實空間的此兩種運算,皆定義成逐個坐標運算,與笛卡兒平面上的運算類似。[9]

凸集

Thumb
凸集中,連接任意兩點的線段仍是的子集。
Thumb
非凸集中,連接某兩點的線段上,有一點不再是的元素。
線段可以檢驗某集合是否凸集

實向量空間中,非空子集稱為凸集,意思是,對於的任意兩個點,連接兩點成一線段,其上的所有點仍在中。例如,實心圓盤  為凸,但  則不然,因為連接相異兩點的線段  並不是圓的子集。三個整數的集合非凸,但其為區間的子集,而該區間為凸。又例如,實心立方體為凸,然而任何空心或凹陷的圖形,如彎月形英語Crescent,則非凸。空集也是凸集,視乎作者偏好,這可能是專門的定義[10],也可能是因為要滿足的條件是空真命題英語Vacuous truth

更嚴謹而言,集合稱為,意思是,對中任意兩點,和單位區間中的任意實數,點

仍是元素

數學歸納法,集合為凸,當且僅當其任意多個元素的凸組合仍在中。所謂向量空間子集凸組合,是其元素的任意加權平均,而各可以是總和為的任意非負實數,即只需[11]

凸集的定義推出,兩個凸集的交集仍是凸集。更甚者,任意一族凸集的交也是凸集。作為特例,若取兩個不交的凸集,則其交集為空集,故應當稱空集為凸。[10]

Remove ads

凸包

Thumb
紅色集的凸包中,每個藍點都是若干個紅點的凸組合

對於實向量空間的每個子集,其凸包是包含最小凸集。所以,是所有覆蓋的凸集的交。等價地,可以將定義成的點的所有凸組合的集合。[12]作為例子,整數集合的凸包,是實數區間,其兩端為原有的整數[8]單位圓的凸包則是閉單位圓盤,其包含單位圓。

Remove ads

閔可夫斯基和

Thumb
集合的閔可夫斯基和。兩個小正方形的和,是大正方形

在任何向量空間(或有定義加法的代數結構)中,兩個非空子集閔可夫斯基和,定義為其元素之和的集合,即 (參見[13])。例如:

此運算定義在非空子集族上,且滿足結合律交換律。既然有結合律和交換律,就可以遞歸定義多個被加項的運算結果。由數學歸納法,可見[14]

Remove ads

閔可夫斯基和的凸包

閔可夫斯基和與凸包運算可以交換。具體而言,對實向量空間的任意子集,其閔氏和的凸包等於其凸包的閔氏和。換言之,

故由數學歸納法得

對任意和非空子集)成立。[15][16]

Remove ads

各命題的敍述

Thumb
閔氏和及凸包。右圖的十六個紅點,組成左圖四個非凸集的閔氏和。左圖每個非凸集由兩個紅點組成,其凸包(淺粉紅色)包含標記加號(+)的點,而右圖中的加號等於左圖各個標加號的點之和。

由前一段的恆等式,對和的凸包中的每點,都存在各凸包的取遍),使得。各點的位置取決於

Remove ads

引理

Thumb
勞埃德·沙普利,2012年諾貝爾經濟學獎得主。他與強·福克曼英語Jon Folkman一同證明沙普利-福克曼引理。[1]

有了以上背景,沙普利-福克曼引理斷言,的表示法

僅需要不多於個被加項取自凸包,而其他被加項,則只需取自原來的集合。以符號復述,即有以上方法表示,且滿足。不妨將下標重新排序,然後就有

其中對,有,而對,則有。注意,倘若重排,則排序的方式也取決於點[17]再精簡,沙普利-福克曼引理可以寫成

舉例,集合中的每個點,根據引理,必定可以寫成的某個元素,與的某個元素之和。[8]

Remove ads

實向量空間的維數

反之,沙普利-福克曼引理刻劃了有限維實向量空間的維數。具體而言,若某向量空間,對於某個自然數滿足引理的結論,但對小於的數不滿足,則其維數恰好為[18]引理僅對有限維向量空間成立。[19]

沙普利-福克曼定理及斯塔的推論

Thumb
某點集(深紅)的凸包以淺紅虛線圍起。點集的內半徑(綠色)必定小於其外接圓半徑(藍色),除非所有點共圓,此時兩個半徑相等。

沙普利與福克曼運用其引理,證明沙普利-福克曼定理,給出集合的閔氏和與其凸包(稱為凸化(convexified)和)的距離上界。定理的敍述如下:

凸化和的任一點,到(未凸化)和集歐氏距離平方,不超過各集合的外接半徑中,最大個的平方和。(所謂外接半徑,定義為包圍該集合的最小球面的半徑。)[20]此上界與求和項數無關(但要求,且集合不能越來越大)。[21]

上述定理給出閔氏和及其凸包之間距離的上界。當且僅當閔氏和為凸集時,此距離為零。該上界取決於維數及各被加項的形狀,但只要,就不取決於項數[3]

通常,外接半徑會大於內半徑,而無論如何,外接半徑總不能小於內半徑。集合內半徑定義為:[22]

最小的正實數,滿足:若凸包中,則若干點的凸包中,而該些點皆在同一個半徑為內。

斯塔將沙普利-福克曼定理中的外接半徑換成內半徑,從而壓低沙普利-福克曼定理的上界:

沙普利-福克曼定理的斯塔推論

凸化和的任一點,到(未凸化)和集的歐氏距離平方,不超過各集合的內半徑中,最大個的平方和。[22][23]

斯塔的推論確定,個集合的閔氏和與其凸包之間,歐氏距離的上界。此距離可以衡量閔氏和非凸的程度,故為簡單起見,下文稱為非凸度。於是,斯塔對非凸度的上界,僅取決於個最大內半徑之值,但不取決於求和的項數(假設)。


例如,非凸集的非凸度為,因為與其凸包(區間)的距離為

所以,既然的非凸度有不取決於項數的上界,就知平均集

非凸度上界,會隨增加而遞減。例如,平均集

和其凸包的距離僅為,等於被加項與其凸包的距離()之半。僅要最大個求和項的形狀,已足以計算和集與凸包的距離的上界,故除以後,平均集與凸包的距離,在趨向無窮時,會遞減至零(對均勻有界的求和項成立,即各個求和項的大小需有同一個上界)。[3]若使用斯塔的上界,則前一句結論的條件可以放寬,只需各求和項的內半徑有同一個上界。[3]

Remove ads

證明和計算

沙普利-福克曼引理的原證明,僅確定存在該種表示法,而無說明如何構造阿羅哈恩[24]蓋士利英語J. W. S. Cassels[25]、斯奈德(Schneider)[26]和其他人都曾給出類似的證明。阿特斯泰因(Artstein)擴展了埃科蘭德英語Ivar Ekeland的簡潔抽象證明。[27][28]也有未經出版的另證。[2][29]1981年,斯塔發表一種疊代法,可以計算給定點的表示法,然而,此計算方法給出的上界,較非構造性證明的上界差。[30]博賽卡斯的書有講述有限維空間沙普利-福克曼引理的初等證明,[31]並將引理應用於估計可分優化(separable optimization)問題與零和賽局對偶間隙

應用

有沙普利-福克曼引理,學者就得將有關凸集閔氏和的結果,套用到(無需凸的)一般集合之和。此種和見於經濟學最優化理論概率論。此三領域的應用中,非凸性起到重要作用。

經濟學

Thumb
消費者偏好位於無差異曲線上的任意籃子,勝過位於上的籃子。籃子,是預算線(藍色)支撐的位置,所以是最優而又可行。相反,雖然消費者更偏好上的任意籃子,但無足夠預算,所以並不可行。

經濟學中,消費者對每一「籃子」商品(basket,即商品的組合)有其偏好程度。每籃子可用一個非負向量表示,其坐標為籃中各商品的量。所有籃子組成的集合中,每個消費者有自己的一族無差異曲線,滿足:在同一條曲線上的各籃子,對該消費者是等價的,即消費者並不覺該曲線上有籃子勝於另一個籃子。每籃子恰好處於一條無差異曲線上。消費者相對於一條無差異曲線的偏好集,定義為該無差異曲線與其更偏好的區域的並集。稱消費者的偏好為,意思是其所有偏好集皆為凸。[32]

如圖所示,消費者認為的最優籃子,是在預算線支撐某個偏好集時取到,因為此時,所選的籃子是整條預算線上,達到最高的無差異曲線的一點。所謂預算線,是由商品的價格向量與消費者的收入計算得出的限制,消費者無足夠收入購買高於此線的籃子。所以,最優籃子的集合是各價格的函數,稱為消費者的需求。若偏好集為凸,則不論價格為何,消費者認為的最優籃子總是組成凸集,例如可能是單元集,或是一條線段。[33]

非凸偏好

Thumb
若消費者的偏好有凹陷,則消費者的決定可以不連續,從一個籃子跳到另一個隔開的籃子。

然而,若有偏好集非凸,則某些價格確定的預算線,可能在兩個分開的最優籃子支撐該偏好集。例如,可以設想,動物園購買獅子或鷹的價錢一樣,且其預算恰好夠買一隻獅子或一隻鷹。此外,假設園主亦認為兩隻動物價值相同,則動物園有可能買獅子,也可能買鷹,但當然不可能買半隻獅子加半隻鷹(獅鷲)。所以,園主的偏好非凸:買兩隻動物中的任一隻,勝於兩者的嚴格凸組合。[34]

若消費者有非凸偏好集,則對於某些價格,需求不連通。不連通的需求,會導致消費者的行為出現不連續的間斷。引述哈羅德·霍特林的話(宜配合所附動圖理解):

若考慮波浪形的無差異曲線,即在某些區域向原點凸,而在其他區域向原點凹,則我等被迫推論,僅有向原點凸的部分需要理會,因為幾乎不可能觀測到其他部分。要偵測該些部分,唯一方法是,觀察價格之比率變化時,需求的不連續變化。此變化的效果是,當直線旋轉時,切點會突然躍過某凹陷。雖然此種不連續的表現,揭示有凹陷,但卻不可能量度缺口的深度。倘若無差異曲線,或其高維推廣,有凹陷部分,則定必因永遠無法測量,而不為人知。[35]

瓦爾特·迪韋爾特英語Walter Erwin Diewert[36]書中,稱赫爾曼·沃爾德英語Herman Wold[37]有強調研究非凸偏好的困難,也引述保羅·薩繆爾森稱凹陷處「被永恆的黑暗遮蔽」[38]

儘管有上述困難,《政治經濟期刊英語Journal of Political Economy》(JPE)在1959年至1961年間,刊登一系列的論文,解明非凸偏好。投稿人包括:法雷爾(Farrell)[39]巴托爾英語Francis M. Bator[40]科普曼斯[41]、羅森博格(Rothenberg)[42]。其中,羅森博格討論非凸集和的近似凸性。[43]該些JPE論文,促使勞埃德·沙普利馬丁·舒比克也合著論文,研究凸化的消費者偏好,並引入「近似均衡」(approximate equilibrium)的概念。[44]JPE論文和沙普利-舒比克論文又啟發了羅伯特·奧曼提出另一個概念,稱為「準均衡」(quasi-equilibrium)。[45][46]

斯塔1969年的論文與當代經濟學

Thumb
肯尼斯·阿羅(1972年諾貝爾獎得主)幫助羅斯·斯塔英語Ross Starr研究非凸經濟體英語Convex preferences[47]

肯尼斯·阿羅收集前人研究經濟學中的非凸集英語Non-convexity (economics)的文獻,列成表,並加入註解,交給羅斯·斯塔英語Ross Starr。斯塔當時仍是本科生,但已在修讀阿羅開設的高等數理經濟學(研究生)課程。[47]斯塔在學期論文中,考慮將非凸偏好換成其凸包所得的假想經濟體,研究其一般均衡。凸化經濟體中,在每個價位,總需求皆是各消費者需求的凸包之和。斯塔的想法吸引數學家勞埃德·沙普利強·福克曼英語Jon Folkman參與,兩人「在私人通信中」證明現以兩人命名的引理和定理,到1969年,斯塔才於論文報告此事。[1]

斯塔1969年的論文中,應用沙普利-福克曼-斯塔定理,證明「凸化」經濟體有一些一般均衡,只要參與者足夠多,能以原經濟體的「準均衡」近似。具體而言,斯塔證明,至少存在一個價格向量為的準均衡,滿足下列條件:

  • 對每個準均衡,所有消費者都可以選到其最優的籃子(在預算限制內,且最偏好)。
  • 在該價格,凸化經濟體中,每種商品的市場皆均衡,即供給等於需求。
  • 每個準均衡的價格,皆「幾乎出清」原經濟體的市場:凸化經濟體均衡組成的集合,與原經濟體的準均衡集合,兩者的距離上界。此結論是根據沙普利-福克曼定理的斯塔推論得到。[48]

斯塔確立以下結論:

「總體中,[取各消費及生產集的凸包]所得的假想經濟體的分配,與真實經濟體的某個分配,兩者的差異,有不取決於參與者數目的上界。因此,當參與者數目趨向無窮時,平均參與者感受到,與擬作行動的偏差,近乎可以忽略不計。」[49]

斯塔1969年論文發表後,沙普利-福克曼-斯塔的結論,在經濟理論獲廣泛應用。羅歇·蓋內里英語Roger Guesnerie如此總結該結論對經濟學的意義:「假設凸性,所得的若干重要結果,在不具凸性的情況下,仍(近似)適用。例如,若經濟體具有大消費側,則偏好的非凸性不影響適用標準結果」[50],還稱「這些結論的一般形式的推導,是戰後經濟理論的重大成就。」[4]許多諾貝爾獎得主都曾研究經濟學中的非凸集英語Non-convexity (economics),除了前述的勞埃德·沙普利(2012年獲獎)外,還有:阿羅(1972)、羅伯特·約翰·奧曼(2005)、傑拉德·德布魯(1983)、特亞林·科普曼斯(1975)、保羅·克魯曼(2008)、保羅·薩繆爾森(1970)。至於互補的主題「經濟學中的凸集英語Convexity in economics」,除以上得主著重外,還有里奧尼德·赫維克茲列昂尼德·維塔利耶維奇·康托羅維奇(1975)、羅伯特·索洛(1987)都著重。[51]

沙普利-福克曼-斯塔的結論,在經濟學各分支的文獻都經常出現,包括微觀經濟學[52]一般均衡理論[53][54]公共經濟學[55](包括市場失靈[56]博弈論[57]數理經濟學[58]、經濟學中的應用數學[59][60]。沙普利-福克曼-斯塔的結論,也使經濟學更多使用測度論和積分理論。[61]

最優化理論

Thumb
函數稱為,意思是圖像上方的區域為凸集

沙普利-福克曼引理可以解釋,為何大規模的最小化問題,即使非凸,仍可用迭代法近似求解(僅對於凸問題,有證明疊代法收斂到最優解)。沙普利-福克曼引理,促使學者將凸優化方法,用於優化多個(無需凸的)函數之和。[62]

最優化理論的前置概念

非線性規劃依賴下列有關函數的若干定義:

  • 函數定義在集合上)的圖像,是所有參數與相應取值組成的二元組的集合:
Thumb
正弦函數並非凸函數

舉例,二次函數為凸,而絕對值函數亦然,但正弦函數(如圖)則不然,因為在區間的蓋圖非凸(而有向上的凹陷)。

加性優化問題

許多優化問題中,目標函數可分離變數(可分),即是多個函數之和,而各個函數的參數不同,如:

又例如,線性規劃問題就可分離變數。考慮一個可分問題,及一個最優解

在該點取到最小值。對此可分問題,同時考慮其「凸化問題」的最優解,即將每個求和項的圖像換成其凸包。此種最優解,會是凸化問題的某點列極限,其中

[5][64]

當然,因為此點是個圖像凸包的點之和,由沙普利-福克曼引理,就可以寫成原圖像的點與少數圖像凸包的點之和。

以上分析,1974年由埃科蘭德英語Ivar Ekeland發表,以解釋為何可分問題有許多項時,即使各項非凸,總問題仍看似凸。對非線性最小值問題而言,對偶問題的解,不一定就是原問題的解(但若已知原問題為凸,且滿足特定條件,則兩者的的最優解相等),但是,1973年,青年數學家克勞德·勒馬雷沙爾英語Claude Lemaréchal詫異,對已知非凸的問題使用凸問題的方法,竟然也成功。勒馬雷沙爾的問題,正是上段加性可分離變數的形式,而每個和項皆非凸函數,但對偶問題的解,仍近似原問題的最優解。[65][5][66]埃科蘭德的分析說明,「大而可分」的最小值問題,即使各和項有凹陷,仍可運用凸優化的方法。埃科蘭德及其後的作者主張,因為變數可以加性分離,所得的總問題近似凸。該等著作以沙普利-福克曼引理為關鍵一步。[5][66][67]沙普利-福克曼引理促使學者將凸優化方法,應用到目標函數為多個函數之和的情況。[5][6][59][62]

概率與測度論

凸集常與概率論一同研究。卡拉西奧多里定理英語Carathéodory's theorem (convex hull)說明,維空間的(非空)子集凸包中的點,是取值於的簡單隨機向量英語Multivariate random variable的期望值,而所謂簡單,意思是僅在不多於個點處有非零概率。所以,對非空集,取值自的簡單隨機向量組成的集合,等於的凸包。由此便可在概率論中,套用沙普利-福克曼-斯塔的結果。[68]反之,藉期望值與凸包之間的聯繫,概率論亦能用作研究凸集,尤其可用作分析沙普利-福克曼-斯塔的結果。[69]沙普利-福克曼-斯塔的結果,廣泛用於隨機集的概率論英語Stochastic geometry[70],例如證明隨機集的大數定律[7][71]中央極限定理[71][72]大離差原理英語Large deviations theory[73]。要證明前列概率極限定理,可以使用沙普利-福克曼-斯塔的結果,來避免假設隨機集為凸。

概率測度是有限的測度,而沙普利-福克曼引理還可以應用到非概率的測度論,如體積向量測度的理論。沙普利-福克曼引理可以加強布倫-閔可夫斯基不等式英語Brunn–Minkowski theorem。該不等式斷言,閔氏和的體積,相較於各和項的體積不能太大,即閔氏和的體積有上界,以各和項的體積的表示。[74]歐氏空間子集的體積,此處定義為其勒貝格測度


高等測度論中,沙普利-福克曼引理適用於證明李亞普諾夫定理,即向量測度值域為凸。[75]值域(或像集)是函數所有可能取值的集合,而向量測度則將測度推廣到允許取向量值。例如,若某測度空間有兩種概率測度,則可定義一個向量測度,是對每個事件,將其兩個概率結合為一個二元組,即

李亞普諾夫定理在經濟學[45][76]、(砰砰)控制論統計理論英語Statistical theory皆有應用。[77]李亞普諾夫定理是沙普利-福克曼引理的連續版[3],而沙普利-福克曼引理是李亞普諾夫定理的離散類比[78]

參考文獻

外部鏈結

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads