トップQs
タイムライン
チャット
視点
確率変数の収束
ウィキペディアから
Remove ads
数学の確率論の分野において、確率変数の収束(かくりつへんすうのしゅうそく、英: convergence of random variables)に関しては、いくつかの異なる概念がある。確率変数列のある極限への収束は、確率論や、その応用としての統計学や確率過程の研究における重要な概念の一つである。より一般的な数学において同様の概念は確率収束 (stochastic convergence) として知られ、その概念は、本質的にランダムあるいは予測不可能な事象の列は、その列から十分離れているアイテムを研究する場合において、しばしば、本質的に不変な挙動へと落ち着くことが予想されることがある、という考えを定式化するものである。異なる収束の概念とは、そのような挙動の特徴づけに関連するものである:すぐに分かる二つの挙動とは、その列が最終的に定数となるか、あるいはその列に含まれる値は変動を続けるがある不変な確率分布によってその変動が表現される、というようなものである。
Remove ads
背景
要約
視点
「確率収束」とは、本質的にランダムあるいは予測不可能である事象の列がしばしばあるパターンへと落ち着くことが期待される、という考えを定式化するものである。そのパターンとは、例えば、
- ある固定値や、ある確率事象から発生するそれ自身への、古典的な意味での収束
- 純粋な決定論的な関数から生じる結果への相似性の増加
- ある特定の結果への嗜好の増加
- ある特定の結果から離れていることに対する反発の増加
などが挙げられる。それより明白ではないが、より理論的なパターンとしては
- 次の結果を表現する確率分布が、ある分布へとより似るようになること
- ある特定の値から離れた結果の期待値を計算することによって形成される列が 0 へと収束すること
- 次の事象を表現する確率変数の分散がより少なくなっていくこと
などが挙げられる。これらの起こりうる異なるタイプのパターンは、研究されている異なるタイプの確率収束において反映される。
上述の議論は一つの列の一つの極限値への収束と関連しているが、二つの列が互いへと収束する概念も重要である。しかし、それは、それら2つの列の差や比によって定義される列を研究することによって容易に扱うことができる。
例えば、等しい有限の平均と分散を持つような n 個の無相関確率変数 Yi, i = 1, …, n の平均が
で与えられるとすると、n が無限大へと近付く時、Xn は確率変数 Yi の共通の平均 μ へと確率収束(下記参照)する。この結果は大数の弱法則として知られる。別のタイプの収束は、中心極限定理を含む別の有用な定理において重要となる。
以下では、(Xn) を確率変数列とし、X を確率変数とし、それらすべては同一の確率空間 上で定義されるものとする。
Remove ads
分布収束
要約
視点
このタイプの収束により、ある与えられた確率分布によってより良くモデル化されるようなランダム実験の列における結果を期待することができる。
分布収束は、この記事内で述べられる全ての他のタイプの収束も意味するという点において、最も弱い収束である。しかしながら、実際の現場において、分布収束は非常によく利用される; 最もよく現れるのは、中心極限定理の応用においてである。
定義
確率変数の列 X1, X2, … が、ある確率変数 X へと分布収束する、あるいは弱収束あるいは法則収束 (converge in law) するとは、
が、F が連続であるような全ての数 x ∈ R に対して成り立つことである。ここで、Fn および F はそれぞれ確率変数 Xn および X の累積分布関数である。
F が連続であるような点のみを考えるということは本質的である。例えば、もし Xn が区間 [0, 1/n] 上一様に分布しているなら、その列は退化確率変数 X = 0 へと収束する。実際、x ≤ 0 である時はすべての n に対して Fn(x) = 0 が成り立ち、 x > 0 である時はすべての x ≥ 1/n となる n に対して Fn(x) = 1 が成り立つ。しかしながら、すべての n に対して Fn(0) = 0 であるにもかかわらず、この極限確率変数に対しては F(0) = 1 である。したがって、F の不連続点 x = 0 では累積分布関数の収束は成立しない。
分布収束は次のように表記することができる。
ここで は X の法則(確率分布)である。例えば、X が標準正規であるなら と書くことができる。
確率ベクトル (X1, X2, …) ⊂ Rk に対する分布収束も、同様に定義される。この列がある確率 k-ベクトルへと分布収束するとは、
が、X の連続集合であるすべての A ⊂ Rk に対して成り立つことである。
分布収束の定義は、確率ベクトルから、任意の距離空間におけるより複雑な確率要素や、さらには漸近の場合を除いて可測でない「確率変数」に対してですら拡張される-そのような状況は例えば経験過程の研究において現れ、これは「定義されていない法則の弱収束」である[1]。
この場合、弱収束という呼び名が好ましい(測度の弱収束を参照されたい)。また、確率要素の列 (Xn) が X へと弱収束する(Xn ⇒ X と記述される)とは、
がすべての連続有界関数 h(·) に対して成り立つことである[2]。ここで E* は外期待値 (outer expectation)、すなわち、h(Xn) を支配するような最小の可測関数 g の期待値を表す。
性質
- F(a) = Pr(X ≤ a) であることから、分布収束は、十分大きい n に対して Xn がある与えられた領域に含まれる確率と、その領域に X が含まれる確率がほとんど等しいことを意味する。
- 一般的に分布収束は、対応する確率密度関数の列が同様に収束するということは意味しない。その一例として、密度 fn(x) = (1 − cos(2πnx))1{x∈(0,1)} を備える確率変数を考える。そのような確率変数は一様分布 U(0, 1) へと分布収束するが、その密度が収束することはない[3]。
- ポートマントーの補題では、分布収束のいくつかの同値な定義が述べられている。それらの定義は直感にそぐわないものでもあるかも知れないが、統計学における多くの定理の証明に利用されている。その補題によれば、(Xn) が X へ分布収束するための必要条件は、次のいずれかが成立することである:
- Ef(Xn) → Ef(X) がすべての有界な連続関数 f に対して成立する;
- Eƒ(Xn) → Ef(X) がすべての有界なリプシッツ関数 f に対して成立する;
- limsup{ Ef(Xn) } ≤ Ef(X) がすべての上半連続かつ上に有界な関数 f に対して成立する;
- liminf{ Ef(Xn) } ≥ Ef(X) がすべての下半連続かつ下に有界な関数 f に対して成立する;
- limsup{ Pr(Xn ∈ C) } ≤ Pr(X ∈ C) がすべての閉集合 C に対して成立する;
- liminf{ Pr(Xn ∈ U) } ≥ Pr(X ∈ U) がすべての開集合 U に対して成立する;
- lim{ Pr(Xn ∈ A) } = Pr(X ∈ A) が、すべての確率変数 X の連続集合 A に対して成立する。
- 連続写像定理によると、g(·) が連続関数であるとき、確率変数列 {Xn} が X に分布収束するなら、{g(Xn)} も g(X) へと分布収束することが分かる。
- レヴィの連続性定理:確率変数列 {Xn} が X に分布収束するための必要十分条件は、それらに対応する特性関数の列 (φn) が X の特性関数 φ へと各点収束することである。
- 分布収束はレヴィ-プロホロフ計量によって距離化可能である。
- スコロホッドの表現定理は、分布収束への自然な拡張である。
Remove ads
確率収束
要約
視点
「例外的」な結果が起こる確率は、列が進むにつれてより小さくなる、という考え方が、このタイプの収束の背景にある。
確率収束の概念は統計学において非常に頻繁に用いられる。例えば、ある推定量が一致推定量であるとは、それが推定された量へと確率収束することを言う。確率収束はまた、大数の弱法則により確立される収束の一つでもある。
定義
確率収束の定義を正式に述べる。任意の ε > 0 および任意の δ > 0 を選ぶ。X を中心とする半径 ε の外側に Xn がある確率を Pn とする。このとき、Xn が X へと確率収束するためには、全ての n ≥ Nδ に対して確率 Pn が δ より小さくなる、ある数 Nδ が存在しなければならない。
確率収束は、収束を表す矢印に記号 p を付け加えるか、確率極限作用素 "plim" を使って表される:
性質
- 確率収束するならば、分布収束する[proof]。
- 確率収束しても、必ずしも概収束しない[proof]。
- 逆に、分布収束が確率収束を意味するためには、極限の確率変数 X が定数である必要がある[proof]。
- 連続写像定理によると、どのような連続関数 g(·) に対しても、 であるならば が成立する。
- 確率収束は、ある固定された確率空間に対する確率変数の空間上の位相を定義する。この位相は、次に述べるカイ・ファン計量により距離化可能である[4]:
あるいは
- .
Remove ads
概収束
要約
視点
概収束は、初等的な実解析の分野で知られる各点収束の概念とほぼ同様な、確率収束の一つの型である。
定義
確率変数列 Xn が X へと概収束あるいはほとんど確実に収束、ほとんど至る所で収束、確率 1 で収束あるいは強収束するとは、
が成り立つことである。
上式は、Xn が X へと収束しない事象が起きる確率が 0 であるという意味で、Xn の値が X の値へと近付くことを意味する(ほとんど (数学)も参照)。確率空間 を定め、Ω から R への関数としての確率変数の概念を利用することで、上式は
と同値となる。
また概収束の同値な定義には、以下もある:
概収束は、しばしば、収束を表す矢印の上に記号 a.s.(almost surelyの略)を付け加えることによって表現される:
距離空間 (S, d) 上の一般的な確率要素 (Xn) に対しても、同様に概収束が定義される:
性質
Remove ads
確実収束
要約
視点
ある確率空間上定義される列あるいは確率変数 (Xn)(すなわち、確率過程)が X へ確実収束 (sure convergence) あるいは各点収束するとは、
が成り立つことである。ここで Ω は、確率変数が定義される確率空間に含まれる標本空間である。
これは、関数列の各点収束の概念を確率変数の列へと拡張したものである(確率変数はそれ自身が関数であることに注意されたい)。
確率変数の確実収束は、上述の他の全ての収束を意味する。しかし、概収束の代わりに確実収束を用いることのメリットは確率論においてはあまり無い。それら2つの収束の違いは、確率 0 の集合に関する点のみに存在する。このことが、確実収束の概念が滅多に用いられることの無い理由である。
Remove ads
平均収束
要約
視点
ある r ≥ 1 に対し、列 (Xn) が X へと r次平均収束(あるいは、Lr-ノルムについて収束)するとは、(Xn) および X の r次絶対積率が存在し、かつ
が成り立つことである。ここで作用素 E は期待値を表す。r次平均収束は、(Xn) と X の差の r次のべきの期待値が 0 へと収束することを意味する。
この種の収束はしばしば、収束を表す矢の上に記号 Lr を付け加えることで表現される:
r次平均収束に関して重要なケースを下に挙げる:
- r = 1 について Xn が X へと r次平均収束するとき、Xn は X へ平均収束すると言われる。
- r = 2 について Xn が X へと r次平均収束するとき、Xn は X へ二乗平均収束すると言う。この収束はまた次のように記述されることもある[5]:
r > 1 に関する r次平均収束は、(マルコフの不等式により)確率収束を意味する。また、r > s ≥ 1 である時、r次平均収束は s次平均収束を意味する。このことから、二乗平均収束は平均収束を意味することが分かる。
Remove ads
性質
要約
視点
様々な収束の概念の間の包含関係を以下に記述する。それらは、矢の記号を使うことで、次のように表される:
いくつかの特別な場合とともに、これらの性質を次のようにまとめる:
- 概収束は、確率収束を意味する[6][proof]:
- 確率収束は、概収束するような部分列 が存在することを意味する[7]:
- 確率収束は、分布収束を意味する[6][proof]:
- r次平均収束は、確率収束を意味する:
- r次平均収束は、より低次(ただしそれらはいずれも 1 より大きいものとする)の平均収束を意味する:
- provided r ≥ s ≥ 1.
- Xn が定数 c へと分布収束するなら、Xn は c へと確率収束する[6][proof]:
- provided c is a constant.
- Xn が X へと分布収束し、Xn と Yn の差が 0 へと確率収束するなら、Yn もまた X へ分布収束する[6][proof]:
- Xn が X へ分布収束し、Yn が定数 c へ分布収束するなら、それらの結合ベクトル (Xn, Yn) は (X, c) へ分布収束する[6][proof]:
- provided c is a constant.
ここで Yn が定数へ収束するという条件が重要であることに注意されたい。もしその収束がある確率変数 Y へのものであったら、(Xn, Yn) が (X, Y) へ収束するという結論は得られない。
- Xn が X へ確率収束し、Yn が Y へ確率収束するなら、それらの結合ベクトル (Xn, Yn) は (X, Y) へ確率収束する[6][proof]:
- Xn が X へ確率収束し、すべての n およびある b に対して P(|Xn| ≤ b) = 1 が成立するなら、Xn はすべての r ≥ 1 に対して X へと r次平均収束する。言い換えると、Xn が X へと確率収束し、すべての Xn がほとんど確実に上下とも有界であるなら、Xn は任意の r について X へ r次平均収束する。
- 概収束表現:通常、分布収束は概収束を意味するものではない。しかし、X0 へ分布収束するある与えられた列 (Xn) に対しては、新しい確率空間 (Ω, F, P) とその上で定義される確率変数 (Yn, n = 0, 1, …) で、各 n ≥ 0 に対して Yn は分布として Xn に等しく、また Yn は Y0 へと概収束するようなものを見つけることが常に可能である[8]。
- すべての ε > 0 に対して
- であるとき、Xn は X へとほとんど完全に (almost completely) 収束すると言う。Xn が X へほとんど完全に収束するなら、それはまた X へ概収束もする。言い換えると、もし Xn が十分に早く X へ確率収束する[注釈 1]なら、Xn は X へ概収束もする。これは、ボレル・カンテリの補題からの直接的な帰結である。
- Sn を n 個の実独立な確率変数の和
- としたとき、Sn が概収束することと確率収束することは同値である。
Remove ads
脚注
参考文献
関連項目
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads