トップQs
タイムライン
チャット
視点
情報幾何学
確率分布を要素とする統計モデルに関する微分幾何学的研究 ウィキペディアから
Remove ads
情報幾何学(じょうほうきかがく、英: information geometry、仏: géométrie de l’information、独: Informationsgeometrie、略称: IG[1])とは、確率分布を要素とする統計モデルに関する微分幾何学的研究[2]のことであり、狭義には双対アフィン接続の微分幾何学[3]を指す。「数理統計学の微分幾何学化」[4]や「統計的推論の幾何学的方法論」[5]や「情報理論における微分幾何を用いた定式化」[6]と表現されるように、情報幾何学は統計学・情報理論・確率理論(大偏差理論)にまたがる[7]学際的な分野である。
概要
要約
視点
情報幾何学の理論的な枠組みは統計学の言葉を必要とせず、純粋な微分幾何学の概念のみで定式化できる。
統計多様体の定義にはいくつかの流儀が存在するが現在最も標準的[8]なのは黒瀬 (1994)[9] によるものであり、 級多様体 と 上の捩れのないアフィン接続 と擬リーマン計量 の組 で テンソル場 が対称なものと定義し、組 を統計構造という。 が の に関する双対(アフィン)接続であるとは、任意の 上のベクトル場 に対してライプニッツ則の類似が成り立つことであり、組 を双対統計多様体という。 が平坦であるならば も平坦であるので、組 を双対平坦空間といい、組 を双対構造という。もともと統計多様体は、ラウリッツィンによってリーマン多様体 と甘利・チェンツォフテンソル場と呼ばれる 対称テンソル場 の組 として定義されていた[10]が、両者は基本的に等価である[11]。
が平坦であるならば、テンソル場 が対称であることとある関数 が存在して局所的に と表されることは同値であり[12][13]、これはヘッシアンに他ならないので が平坦な統計多様体は1970年代に志磨裕彦が定義したヘッセ多様体と一致しており、その統計構造をヘッセ構造、関数 をヘッセ・ポテンシャルという[14]。ヘッセ構造はAdS/CFT対応におけるBTZブラックホールに見出されることが知られている[15][16]。
Remove ads
歴史
要約
視点
情報幾何学のアイデアは、1929年にハロルド・ホテリングが記した草稿[17][18]に遡ることができる[19]。ホテリングはフィッシャー情報行列 (ただし と は情報幾何学でよく見られる略記である)が統計モデルにリーマン計量(フィッシャー計量)を定めることを考察し[20]、1945年にクラメール・ラオも独立にそのことを指摘した[21]。さらに1972年にはニコライ・チェンツォフが、マルコフ埋め込みに関する不変性の下では、リーマン計量が(定数倍を除いて)フィッシャー計量だけに限られ、アフィン接続も(1次元実数パラメータの自由度を除いて)一意に定まることを有限集合上の確率分布の場合について証明した[22][23](チェンツォフの定理[24])。一方、1975年にブラッドリー・エフロンは統計的推論の高次漸近理論において、指数型分布族に埋め込まれた統計モデル(曲指数型分布族)にある種の埋め込み曲率を定義し[25]、フィリップ・デイヴィッドはその曲率がフィッシャー計量に関して非計量的なあるアフィン接続から定まることを指摘し、それをエフロン接続と命名した[26]。
このような状況に対し1982年に甘利俊一は、パラメトリックな統計モデル に対しを満たす 上の対称なアフィン接続 を 接続()と定義して[27]一般論を展開することに成功した[28]。実際、有限集合上の確率分布において 接続はチェンツォフの定めたアフィン接続の1係数族と一致しており[29]、特に に対応する e 接続(指数接続)はエフロン接続と一致しており[30]、 に対応する 接続はフィッシャー計量に関するレヴィ・チヴィタ接続に他ならなかった[31]。この一般化を契機として、フィッシャー計量と 接続の成す微分幾何学的構造、特に先述の e 接続と に対応する m 接続(混合接続)が調べられるようになり[32]、e 接続の平坦性は統計モデルの最適性を、m 接続の平坦性は推定の最適性を曲率テンソルを使って定量評価することを可能にした[33]。
甘利はさらに、1982年に長岡浩司と共同で情報幾何の双対構造を発表し[34]、1983年に公文雅之と共同で統計的推論の高次漸近理論の幾何を提唱した[13][35]。1984年にデイヴィッド・コックスが統計の微分幾何に関するワークショップをロンドンで開催したのを皮切りに[36]、少しずつ世界的な知名度が上がって研究が活発化するようになった[37]。江口真透が情報幾何をダイバージェンスを基に構築できることを示したのはその翌年のことであり[38]、双対平坦空間や正準ダイバージェンスなどの一般論が整備されるにつれて情報幾何学はその地位を確立することに成功した。
情報幾何学の応用は、EMアルゴリズム[39][40]のような統計的推論のみならず、統計物理学[41][42]や学習理論[43]、情報熱力学[44][45]にまで及んでおり、2018年にはこのような進展を背景にシュプリンガー社から学術誌 Information Geometry が刊行されることが決定した。今後はさらに、量子情報幾何[46][47]やワッサースタイン幾何[48]、ルピナー幾何などの発展も期待されている。人工知能の分野では、ニューラルネットや神経発火パターンの情報の解釈に応用され始めている。超弦理論と量子情報を結ぶ学術領域では、情報幾何学が応用され始めている。
Remove ads
注釈と出典
参考文献
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads