初級Mathマニアの寝言

数学は色々なところで応用可能であり、多くの人が数学の抽象的な概念の意味や意義を鮮明に知ることができれば今まで以上に面白い物や仕組みが生まれるかもしれません。このブログは数学を専門にしない人のために抽象的な概念の意味や意義を分かりやすく説明することを目的としています。数学を使って何かしたい人のお役に立てたら幸いです。

情報幾何学1: 確率分布とリーマン多様体

今回は確率分布が作る幾何学について説明します。

●フィッシャー情報行列とリーマン多様体

まずは、前の記事で説明したような応用上よく出てくるガウス分布幾何学的に次のように理解できることに注意しましょう(多様体についてはこちら)。

f:id:ogyahogya:20150413141237p:plain

上の例のようにパラメータの組を一つ定めると確率密度関数を定めることができます。このことを一般化して次の確率分布の族である統計モデルと確率分布を特定するパラメータの集合である多様体を同一視できます(厳密には統計モデルにいくつかの条件を付ける必要がありますが、応用上気にしなくて良いことが多いです)。 f:id:ogyahogya:20150414171034p:plain

確率分布が作る幾何学を考えるときに重要なフィッシャー情報行列はつぎのように定義されます。

f:id:ogyahogya:20150413152752p:plain

フィッシャー情報行列は定義から対称行列であることが分かります。さらに、フィッシャー情報行列  G(\xi) が任意の  \xi\in \Xi について正定値対称行列であれば、多様体  \Xi G(\xi)に対応するリーマン計量を導入することでリーマン多様体となります。このフィッシャー情報行列に対応するリーマン計量をフィッシャー計量と呼びます。よって、パラメトライズされた確率分布の族が与えられたらフィッシャー計量を導入することでパラメータたちの距離を測ったりするなどの幾何学的な議論ができるようになります。具体的には、次のように近くのパラメータの距離を定義することができます。

f:id:ogyahogya:20150414175132p:plain

●フィッシャー情報行列の具体的な計算

フィッシャー情報行列を定義通り計算すると計算量が多くなることがよくあります。計算量を減らすために次の公式を利用できます。

f:id:ogyahogya:20150414111738p:plain例えば、ガウス分布のフィッシャー情報行列を計算してみましょう。

f:id:ogyahogya:20150414153211p:plain

 上の例では、フィッシャー情報行列を使って次のことも言えます。

f:id:ogyahogya:20150414182155p:plain

●参考文献

 情報幾何学の創始者である甘利俊一先生の英語の本を参考にして記事を書きました。

Methods of Information Geometry (Tanslations of Mathematical Monographs)

Methods of Information Geometry (Tanslations of Mathematical Monographs)

 

●予告

今回紹介したフィッシャー情報行列は統計学の方でも非常に重要なクラメール・ラオの不等式と密接な関係があります。クラメール・ラオの不等式は推定値の誤差をどれだけ減らせるかの限界を示した不等式です。次回は情報幾何学から脱線してフィッシャー情報行列とクラメール・ラオの不等式の関係について詳しく説明します。