この記事では、
で少し書いた中心極限定理について詳しく説明します。中心極限定理は直感的にはたくさんの確率変数の和の確率分布関数はガウス分布(正規分布)になるということを述べています。一つ一つの確率変数にあまりきつい条件を課すことなく言えるので、色々な分野で応用が可能です。しかし、あまりきつい条件を課さないということで、その定理を示すためにはいくつかの抽象的な概念を経由する必要があります。
で書いた確率測度の弱収束と確率分布関数の分布収束という概念も中心極限定理を証明するために必要な概念となっています。
●中心極限定理とは何か
中心極限定理はある条件が成り立てば独立な多くの確率変数の和の確率分布関数が標準ガウス分布へ分布収束することを主張しています。ここで、重要なのは確率変数が同一である必要はないということです。多くの本では確率変数たちが独立で同一(i.i.d.)であるなら正規化された和の確率変数たちに対して中心極限定理が適用できることを述べていますが、同一性の仮定は必要ありません。同一性の仮定が必要ないことは実用上とてもうれしいことです。例えば、ある地域に住む人々の消費電力を確率変数で表したとしましょう。日々の経験から人々の電力の使い方は同一の確率分布に従うとは思えません。このとき、その地域の消費電力はその地域に住む人々の消費電力の和となるので、地域の消費電力もまた確率変数となると考えることができます。よって、地域の消費電力も確率分布を持つわけです。では、その確率分布はどんな形になるでしょうか?人々の消費電力は確率変数と考えたときに独立と考えられます。なぜなら、自分の家でどのように電気を使うかは隣の家の電気の使い方に依存しないはずだからです。よって、中心極限定理を使うために同一性の仮定が必要ないことから多くの場合、地域の消費電力の確率分布はガウス分布になることが予想されます。もし、中心極限定理に同一性の仮定が必要なら地域の消費電力の確率分布の形はどんなものになるか予想することが難しくなるはずです。
このように中心極限定理は集団の振る舞いを知る上でかなり便利です。その定理は正確には次のようになっています。
中心極限定理は上のように確率変数たちが独立ということと、リンデベルグ条件が成立すれば同一性の仮定がなくても適用できます。同一性の仮定は次のようにリンデベルグ条件がなりたつための十分条件になっています。
また、次の条件はリヤプノフ条件と呼ばれ、これもリンデベルグ条件が成り立つための十分条件になっています。
例えば次のような感じで中心極限定理を適用できます。
上の例でn=15, n=20, n=50, n=100の場合に のヒストグラムを作ると次のような感じになります。ただし、各 は] 上の一様分布で生成しています。つまり、この場合はすべての確率変数が同一分布です。
図を見ると が大きくなるにつれて正規分布に近づいていることが分かります。
また、すべての確率変数が同一分布ではないときにも次のように が大きくなると正規分布に近づくことが分かります。
●確率測度のフーリエ変換: 特性関数
前の記事の中で独立な確率変数たち の和の確率密度関数は の確率密度関数 の合成積
で与えられるということを述べました。
で書いたようにフーリエ変換を施すと
のように合成積は通常の積に変わり、計算がしやすくなります。このことを利用して中心極限定理を示すことができるのです。ここでは、前の記事で書いたフーリエ変換の定義を一般化して次のように確率測度のフーリエ変換を定義します(本質的ではないが符号が異なることに注意)。これが確率測度の特性関数というものです。
例えば、平均 、 分散 のガウス分布の特性関数は次のように求めることができます。
よって、確率変数たち が独立なガウス分布に従うなら、 もガウス分布に従うことが次のように分かります。
よって、確率変数たちの和を考えたときにもともとの確率変数たちがすべてガウス分布に従うなら和もガウス分布に従うということが特性関数を計算することで分かります。中心極限定理は和を構成する確率変数たちがガウス分布に従わなくても、たくさんの確率変数の和はガウス分布に近くなるということを言っているのです(ちょっとした仮定のもとで)。
●中心極限定理の証明の流れ
中心極限定理は確率分布関数の列の標準正規分布への分布収束を述べていますが、その分布収束を示すために、対応する特性関数の列の収束を用います。特性関数の列の収束と確率分布関数の列の分布収束の関係は確率測度の列の弱収束との関係を使って示すことができます。
実際に、次のように確率測度の列が弱収束するなら対応する特性関数の列が収束することを示すことができます。
逆に特性関数が収束するなら確率測度が弱収束するということも成り立ちます。これはGlivenkoの定理と言われています。
上の定理と前の記事の確率測度の弱収束と確率分布関数の分布収束の等価性より、次の関係が成り立つことが分かります。
この関係は次のように中心極限定理の証明の中で利用できます。
●参考文献
記事を書くにあたって参考にした文献です。
(1) タイトルのとおり中心極限定理について詳しく書いている。
(2) 証明が分かりやすい。
Theory of Probability and Random Processes (Universitext)
- 作者: Leonid Koralov,Yakov G. Sinai
- 出版社/メーカー: Springer
- 発売日: 2012/08/14
- メディア: ペーパーバック
- この商品を含むブログを見る
●予告
中心極限定理をもっと掘り下げます。