初級Mathマニアの寝言

数学は色々なところで応用可能であり、多くの人が数学の抽象的な概念の意味や意義を鮮明に知ることができれば今まで以上に面白い物や仕組みが生まれるかもしれません。このブログは数学を専門にしない人のために抽象的な概念の意味や意義を分かりやすく説明することを目的としています。数学を使って何かしたい人のお役に立てたら幸いです。

確率とは何か

コインを投げたとき表が出る「確率」は  \frac{1}{2} で、サイコロを投げたとき1が出る「確率」は  { \frac{1}{6} } だとかよく言いますが、「確率」とは何でしょうか?そもそもなぜ「確率」というものを考える必要があるのでしょうか?

●「確率」を考える理由

「確率」の定義を考える前に、なぜそのようなものを導入する必要があるのか少し考えてみましょう。例として、コイン投げを考えます。コインを剛体と仮定しましょう。コインを投げるとは、ある力をコインへ加えたと考えられます。このとき、コインが従う運動方程式

f:id:ogyahogya:20140917180101p:plain

というふうに書けます。つまり初期条件  q(0), \dot{q}(0) を与えて上の運動方程式を解くことでコインの軌道  q(t) が得られます。したがって、コインを投げてから何秒後には表を向いているのか裏を向いているのかを求めることができ、「確率」という概念は必要ありませ ん!

 

というのは冗談で、我々は経験的に初期条件  q(0), \dot{q}(0) F u が異なれば表が出るか裏が出るかが変わってくるということを知っています。これはコインの軌道  q(t) を求めるためには厳密に  q(0), \dot{q}(0) F u を測定する必要があるということを意味しています。しかも、コインを投げる毎に。これは非常に手間のかかる作業で、ものすごい暇人しかできないでしょう、というか、 F u を厳密に測定する方法があるのでしょうか?そこで、解析するのが難しい途中の軌道を考えることは諦めて、最終的な結果を得るために「確率」という概念を導入するのです。つまり、「確率」という概念を導入するということは問題をものすごく単純化することを意味しています。色々な雑音がランダムに振る舞う(「確率」的である)としてしまうのも難しいことを考えるのは止めて単純化していると考えることができます。

●初等的な定義(分かりやすいが不十分)

直感的に分かりやすい「確率」は次のものでしょうか。

f:id:ogyahogya:20140918102153p:plain

サイコロを振るという例では、「1が出る」、「2が出る」、「3が出る」、「4が出る」、「5が出る」、「6が出る」という 6個の根元事象があります。いま、それらの根元事象が1/6で出ると仮定しましょう。このとき「偶数が出る」という事象の確率は「偶数が出る」= { 「2が出る」, 「4が出る」, 「6が出る」} なので

                        「偶数が出る」確率=1/6×3=1/2

となる、というわけです。しかし、この「確率」の定義には次のような問題点があります。

f:id:ogyahogya:20140918105245p:plain

例えば、

f:id:ogyahogya:20140918104152p:plain

という例の場合半径は0から1の実数をとると考えるとその根元事象は無限にあるように思えます。また、半径が1/2以下になる事象の中の根元事象も無限にあるように思えます。このような問題に上の確率の定義では答えられないのです。では、上の例の問題に答えるにはどうすれば良いでしょうか?次のように「確率」を定義すると解決できるように思えます。

f:id:ogyahogya:20140918135833p:plain

この定義のもとで、線分の長さは面積の一種だと考えると、上の例は1/2が答ということになります。しかし、この定義も問題があります。なぜなら、サイコロを振る例の場合、標本空間の面積や事象の面積が数学的には0となってしまうからです。つまり、この定義を使ってサイコロを振って「偶数が出る」という事象の確率を求めることができません。初等的な確率と集合の面積を使った確率の両方の特徴を兼ね備えたものが現代的な「確率」の定義となります。

●現代的な定義(抽象的)

前の記事で述べたように数学とは集合の性質を写像を通して調べる学問です。現代的な確率の定義はそのようになっています。また、二つの初等的な確率の定義はこの現代的な定義に含まれます。暇な人は確認してみてください。現代的な確率を定義するために次の「集合の集合」を定義します。

f:id:ogyahogya:20140918143004p:plain

標本空間が与えられたとき、 \sigma加法族はたくさんあります。どんな事象の確率を計算したいかによって \sigma加法族を適切に設定するのです。例えば、サイコロを振ると 1, 2, 3, 4, 5, 6 という目が出ますが、その中で我々が知りたいのは偶数が出たか奇数が出たかだけであるとしましょう。[1], [2], [3], [4], [5], [6] という記号でそれぞれ「1, 2, 3, 4, 5, 6 の目が出た」という事象を表すとすると、次の図のように標本空間が分割されて、 \sigma加法族が定義されたとことになります。

f:id:ogyahogya:20140918144630p:plain

 また、1の目が出たか否かを知りたいときは次のように  \sigma加法族を設定するのです。

f:id:ogyahogya:20140918144641p:plain

  \sigma加法族という概念を使うと確率測度という概念を定義できます。

f:id:ogyahogya:20140918150051p:plain

これで、ようやく確率を定義できます。確率の定義はここまで来ると簡単で、単に確率測度の値のことを言っています。

f:id:ogyahogya:20140918151052p:plain

確率を定義するために前の記事で述べたように、集合と写像を意識していることが確認できますね。つまり、確率とは  \sigma加法族の要素を確率測度を通して[0,1]区間の上に写した結果の値のことであると現代の確率論では考えるのです。確率を定義するために抽象的な概念を経由しているので分かりにくく感じるかもしれませんが、このようにすることで非常に多くの例に対して確率の議論ができるようになったのです。

●参考文献

 記事を書くときに参考にした本を紹介します。

(1) 分かりやすい。読み物としても面白い。

確率・統計入門

確率・統計入門

 

 (2) 記事で具体的には触れなかった確率測度の例が多く乗っている。

はじめての確率論 測度から確率へ

はじめての確率論 測度から確率へ

 

  (3) きっちり書いている。3章では電気回路をランダムフォークと関連付けている。

確率論 (新しい解析学の流れ)

確率論 (新しい解析学の流れ)

 

 (4) 最高に分かりやすい。英語が読めるなら今のところ一番のおすすめ。確率が操れるようになるのでは。

Probability, Random Variables and Stochastic Processes

Probability, Random Variables and Stochastic Processes

  • 作者: Athanasios Papoulis,S.Unnikrishna Pillai
  • 出版社/メーカー: McGraw-Hill Publishing Co.
  • 発売日: 2002/01/01
  • メディア: ペーパーバック
  • この商品を含むブログを見る
 

●予告

次回は確率変数という概念を集合と写像を意識して解説したいと思います。この概念を習得すると、もっと実用的な確率過程の概念に進むことができます。

小、中、高と大学以上の数学の違いについて

小学校、中学校、高校までは数学が得意だったけど、大学で習う数学はよく分からないという人は意外と多いのではないでしょうか?大学以上の数学が小、中、高に比べて習得しにくい本質的な原因は何なのか考えてみましょう。原因が分かれば大学以上の数学も学びやすくなるはずです。

●小、中、高の数学

小、中では整数や有理数、実数を習いました。 また、中、高では、初等関数(  x^3+2x^2+1, \frac{x+2}{x^2+1}, e^x, \log x, \sin x)なんかを習いましたし、集合の概念も学びました。図で書くとこんな感じです。

f:id:ogyahogya:20140916102949p:plain

 

高校までにやっていたことを振り返ってみると主に集合の中の要素を取り出して和の計算や積の計算を練習していたことが分かります。例えば、3+5=8という計算は整数の集合から3と5を取り出して足すと整数の集合の中の8になり,  (3x+5)+(x^2+x)=x^2+4x+5 という計算は2次以下の多項式の集合から 3x+5 x^2+x を取り出して足すと2次以下の多項式の集合の中の  x^2+4x+5 になるということをたくさん練習しました。小、中、高では扱う数や関数の種類がそれほど多くないため、集合を意識しなくても理解できた(テストで点数がとれた)という人が多いはずです。

●大学以上の数学の特徴

大学以上の数学では、小、中、高のような文部科学省の定めた制限がなくなりますので一気に対象とする範囲が広がります。例えば、次のような感じの集合を対象とするようになります。

f:id:ogyahogya:20140916104924p:plain

ベクトル空間になる例としては、連続関数の全体や可積分な関数の全体などが挙げられます。連続関数というだけでもたくさん(無限に)あるのでベクトル空間がいかに抽象的な集合かが分かると思います。また、ノルム空間や内積空間はそれぞれベクトル空間に何らかのノルムと内積が定義された集合のことです。つまり、単なるベクトル空間よりもノルム空間や内積空間の方がノルムや内積という概念を通じて個々の要素の性質が分かりやすくなっています。しかし、ノルムや内積の公理を満たせば何でもノルムや内積となるのでノルム空間や内積空間というだけではかなり抽象的な集合です。滑らかな多様体代数多様体、可測集合なども抽象的な集合として定義されます。このように大学以上の数学では対象とする集合が小、中、高に比べて圧倒的に多くなり、また、抽象的になります。

●大学以上の数学はどのように議論が進むか

前述したように、大学以上の数学は扱う対象が非常に多く、抽象的になります。そこで、大学以上の数学では議論が混乱しないように、どんな集合に含まれる要素を解析するのかということをはっきりさせます。そして、集合の性質や要素の性質を写像を通して調べるのです。集合  X から集合  Y への写像というのは、任意の  x\in X に対してある  y\in Y を対応させる  f のことで、 f:X\rightarrow Yと書きます。イメージとしては次のような感じです。

f:id:ogyahogya:20140916130832p:plain

 

写像を使って集合内の要素の性質を調べる

写像を使うことで、素性のよく分からない集合  X の要素たちをよく分かっている集合  Y の中へ写して自分たちが理解しやすいようにすることができます。もっと簡単に言うと、難しそうな集合を我々の慣れ親しんでいる整数の集合や実数の集合  {\bf R} へ移して考えるのです。例えば、

f:id:ogyahogya:20140916131924p:plain

という  [0,T] 上で定義されたすべての連続関数の集合を考えましょう。これはベクトル空間の一例です。この集合は整数や実数の集合ほど簡単そうではありません。 C[0,T] の中の要素の大小関係を表すにはどうしたら良いでしょうか?我々は  C[0,T] という集合よりも非負の実数の集合  {\bf R}_{\geq 0} の方が慣れ親しんでいるはずです。そこで  C[0,T] の要素を  {\bf R}_{\geq 0} の要素へ写像して、大きさを表現します。このような写像の一例としてノルムがあるのです。イメージとしては次のような感じです。

f:id:ogyahogya:20140916135715p:plain

●集合と写像を意識するメリット

前述したように議論をクリアにするために対象とする集合は何かをきちんと明確にし、その集合の性質を写像を使って調べるということを大学以上の数学は行います。このような観点に立つと、一つ一つの事例ではなく無限個の対象に共通する性質を調べることができます。しかし、数学を研究する人の立場ではなく、具体的なものを作る人にとってはこの観点はどれほど有益なのでしょうか?例えば、テレビやパソコンや車や飛行機やそれらの部品などは、集合と写像を意識した汎用性のある議論だけでは作ることができません。その具体的なものに固有の性質を研究する必要があるからです。つまり、数学者以外のエンジニアや研究者には数学者の好む汎用性のある結果だけでは意味がないのです。では、数学者以外の人たちは集合と写像を意識した大学以上の数学を学ぶ必要はないのでしょうか?初級Mathマニアの意見では、数学者以外の人たちは普段の仕事で集合と写像を意識するという習慣がそれほどないのですから、その思考法を身に付ければ他の人には思いつかない発想ができるようになるかも知れません。集合と写像を意識するということで新しいアイディアを得る武器になると思います。

●まとめ

1. 大学以上の数学は対象とする集合が多くなり、抽象的になる。

2. 集合の性質を調べるには写像を使う。

3. 数学者の思考法と、それ以外の人の思考法はだいぶ違う。数学者でない人も数学者の思考法を学ぶと色々と新しいアイディアが出せるかも。

●予告

次回からは数学とは対象とする集合の性質を写像を通して調べる学問であるということを意識しながら色々な概念の説明をしたいと思います。はじめのうちは色々な分野に応用を持つ確率や統計の話を集合と写像の言葉を使って説明したいと思います。