記事の内容
今回は、「プログラミングのための確率統計」という本を紹介する。
本書は、確率という抽象的な概念を理解するのを助けてくれる。具体的な算数の話に置き換えてくれるからだ。
そのために、「確率とは面積だ」する。
確率統計の初心者にも、ある程度勉強してきた人にも、とても学びが多い本だと思う。
今回の記事では、ある程度、確率統計を勉強したことがある私が、とても学びになったテーマをまとめてみたい。
それでは、目次をどうぞ。
プログラミングのための確率統計 平岡和幸・堀玄
本書の中心メッセージ
・確率とは面積や体積を一般化したものだ
・確率変数とは、名前は変数でも正体は関数だ
神様視点と面積
確率というものをイメージしたい。
そのために、静止画として眺める。本書では、これを「神様視点」と呼んでいる。この見方によって、「確率とは面積だ」という本書のメッセージが浮き彫りになる。
発想の転換として、「一般的なサイコロによる確率のイメージ」を追放すること。
神様から見た、様々な世界のあるパラレルワールドの全体を考える。神様は全体を見ているのだから、すべては確定している。だから、パラレルワールドを塗り分けることも当たり前にできる。
(Ω, ω, P)の3つ組
パラレルワールド全体をΩで表し、個々の世界をωで表す。
そのパラレルワールドの塗り分けこそ面積であり、確率になる。
神様から見れば、確率変数とは、確定したただの関数f(ω)のこと。
f 自体は何の不確定性もないただの関数。
世界ωを入力すれば、その面積を返してくれる関数Pが、確率変数。
「パラレルワールド全体の集合Ωと、Ω内の領域に対して面積を測る関数P都が与えられれば、確率の話ができる」
しかし、人間は自分がどの世界にいるか分からない!!!!
条件付き確率も、ベイズも「割合」で
確率を面積として扱うことで、ただの算数としてイメージできる。
同時確率、周辺確率、条件付き確率の3点セットも、面積計算でイメージ。
条件付き確率は、割合としてイメージできる。
・p(工場|A) はA県の土地の50パーセントは工場」という意味
・p(A|工場)は国の工場の総面積のうちでA県にあるのは20パーセントという意味
・ベイズ
逆問題 結果を見て原因を推測する。
つまり、P(原因 | 結果)を求めたい。
さっきの条件つき確率を面積の割合でイメージすれば、
求めたいのは、
(全体の中の結果の割合)の中の原因の割合
になる。
個人的に、本書のベイズの説明がとても分かりやすかった。
確率を面積として考える。神様視点からは、それらの関係は「割合」になる。だから、イメージも計算もしやすい。ベイズの原因と結果という扱いにくい概念も、担なる面積計算としてイメージできた。安易に原因・結果という概念を扱うべきではない。原因、結果という概念への注意点も記載されている。
平均値と期待値の違い
おすすめ記事