統計学を哲学する【まとめ】統計学には飛躍があり、それは思想だ

記事の内容

今回は、一部で話題になっている本を紹介したい。

『統計学を哲学する』という本だ。

なぜ統計学に哲学が必要なのか？

それは、統計学の理屈は、得られたデータから得られていないデータを推測することを正当化するためのものだからだ。しかし、落ち着いて考えてみてほしい。どうして、得られたデータから得られていないデータのことがわかるのか？

哲学の歴史では、ヒュームによる帰納推論への懐疑がある。

「今日までこうだったのだから、明日以降もそうなる」

これは習慣的には正しいが、この仮説はどうやっても正当化できない。こうした帰納推論は、根本的に不可能な課題なのだ。

それなら、統計学はどうやって不可能に挑むのか？

その理屈を深く納得するには、哲学的な概念整理が有効だ。本書では、丁寧に議論を展開してくれる。統計学を腑に落とすためにも、科学哲学の知見を得るためにも、とても役立つ本だと思う。

それでは、本書から一部をまとめてみる。

記事の内容
統計学を哲学する　大塚淳
帰納的推論の根拠は？推測統計の答え
確率モデルと統計モデルの違い
自然種から認識論へ
なぜ意味論が必要か
ベイズ統計の認識論
まとめ
関連記事

統計学を哲学する　大塚淳

統計学は実験や臨床試験、社会調査だけでなく、ビッグデータ分析やAI開発でも不可欠である。ではなぜ統計は科学的な根拠になるのか? 帰納推論や因果推論の背後に存在する枠組みを浮き彫りにし、科学的認識論としてデータサイエンスを捉え直す。科学と哲学を架橋する待望の書。

統計学の正当化を深ぼるために、存在論、意味論、認識論の3つの軸をもちいて攻めていく。

科学哲学の議論としても、とても興味深かった。

帰納的推論の根拠は？推測統計の答え

問い

「統計を用いて帰納推論するにあたり、どのような存在物を措定し、どのようにそれを記述すればいいか？」

ヒュームは帰納推論を成り立たせるために「自然の斉一性」を考えた。自然は、未来も過去と同じように働くだろうという仮定のことだ。

しかし、この仮定そのものは、得られたデータだけからは導くことは原理的に不可能。なぜなら、そこに未来の情報は含まれていないからだ。

記述統計の枠組みでは、そもそも得られたデータに対する言明しか行わない。未知のデータの推測はカテゴリーミステイクになる。推測統計の出番になる。

帰納的推論を行うには「自然の斉一性」のような仮定がいる。推測統計では、その仮定を「確率モデル」として定式化した。

確率とは、データ自体ではなく、データを生み出す源として想定されるような世界に属する概念。期待値などの概念もその世界に属する。

そして、斉一性は次のように肉付けされる。

・確率モデルがデータ観測過程をとおして同一

・データ観測が互いに影響を及ぼすことなくランダムになされる

この条件は、「確率変数は独立同一分布に従う」と表現される。

以上のように、推測統計はデータと確率モデルの二限論を取ることにより、得られていないデータの推測を試みる。

確率モデルと統計モデルの違い

有限個のデータという制約下では、推測の制度が落ちる。

だから、どんな特徴のある確率モデルなのかをさらに仮定する。仮定に対する仮定だ。

確率モデルが存在するという仮定は、真であってもらわないと困る。一方、統計モデルは、確率モデルを近似する方法の一つだ。その意味で統計モデルは嘘を含むが、帰納推論という目的を満たすほど適切であればいい。

「すべてのモデルは偽であるが、そのうちいくつかは役に立つ」

統計学者ジョージ・ボックス

統計モデルとして有用なのが、正規分布などの分布族たちだ。

自然種から認識論へ

私たちは、ある単位で世界を区切り認識している。そうしなければ、認識や推論、思考ができない。この離散的な単位を自然種と呼ぶ。

これは、何が同じで、何が違うかという基準を与える。カテゴリーを与えることで、そのカテゴリーでの思考を担保する。

分布族は、統計学において自然種の役割を果たす。このことを、本書では確率種と読んでいる。統計学者は、さまざまな帰納問題をそれぞれふさわしい確率種へと帰着させて理解する。おかげで、現実のさまざまな帰納問題を確率種という「型」で分析できる。

ただし、こうした確率種という概念は経験の範囲におさまらない。

しかし、どうやってふさわしい確率種へと至るのだろうか？この過程を正当化する必要がある。この過程こそ、推測統計のロジックの大事なところであり、認識論に分類される部分だ。経験を越えたものへのアプローチを正当化する認識論が必要になる。

なぜ意味論が必要か

確率モデルも統計モデルも数学的存在だ。しかし、帰納推論において考えたいことは現実の問題である。これらモデルが現実世界の何を表しているのか、厳密な対応関係はあきらなのか？

確率は集合を用いて定義される。それなら、数学的対象が「起こりやすい」「起こりにくい」とはいったいなんのことだろうか。

数学の概念と現実を適切に接続できる根拠はなんだろうか？

確率モデルが現実の何と対応しているのかという意味論が必要だ。確率の意味論は、主観確率と客観確率に分かれる。さらに、どのように帰納推論を行うべきかという認識論的な対立として、ベイズ統計と古典統計がある。

ベイズ統計の認識論

ベイズ統計による帰納推論は、健全な論理規則 (ベイズの定理に基づく更新) により正当化されると考えられる。しかし、これではアプリオリな推論形式であり、新しい情報は得られない。どうすれば、まだ得られていない情報、つまり帰納ができるのか。

ベイズ統計における確率の意味は、信念の度合いだ。この信念の度合いを更新する手続きはどのように正当化されるのか。

内在主義的認識論が有効だ。正当化を主体の有する信念間の妥当な関係性として理解する。しかし、これも前提が正しくなければ意味がない。つまり、正当化の過程には無限後退が生じる。それに、主体の中にある信念の度合いの関係性と、「外」の世界の一致の担保の根拠がわからない。

正当化の無限後退を止める基礎的な信念があるのか？それ自身によって正当化される信念などあるのか。

経験ベイズという考え方では、データに合わせて事前分布を調整する。ここには、頻度に合わせて設定された経験的な事前分布は基礎的であって、それ以上の確率的な正当化は求めないという態度がある。しかし、これは一種の取り決めに過ぎない。

信念の度合いとは区別された「事象の実際の起こりやすさ」とは何か、また両者を一致させるとはどのようなことなのか、全く自明ではない。

つまり、正当化のためには数学を超えた、実験や観測の適切さなどという定量化し辛い領域へと、全体論的なチェックが必要になる。哲学における認識論の議論へと回帰する。

まとめ

統計学の存在論

統計学を成り立たせるための前提として、何が存在していると考えるべきなのか。

データとデータを生み出す確率モデルの二限論を仮定する。

存在論的前提は、理論の説明力を左右する。

しかし、仮定の多い、豊かな存在論は、認識論的には負担になる。トレードオフの関係だ。

こうした存在論の仮定に、それぞれの概念は依存している。だから、概念の住む世界を混同してはいけない。カテゴリーミステイクになる。

推定とは、これらのうち浅い層に属する概念によってより深い層に属する概念を捉えようとすることだと言える。

(中略)

統計学とは、こうして区分された存在の層を乗り越えていこうとする試み、またそれが可能であるための条件を特定しようとする試みだと言えるだろう。

p219

ただし、確率種も一つの仮説であることに注意。仮説が覆るのはよくあることだ。

そして、こうした確率種、自然種を我々が仮定する目的に注意する。目的は唯一ではない。だからこそ、主体の認識能力によって持つべき存在論は変わってくる。深層モデルは、独自の仕方で世界を分節しているように見える。深層モデルはどのような存在論を持つのか、課題になる。

統計学の意味論

存在論により仮定された数理的存在物が、現実の世界とどう対応しているのか。ここにあいまいさ、矛盾があれば、統計学の現実における推論は弱くなる。

そこで、意味論が必要になる。確率モデルと現実との橋渡しの議論だ。

数理モデルの内部で、現実とは独立に数理的探究をすることができる。これこそ、モデル化することの力であり数学の世界だ。

しかし、数理的世界だけの探求ではなく、統計学は現実世界での応用をめざす。だから、数理的世界での探求が、現実世界の探求に対応していることを担保しなくていけない。意味論が必要だ。

そして、意味論は語れることの条件を明快にしてくれる。確率の意味が明快ならば、当然、無意味な語りも定義される。例えば、頻度主義をとるなら、確率とは事象の相対頻度なのだから、「仮説の確率」という言明は無意味になる。主観主義をとるのならば「仮説の確率」は、信念の度合いとして表現できる。

確率とは何かという意味論は、確率の哲学という分野でこそ、盛んに議論されている。

確率とはいったいなんなのか？確率の哲学入門【本紹介】 - 「好き」をブチ抜く

統計学の認識論

帰納推論は原理的には不可能だ。では、統計学のロジックでは、帰納推論をどのように正当化しているのか。

正しい認識であることを保証するために、内在主義的、外材主義的な保証の方法がある。しかし、これらは説明の過程のどこかで、正当化フレームの外部を参照してしまう。穴があく。

一方、仮説の正しさだけではなく、その有用性によって認識論的な正当性をはかる立場もある。プラグマティズムだ。

また、深層学習モデルなどには、正当化を担保するアプリオリな理論はない。正当化の根拠を、普遍的な理論ではなく、認識主体の能力に求める考えた方が有効そうだ。しかし、これでは科学的な普遍性が犠牲になる心配がある。