好きをブチ抜く

「好き」をブチ抜く

本、映画、科学、哲学、心理、すごい人の考え方など。あらゆる情報を編集したい。

ソーバーの名著『科学と証拠』を読む【要約・読書メモ】

記事の内容

 

この記事では、エリオット・ソーバーの『科学と証拠』を取り上げます。

https://amzn.to/46uxnCp

 

科学哲学、統計の哲学に興味がある人にとって、とてもおすすめな一冊です。また、この日本語訳版も素晴らしく、読者に向けた様々な配慮があります。

 

この記事では、本旨の要約、そして、読書メモをまとめます。

 

もちろん、私が解釈したものなので、間違いが含まれる可能性があります。ご注意を。

 

 



結論の要約

 

結論

 

  • 単純仮説
    • 事前確率が客観的に与えられるケースならばベイズ主義に従い、そうでなければ尤度主義に従う。
  • 複合仮説
    • AIC(もしくはそれを発展させたモデル)に従う。

 

 

ソーバーの態度

  • 客観主義
    • 現在の証拠から何がわかるのか、ということが科学の方法である。
  • 客観性の意味
    • 誰でも認めざるを得ないような証拠

 

しかし、現実の統計的実践に基づく科学は、この基準を満たしていないケースがある。
それは、尤度主義、ベイズ主義、頻度主義が混雑しているからだ。

 


戦略的土台は「尤度主義」


証拠に対して客観性を求めるという原則からは、戦略としては、尤度主義の採用が基本になる。
問題によって、ベイズ主義や頻度主義と補完して使用する。

 

  • 尤度
    • 仮説を仮定したときに観測済みデータ得られる条件つき確率
  • 尤度の法則
    • 比較される二つの仮説のうち、尤度の高い方が、証拠によって支持される。

 

どの理論が真なのか、ではなく、どの理論がその証拠によって最も裏付けられているか。

 

 


ベイズ主義との共同

 

事前確率が客観的に与えられるケースならばベイズ主義に従い、そうでなければ尤度主義に従う。

 

 

頻度主義との共同

 

頻度主義とは?

  • 「試行を何度も繰り返したときの頻度が極限においてとる値」を確率とみなす。
    • 頻度主語はさまざまなタイプを含み、一枚岩ではない。
  • フィッシャーの有意性検定、ネイマンピアソンの仮説検定も頻度主義の仲間ではある。
    • 何の頻度か?という点が異なる。
  • 「客観性の基準」を満たさないため、ソーバーはネイマンピアソン流の仮説検定を認めない。

 

  • 単純仮説
    • 尤度の法則を適用できる。
  • 複合仮説
    • 尤度の法則を適用できない。
    • AICを利用する。

 

 

  • AIC
    • 平均対数尤度の近似的な不偏推定量
    • 不偏推定量も、何度も試行を繰り返すという前提があるため、頻度主義の仲間となる。
    • 問いを転換している。
      • 「真理とは?」から「より正確な予測とは?」へ
      • 「カルバック-ライブラー距離」
      • 予測正確性に関して不偏推定量を与える

 

 

 

 

 

 

読書メモ

 

 

ロイヤルの3つの問い

 

 

1 現在の証拠から何が分かるか

尤度主義

 

2 何を信じるべきか

ベイズ主義

 

3 何をするべきか

頻度主義

 

ロイヤルは1が最も重要だと考えた。ソーバーも基本的にはこの立場。

 

 

 

 

 

1 ベイズ主義

 

 

ベイズ主義は哲学であり、知識や信念に関する認識論の一種だ。ゆえに、数学のベイズの定理よりも多くの主張を含む。

 

確率と尤度の違い

仮説Hの尤度がわかっても、Hでない場合の尤度はわからない。 ゆえに、尤度の和は1にならない。

論理的に強い仮説は、論理的に弱い仮説より高い確率を持つことはできない。一方、尤度はそうとは限らない

 

 

ベイズの定理では、確率同士の関係を表す。ゆえに、共時的である。一方、ベイズ主義の場合、更新規則にかかわり、確率の通時的な関係を問う。

 

ベイズ主義は更新規則に関するアドバイス、と解釈できる。ゆえに、認識論の観点からいってこのアドバイスは有用である。

 

 

尤度比という核心

観察により事後確率を更新できるかどうかは、仮説の尤度の比に依存する。つまり、尤度が同じ場合、更新されず、事前確率と事後確率は等しい。

 

観察の無条件確率

二者択一の仮説のもとでなされる確率の平均である。つまり、重みづけされた2つの尤度の平均のこと

 

 

確証、反証の意味

ベイズ主義の確証と反証は、確率の比較を必ず伴う。確率の絶対的値だけでは何も言えない。確証の度合いの定義は、基本的には、定性的なものだけとなる。

 

信頼性

ベイズの定理の数学的な対称性とは異なり、検査という具体例の場合、検査手続きの物理的な特徴が無視できない。ゆえに、尤度はしばしば事前確率とは独立であり、手続きの信頼性は尤度と関係する。

 

 

ベイズ主義のテーゼの一つ

何らかの確率の入力無しには、確率の出力はない。

 

ベイズ主義の欠点

・事前確率や尤度に、客観的に値を付与できない場合がある。

・ある仮説は、その否定と比較する必要がある。しかし、ある仮説の否定には無限のパターンが含まれる。

・無差別の原理という指針はあるが、論理空間の分割方法は複数あるため、矛盾を生んでしまう。

 

 

 

 

 

 

2 尤度主義

 

ベイズ主義のように「仮説の確からしさ」ではなく、尤度主義は「証拠による支持」を述べる。ゆえに、事前確率が客観的に与えられないときが尤度主義の真価だ。

・証拠が仮説の確率を上げたか、下げたのか、とは問わない。

・明確な尤度を持つ仮説のみを互いに比較する。たとえば、一般相対性理論とその否定を比較するのではなく、一般相対性理論と代替理論を比較する。

 

 

尤度の法則

・証拠が仮説1よりもある仮説2を指示する裏付けは、2つの仮説についての比でしか表せない。証拠が一つの仮説を指示する度合い、は間違い。

・単独の仮説の尤度がもつ絶対的な値ではなく、異なる仮説の尤度との関係が重要。尤度主義では、仮説の確率の確からしさを主張しない。

・これは定理ではなく、提唱に過ぎない。

・尤度主義よりもベイズ主義が有効な場面があるからといって、尤度主義の敗北ではない。ベイズ主義がまずいときに尤度主義は有効である、という立場だ。

 

 

 

 

条件付き確率の定義

定義に登場する3つの量の関係を示す。それらの存在や認識は、確率の解釈による。現れる全ての量が必ず意味を持つ、と主張しているのではない。

 

 

 

全証拠の原則

・知っているすべてを考慮に入れよ。

・尤度主義者、ベイズ主義者は、どちらもこの原則を受け入れる。

・論理的に弱いデータ記述に変更したとき、証拠が示す評価が変わるなら、そうした論理的な変更は許されない。

 

 

尤度主義の限界

・証拠が何を示すかに注目し、何を信じるべきか、何をするべきかを言わない。

・科学の仮説は、ほとんどが単純仮説ではなく、複合仮説である。複合仮説の尤度は、尤度は一つのパラメータを固定してその確率密度を計算するものなのだから、計算できない。よって、尤度を単一の値にまとめる工夫が必要だが方法に任意性がある。しかも、その選択によって結論が変わるかもしれない。

 

 

 

 

 

 

 

頻度主義 有意検定

 

頻度主義は一枚岩ではない。

 

頻度主義は、確率の意味論というよりも、認識論で捉えるべきだ。

推論規則に関する認識論

同じ規則を用いて繰り返し判断を行ったとき、悪い結果=判断を謝ることに陥る頻度が小さい、と考えられる推論規則を採用するような態度のこと。

 

※認識論

知識の成立や信念の正当化に関わる問題

 

 

 

 

フィッシャーの有意性検定

 

有意性検定は、確率論的MTである。しかし、確率論的MTは推論形式としては妥当ではない。

 

確率論的MT

 

Pr(O|H)は非常に高い

Oではない

----------------------------

Hは棄却されるべき

 

 

 

理由1

仮説を棄却するための確率の境界線はどこに引くべきか?

そんな境界線は存在しない。

 

理由2

証拠は仮説に対する反証と考えればいいか?

このままでは考えられない。

この解釈をとるには、本質的に、対立仮説の特定が必要になる。テストには、仮説の比較が必要である。 

 

理由3

全証拠の原則に反する。

 

有意性検定の二つの解釈

帰無仮説が棄却されるべきかどうか

帰無仮説に対する反証の強さを測る

 

弱点1

データの記述方法が複数ありうる。ゆえに、結論も変わってしまう。

 

弱点2

サンプルの大きさに敏感である。

 

 

 

 

 

 

頻度主義 ネイマンピアソンの仮説検定

 

証拠の解釈ではなく、受け入れと棄却についての助言を与える態度決定の理論。

 

ネイマンピアソンの仮説検定は3ステップからなる。

どちらを帰無仮説にするか決める。

第1種の誤りの上限を決める。

第二種の誤りを最小限にする。

 

これら方針に対して、帰無仮説の選択具体的なαの数値の設定が恣意的になってしまう。そして、尤度の法則とズレる。全証拠の法則に反することが欠点。

 

頻度主義者の最尤推定

正当化には汎用的方針を使う。

推定方法が許容的でなければならない。 

許容的

誤差が小さくなること。

十分性、一致性、有効性、情報量など。

 

尤度比検定は頻度主義である。

二つのモデルは入れ子になっており、尤度が小さい方が分子に来る。

このとき、帰無仮説選択の恣意性は消える。

 

 

 

 

 

頻度主義 モデル選択理論

 

モデル選択理論は、実は、その中身は、モデル選択ではなく、モデル比較を扱う。

 

理論による予測の正確性をいかに見積もるべきか?につながる。

 

既存データに適合させたモデルがどれほど正確に新しいデータを予測できるか、この度合いを見積もることができる。

 

 

一般的に、複雑なモデルの方が、簡単なモデルよりも尤度は高くなる。しかし、複雑なモデルの方が予測精度がいい、とは言えない。

 

モデル性能の平均的な良さ、つまり、期待値を知りたい。データ数には依存しない

 

この基準が、赤池情報量基準だ。

データに対するモデルの適合度、モデルの単純性の両方を考慮している。

 

どのモデルが真かではなく、モデルの予測正確性を推定する。

不偏な推定値を得る方法である。

 

 

AICは、長期的な試行において意味をもつ「不偏性」がベースになっている。しかし、頻度主義に本質的に結びついているわけではなく、ベイズ主義、尤度主義と共存可能。

 

 

 

 

関連記事

 

www.buchinuku.work

www.buchinuku.work