メモ。

仮説検定とか最尤推定とかをする時に、背後にどんな確率空間が広がっていてその中で確率論的にどういう意味のあることをしているのかがわからないという話です。

ほとんど学科のTwitterアカウントからの引用。

確率勉強すればするほどわからなくなってくるぞ………

母集団とは何だ、推定量とは何だ、俺達はどんな確率空間の上で生活してるんだ

検定も全く意味がわからないぞ…。どんな確率空間でどんな量に対する議論をしているんだ……。

Replying to @kanextension どういう疑問を持ってるの?

Replying to @MAEA_2 母集団から標本を持ってきて何らかの推定値を作る、みたいな操作をするときに、そのどこまでが確率空間の中でどこからが確率空間の外のお話なんだろうみたいなのがわかってないのかも……

Replying to @kanextension 多分混乱するのは、標本X_1,X_2,…,X_nを取ってくるみたいな書き方をして確率変数なのか実現値なのかわかりにくいときがあるからかな。慣習的にこう書いてしまうことが多いけど、 続く

Replying to @MAEA_2 @kanextension これもΩから標本ω_1,ω_2,…,ω_nを取ってきて、それぞれに対して確率変数の実現値の集合X_1(ω_1),…,X_n(ω_n)を取ってくるって意味です。 気もするけど。

Replying to @MAEA_2 @kanextension ただ、(Ω,F,μ)を考えることとΩを仮定せずに確率変数の集合を考えることは数学的には同じ記述能力を持ってるから、この辺はフォーミュレーションの違いって気もするけど。

Replying to @MAEA_2 なんかだんだんわかってきた気がする……。あと、仮説検定って、ある確率空間の確率変数Xを考えて、その「分布」をf(x)と仮定して、Xの地域を棄却域Rと採択域Aに分けて∫_{R}f(x)dx = αが十分小としたときに、「実際に」X∈Rだったから「確率的に」Xの「分布」がfとは(続)

Replying to @MAEA_2 言えないっていう推論みたいなものだと認識してるんだけど、これって合ってる?あってるとしたら、「」で囲った部分がどの世界で何について言及してるのかよくわかってないんだけど、これってどういうことなんだろう…??

Replying to @kanextension えっと、その認識であっていると思う。たぶん昨日書いた誤解と同じで、確率変数(可測関数)とその実現値とが混同してるんじゃないかな。いまX∈RというときのXはある実現値X(ω)のことだよ。

帰無仮説が正しいとした場合に実際に観測データと同じようなことが起こる確率がめちゃくちゃ小さいから帰無仮説は成り立ってないと考えたほうがいいよね、っていうのは人間の勝手な感想であって、確率論的に意味のある話をしてるわけではないのか

仮説検定、現実の母集団から標本を取ってくる確率空間(Ω,Σ,P)と、帰無仮説が成り立つように作った確率空間(Ω’,Σ’,P’)の2つがあって、ほとんどの議論は後者の確率空間でしてるっていう認識であってるのかな?

でもそうなると、「帰無仮説を誤って棄却してしまう確率」っていうのはどの確率空間のどんな事象について話してるんだ…?両方の空間が見えるメタな確率空間とかが存在するのか…??

Replying to @natk39tun 検定するときに「帰無仮説を誤って棄却してしまう確率」みたいなものが出てくると思うんだけど、確率っていうからには「帰無仮説を棄却する」ことはどこかの確率空間の何らかの事象を表してると思うんだけど、それってどの確率空間での話をしてるの?

あ、待てよ、もっと冷たい見かたをして、「帰無仮説を棄却する」:<=>「後者の確率空間で統計量の値が特定の範囲(=棄却域)に入っている」って言う風に解釈すれば、仮説の棄却っていう事象は後者の確率空間の中で考えられるのか……???

でも、現実世界に即してるほうの確率空間は母集団から標本を取ってきたほうの前者の空間なんだから、「帰無仮説を棄却する」っていう事象も前者の空間の事象として考えられるほうが自然な気がする……わからなくなってきたぞ……

Replying to @kanextension 帰無仮説を棄却するという事象は言葉通り、事象が棄却域に入るという事象のことやで。

Replying to @MAEA_2 なるほど、ありがとう。検定するときは母集団から標本を取ってくる確率空間と帰無仮説が成り立つような確率空間の二種類の空間を考えてて、「帰無仮説を棄却する」っていうのは後者の確率空間での事象っていうことで合ってる?

Replying to @kanextension そうそう。前者の確率分布(真の確率分布)は知りようがないので、標本をうにゃうにゃして作った統計量はこの確率分布に従うんじゃって勝手に決めて検定を行うって感じやで。

Replying to @MAEA_2 仮説検定完全に理解した!!!!!ありがとう!!!!!!!!!

ん、まてよ、そもそも前者の確率空間なんてものを暗黙に想定しなくても、事実としてこんな値x1…xnがあります、って言うだけでいいのか?っていうのを一瞬思ったけど、そうなると標本平均の平均とかが考えられなくなるからやっぱりこのままでいいのか

最尤推定も母集団から標本を取ってくる空間の他に、人間が勝手に考えたパラメータθによって測度が決まるような確率空間(Ω,Σ,P_θ)を無限に列挙して、その瞬間瞬間で別な空間を使い分けながら最もそれっぽい空間を選択してる、みたいなイメージでいいのかな

Replying to @kanextension そう。そういう(Ω,Σ,P_θ)の集まりをパラメータθを持つ確率分布族という。標本が勝手に設定した確率分布族のいずれかに従って生成したと仮定して尤度L(θ)が最大となるθの値を推定量とする。

Replying to @MAEA_2 @kanextension ごめん(Ω,Σ,P_θ)の集まりじゃなくてP_θのあつまり

Replying to @MAEA_2 神か…!!なんかそういう話についてちゃんと書かれたオススメの本とかってない??

Replying to @kanextension よくぞ聞いてくれた。この本が神すぎてやばいのでおすすめやで。 ベイズ統計の理論と方法 amazon.co.jp/dp/4339024627/…

まとめると、検定や推定は現実世界の性質を表していそうな確率空間を(場合によっては複数)考えて、それらがどの程度現実世界に適合していそうかを確率論の外からメタ的に考える手法、ということが言えそうです。

/img/post/2017-07-20-bayes.jpg

はよ届いて