A way of thinking

筆者個人の思考過程です。意見には個人差があります。

モデル選択本*1の,David Andersonの一日ショートコースを受けてきました。まぁ基本的に知っている話題だったので,個人的には大体理解できたように思います。すごく分かりやすい講義をされていましたし(QAICの話はここでしなくてもって感じでしたが)。基本的に,Kullback-Leibler information→AIC→Multi Model Inference (Model averagingとか)の流れでした。Information Theoryだから,p値は使うなといっているだけあって,全然出てこない(最後にちゃんとこの点を,"they cannot be mixed"と強調されていました)。個人的には,AICの式の導出がちょっと分かって嬉しかったのかと,論文で簡単に読んだことはありましたが,モデルアベレージングの導入がおもしろかったです。モデルアベレージングがどれだけイケテルのはまだちょっとわからないですが,発想は大変簡単で分かりやすいです。そして,利点も理解できます。とりあえず,そのうち勉強する価値がありそう。どうしても,赤池ウエイトは通ることになるのですが,久保さんのコメントはこちら。とりあえず,今のボクには判断できないけど。

基本的にこの本に沿って説明されたようです。

Model Based Inference in the Life Sciences: A Primer on Evidence

Model Based Inference in the Life Sciences: A Primer on Evidence

以下,個人的な文献のメモ。
デイビッドがお薦めしていた論文2本。「こういう話を君もEcotoxcologyな分野で書くべきだよ*2。」と言ってたけど,確かにと思う半分,別に他の分野で紹介されていれば,そんなに必要性は感じない気もする。デザインベースの世界では,ITな手法がそんなにすごく御利益があるという感じではない気がするし。まぁでも,予測という意味で,モデルアベレージングを使う方が良いというのであれば,それはそれで,色んなインパクトがあると思います。

Burnham, K. P., and D. R. Anderson. 2004. Multimodel inference - understanding AIC and BIC in model selection. Sociological Methods & Research 33:261-304.


Burnham, K. P., D. R. Anderson, and K. P. Huyvaert. 2011. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behavioral Ecology and Sociobiology 65:23-35.


グラムがモデルアベレージングにあまり前向きでない?例と紹介していた論文。

Richards et al. 2011. Model selection and model averaging in behavioural ecology: the utility of the IT-AIC framework. Behavioral Ecology and Sociobiology 65:77-89.

余談的な大雑把なメモとしては...(大雑把な解釈とあっているかわからない英語),

  • 個人的な印象としては,基本的に赤池さんらの業績をとても頻繁に引用して説明されていて,それに刺激を受けられたのがよく理解できました。
  • BICはキライ(I hate BIC)。
  • 統計的有意差のように,0か1の切り分けはおキライのようです(Science is not about Threshold)*3
    • 赤池ウェイト等をつかって,モデル間の相対的な重要性に着目して議論すべき。
    • 説明変数の重要性も赤池ウェイトを使って。。このあたりは,色々異論がありそうですが。
  • ステップワイズはおわってる(really really bad)。
  • 真のモデルはない(There are no true models)。
  • Chamberlin (1890)ですでに複数作業仮説による科学は唱えられていた。でもそれに答える手法が最近までなかった。
  • AICcイチ押し(とにかく,AICではなく,AICcを使いなさいというお話でした)。
  • 赤池ウェイトの話になりますが,モデルの尤度という考え方はあーなるほどなぁと思いました。
  • Brief is not evidence.無情報な事前分布を使う事によって,the resulting "posterior" can be taken as evidence.
    • ベイズにどのような印象をもっておられるのか,ちょっと読み取れなかったのですが,そんなに好きそうな感じではなさそう?(あまり自信ないです)。

### 追記121126
Rってやっぱすごくて,ちゃんとモデルアベレージングとかAICcを計算するパッケージが存在していた。Davidに聞いてみたら,ボクの友達が作ったんだよ。とのこと。どうりで,Davidの講義で出たような表が簡単に書けるようになっているわけだ。すごいなぁ。まじで。
AICcmodavg: Model selection and multimodel inference based on (Q)AIC(c)
http://cran.r-project.org/web/packages/AICcmodavg/index.html

### 追記121127

Link WA, Barker RJ. 2006. Model weights and the foundations of multimodel inference. Ecology 87:2626-2635.

ざっと眺めただけだけど,multimodel inferenceやモデルアベレージングにはもう使えるものとしていて,BICAICかって話のように感じる。Davidが言うには,AICに基づくモデル確率に対するベイズ側からのエラーに基づく批判らしいけど。もう全然わかんないです。とりあえず,メモとして。

*1:本人がfrog bookと言ってた。ちゃっかり日本にある本に貼る用にサインをもらっておきました

*2:と,Willにサバティカル中に書くのをすすめたけど,書いてくれなかったと言ってた

*3:関係ないですが,中西さんもここで「科学は二分法ではない」とおっしゃっています