A way of thinking

筆者個人の思考過程です。意見には個人差があります。

AICcのメモ

以下,いつも通り,とりあえずのメモとして。
生態学あたりでは有名な以下のモデル選択本では,サンプル数が小さい時には,AICではなく,AICcの使用が進められています。

Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach

Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach

これに対して,久保さんのサイトでは,

  • ワケもわからぬまま AICc を使うのは ヤメてください
    • AICc は「ばらつき」が正規分布と仮定したときに導出された「補正案」のひとつです
    • 正規分布を使ってない統計モデルではおそらく意味のない「補正」でしょう
      • 少なくとも統計学的な正当化はありません

と記載されています。すなわち正規分布を誤差分布とした場合で,それ以外の分布を使用する場合は,むやみに使うのは避けた方がよいということだと思われます。


ぱっと見つけた範囲では,Ecological Models and Data in Rの著者Bolkerさんは,そのdraftの中で以下のように述べています*1。それによるとこの問題は未解決の問題だとした上で,著者自身はサンプルサイズが小さい場合はAICcの使用を進めています。

The AIC c was originally derived on the basis of linear models with normally distributed errors, so it may apply to a smaller range of models than the AIC ― but this is really an op en question. Shono (2000) found using simulation studies that the AICc gave accurate answers for typical fisheries data sets, although Richards (2005) suggests that AICc might not perform as well for other kinds of ecological data sets. (I would recommend using AICc for small samples, but being careful with the results if they disagree with the results based on large-sample AIC.)

Ecological Models and Data in R

Ecological Models and Data in R

*1:出版された本は所持してないです