AICによるモデルアベレージングと予測

意訳すると、「ひやっほーい。種の感受性分布（SSD）の分布にどの分布を選択したらいいかわからない！って問題があったけど、モデルアベレージングを使えば、これで解決やで。んでおれらはこれ使ってSSD書くぜ*1」みたいな論文に出会って、「うへぇ」ってなっていたのですが、そもそもモデルアベレージングについて、なんとなくAICによるweightによる計算方法はイメージがつくくらいで、よく知らないなぁと思ったので、いくつか文献を読んでみた。

Schwarz, C.J., Tillmanns, A.R., 2019. Improving statistical methods to derive species sensitivity distributions. Water Science Series, WSS2019-07, , Province of British Columbia, Victoria.

まずは、モデルアベレージングがよい！の根拠として、引用された文献がこれ。Rのパッケージでssdtools*2を作っているカナダのグループの報告書。確かに、モデルアベレージングがデータが追加されてもStableな予測値を出す、みたいな結果があるのだけど、限られたデータセットをベースにした解析だし、しかも判断は図で視覚的に…という感じで、主観的。あと、stableという点において、accurateかどうかは問題としていないことにも注意が必要。どちらかというと、insensitiveがもっとfairな表現じゃないかなぁと思ったりもする*3。また、この調べ方も、新しい毒性データを追加して、再度モデルを推定し直しているので、それじゃあパラメータもweightも全部変わるやん、と思うので、このあたりもなんとなく気持ちが悪い。前段として、異なる分布が同程度によくフィッティングする状況が分布の選択に困る場面として想定されているけど、個人的には、「いや、だからそれはもう多分どの分布で推定してもHC5一緒やで」とツッコみたくもなったり。
ということで、総じて、この文献をベースに、「モデルアベレージング最強やで」とグイグイくるのは...（以下略。

Dormann, C.F., Calabrese, J.M., Guillera-Arroita, G., Matechou, E., Bahn, V., Bartoń, K., Beale, C.M., Ciuti, S., Elith, J., Gerstner, K., Guelat, J., Keil, P., Lahoz-Monfort, J.J., Pollock, L.J., Reineking, B., Roberts, D.R., Schröder, B., Thuiller, W., Warton, D.I., Wintle, B.A., Wood, S.N., Wüest, R.O., Hartig, F., 2018. Model averaging in ecology: a review of Bayesian, information-theoretic, and tactical approaches for predictive inference. Ecol. Monogr. 88, 485-504.

ついでに、より一般的な文脈でのモデルアベレージングについてのレビューも参考に読んでみた。メモなどは以下の通り。数式は読み飛ばしているので、内容は是非ご自身でご確認下さい。

モデルアベレージングをする際に必要なってくるweightの推定自体に不確実性が発生する。このあたりは、恥ずかしながら、頭になかった。
一方で、選択されたsingle-best modelを使った予測だと、どのモデルが正しいのかという点における不確実性が予測に含まれてないので、真の予測誤差を過小評価する。とのこと。
一般論ではあるが、「信頼区間」のカバレッジは、モデルアベレージングによって、改善する”かもしれない”。という記述自体からも、モデルアベレージングがsilver bulletではないことが読み取れる。
結論にも、「モデルアベレージングは、予測誤差を減少されるかもしれない、しかし、かならずしも減少するとも限らない」とも書いてる。
AICによるweightsを、確率のように扱っていいのか、という点についても、議論を呼ぶところですよと書いてある（すなわち、そもそもそのweightでいいのか、問題がある）。AIC weightsとブートストラップによるモデルweightsが本質的に違っていた（Burnham & Anderson 2002）という事例もあるとのこと。
一方で、BICの方は、真のモデルの存在を仮定するので、そのモデルが真である確率、みたいなものをすんなり計算できそう、とも思った（これは感想）。
オススメ！自体は、最後のOverall conclusion and recommendationsを読むといいと思います！

*1:もちろん、あおり気味

*2:Rユーザーとしては、こういうの待ってましたというパッケージではあります

*3:さらに邪推すると、行政的には、stableな方が説明しやいという側面はあるのかもなぁと思ったり

A way of thinking

筆者個人の思考過程です。意見には個人差があります。

AICによるモデルアベレージングと予測