A way of thinking

筆者個人の思考過程です。意見には個人差があります。

Noe, D.A., Bailer, A.J., Noble, R.B., 2010. Comparing methods for analyzing overdispersed count data in aquatic toxicology. Environ. Toxicol. Chem. 29, 212-219.

Nobleさんが,以前にoverdispersionと二項分布で書いていた論文のポアソン版。疑似ポアソンかGLMMが良かったとのこと。負の二項分布なモデルは,負の二項分布から生成したデータを除いて(これが良い感じなのは,当たり前)使用した疑似データではいまいちだった模様。メモとしては,

  • 疑似データは妥当か(そもそもこれをどう評価するかは不明)
  • 線形で考えているけど(多分),上のRitzさんの論文のように,ボクのすくない経験では,S字カーブなどの非線形の方が現実的に有効。ということで,非線形への拡張がないのは残念*1
  • イントロで,もっと現状(変数変換で正規分布)との比較をして,ポアソンなモデルを使う利点を議論してほしかった。二項分布の論文はかなりここが丁寧に書かれていたのですが。
  • 疑似ポアソンっていいの?

*1:これに挑戦しようとして,Winbugsを使ってやろうとした経験があるのですが,データがいまいちのせいもあってランダム効果が思った以上にばらつきを説明して他のパラメータの値がいまいちになった経験あり