A way of thinking

筆者個人の思考過程です。意見には個人差があります。

TITAN追記(2013/10/01)

2本論文を比較的?ちゃんと眺めたので,上の個人的メモへの返答をまず先に:

  • むしろ,0が多くてばらつきの多い(分位点回帰でえいやで回帰するような*1)データを想定して作られているとのこと(Baker & King 2013)。
  • データは多くないとだめ。偏りがあるとよくない(Baker & King 2013)。
  • まぁ1つの定義の仕方という認識でいいと思う。著者らもそのあたりはなんとなく考えているような気がする。


では,読んだ2本の論文のメモ:

Cuffney, T.F. & Qian, S.S. (2013) A critique of the use of indicator-species scores for identifying thresholds in species responses. Freshwater Science, 32, 471-488.

Tom Cuffneyさんは論文別刷りもすぐ送ってくれて,ええ人だと思うのです(動画もなかなかええ感じ)。この論文の主張は,簡単に言うと,シンプルなモデルから発生させたデータで,全然閾値推定できておらんじゃないか!TITAN?んなもん使えんよ,という感じ。TITANのもととなる計算の中身をすごく簡単に説明してくれている(ありがたい!)。んで,これを読むと,あーTITANってダメそうだな,これにどうやって反論するんだろう・・・と思った。

Baker, M.E. & King, R.S. (2013) Of TITAN and straw men: an appeal for greater understanding of community data. Freshwater Science, 32, 489-506.

で,反論。簡単に言うと,基本的に発生させたデータが悪いので,そこから得られた結論も全然お門違いよ,という回答。上に書いたように,0やばらつきの多いデータを想定しているというのがミソ。あと,対数変換する必要はないのに,しているとか,そういう批判。ただ,細かい?点で2だけCuffney & Qianの指摘を認めていて,それは今後改訂されるTITANでは解決されるでしょう。と書いてある(これが出たのは,今年の初めの方なので,もう何かあってもいいと思うのですが,著者のサイトとかで何かが新しく公開された感じはしない。。)。


すごくおおざっぱにまとめると万能な手法ではないので,慎重に使わないといけないという,当たり前の結論になってしまう気がします。Tomさんはボクの好きなタイプだけど*2,今回はBaker & Kingに軍配あり?,という感じかも(まぁ勝ち負けではないですが)。とにかく読んでて結構おもしろかった。


あと関連して:

Qian, S.S., Cuffney, T.F., Alameddine, I., McMahon, G. & Reckhow, K.H. (2010) On the application of multilevel modeling in environmental and ecological studies. Ecology, 91, 355-361.

混合モデルの話。交互作用の使い方?が個人的に盲点でおもしろかった。

*1:分布で言うと,ポアソンではなく負の二項分布のようなばらつきの多い

*2:そういう意味ではないです