A way of thinking

筆者個人の思考過程です。意見には個人差があります。

Daily et al. (2012) Experimental and environmental factors affect spurious detection of ecological thresholds. Ecology, 93, 17-23.

閾値応答を調べる3つの方法*1を使って,閾値応答はない疑似データ(線形応答を仮定)をモデリングして,偽の閾値がどう推定されて,それがサンプルサイズや説明変数の傾度に沿ったデータの分布などからどういう影響を受けるかを調べた論文。この手の話,ちょっと気になっていたのですが,まだ誰もやってなかったのですね。(最も)重要そうなのは,データが説明変数の傾度にそってどう分布しているか,だそうです。例えば,データが説明変数の中間辺りに多い正規分布をしていると,それに引きずられて,真ん中くらいに閾値があるように推定されるのが,Fig.3から見て取れます。個人的には,閾値無しモデルを含めてAICによるモデル選択をしたらどうなるか?とかも気になります。データの分布の問題を解決するには,生データをブートストラップして,分布の偏りなどに補正をかけてやる,なんて方法が有効なんですかね(単なる憶測)。

*1:piecewise quantile regresstion, Sizer, nonparametric change point analysis