A way of thinking

筆者個人の思考過程です。意見には個人差があります。

SA

重回帰分析の難しさ

吉田寿夫, 村井潤一郎. 2021. 心理学的研究における重回帰分析の適用に関わる諸問題. 心理学研究 advpub. 10.4992/jjpsy.92.19226 Twitter界隈で盛り上がっている重回帰分析に関する論文について,いつもどおり自分のメモを残しておこうと思う。より高尚な?…

ダメな統計学

ダメな統計学: 悲惨なほど完全なる手引書作者:ラインハート,アレックス発売日: 2017/01/27メディア: 単行本アマゾンの評価でも訳の問題が指摘されていて気になったけど,メルカリで安かったのでポチった訳本。20ページくらいしかよんでないけど,途中でやめ…

イワナの生残率の状態空間モデル

Yasunori Yamashita, Yuichi Iwasaki, Toshimitsu Matsubara, Kyuma Suzuki, Yuhei Kanzawa, Takehiro Okuda, Kazuya Nishina, Carlos Augusto Strüssmann (2020) Comparison of survival rates between domesticated and semi-native char using Bayesian m…

不偏分散のルートから計算する標準偏差は不偏ではない

もうタイトルの通りなんだけど,結構衝撃だったのでメモっておく。化学物質の生態リスクの分野では,個々の生物種の毒性値を対数正規分布などの分布(種の感受性分布と呼ばれる。略してSSD。)にフィッティングさせて,X%が影響を受ける割合とかって計算す…

Strobl, C., Boulesteix, A.-L., Zeileis, A., Hothorn, T., 2007. Bias in random forest variable importance measures: Illustrations, sources and a solution. BMC Bioinformatics 8, 25. Rを使ってランダムフォレスト(RF)で説明変数の重要度を評価す…

回帰係数の大きさを比較する

異なるデータセットで,同じ説明変数の回帰係数の大きさを比べたい場合がある(以下は単回帰想定)。ただ,点推定値と標準誤差はRで出てくるだけど,そこからどうやって推定したら分からないとなる人が多いと思う*1。Canada is a beautiful countryのTさんか…

2つの変数のかけ算の中央値と信頼区間を調べるとする。中央値の方は,それぞれの変数の中央値のかけ算でも大差はないが,信頼区間となると,それぞれの変数の信頼限界の値のかけ算ではずれてくる。当たり前ではありますが,ちょっと気になったので,調べてみ…

mixtox

複合曝露影響の評価(予測)のR packageが出たみたいです。その名もmixtox。どれくらい使えるか全然分かってないのですが,スタンダードなところはおさえられているような気がします。TKST&KMにしても,Meyerの論文にしても,Rでパッケージ化して,非常に分…

Fox DR, Landis WG (2016) Comment on ET&C perspectives, November 2015—A holistic view. Environmental Toxicology and Chemistry, 35: 1337-1339 FoxさんとLandisさんのCritical Perspectives*1。一押しポイントがよくわからないのですが,要は協力して…

Cade BS (2015) Model averaging and muddled multimodel inferences. Ecology, 96: 2370-2382 Quantile regressionのCadeさん。結論のところを眺めただけですが, The simple averaging of regression coefficients recommended by Burnham and Anderson (2…

2値データの統計解析(Ecotoxまわり)

以下,ほぼ個人的なメモですが。例えば,生死とかいわゆる2項分布に従いそうなデータって,生態毒性の分野(生態学も?)では,結構ゴリゴリ正規分布の世界で扱われていることが多いと思いますし,実際に,Ralf Schaferさんあたりが,キャッチーな論文を出し…

Toquenaga Y (2016) How to walk on statistical mandalas as a population ecologist Population Ecology doi:10.1007/s10144-015-0532-z Jeconetの宣伝メールにまんまとはまって,読みました。「Bayesian, Fisherian, error, and evidential statistical a…

Hooten MB, Hobbs NT (2014) A guide to Bayesian model selection for ecologists. Ecological Monographs, 85: 3-28 Mevin*1さんらによるベイズモデル選択のガイド。コテコテのベイジアンになるのはまだまだなので,全然ちゃんと読んでなくて,Highlights…

生態学会誌の冊子をとってなかったので,やっと眺められた特集。ここ。 箱山 洋 (2015) 趣旨説明(生態学におけるモデル選択). 日本生態学会誌, 65: 155-156 ボクの理解が足りないだけかもしれませんが,誤解を恐れず,粕谷さんの記事について個人的なコメン…

Davies GM, Gray A (2015) Don't let spurious accusations of pseudoreplication limit our ability to learn from natural experiments (and other messy kinds of ecological monitoring). Ecology and Evolution ざっと眺めただけだけど,疑似反復にどう…

Green JW (2015) The Challenge: Statistical challenges in ecotoxicology. Environmental Toxicology and Chemistry, 34: 2437-2437 Statistical challenges in ecotoxicologyという題目で,Green, Newman, Crane, Mebane*1,Aldenbergたちがコメントを寄…

Nakagawa, S., Schielzeth, H., 2013. A general and simple method for obtaining R2 from generalized linear mixed-effects models. Methods Ecol. Evol. 4, 133-142. 以下は,作業用メモです。AICの値ではモデルの相対比較はできても,そのモデルがどれ…

probitかlogitか,logがそのままか?

Joeとのメールコラボ研究で気になったことをメモ。LC50とかの推定ではほとんど違いは見えないんだけど,結構ややこしいことに,そういうのでデータ解析の解釈が結構ガラッと変わってしまうデータに出会ってしまった。いやぁ,単に濃度反応関係を描くだけなの…

Ritz C (2010) Toward a unified approach to dose-response modeling in ecotoxicology. Environmental Toxicology and Chemistry, 29: 220–229 Rのpackage(drm)を作ったRitzさんのdrm紹介論文(では直接はないですが,まぁそういうことだと思います)。二…

二項分布をfamilyとするGLMで確率が0%や100%はモデル予測に使われていないのか?という素朴な疑問(例えば,応答変数が生存率だった場合,10匹中0匹生き残ったとか,10匹とも生き残ったという状況)。logit変換の式を見ると,確率pが1または0の時は分母が0に…

Low-Décarie, E., Chivers, C. & Granados, M. (2014) Rising complexity and falling explanatory power in ecology. Frontiers in Ecology and the Environment. 1930年くらいからの生態学のジャーナルに載った論文をひろってきて,p値が報告されている数…

変数が色々あるときにその間の相関をざっと見るのに多変数の相関を可視化する方法メモがとても良い。先日見つけて,今日「ああそういえば」と思って使って見たら,とてもいい。Rはほんと探せばなんでもあるんじゃないかぐらいある。

Hedtke, J.L., Robinson-Wilson, E. & Weber, L.J. (1982) Influence of body size and developmental stage of coho salmon (Oncorhynchus kisutch) on lethality of several toxicants. Fundamental and Applied Toxicology, 2, 67-72. 孵化後175日まで調…

理論ベースと経験ベース

化学物質の複合影響の話を少し頑張って勉強した後での感想です。理論は一般化のために重要だし,統計解析やその類の解析*1は,まだまだ一般化ができない中で一定の結論を導き出すために必要。生態毒性学の中で主流なのは,同じような毒性機構が仮定されたCon…

Wheeler, J.R., Maynard, S.K. & Crane, M. (2014) An evaluation of fish early life stage tests for predicting reproductive and longer-term toxicity from plant protection product active substances. Environmental Toxicology and Chemistry, 33, …

Statistics for Censored Environmental Data Using Minitab and R (Statistics in Practice)作者: Dennis R. Helsel出版社/メーカー: Wiley発売日: 2012/02/01メディア: ハードカバーこの商品を含むブログを見る検出・定量限界未満の打ち切りデータ*1を統計…

全然やっていてアレなんですが,やっぱ良くないんですね,ということが議論されている模様*1。この場合ってどうしたらいんですかね?モデルのランキング自体が変わりうるんですかね?全然分かってないです。 http://hosho.ees.hokudai.ac.jp/~kubo/log/curre…

SA SA

標本分散はn-1で割らないと,分散は過小に推定してしまいがちになりますよ,というRコード*1。 n yvar1 yvar2 for (i in 1:1000){ # 1000回繰り返す*2 y yvar1[i] yvar2[i] } mean(yvar1) # 平均値は0.8ぐらいになる:平均的に過小推定してしまう。 mean(yva…

AICの誤用

AICは、正しいモデルを選ぶものではないので、正しいモデルを選ばない とは,生態学会での粕谷さんの発表にあった言葉です(スライドはこちら)。はてさて,ボクも”誤解”していた1人です。まぁ,結果的に「間違ったことになっているか」はケースバイケースな…

某シンポにRay Hilbornさんが来るというので,参加して,サインをもらっておきました。話自体はあんまりだったんだけど,Mさん曰く「持続可能性という名の下に過剰規制されていることに意識があるのではないか」という話でしたが,持続可能性の定義曖昧だ,…