A way of thinking

筆者個人の思考過程です。意見には個人差があります。

重回帰分析の難しさ

吉田寿夫, 村井潤一郎. 2021. 心理学的研究における重回帰分析の適用に関わる諸問題. 心理学研究 advpub. 10.4992/jjpsy.92.19226

Twitter界隈で盛り上がっている重回帰分析に関する論文について,いつもどおり自分のメモを残しておこうと思う。より高尚な?視点でのコメントなんかはtwitterのまとめなんかをみてもらうのがいいかなと思います(丸投げ)。

  • 全体的な感想:これはまったく批判ではないのですが,当然,引用されている実例が心理学なので,いまいちわかりにくいというのはあるかなと思いますが,総じて改めて重回帰の適用って難しいなぁと思いました。
    • 余談:第一著者の吉田さんは,大学生のときに買った『本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本』の著者であることに気づいて,個人的にはひそかに興奮しました。
  • 岩崎学*1さんの本等を引用しつつ,”ある現象の生起に関わる因果関係を観測研究のデータのみに基づいて完全に明らかにするのは不可能である”という前提をもとに,"我々は,それが厳密にできないまでも最善を尽くす必要がある"というスタンスは大事かなと思いました*2
  • ボクなりにちょー粗々でまとめると
    • 説明変数(独立変数)をきちんと選びなさい。
      • 例えば,重回帰の説明変数ではすべて並列的に扱われるが,説明変数間の関係とか無視していますよ。とか。X1の(直接及び間接的な)効果をみたいのであれば,X1の媒介変数を説明変数にいれてはいけませんよ。とか*3
    • 安易な因果の解釈はやめようね。
      • それっぽい文章をいれて,禊が済んだかのようにしてしまうのは望ましくないと書いてあるのも個人的には胸が…。
    • (標準)偏回帰係数の解釈もめっちゃ要注意
      • ”(標準)偏回帰係数は,「他の独立変数から当該の独立変数を予測する回帰分析における残差」と「従属変数(ないし,他の独立変数から従属変数を予測する回帰分析における残差)」の関係を示すものであり,「当該の独立変数そのもの」と「従属変数」の関係を示しているものではない*4。”とか"「x1 と従属変数の単相関係数」と「他の独立変数と従属変数の単相関係数」を比べることを通して検討すべきであろう"とかも,個人的にはなるほどなぁと思ってしまった。
    • 説明と予測を混同してはいけない*5
      • これも難しい問題だと思うけど,こういう使い方はいいよね,という記述もあったりしてよい。
    • 他にもあるけど,本文読んでください!ということで,個人的なメモでした。個人的には,Tさんが某勉強会で言っていた「データ解析に向き合う誠実さ」を改めて思い出したり。

*1:同じ岩崎なのですが,まったく関係はないです。多分

*2:個人的には,実現可能性や言及の仕方如何によっては「ぼちぼち」を前につけたいですが。

*3:余談ですが,”著者らには妥当であろう論拠が推察できない"っていい表現だなと思いました

*4:5回くらい読むとあー。。。となる感じ?

*5:本文そのまま