A way of thinking

筆者個人の思考過程です。意見には個人差があります。

標本分散はn-1で割らないと,分散は過小に推定してしまいがちになりますよ,というRコード*1

n <- 5 # サンプル数
yvar1 <- numeric() # nで割った結果を格納する箱
yvar2 <- numeric() # n-1で割った結果を格納する箱


for (i in 1:1000){ # 1000回繰り返す*2
y <- rnorm(n, 5, 1) # 平均値5,分散1の分布からランダムにデータを作成する
yvar1[i] <- sum(((y - mean(y))^2)) /n # nで割った分散
yvar2[i] <- sum(((y - mean(y))^2)) /(n-1) # n-1で割った分散
}


mean(yvar1) # 平均値は0.8ぐらいになる:平均的に過小推定してしまう。
mean(yvar2) # 改善されている

*1:そんなんいらんわ,と言われそうですが

*2:for文で回す必要もないかもです