標本分散はn-1で割らないと,分散は過小に推定してしまいがちになりますよ,というRコード*1。
n <- 5 # サンプル数
yvar1 <- numeric() # nで割った結果を格納する箱
yvar2 <- numeric() # n-1で割った結果を格納する箱
for (i in 1:1000){ # 1000回繰り返す*2
y <- rnorm(n, 5, 1) # 平均値5,分散1の分布からランダムにデータを作成する
yvar1[i] <- sum(((y - mean(y))^2)) /n # nで割った分散
yvar2[i] <- sum(((y - mean(y))^2)) /(n-1) # n-1で割った分散
}
mean(yvar1) # 平均値は0.8ぐらいになる:平均的に過小推定してしまう。
mean(yvar2) # 改善されている