猫も杓子も構造化

発達障害、特別支援などについて書いています。最近は心理学関係の内容が多めです。

続続・自由度について(実験修正編)

以前書いた記事で不偏分散と標本の分散の比較し、そのときは別々の標本からそれぞれの統計量を計算した。

nekomosyakushimo.hatenablog.com

しかし、よくよく考えると同じ標本からそれぞれの統計量を計算した方が比較の観点からは正しかったのだと気づいた(標本誤差が減るので)。寝ぼけていたのかもしれない。

つまり、

#不偏分散と標本分散の比較
for (i in 1:10000){
  dat <- rnorm(10,100,15)
  dat_mean <- mean(dat)
  sample_var[i] <- sum((dat - dat_mean)^2)/10
  unbias_var[i] <- var(dat)
}

とすることで、純粋に分散の計算方法だけの違いが見れる。期待値を計算して修正式に当てはめると、

mean(unbias_var)
 # [1] 226.4204
mean(sample_var) *10/9
 # [1] 226.4204

このようにぴったりと一致する。