続続・自由度について(実験修正編)
以前書いた記事で不偏分散と標本の分散の比較し、そのときは別々の標本からそれぞれの統計量を計算した。
nekomosyakushimo.hatenablog.com
しかし、よくよく考えると同じ標本からそれぞれの統計量を計算した方が比較の観点からは正しかったのだと気づいた(標本誤差が減るので)。寝ぼけていたのかもしれない。
つまり、
#不偏分散と標本分散の比較 for (i in 1:10000){ dat <- rnorm(10,100,15) dat_mean <- mean(dat) sample_var[i] <- sum((dat - dat_mean)^2)/10 unbias_var[i] <- var(dat) }
とすることで、純粋に分散の計算方法だけの違いが見れる。期待値を計算して修正式に当てはめると、
mean(unbias_var) # [1] 226.4204 mean(sample_var) *10/9 # [1] 226.4204
このようにぴったりと一致する。