連続のための修正とは何か
連続のための修正(連続性の補正)について調べたことのメモ。(まだ理解は不完全なのであまり信用できる記事ではありません。)
やや遠回りではあるが、まずは離散変量での検定について考える。
コインを10回投げて表の出る回数(確率変数)というのは、n=10, p=0.5 の二項分布に従う。それぞれの変数のとる確率はdbinom関数で簡単に求められる。以下はその表および確率分布の図である。(z値はあとで使うので今は無視してよい)
表の回数 | 確率 | z値 |
---|---|---|
0 | 0.001 | -3.162 |
1 | 0.010 | -2.530 |
2 | 0.044 | -1.897 |
3 | 0.117 | -1.265 |
4 | 0.205 | -0.632 |
5 | 0.246 | 0.000 |
6 | 0.205 | 0.632 |
7 | 0.117 | 1.265 |
8 | 0.044 | 1.897 |
9 | 0.010 | 2.530 |
10 | 0.001 | 3.162 |
さて、ここでこのコインが本当に0.5の確率で表がでるものなのか(細工がされていないか)調べたいとする。帰無仮説をp=0.5として、例えば、表の回数が(0、1)回あるいは(9、10)回だったらこの帰無仮説を棄却するものとしよう(極端に裏ばかりでる、あるいは極端に表ばかりでるようだったらp=0.5ではないとする両側検定)。通常だと有意水準を定めて、その水準を超えるようだったら帰無仮説を棄却とするだろうが、とりあえずここでは、上記の回数だったら棄却すると設定する。このとき、第1種の誤りαの確率は、それぞれの確率変数のとる確率の和である。すなわち、
coin_prob <- dbinom(0:10,size=10,prob=0.5) sum(coin_prob[1:2]) +sum(coin_prob[10:11]) [1] 0.02148438
であり、0.021%程度の確率で帰無仮説が真なのに、それを誤って棄却してしまうことになる。
ところで、二項分布はnが大きくなれば正規分布に近づくことが知られている。この性質を利用して、得られた値について検定を行おうという考えがでてくる。実現値を x 、平均を μ 、標準偏差を σ とすると、次のように z へと標準化ができる。
この変換をして得られたzの値は、最初に載せた表に記載してある。この z は近似的に、平均0、分散1の標準正規分布に従う。
さて、このzの値を用いて有意確率を計算してみる。表の回数が(0、1)回あるいは(9、10)回というのは, z値が |z| > 2.53 になる確率なので、正規分布が平均に対称なのを利用し、
pnorm(-2.53) * 2 [1] 0.01140625
と求められる。αの確率は、0.011%となり、最初に二項分布を用いて求めたときよりも、第1種の過誤を犯す確率がかなり小さく評価されてしまうこととなった。
これは、もともと二項分布が離散変量に基づく分布にもかかわらず、xを連続変量として扱っていることに原因があるとされている。離散的な整数を連続変量として当てはめているわけだが、それらの離散的な整数と整数の間にも確率があるわけで、この確率を考慮しないと、連続的変量としての分布への当てはまりが悪くなる。
※下の方にその解説がある。
統計学入門−第3章
離散変量をもとに連続変量の分布に近似して検定を行う際には、次に示す連続のための修正(イェーツの修正や半整数補正とも呼ばれる)を施した方が正規分布への近似がよくなるとされる。
今の例で考えると、1.5、8.5のところからz値を求めると正規分布により正確に近似されるはずである。上の式をもとにして z を修正し、その値を用いてαの確率を求めると以下のようになる。
(abs(1 - 10*0.5) - 0.5) / sqrt(10*0.5*0.5) [1] 2.213594 (1 - pnorm(2.213594)) *2 [1] 0.02685672
αの確率は0.027%で、何も考えずにz値に変換した場合に比べて、二項分布で求めていたときの有意水準αに近づいており、第1種の過誤の過小推定の危険性を避けている。(今度は大きく評価するようになったが。)
とりあえずここまで。
【参考】
『心理学のためのデータ解析テクニカルブック』(北大路書房)
- 作者: 森敏昭,吉田寿夫
- 出版社/メーカー: 北大路書房
- 発売日: 1990/06/01
- メディア: 単行本
- 購入: 3人 クリック: 6回
- この商品を含むブログ (9件) を見る