猫も杓子も構造化

発達障害、特別支援などについて書いています。最近は心理学関係の内容が多めです。

比率の差の検定・多重比較

群間で条件ごとに比率の差を検討したいような状況を考える。

例えば、自閉症の人の弱い中枢性統合の仮説を検討するためにHappeという研究者が1996年に行った実験の分析はその状況である。研究では、通常錯視が起きやすいと思われる2D条件と、錯視が起きずらいと思われる3D条件の2つの条件で、自閉症群、軽度の学習障害群、定型発達群の3群からデータを得ている。

Studying weak central coherence at low levels: children with autism do not succumb to visual illusions. A research note. - PubMed - NCBI

それぞれの群に対し、3D条件の方が2D条件に比べて成績が向上した人の割合(錯視にだまさにくくなった人の割合)というのが示されている。自閉症群は44%、学習障害群は73%、定型発達群は95%である。各群の人数は論文中に報告されているので、それをもとに分割表を作成すると次のようになる。

成績向上 向上せず 合計
自閉症 11 14 25
学習障害 19 7 26
定型発達 20 1 21
合計 50 22 72

2つのカテゴリー変数に関連があるかについてのは、カイ2乗検定を行うのが一般的である。論文でも、自閉症とそれぞれの群の間での比率の差が、「autism vs normal, χ^2 = 13.67, p < .001; autism vs MLD, χ^2 = 4.44, p < .05」と報告されている。

上記の分割表のデータをRで検定にかけてみると、同じ値が得られる。(微妙なずれは小数点以下何桁まで計算するかの話かな、おそらく)

> dat <- matrix(c(11,20,14,1),2,2) #自閉と定型発達の分割表
> chisq.test(dat,correct=F) #連続性の補正は行わない

	Pearson's Chi-squared test

data:  dat
X-squared = 13.635, df = 1, p-value = 0.000222


> dat1 <- matrix(c(11,19,14,7),2,2)#自閉と学習障害の分割表
> chisq.test(dat1,correct=F) #連続性の補正は行わない

	Pearson's Chi-squared test

data:  dat1
X-squared = 4.4488, df = 1, p-value = 0.03493


ちなみに、比率の差を検定する関数としては、prop.test()という関数もある。今のケースだと次のように引数を指定すると上記と同じ値が得られる。

http://cse.naro.affrc.go.jp/takezawa/r-tips/r/66.html

> #成績向上人数とサンプル数を引数に指定
> prop.test(c(11,20),c(25,21),correct=F) #自閉と定型発達の比較

	2-sample test for equality of proportions without continuity correction

data:  c(11, 20) out of c(25, 21)
X-squared = 13.635, df = 1, p-value = 0.000222
alternative hypothesis: two.sided
95 percent confidence interval:
 -0.7272237 -0.2975382
sample estimates:
  prop 1   prop 2 
0.440000 0.952381 

> prop.test(c(11,19),c(25,26), correct=F) #自閉と学習障害の比較

	2-sample test for equality of proportions without continuity correction

data:  c(11, 19) out of c(25, 26)
X-squared = 4.4488, df = 1, p-value = 0.03493
alternative hypothesis: two.sided
95 percent confidence interval:
 -0.54947807 -0.03206039
sample estimates:
   prop 1    prop 2 
0.4400000 0.7307692 

ただ、この分析の仕方は得られたデータに対して、二回統計的検定を行なっているので、いわゆる検定の多重性の問題に抵触しているように思う。これを避けるためには、3郡の比率の差についての検定を行なったのちに、事後検定として多重比較を行うのが適切だろう。

比率の差の多重比較については、群馬大学の青木先生のページに解説とRのコードが載っている。

比率の差の多重比較(対比較)

多重比較のうちライアンの方法にて、検定を行うと次のような結果になる。

> #分割表の比率の差を検討
> dat2 <- matrix(c(11,19,20,14,6,1),3,2) #3郡全ての分割表
> chisq.test(dat2,correct=F) #連続性の補正は行わない

	Pearson's Chi-squared test

data:  dat2
X-squared = 14.961, df = 2, p-value = 0.0005638

> 
> #全体として差があったのでライアンの方法で多重比較
> source("http://aoki2.si.gunma-u.ac.jp/R/src/p_multi_comp.R", encoding="euc-jp")
> 
> p.multi.comp(c(25,26,21), c(11, 19, 20), method="ryan")
p[ 1]=0.44000 vs. p[ 3]=0.95238 : diff.= 0.51238, RD=0.32643 : P=0.00017, alpha'=0.01667

これだと、一番比率が高い定型発達群と自閉症群との間には有意な差があることが認められるが、その他のペアでは有意な差がないことが分かり、もとの論文の主張とは一部異なる結果が得られたことになる。