猫も杓子も構造化

発達障害、特別支援などについて書いています。最近は心理学関係の内容が多めです。

標本抽出の方法とかについて

調べたことを書いてみようのコーナー。

特別支援界隈だと有名な「通常の学級に在籍する発達障害の可能性のある特別な教育的支援を必要とする児童生徒に関する調査結果について」。発達障害の疑いがある児童・生徒は、2002年の調査だと6.3%だったものが、2012年の調査だと6.5%という結果が出ている。この調査、小学校・中学校の学年別の数値とか見てみると結構面白いのですが、今回はその調査を題材に標本抽出調査の考え方を書いてみます。

この調査は日本の通常級に教育的支援が必要な児童生徒がどれだけいるかを調べたい訳ですので、在籍している児童生徒を全員を調査すれば正確な値が得られます(悉皆調査)。

ですが、そんなことしてたらいくらお金と時間があっても足りないので、現実的には日本全国の中から一部の児童生徒を選んで調査をする訳です(標本調査)。

で、このときの選び方に偏りがあると、そこで得られた情報は日本全国の児童生徒を代表しているとは言えない訳です。極端な例ですが、成績が良い子だけ集めて調査したら学習面で著しい困難を示す児童生徒は限りなく0に近づくでしょうが、その一部の児童生徒の情報を元にして「日本全国の児童生徒で学習面で困難を示す児童生徒はいない」とは言えない訳です。従って、一部の児童生徒を選ぶ際には、偏りが出ないように選ばないといけません(無作為抽出)。

一番シンプルな方法は、全児童生徒に通し番号をつけて、その番号から無作為にいくつかの番号を選び、その番号に対応した児童生徒のみを調べるという方法ですが(単純無作為抽出)、全国調査なので全児童生徒に通し番号をつけるだけでもちょっとしんどそうです。

なので、一部の児童生徒を選ぶというプロセス何段階かに分けて考えます(多段抽出法)。

まず、全国の小中学校から学校を選びます(第一段抽出)。次に、選ばれた学校から各学年1学級を無作為に選びます(第二段抽出)。最後に、選ばれた学級から男女5名ずつを無作為に選びます(第三段抽出)。このように三段階に分けることで、膨大な数の児童生徒に通し番号をつけることをせずに、一部の児童生徒を選ぶことができました(3段抽出法)。

さて、学校にはたくさんの児童生徒が在籍している学校もあれば、少ない児童生徒数の学校もあります。これらの学校をランダムに選ぶと、児童生徒数が多い学校も少ない学校も同じ1つのサンプルとして扱われてしまいますが、実際にはぜん児童生徒数に占める割合を考えると、それらを同等のものとして扱うと都合が悪いです。

なので、各学校を市郡の規模と学校規模のカテゴリーで分けて(層化抽出)、それぞれのカテゴリーに対して選ぶ学校数を割り当てます。その際に、全児童生徒数に対してそのカテゴリーに含まれる児童生徒の比率で割り当てる数を決定します(確率比例抽出)。

こうすることで、大きな学校も小さな学校も、大都市の学校も小さな村の学校も選びつつ、それぞれの在籍児童数のバラつきを加味した上で学校を選ぶことができました。

と、ここまでが以下の標本抽出の部分に書いてあることでした。

(5)標本抽出方法及び標本児童生徒数
①標本抽出方法
層化三段確率比例抽出法とする。
・学校を市郡規模と学校規模で層化する。
・標本学校数は、小・中学校のそれぞれ600校とし、各層への標本学校数の割り当ては、児童生徒数に比例割当とする。
・各層における標本学校の抽出は、児童生徒数による確率比例抽出とする。(第一段抽出) ・抽出された学校の各学年において、1学級を単純無作為抽出し標本とする。(第二段抽出)
・抽出された学級において、原則、男女それぞれ5名の児童生徒を単純無作為抽出し標本児童生徒とする。(第三段抽出)

②標本児童生徒数
53,882人(小学校:35,892人、中学校:17,990人)

通常の学級に在籍する発達障害の可能性のある特別な教育的支援を必要とする児童生徒に関する調査結果について:文部科学省


調査の内容とかについてはまたいつか。