信号検出理論事始め
信号検出理論というものがある。もともとは、レーダーの性能など通信工学的な分野で発展した理論でそれが感覚や知覚の心理学研究に応用されるようになったらしい。
以下の本を参考に、自分の学習のメモを残す。(記事の内容の正しさは保証できないため、しっかりと学びたい人は原典をあたることをおすすめする。)
Detection Theory: A User's Guide
- 作者: Neil A. Macmillan,C. Douglas Creelman
- 出版社/メーカー: Lawrence Erlbaum
- 発売日: 2004/10/04
- メディア: ペーパーバック
- この商品を含むブログを見る
はじめに ~考え方編~
まず信号検出理論の特色を一言で言ってしまえば、それは、観察者の反応を(1)提示される刺激による要因と(2)反応のバイアスによる観察者側の要因の2つに分離して記述できることだと思う。古典的な精神物理学の研究では、刺激側の要因と心理反応の関数関係の記述を主としていたが、反応における認知的なプロセスの部分も考慮に入れてモデル化しているというのは、この理論の強みであるように思う。
これだけだと「何のことだ?」と思う方もいるかもしれないので例を出して考えよう。
例えば、次のような事態を考えてみる。ここに嘘発見器があるとする。発見器をつけた状態で話をすると、発見器は「嘘」か「正直」のどちらかの回答を返すものとする。さて、この発見器の性能を検証しようと考え、次のような実験を行う。発見器をつけた状態で、それぞれ25回の「嘘の話」と「本当の話」をする(こういうのを刺激クラスと呼ぶ)。「嘘の話」に正しく「嘘」と言うことができ、本当の話に対して「正直」ということができる割合が高ければ、この発見器は優秀だと言うことができる。この架空の実験の結果を表で示す。
刺激クラス | 「嘘」と反応 | 「正直」と反応 | 合計 |
---|---|---|---|
嘘の話 | 20 | 5 | 25 |
本当の話 | 15 | 10 | 25 |
さて、この嘘発見器は優秀なのであろうか。嘘の話に注目すると、25回中20回も嘘を見破っている。確率で言えば80%の確率で嘘を発見しているので優秀だと言えるかもしれない。しかし、本当の話に注目すると、25回中15回も間違って嘘だという反応を返している。確率でいえば60%の確率で間違った判断を下している。これでは、この発見器が優秀だと言いきることはできなかろう。
このように、片方の刺激クラスにのみに注目していたのでは間違った推論をしてしまう恐れがある。したがって、嘘発見器の正確性を評価しようと思ったのであれば、どちらの刺激クラスも考えなければならない。
ところで、嘘発見器の性能を正確性という一つのパラメータで記述してよいものであろうか。ここに嘘発見器Bがあるとして(さっきの嘘発見器をAとする)、先ほどと同様の実験を行った結果が下記の通りだとする。
刺激クラス | 「嘘」と反応 | 「正直」と反応 | 合計 |
---|---|---|---|
嘘の話 | 16 | 9 | 25 |
本当の話 | 11 | 14 | 25 |
嘘の話に注目すると、64%の正確性で嘘を見破っており、嘘発見器Aよりも嘘を見破る力は弱い。本当の話に注目すると、44%の確立で間違った判断をしてしまっていて、嘘発見器Aより間違って「嘘」だと反応してしまう率は低い。Aの発見器よりも「保守的な」発見器だと言えるかもしれない。
どちらの発見器も、正しく判断できた数(左上と右下のセルの合計)は30であり、同程度の正確性で嘘を検出している。しかし、この2つは嘘検出の正確性では同程度だとしても、その反応のパターンは結構ちがっている。こうした、反応パターンの違いを考慮してモデルを構築するのが信号検出理論の大きな強みだろう。
信号検出理論の用語たち
さて、ここで信号検出理論の用語を導入する。一番最初の嘘発見を例にして話を進める。2つの刺激クラスについて2つの反応パターンがあった訳なので、この組み合わせは、2×2で4つのパターンがあることになる。その用語を以下の表に示す。いかにも、もともとレーダーの研究で使われていたっぽい用語である。
刺激クラス | 嘘 | 正直 | 合計 |
---|---|---|---|
嘘の話 | ヒット(Hits) (20) |
ミス(Misses) (5) |
25 |
本当の話 | 誤警報(False Alarms) (15) |
正棄却(Correct Rejection) (10) |
25 |
この表には、4つの単語があるが実質独立しているのは2つだけなので(例えば、ヒットの数が決まればミスの数は必然的に(合計 ー ヒット)になる)、この表の特徴は2つの値で表すことができる。すなわち、ヒット率をH、誤警報率をFと表すと次のように書くことができる。(F , H)=(.60, .80)
まず、求めるのは検出力を表す指標である。検出力はHが高い時に高くなり、Fが高い時に低くなる(なにせ間違った判断を下している訳だから)ものが望ましい。この条件を満たすシンプルなものは、H - Fである。今の発見器の例だと、 .80 - .60 = .20 になる。
あるいは正しい判断を行なった確率というのでも良い指標であろう。ヒット(H)と正棄却(1 - F)を2で割ると、試行数における正しい判断の割合が算出できる。
今の例だと、( .80 + .40) / 2 = .60 になる。
ここまでで2つの指標を導入した訳だが、信号検出理論でもっとも広く使われる指標はもう少し複雑である。 HとFの確率を、正規分布における確率点に変換した値を計算して得られるd'(読みはディープライム)というものが使われる。
先の例で言うならば、z(H) = 0.842 、 z(F) = 0.253であるから、d' = 0.589 となる。Rで確率点を求めたいのであれば,qnorm()という関数を使うと良い。
> H <- qnorm(0.8) > F <- qnorm(0.6) > H - F [1] 0.5882741
とりあえず、これで検出における正確性を表す指標が手に入ったこととなる。今日はここまでで、次回以降で正確性を表す指標とは違う、反応のバイアスに関わる指標について書いていこうと思う。