猫も杓子も構造化

発達障害、特別支援などについて書いています。最近は心理学関係の内容が多めです。

二項分布とポアソン分布

二項分布とポアソン分布も親戚関係にあるらしい(『キーポイント確率統計』岩波書店)。二項分布を、npλに固定したまま、pを0に近づけ、nを無限に大きくしていくとポアソン分布が現れるからである。二項分布は超幾何分布の子どもだった訳だから、さしずめポアソン分布は超幾何分布の孫といったところでしょうか。

さて、どの程度nが大きくなったりpが小さくなると、ポアソン分布に近づくのだろうか。例にもよって例のごとくRで試してみる。

とりあえずそんなに小さくもないp=0.2と、そんなに大きくもないn=20ぐらいから。

n <- 20
p <- 0.2
lambda <- n*p
x <- 0:10

aa <- dpois(x,lambda = lambda)
bb <- dbinom(x,n,p)
cc <- data.frame(
  Poisson = aa,
  Binom = bb
)

rownames(cc) <- as.character(c(x))
barplot(t(cc), beside =T)
legend("topright", fill= c("#333333", "#eeeeee"),legend = c("Poisson", "Binom"))

f:id:nekomosyakushimo:20170822000406p:plain


まぁ、似たような分布ではあるがそれなりに違ってもいる。
確率を半分にしてp=0.1にしてみるとこんな感じ。

f:id:nekomosyakushimo:20170822000549p:plain

だいぶ近い分布になりましたね。
さらに半分にp=0.05にするとより近づく。

f:id:nekomosyakushimo:20170822000802p:plain

さて、今度は元の確率p=0.2に戻してnを増やしてみる。
まずn=50ぐらいまで増やす。(グラフ範囲は見やすい必要そうな場所のみ)

f:id:nekomosyakushimo:20170822001053p:plain

これは結構違う。
さらに増やしてn=100ぐらいだとどうでしょう。

f:id:nekomosyakushimo:20170822001411p:plain

これでも結構違う。やはりまれな現象に当てはまるのがポアソン分布ということで、p=0.2程度だとnを増やしてもポアソン分布には近づかないらしい。
この状態でp=0.05程度まで下げると次の通り。

f:id:nekomosyakushimo:20170822001725p:plain

だいたい一致する。

ちなみに、nをいたずらに増やしてもポアソン分布には近づかなかったのだが、中心極限定理に従って二項分布が正規分布に近似している様子は見てとれる。