二項分布とポアソン分布
二項分布とポアソン分布も親戚関係にあるらしい(『キーポイント確率統計』岩波書店)。二項分布を、npをλに固定したまま、pを0に近づけ、nを無限に大きくしていくとポアソン分布が現れるからである。二項分布は超幾何分布の子どもだった訳だから、さしずめポアソン分布は超幾何分布の孫といったところでしょうか。
さて、どの程度nが大きくなったりpが小さくなると、ポアソン分布に近づくのだろうか。例にもよって例のごとくRで試してみる。
とりあえずそんなに小さくもないp=0.2と、そんなに大きくもないn=20ぐらいから。
n <- 20 p <- 0.2 lambda <- n*p x <- 0:10 aa <- dpois(x,lambda = lambda) bb <- dbinom(x,n,p) cc <- data.frame( Poisson = aa, Binom = bb ) rownames(cc) <- as.character(c(x)) barplot(t(cc), beside =T) legend("topright", fill= c("#333333", "#eeeeee"),legend = c("Poisson", "Binom"))
まぁ、似たような分布ではあるがそれなりに違ってもいる。
確率を半分にしてp=0.1にしてみるとこんな感じ。
だいぶ近い分布になりましたね。
さらに半分にp=0.05にするとより近づく。
さて、今度は元の確率p=0.2に戻してnを増やしてみる。
まずn=50ぐらいまで増やす。(グラフ範囲は見やすい必要そうな場所のみ)
これは結構違う。
さらに増やしてn=100ぐらいだとどうでしょう。
これでも結構違う。やはりまれな現象に当てはまるのがポアソン分布ということで、p=0.2程度だとnを増やしてもポアソン分布には近づかないらしい。
この状態でp=0.05程度まで下げると次の通り。
だいたい一致する。
ちなみに、nをいたずらに増やしてもポアソン分布には近づかなかったのだが、中心極限定理に従って二項分布が正規分布に近似している様子は見てとれる。