猫も杓子も構造化

発達障害、特別支援などについて書いています。最近は心理学関係の内容が多めです。

二項分布の3次のモーメント

統計学の教科書において確率分布を紹介するときに2次のモーメントまでしか載っていないことが多い。

モーメント母関数を用いれば、何次のモーメントでも求めることができるので、何の役に立つかは分からないが、ここでは二項分布の3次のモーメントを求めてみよう。

n次のモーメントの求め方は、モーメント母関数をn微分して、 \xiを0と置くのであった。まず、二項分布のモーメント母関数を2階微分をしたものは、

   f^{\prime\prime}(\xi) = np \{ (n-1) pe^{2\xi}(pe^\xi + q)^{n-2} + e^\xi(pe^\xi + q)^{n-1} \}

である。これをさらに微分すると、


  
\begin{split} f^{\prime\prime\prime}(\xi) &= np \{ 2pe^{2\xi}(n-1) (pe^\xi + q)^{n-2} + p^2e^{3\xi}(n-1)(n-2)(pe^\xi +q)^{n-3}\\
\\
&\quad + e^\xi (pe^\xi + q)^{n-1} + pe^{2\xi} (n-1)(pe^\xi + q)^{n-2} \}
\end{split}


となる。そこで、 \xi =0とおき、 pの次数で整理すると、

  \begin{split}
f^{\prime\prime\prime}(0) &= np \{ 2p(n−1) + p^2(n−1)(n−2)+ 1 + p(n−1) \} \\
\\
&= 2np^2(n−1)+np^3(n−1)(n−2)+np+np^2 (n−1)\\
\\
&= n(n−1)(n−2)p^3 + 3n(n−1)p^2 + np 
\end{split}


となり原点まわりの3次のモーメントが得られる。これを利用し、今度は平均値周りの3次のモーメントを求めてみる。平均値周りのモーメントは、

   m_3 = E((x - \mu)^3)

であり、これを展開すると、

   m_3 = E(x^3) -3\mu E(x^2) + 2\mu^3

となる。 \mu = E(x) = npであるので、先に求めた原点まわりのモーメントをこの式に代入することで、 m_3を求めることができる。ちなみに、2次の原点周りのモーメントは、

   E(x^2) = n(n-1)p^2 + np

である。

まず、それぞれを代入する。

  \begin{split}
 m_3 &= n(n−1)(n−2)p^3 + 3n(n−1)p^2 + np -3np \{ n(n-1)p^2 + np \} + 2n^3p^3\\
\\
&= np \{ (n−1)(n−2)p^2 + 3(n−1)p + 1 - 3(n-1)np^2 -3np + 2n^2p^2 \}
\end{split}


ごちゃごちゃしていて分かりづらいが、{ }の中を pの次数にそって整理し、各係数を計算していくと、

  
\begin{split}
m_3 &= np \{ (n−1)(n−2)p^2 + 3(n−1)p + 1 - 3(n-1)np^2 -3np + 2n^2p^2 \} \\
\\
&= np \{ \{(n−1)(n−2)- 3(n-1)n + 2n^2 \}p^2 + \{3(n−1) - 3n \} p + 1 \} \\  
\\
&= np (2p^2 - 3p +1)\\
\\
&= np (1 - p)(1 - 2p) 
\end{split}


が求まる。

3次のモーメントを標準偏差の3乗 \sigma^3で割ったものは歪度と呼ばれて分布の左右対称性の指標とされたりする。 q = (1-p)とすると分散は npq \sigma = \sqrt{npq}と表せるので、


  \displaystyle 歪度 = \frac{m_3}{\sigma^3} = \frac{npq(1 - 2p)}{(\sqrt{npq})^3} = \frac{npq(1 - 2p)}{npq \sqrt{npq}} = \frac{1 - 2p}{ \sqrt{npq}}


となる。分子に注目すると、 p =0.5のときに歪度は0となることがわかる。 p > 0.5では、歪度は負の値をとり、 p < 0.5では歪度は正の値をとる。歪度が0のときに分布は左右対称で、歪度が正のときには右の裾が長く、負のときには左の裾が長い分布が得られる。実際に二項分布の確率分布を確認してみてもその通りになっていることが分かる。