2012年11月8日木曜日

正規分布

 100人の人が集まったとき、背の高さが全員全く同じということはあり得ません。確率的な言い方をすれば、その確率は相当低いと言えます。普通は、背の高い人もいれば、低い人もいて、背の高さはばらばらでしょう。実際に測って、分布図にしてみると、以下のようになりました。 図:背の高さの分布

 横軸に身長を、縦軸に度数をとりました。バラツキはありますが、170cm付近に集中している分布になっていることが見て取れます。近似曲線を引けば、赤線のようになるでしょう。実は、この赤線は正規分布になっています。自然現象や社会現象など、複雑な現象は、この正規分布で近似できると言われています。  正規分布は、平均と分散が決まれば、分布が決まります。平均を$\mu$、分散を$\sigma^2$とすれば、正規分布を表す関する$f(x)$は、次式のようになります。
\begin{equation} f(x) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp \left \{ -\frac{(x-\mu)^2}{2\sigma^2} \right \} \end{equation}
$\pi$は円周率で、$\exp$は指数関数を表します。平均0、分散1の正規分布は、標準正規分布と呼ばれます。
 横軸は身長を何cm間隔かで区切って、その範囲の身長の人の数が縦軸になっています。人数が多くなっている身長の範囲では、その身長の人が存在しやすいことを示しています。つまり、身長の範囲に対する人数は、その起こりやすさと考えることができます。実は、この身長の範囲に対する人数で表される面積は、確率になります。身長の範囲を限りなく小さくしていったとき、この確率は確率密度になります。このとき、正規分布の赤線は確率密度関数と呼ばれます。
 確率変数$X$が連続的な値をとり、$\alpha \leqq X \leqq \beta$の範囲にあれば、その確率は次式で表されます。
\begin{equation} P(\alpha \leqq X \leqq \beta) = \int ^{\beta} _{\alpha} f(x) dx \end{equation} $f(x)$は、$X$の確率密度関数です。

0 件のコメント:

コメントを投稿