
横軸に身長を、縦軸に度数をとりました。バラツキはありますが、170cm付近に集中している分布になっていることが見て取れます。近似曲線を引けば、赤線のようになるでしょう。実は、この赤線は正規分布になっています。自然現象や社会現象など、複雑な現象は、この正規分布で近似できると言われています。 正規分布は、平均と分散が決まれば、分布が決まります。平均をμ、分散をσ2とすれば、正規分布を表す関するf(x)は、次式のようになります。
f(x)=1√2πσ2exp{−(x−μ)22σ2}
πは円周率で、expは指数関数を表します。平均0、分散1の正規分布は、標準正規分布と呼ばれます。
横軸は身長を何cm間隔かで区切って、その範囲の身長の人の数が縦軸になっています。人数が多くなっている身長の範囲では、その身長の人が存在しやすいことを示しています。つまり、身長の範囲に対する人数は、その起こりやすさと考えることができます。実は、この身長の範囲に対する人数で表される面積は、確率になります。身長の範囲を限りなく小さくしていったとき、この確率は確率密度になります。このとき、正規分布の赤線は確率密度関数と呼ばれます。
確率変数Xが連続的な値をとり、α≦X≦βの範囲にあれば、その確率は次式で表されます。
P(α≦X≦β)=∫βαf(x)dx f(x)は、Xの確率密度関数です。
0 件のコメント:
コメントを投稿