Processing math: 100%

2012年11月5日月曜日

平均と分散

 データの代表値は、例えば、平均値でしょう。今、人が100人居て、身長を測ったとします。この集団の特徴を表す代表的な値として、身長の平均値は有用でしょう。100人の身長をx1x2、...、x100とおけば、平均値ˉxは次式であらわされます。
ˉx=x1+x2+...+x100100

 でも、身長の平均値が175cmだったとして、100人全員の身長が偶然175cmだったのと、身長が100cmの人が半数、250cmの人が半数だったのとでは、意味合いが異なります。つまり、平均値だけでは情報として不十分であり、どのようにばらついているかが重要な情報になります。ばらつき具合を示す量として、分散があります。分散は、各データが平均値からどの程度ずれているかの平均を示します。分散σ2は、次式で表されます。
σ2=(x1ˉx)2+(x2ˉx)2+...+(x100ˉx)2100

 人数を一般化して、n個の数値データが得られたとすれば、その平均と分散は、次式であらわされます。
ˉx=x1+x2+...+xnn

σ2=(x1ˉx)2+(x2ˉx)2+...+(xnˉx)2n

0 件のコメント:

コメントを投稿