【統計学】分散・標準偏差とは?関数で簡単に求める【Excel】

統計学の基礎知識である「分散・標準偏差」。
データのまとまりから数値の散らばり具合を見る言葉です。

例えば、ある数値の集合体

  • 5,6,5,6,5,6,5,6
  • 1,10,2,9,7,4,6,5,5,6

どちらも平均値は「5.5」になりますが、データの性質としては異なるものと感じませんか?

これを数値化するのが「分散・標準偏差」です。

目次

分散とは?

分散の公式

分散 = (( データ – 平均値 )²) の総和 ÷ データ数

分散の求め方としては

  1. データの平均値を取得
  2. 各データから平均値を引いて2乗する
  3. ②のデータをすべて足す
  4. データ数で割る

このようになります。
Excelで先ほどのサンプルデータを使って求めてみます。

まずは「5,6,5,6,5,6,5,6」から見てみましょう。

平均値が5.5、全て値の平均との差-0.5を2乗し、データの個数10で割ると0.25となります。

次は「1,10,2,9,7,4,6,5」で見てみます。

分散は7.05になりました。ちなみにExcel関数では

分散 = VARP(データ範囲)

で一発で求められます。

2乗する理由は?

平均との差はプラス・マイナス両方の値が考えられるため、数値とするため2乗しています。

標準偏差とは?

標準偏差の公式

標準偏差 = √分散

分散は、計算するために2乗しているためデータが大きくなり単位が異なります。これを正すために平方根を取り、単位を揃えます。

Excel関数で求める場合には

標準偏差 = SQRT(分散)

先ほど求めた分散に当てはめると

  • 0.5(標準偏差) = √0.25(分散)
  • 2.65(標準偏差) = √7.05(分散)

となりました。

なぜ標準偏差を求めるのか?

標準偏差を求めることにより、データが正規分布に従っていると仮定して、データ範囲内の数値が現れる確率を求めることができます。

引用:正規分布-wikipedia

上記図を見て、平均値を0として平均値±標準偏差で68.2%の確立と算出できます。

他には平均値±標準偏差×3(3α)で見ると99.7%とほとんどを網羅することができます。

範囲指定した値が出現する確率標準偏差:0.5の範囲標準偏差:2.65の場合
平均値±標準偏差68.3%5~62.85~8.15
平均値±(標準偏差×2)95.4%4.5~6.50.2×10.8
平均値±(標準偏差×3)99.7%4~7-2.45~13.45

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!

コメント

コメントする

目次
閉じる