【統計学】分散・標準偏差とは?関数で簡単に求める【Excel】

当ページのリンクには広告が含まれています。

統計学の基礎知識である「分散・標準偏差」。

データのまとまりから数値の散らばり具合を見る言葉です。

例えば、ある数値の集合体

  • 5,6,5,6,5,6,5,6
  • 1,10,2,9,7,4,6,5,5,6

どちらも平均値は「5.5」になりますが、データの性質としては異なるものと感じませんか?

これを数値化するのが「分散・標準偏差」です。

目次

分散とは?

分散とは、単純なデータの散らばり具合を見るための指標です

計算方法は

  1. データの平均値を取得
  2. 各データから平均値を引いて2乗する
  3. ②のデータをすべて足す
  4. データ数で割る

このようになります。

Excelで先ほどのサンプルデータを使って求めてみます。

まずは「5,6,5,6,5,6,5,6」から見てみましょう。

分散の公式

分散 = (( データ – 平均値 )²) の総和 ÷ データ数

平均値が5.5、全て値の平均との差-0.52乗し、データの個数10で割ると、分散は0.25となります。

次は「1,10,2,9,7,4,6,5」で見てみます。

分散は7.05になりました。

ちなみにExcel関数ではVARP(データ範囲)で一発で求められます。

2乗する理由は?

平均との差はプラス・マイナス両方の値が考えられるため、数値とするため2乗しています。

標準偏差とは?

分散は、計算するために2乗しているためデータが大きくなり単位が異なります。これを正すために平方根を取り、単位を揃えます。

標準偏差の公式

標準偏差 = √分散

Excel関数で求める場合にはSQRT(分散)となります。

先ほど求めた分散に当てはめると

  • 0.5(標準偏差) = √0.25(分散)
  • 2.65(標準偏差) = √7.05(分散)

となりました。

なぜ標準偏差を求めるのか?

標準偏差を求めることにより、データが正規分布に従っていると仮定して、データ範囲内の数値が現れる確率を求めることができます。

この考え方が統計学の基礎となります。

引用:正規分布-wikipedia

上記図は見ると、平均値を0として平均値±標準偏差で68.2%の確立と算出できます。

他には平均値±標準偏差×3(3α)で見ると99.7%とほとんどを網羅することができます。

範囲指定した値が出現する確率標準偏差:0.5の範囲標準偏差:2.65の場合
平均値±標準偏差68.3%5~62.85~8.15
平均値±(標準偏差×2)95.4%4.5~6.50.2×10.8
平均値±(標準偏差×3)99.7%4~7-2.45~13.45
  • URLをコピーしました!

コメント

コメントする

目次