ファイナンス

【5分でわかる】標準偏差とは エクセルでの求め方・リスクや偏差値との関係も解説

 

こんにちは、セーシン(@n_spirit2004)です。

統計用語の中に「標準偏差」というものがあります。

標準偏差を使うと、統計データの中のバラツキやリスクを定量的に計算することができるようになります。

この記事では、標準偏差とは何か、標準偏差とリスクとの関係、エクセルを使った求め方などを解説していきます。

加えて、標準偏差と関係の深く、学力テストでよく使われる偏差値についても解説していきます。

 

標準偏差とは

標準偏差とは、抽出したデータのバラツキの大きさを表します。

標準偏差が大きいほど、データの中にあるバラツキが大きく、標準偏差小さいほど、データの中にあるバラツキが小さいことになります。

標準偏差は次のように求められます。

標準偏差σ = 分散^(1/2)

このときに分散は、次のように求められます。

分散 = ∑(各データの値 ー 平均値)^2

つまり、分散とは各データの値と平均値の2乗をの総和になります。

図で表すと以下のようになります。

分散の意味を図解する

5つのデータがある場合、そのデータと平均値の差異の2乗を全て足すと分散になります。

分散のままだと、単位が2乗のままになってしまうので、元データを単位をあわせた標準偏差がバラツキを表す指標として使われます。

 

標準偏差の計算例

標準偏差の意味合いをよりわかりやすくするために、計算例を出して考えてみます。

ここに母集団Aと母集団Bがあり、それぞれ10個のデータがあります。

母集団A 5 6 4 3 2 5 4 3 5 4 平均4.1
母集団B 9 2 10 3 1 4 2 7 2 1 平均4.1

どちらの母集団も、平均値は4.1で同じですが、一見すると母集団Bの方がバラツキが大きいように思います。

これを標準偏差を使って定量的に表すと以下のようになります。

母集団A 1.2
母集団B 3.3

この結果から、数値的にも母集団Bの方がバラツキが大きいことがわかります。

このように標準偏差を使うと、バラツキを定量的に求めることができるようになります。

 

標準偏差をエクセルで計算する

標準偏差は、分散の平方根だと説明しましたが、これを手計算で求めるのは非常に困難な作業です。

しかし、エクセルのSTDEVという関数を使うと、標準偏差を瞬時に求めることができます。

先ほどの例でみると、母集団Aの場合、以下表の一番左の5から一番右の4のところをSTDEV関数で選択すれば簡単に求めることができます。

母集団A 5 6 4 3 2 5 4 3 5 4 平均4.1
母集団B 9 2 10 3 1 4 2 7 2 1 平均4.1

 

実際にこれがSTDEV関数を使って、標準偏差を求めている画面です。

標準偏差をエクセルで求める

 

標準偏差の意味合い

あるデータのサンプルが、平均値を頂点とした理想的な分布(正規分布)をしていると仮定した場合、標準偏差σは次のような意味を持ちます。

  • 平均値±1σの間に全データの68.27%が分布している。
  • 平均値±2σの間に全データの95.45%が分布している。
  • 平均値±3σの間に全データの99.73%が分布している。
  • 平均値±6σの間に全データの99.999997%が分布している。

先ほどの例で±3σを考えると、母集団Aは統計上、0.5~7.7(4.1±3×1.2)の間に99.73%のデータが集約されているという解釈になります。

一方、母集団Bの場合は、統計上、-5.8~14.0(4.1±3×3.3)の間に99.73%のデータが集約されているという解釈になります。

これを正規分布表を使って表すと、以下のようになります。

この標準偏差は品質管理にも使われます。

例えば、工程内の母集団から部品を抜き取って検査したときに、寸法の標準偏差を計算します。

もし標準偏差が大きければ、その母集団の部品の寸法バラツキは大きいことになりますし、逆に標準偏差が小さければ、その母集団の部品の寸法バラツキは小さいことになります。

こうした考え方は、様々な品質指標に応用されています。

例えば、工程における製品のバラツキ具合を示す、工程能力指数があります。

他にも、経営改善にも使われるシックスシグマ(6σ)のシグマも元は標準偏差・バラツキからきていて、正常な範囲を6σまで許容できるとエラーが起きる確率が100万分の3や4まで下げられるところからシックスシグマと名付けられています。

【5分でわかる】シックスシグマとは 5つの分析プロセスを解説シックスシグマとは、企業活動で発生するばらつきをおさえて、経営品質の改善を図るための経営改善手法のことです。 シックスシグマは、日...

 

標準偏差とリスクの関係

ビジネスの定量分析の世界では、標準偏差のことをリスクといいます。

つまり、「リスクが大きい=バラツキが大きい」ということになります。

例えば、次のように将来3パターンのシナリオに分かれる投資機会Aがあるとします。

投資機会A

パターン 収益 確率
シナリオA 100万 20%
シナリオB 50万 60%
シナリオC 5万 20%

このとき、収益の期待値は次のようになります。

期待値 = 100万×0.2 + 50万×0.6 + 5万×0.2 = 51万円

ここから標準偏差を求めるには、まず分散(標準偏差の2乗)を求めます。

分散 

= (100万-51万)2×0.2 + (50万-51万)2×0.6 + (5万-51万)2×0.2

= 904万円2

ここから標準偏差は次のようになります。

標準偏差 = 約30万円

これを期待値が同じ51万円になるような次の投資機会Bと比べてみます。

投資機会B

パターン 収益 確率
シナリオA 71万 50%
シナリオB 31万 50%

期待値が同じなので、投資機会Aでも投資機会Bでも、どちらに投資してもよさそうに見えますが、リスクの観点から比較してみると異なる結果になります。

投資機会Bの標準偏差を投資機会Aと同じように計算すると、以下のようになります。

標準偏差 = 約20万円

つまり、投資機会Aと投資機会Bは全く期待値は同じですが、投資機会Bの方がよりリスクの低い投資だということがわかります。

 

標準偏差を活用した偏差値とは

標準偏差を使った指標のひとつとして偏差値があります。

偏差値とは、全体の中で自分がどの程度の順位に位置しているかを示したものです。

 

偏差値の求め方

偏差値は次のように計算できます。(偏差値はテストの点数でよく使われるので、ここではテストの点数を例に挙げます)

(あなたの点数 - 平均点) ÷ 標準偏差 × 10 + 50

例えば、あるテストの分布が以下のようになっていたとします。

生徒 A B C D E F G H I J 平均
母集団 70 81 66 54 90 49 67 78 77 55 68.7

 

このときSTDEV関数を使うと、標準偏差は13.18であることがわかります。

このとき、上記の偏差値の式を使うと、それぞれの生徒の偏差値は次のようになります。

生徒 A B C D E F G H I J 平均
母集団 70 81 66 54 90 49 67 78 77 55 68.7

標準偏差

51.0 59.3 48.0 38.8 66.2 35.1 48.7 57.1 56.3 39.6

 

偏差値の意味

仮に試験点数の分布が正規分布に従っている場合、偏差値と順位には次のような関係があります。

偏差値 上位からの%
75 0.62%
70 2.28%
65 6.68%
60 15.87%
55 30.85%
50 50.00%
45 69.15%
40 74.13%
35 93.32%

 

実際にはテストの結果が正規分布に従うことはまずないので、ここにあげた偏差値と順位の関係はあくまで目安になります。

 

まとめ

以上、標準偏差の解説でした。

  • 標準偏差とは、母集団の中にあるデータのバラツキを示したものである。
  • 標準偏差は分散の平方根として求められる。分散は各データと平均値の差を2乗したものの総和である。
  • 標準偏差はエクセルのSTDEV関数を使うと、簡単に計算できる。
  • データが正規分布していると、標準偏差を使うことによって、何%のデータがどの範囲に入っているか推測することができる。この考え方は、品質管理に応用されている。
  • 標準偏差は、投資機会に対するリスクと考えることもできる。同じ期待値の投資機会であっても、標準偏差によってリスクの度合いを測ることができる。
  • 学力テストで使われる偏差値も標準偏差を活用して求められる指標である。

 

ABOUT ME
アバター
セーシン
元サラリーリーマン管理職で新規事業、海外駐在などを経験し、現在は独立して法人向けコンサル等、いろいろやっています。サラリーマン時代には15年間副業やっていました。 ツイッターアカウントはこちら
おすすめ記事