ファイナンス思考・知識・勉強

【5分でわかる】標準偏差とは リスク・偏差値との関係 エクセルでの求め方

 

統計用語の中で「標準偏差」という言葉を聞いたことがあります。

しかし、標準偏差って何?と聞かれても、即答できる人は少ないのではないでしょうか。

この記事では、標準偏差の解説、リスクとの関係をエクセルを使った求め方を交えて解説していきます。加えて、標準偏差と関係の深い、偏差値についても解説していきます。

 

標準偏差とは

標準偏差とは、抽出したデータのバラツキを表します。

標準偏差のエクセルでの求め方

標準偏差が大きいほど、データのバラツキが大きいということになります。標準偏差の2乗のことを分散といいます。

 

例えば、違う母集団から10個ずつデータを取ったとします。

母集団A 5 6 4 3 2 5 4 3 5 4 平均4.1
母集団B 9 2 10 3 1 4 2 7 2 1 平均4.1

 

どちらの母集団も、平均値は4.1で同じですが、一見すると母集団Bの方がバラツキが大きいように思います。

 

これを標準偏差を使って定量的に表すと以下のようになります。

母集団A 1.2
母集団B 3.3

 

この結果から、数値的にも母集団Bの方がバラツキが大きいことがわかります。

 

個々のデータXと、平均Yとの差(X-Y)の2乗の総和を分散といいます。標準偏差は、分散の平方根で表すことができます。手計算では非常に困難な作業ですが、エクセルのSTDEVという関数を使うと、瞬時に求めることができます。

 

先ほどの例でいうと、以下表の5から4のところをSTDEV関数で選択すれば簡単に求めることができます。

母集団A 5 6 4 3 2 5 4 3 5 4 平均4.1
母集団B 9 2 10 3 1 4 2 7 2 1 平均4.1

 

標準偏差の統計的意味

あるデータのサンプルが、平均値を頂点とした理想的な分布(正規分布)をしていると仮定した場合、標準偏差σは次のような意味を持ちます。

  • 平均値±1σの間に全データの68.27%が分布している。
  • 平均値±2σの間に全データの95.45%が分布している。
  • 平均値±3σの間に全データの99.73%が分布している。
  • 平均値±6σの間に全データの99.999997%が分布している。

 

上の例で±3σを考えると、母集団Aは統計上、0.5~7.7(4.1±3×1.2)の間に99.73%のデータが集約されていることになります。一方、母集団Bの場合は、統計上、-5.8~14.0(4.1±3×3.3)の間に99.73%のデータが集約されていることになります。

 

 

標準偏差は品質管理にも使われます。

例えば、工程における製品のバラツキ具合を示す、工程能力指数などに用いられますし、経営改善にも使われるシックスシグマ(6σ)のシグマも標準偏差の考え方が基になって考えられています。

【5分でわかる】シックスシグマとは 5つの分析プロセスを解説シックスシグマとは、企業活動で発生するばらつきをおさえて、経営品質の改善を図るための経営改善手法のことです。 シックスシグマは、日...

 

標準偏差とリスク

ビジネスの定量分析の世界では、標準偏差のことをリスクといいます。つまり、「リスクが大きい=バラツキが大きい」ということになります。

 

例えば、次のように将来3パターンに分かれる投資案があるとします。

パターン 収益 確率
A 100万 20%
B 50万 60%
C 5万 20%

 

このとき、収益の期待値は次のようになります。

期待値 = 100万×0.2 + 50万×0.6 + 5万×0.2 = 51万円

 

ここから標準偏差を求めるには、まず分散(標準偏差の2乗)を求めます。

 

分散 

= (100万-51万)2×0.2 + (50万-51万)2×0.6 + (5万-51万)2×0.2

= 904万円2

 

ここから標準偏差は次のようになります。

標準偏差 = 約30万円

 

これを期待値が同じ51万円になるような次の投資と比べてみます。期待値が同じなので、どちらに投資してもよさそうですが、リスクの観点から比較してみます。

パターン 収益 確率
A 71万 50%
B 31万 50%

 

この場合、

標準偏差 = 20万円

 

となります。したがって、上と比べて期待値は同じですが、リスクの少ない投資だということがわかります。

 

偏差値とは

標準偏差を使った指標のひとつとして偏差値があります。

 

偏差値の求め方

偏差値とは、全体の中で自分がどの程度の順位に位置しているかを示したものです。

 

偏差値は次のように計算できます。

(あなたの点数 - 平均点) ÷ 標準偏差 × 10 + 50

 

例えば、あるテストの分布が以下のようになっていたとします。

生徒 A B C D E F G H I J 平均
母集団 70 81 66 54 90 49 67 78 77 55 68.7

 

このときSTDEV関数を使うと、標準偏差は13.18であることがわかります。

 

このとき、上記の偏差値の式を使うと、それぞれの生徒の偏差値は次のようになります。

生徒 A B C D E F G H I J 平均
母集団 70 81 66 54 90 49 67 78 77 55 68.7

標準偏差

51.0 59.3 48.0 38.8 66.2 35.1 48.7 57.1 56.3 39.6

 

偏差値の意味

仮に試験点数の分布が正規分布に従っている場合、偏差値と順位には次のような関係があります。

偏差値 上位からの%
75 0.62%
70 2.28%
65 6.68%
60 15.87%
55 30.85%
50 50.00%
45 69.15%
40 74.13%
35 93.32%

 

実際にはテストの結果が正規分布に従うことはまずないので、ここにあげた偏差値と順位の関係はあくまで目安になります。

 

まとめ

標準偏差は母集団のバラツキを表す指標として頻繁に用いられます。

ビジネスパーソンとして知っておくべき最低限の統計基礎として理解をしておきましょう。

 

ロバスト設計は、製品がバラツくことを前提にしながら、品質を確実に担保するための手法です。

品質管理の基本 FMEA・ロバスト設計を使い上流工程で管理する 私は、海外も含めて30-40社のメーカーと一緒に仕事をしてきましたが、製品の品質を確保するためのプロセスはどこのメーカーでも似た...