ファイナンス思考・知識・勉強

【5分でわかる】標準偏差とは エクセルでの求め方 リスク・偏差値との関係

 

統計用語の中で「標準偏差」という言葉を聞いたことがあります。

しかし、標準偏差って何?と聞かれても、即答できる人は少ないのではないでしょうか。

この記事では、標準偏差の解説、リスクとの関係をエクセルを使った求め方を交えて解説していきます。加えて、標準偏差と関係の深い、偏差値についても解説していきます。

 

広告

標準偏差とは

標準偏差とは、抽出したデータのバラツキを表します。

標準偏差が大きいほどバラツキが大きく、標準偏差小さいほどバラツキは小さいことになります。

 

標準偏差の意味

あるデータのサンプルが、平均値を頂点とした理想的な分布(正規分布)をしていると仮定した場合、標準偏差σは次のような意味を持ちます。

  • 平均値±1σの間に全データの68.27%が分布している。
  • 平均値±2σの間に全データの95.45%が分布している。
  • 平均値±3σの間に全データの99.73%が分布している。
  • 平均値±6σの間に全データの99.999997%が分布している。

 

上の例で±3σを考えると、母集団Aは統計上、0.5~7.7(4.1±3×1.2)の間に99.73%のデータが集約されていることになります。一方、母集団Bの場合は、統計上、-5.8~14.0(4.1±3×3.3)の間に99.73%のデータが集約されていることになります。

したがって、先ほど書いたように、標準偏差が大きいほど、データの分布範囲(すなわちバラツキ)が大きいと言えます。

 

標準偏差は品質管理にも使われます。

例えば、工程における製品のバラツキ具合を示す、工程能力指数などに用いられますし、経営改善にも使われるシックスシグマ(6σ)のシグマも標準偏差の考え方が基になって考えられています。

【5分でわかる】シックスシグマとは 5つの分析プロセスを解説シックスシグマとは、企業活動で発生するばらつきをおさえて、経営品質の改善を図るための経営改善手法のことです。 シックスシグマは、日...

 

標準偏差とリスク

ビジネスの定量分析の世界では、標準偏差のことをリスクといいます。つまり、「リスクが大きい=バラツキが大きい」ということになります。

例えば、次のように将来3パターンに分かれる投資案があるとします。

パターン収益確率
A100万20%
B50万60%
C5万20%

 

このとき、収益の期待値は次のようになります。

期待値 = 100万×0.2 + 50万×0.6 + 5万×0.2 = 51万円

 

ここから標準偏差を求めるには、まず分散(標準偏差の2乗)を求めます。

分散 

= (100万-51万)2×0.2 + (50万-51万)2×0.6 + (5万-51万)2×0.2

= 904万円2

ここから標準偏差は次のようになります。

標準偏差 = 約30万円

これを期待値が同じ51万円になるような次の投資と比べてみます。期待値が同じなので、どちらに投資してもよさそうですが、リスクの観点から比較してみます。

パターン収益確率
A71万50%
B31万50%

この場合、

標準偏差 = 20万円

となります。したがって、上と比べて期待値は同じですが、リスクの少ない投資だということがわかります。

 

広告

標準偏差のエクセルでの求め方

標準偏差が大きいほど、データのバラツキが大きいということになります。標準偏差の2乗のことを分散といいます。

 

例えば、違う母集団から10個ずつデータを取ったとします。

母集団A5643254354平均4.1
母集団B92103142721平均4.1

 

どちらの母集団も、平均値は4.1で同じですが、一見すると母集団Bの方がバラツキが大きいように思います。

これを標準偏差を使って定量的に表すと以下のようになります。

母集団A1.2
母集団B3.3

 

この結果から、数値的にも母集団Bの方がバラツキが大きいことがわかります。

個々のデータXと、平均Yとの差(X-Y)の2乗の総和を分散といいます。標準偏差は、分散の平方根で表すことができます。手計算では非常に困難な作業ですが、エクセルのSTDEVという関数を使うと、瞬時に求めることができます。

先ほどの例でいうと、以下表の5から4のところをSTDEV関数で選択すれば簡単に求めることができます。

母集団A5643254354平均4.1
母集団B92103142721平均4.1

 

 

偏差値とは

標準偏差を使った指標のひとつとして偏差値があります。

偏差値とは、全体の中で自分がどの程度の順位に位置しているかを示したものです。

 

偏差値の求め方

偏差値は次のように計算できます。(偏差値はテストの点数でよく使われるので、ここではテストの点数を例に挙げます)

(あなたの点数 - 平均点) ÷ 標準偏差 × 10 + 50

例えば、あるテストの分布が以下のようになっていたとします。

生徒ABCDEFGHIJ平均
母集団7081665490496778775568.7

 

このときSTDEV関数を使うと、標準偏差は13.18であることがわかります。

このとき、上記の偏差値の式を使うと、それぞれの生徒の偏差値は次のようになります。

生徒ABCDEFGHIJ平均
母集団7081665490496778775568.7

標準偏差

51.059.348.038.866.235.148.757.156.339.6

 

偏差値の意味

仮に試験点数の分布が正規分布に従っている場合、偏差値と順位には次のような関係があります。

偏差値上位からの%
750.62%
702.28%
656.68%
6015.87%
5530.85%
5050.00%
4569.15%
4074.13%
3593.32%

 

実際にはテストの結果が正規分布に従うことはまずないので、ここにあげた偏差値と順位の関係はあくまで目安になります。

 

広告

まとめ

標準偏差は母集団のバラツキを表す指標として頻繁に用いられます。

ビジネスパーソンとして知っておくべき最低限の統計基礎として理解をしておきましょう。

 

ロバスト設計は、製品がバラツくことを前提にしながら、品質を確実に担保するための手法です。

品質管理の基本 FMEA・ロバスト設計を使い上流工程で管理する 私は、海外も含めて30-40社のメーカーと一緒に仕事をしてきましたが、製品の品質を確保するためのプロセスはどこのメーカーでも似た...
広告
ABOUT ME
アバター
セーシン
元リーマン管理職+副業歴15年、海外事業・独立起業などの経験を踏まえて、仕事、経営、キャリア、海外に関することなど、ビジネスパーソンとしての戦闘力を高めるための情報を発信しています。 ツイッターアカウントはこちら