ロジカルシンキング

【5分でわかる】標準偏差とは?エクセルでの求め方・使い方【偏差値との関係もわかりやすく解説】

 

こんにちは、セーシン(@n_spirit2004)です。

統計用語の中に「標準偏差」というものがあります。

標準偏差がわかると、統計データのバラツキを定量的に計算できるようになります。

この記事では、その標準偏差とは何か、標準偏差とリスクとの関係、エクセルを使った求め方などを解説していきます。

加えて、標準偏差と関係が深く、学力テストでよく使われている「偏差値」についても解説していきます。

 

標準偏差とは

標準偏差とは、データのバラツキの大きさを表します。

標準偏差が大きいほど、データの中にあるバラツキが大きく、標準偏差小さいほど、データの中にあるバラツキが小さいことになります。

例えば、以下の左図と右図を比較してみると、平均値は同じですが、バラツキ度合いが異なるのが見た目にもわかります。

標準偏差の図解

この図の場合、左図はバラツキ小さい=標準偏差が小さくなり、右図はバラツキが大きい=標準偏差が大きくなります。

このように、平均値が同じであっても、母集団のバラツキ度合いによって標準偏差は変わってくるのです。

 

標準偏差の計算式

標準偏差は、以下の計算式で表されます。(標準偏差はσ(シグマ)の記号で表されます)

標準偏差σ = 分散^(1/2)

分散とは、数値データのばらつき具合を表すための指標です。

このとき分散は、以下の計算式から求められます。

分散 = ∑(各データの値 ー 母集団の平均値)^2

つまり、分散とは各データの値と平均値の2乗の総和になります。

例えば、以下のように5つのデータがある場合、分散は矢印の長さの2乗の和になります。

分散の意味を図解する

2乗にすることで、平均値に比べて大きくても、小さくても、正の値でバラツキを表せます。

しかし、分散のままだと、単位が元の単位の2乗のままになってしまうので、分散の平方根をとることで元データの単位とあわせることができます。

その分散の平方根が、標準偏差となり、バラツキの大きさを表す指標として使われます。

 

標準偏差の計算例

実際の標準偏差の計算例を見てみましょう。

母集団Aと母集団Bに、以下のようにそれぞれ10個のデータがあるとします。

母集団A 5 6 4 3 2 5 4 3 5 4 平均4.1
母集団B 9 2 10 3 1 4 2 7 2 1 平均4.1

どちらの母集団も、平均値は4.1で同じですが、一見すると母集団Bの方がバラツキが大きく見えます。

 

分散から標準偏差を求める方法

標準偏差の計算式に従って、まず母集団Aと母集団Bの分散を求めてみます。

母集団Aの分散

= (5-4.1)^2 + (6-4.1)^2 + (4-4.1)^2 +・・・+ (4-4.1)^2

= 1.43

母集団Bの分散

= (9-4.1)^2 + (2-4.1)^2 + (10-4.1)^2 +・・・+ (1-4.1)^2

= 11.21

上記の計算から求めた分散の平方根をとると、以下のように標準偏差を計算できます

母集団Aの標準偏差 = 1.43^(1/2) = 1.2

母集団Bの標準偏差 = 11.21^(1/2) = 3.3

このように標準偏差を求めることにより、数値的にも母集団Bの方がバラツキが大きいことが定量的にわかるようになります。

 

エクセルで標準偏差を求める方法

標準偏差を求めるのに分散を毎回計算するのは大変ですが、エクセルの関数を使えば母集団のデータから1発で標準偏差を求めることができます。

そのエクセルの関数とは、STDEV関数です。

先ほどの例でみると、母集団Aの場合、以下表の一番左の数値5から一番右の数値4のところをSTDEV関数で選択すれば簡単に求めることができます。

同じく母集団Bの標準偏差を求める場合は、以下表の一番左の数値9から一番右の数値1までの範囲でSTDEV関数を適用します。

母集団A 5 6 4 3 2 5 4 3 5 4 平均4.1
母集団B 9 2 10 3 1 4 2 7 2 1 平均4.1

以下、実際にSTDEV関数を使って標準偏差を求めている画面です。

標準偏差をエクセルで求める

 

標準偏差のビジネスにおける使い方:事例

標準偏差のビジネスでの活用事例を2つ紹介します。

 

品質管理における使い方

ある母集団が、平均値を頂点とした理想的な分布(正規分布)をしていると仮定した場合、標準偏差σは次のような意味を持ちます。

  • 平均値±1σの間に全データの68.27%が分布している。
  • 平均値±2σの間に全データの95.45%が分布している。
  • 平均値±3σの間に全データの99.73%が分布している。
  • 平均値±6σの間に全データの99.999997%が分布している。

これを正規分布表を使って表すと、以下のようになります。

この考え方は、品質管理で応用されていて、品質管理では特に±3σが使われます。

例えば、ある部品の寸法が100mmで、その設計上の許容差が±0.5mmだとして、部品を母集団から300個抜き取って、寸法を計測した結果、標準偏差σが0.1mmだとします。

規格上の許容差:±0.5mm

±3σ:±0.3mm

この結果を見ると、部品の寸法がバラついて3σになっても、許容差の範囲内に入っているので、想定外の製造上のバラツキが起きても十分な余裕があると言えます。

標準偏差を品質管理に活用した事例

(この事例のように、許容差と標準偏差から製造工程の能力的な余裕を示す指標を工程能力指数と言います。詳細を知りたい場合は、工程能力指数で検索してください。)

このように標準偏差は、品質管理をする上で重要な指標として製造現場で活用されているのです。

他にも、経営改善にも使われるシックスシグマ(6σ)のシグマも元は標準偏差・バラツキからきていて、正常な範囲を6σまで許容できるとエラーが起きる確率が100万分の3や4まで下げられるところからシックスシグマと名付けられています。

【5分でわかる】シックスシグマとは 5つの分析プロセスを解説シックスシグマとは、企業活動で発生するばらつきをおさえて、経営品質の改善を図るための経営改善手法のことです。 シックスシグマは、日...

 

定量的なリスク管理における使い方

ビジネスにおける定量分析の世界では、標準偏差のことをリスクといいます。

つまり、「リスクが大きい=バラツキが大きい」ということになります。

例えば、次のように将来3パターンのシナリオに分かれる投資機会Aがあるとします。

投資機会A

パターン 収益 確率
シナリオA 100万円 20%
シナリオB 50万円 60%
シナリオC 5万円 20%

このとき、収益の期待値は次のようになります。

期待値 = 100万×0.2 + 50万×0.6 + 5万×0.2 = 51万円

ここから標準偏差を求めるには、まず分散(標準偏差の2乗)を求めます。

分散 

= (100万-51万)2×0.2 + (50万-51万)2×0.6 + (5万-51万)2×0.2

= 904万円2

分散の平方根をとると標準偏差は、以下のようになります。

標準偏差 = 約30万円

これを期待値が同じ51万円になるような次の投資機会Bと比べてみます。

投資機会B

パターン 収益 確率
シナリオA 71万 50%
シナリオB 31万 50%

期待値が同じなので、投資機会Aでも投資機会Bでも、どちらに投資してもよさそうに見えますが、リスクの観点から比較してみると異なる結果になります。

投資機会Bの標準偏差を投資機会Aと同じように計算すると、以下のようになります。

標準偏差 = 約20万円

つまり、投資機会Aと投資機会Bは全く期待値は同じですが、投資機会Bの方がよりリスクの低い投資だということがわかります。

このように標準偏差は、リターンに対するリスク分析としても活用できるのです。

 

標準偏差を活用した偏差値とは

標準偏差を使った指標のひとつとして、学力テストで出てくる偏差値があります。

偏差値とは、簡単に言うと、母集団の中で自分がどの程度の順位に位置しているかを示したものです。

 

偏差値の意味合い

仮に試験の点数が正規分布に従って分布している場合、偏差値と順位には次のような関係があります。

偏差値 上位からの%
75 0.62%
70 2.28%
65 6.68%
60 15.87%
55 30.85%
50 50.00%
45 69.15%
40 74.13%
35 93.32%

 

例えば、試験を受験した人が10,000人いるとすると、偏差値75だと上位から62人に位置していることになり、偏差値70だと上位から228人に位置していることになります。

しかし、実際のテストの点数が完全な正規分布になることはまずないので、偏差値と順位の関係はあくまで目安として捉える必要があります。

 

偏差値の求め方-エクセルで簡単に求められる

テストの点数の偏差値は、以下のように計算できます。

(テストの点数 - テストの平均点) ÷ 標準偏差 × 10 + 50

計算式を見てわかるように、テストの点数が平均点と同じであれば、偏差値は50になります。

例えば、あるテストの分布が、以下のようになっていたとします。

生徒 A B C D E F G H I J 平均
母集団 70 81 66 54 90 49 67 78 77 55 68.7

このとき、エクセルのSTDEV関数を使って標準偏差を求めると、13.18になります。

標準偏差13.18と、上記の偏差値の式から、生徒A~Jの偏差値は次のように計算できます。

生徒 A B C D E F G H I J 平均
母集団 70 81 66 54 90 49 67 78 77 55 68.7

偏差値

51.0 59.3 48.0 38.8 66.2 35.1 48.7 57.1 56.3 39.6

生徒の母集団が10人と少ないことと、点数が正規分布に沿って分布していないので、偏差値の目安となる順位とは異なっていますが、偏差値によって自分がどのあたりに位置づけられているかの目安にすることができます。

 

まとめ

以上、標準偏差の解説でした。

  • 標準偏差とは、母集団の中にあるデータのバラツキを示したものである。
  • 標準偏差は分散の平方根として求められる。分散は各データと平均値の差を2乗したものの総和である。
  • 標準偏差はエクセルのSTDEV関数を使うと、簡単に計算できる。
  • データが正規分布していると仮定すると、標準偏差を使うことで製造工程の信頼性を定量的に表すことができるので、標準偏差は品質管理によく応用されている。
  • 定量分析においては、標準偏差をリスクと考えることもできる。例えば、同じ期待値の投資機会であっても、標準偏差によってリスクの度合いを定量化できる。
  • 学力テストで使われる偏差値も標準偏差を活用して求められる指標である。

 

仕事に役立つ知識や能力を

オンライン講座で
プレゼンなどのビジネススキルを
1講座単位で学べます!

\15万講座から選べる/

おすすめ講座10選を見る>>