Ns spirit 投資学・経営学研究室

投資・経営の基礎を網羅した「投資学・経営学研究室」のブログ版です。ビジネスパーソンに必須となる基礎知識・基礎スキル、仕事やキャリアに関する情報を中心に発信していきます。

【5分でわかる】相関係数・回帰分析とは 複数事象の相関がわかる定量分析手法

相関係数・回帰分析
2つ以上の変数の相関をみる指標に、相関係数があります。また、それをグラフで表現する方法として、回帰分析があります。

 

相関係数
相関係数とは、2つの変数の相関関係を示す指標です。相関係数は必ず-1~1の範囲に収まり、0.7以上あれば正の相関(片方の値が上がれば、もう片方の値が一定の割合で上がる関係)があると考えられます。

逆に-0.7以下であれば負の相関(片方の値が上がれば、もう片方の値が一定の割合で下がる関係)があるとされています。相関係数が1のときは、2つの変数は完全に正の相関があることになります。逆に-1のときは、2つの変数は完全に負の相関があることになります。

相関係数はエクセルのCORREL関数を用いれば、簡単に求めることができます。下の表の場合は、「相関係数=CORREL(A1:J1 , A2:J2)」となります。

  A B C D E F G H I J
1 10 12 3 14 4 10 6 11 9 11
2 16 17 3 26 7 18 10 15 15 14


この場合相関係数は0.937でかなり相関が強いことになります。

 

回帰分析
回帰分析とは、ある原因に対し、結果となる数字がどのような関係を持っているかを調べる際に用います。例えば、原因となる値をXとして、結果となる値をYとすると、次のような式で表すことができます。

 Y = a・X + b 、 Y = a・Xb 、 Y = a・eX 、 Y = a・logX

上記の相関係数で使った値をグラフにすると、次のようになります。



ここでR2値とは、ある現象がその回帰式で表される確率というように考えればOKです(したがって、例のグラフの場合9割方は描いた回帰式で説明がつくということになります)。

R2値は一般的には、0.5~0.8なら、回帰式が成立する可能性がありそうで、0.8以上であれば、成立する可能性がかなり高いことを示します。(直線近似の場合は、R2=相関係数の2乗になります)

 

エクセルを使った回帰分析
1.エクセルで回帰分析をするときは、グラフ上で、近似曲線を追加するを選択します。
近似曲線の描き方

2.近似曲線の種類を選びます。
近似曲線の種類

3.「グラフに数式を表示する」と「グラフにR-2乗値を表示する」を追加します。
近似曲線のR値

 

重回帰分析
重回帰分析とは、次の式のように、ある結果となる変数に対して、原因となる変数が2つ以上ある場合に行う回帰分析のことです。

 Y = a1・X1 + a2・X2 + a3・X3 + ・・・ + b

行1には、行2と行3の変数からなる関係があるとします。

  A B C D E F G H I J
1 10 12 3 14 4 10 6 11 9 11
2 16 17 3 26 7 18 10 15 15 14
3 10 11 2 15 5 9 6 13 7 14


重回帰分析は、エクセルの「ツール」→「分析ツール」の中にある回帰分析を使うと求められます。

重回帰分析の方法

ここから、次のような関係が導かれます。

 Y = 0.24・X1 + 0.49・X2 + 1.046

重回帰分析では、次の2つの値に注意する必要があります。(いずれも上のやり方で自動的に出てくる数字です)

■t値
t値、エクセルを使って、回帰分析をすると自動的に出てきます。この値が大きい変数は、出力側の変数(例の場合Y)との関係性が強くなります。また、この値が2を超えているかどうかが、入力側の変数(例の場合X)として採用するかどうかの判断材料になります。

■P値
P値も、エクセルと使うと自動的に出てきます。この値が、0.05よりも大きいときは、入力側の変数(例の場合X)として採用しないほうがよいとされています。


また、重回帰分析では、相関の強い変数を2つ以上採用することは避けるべきだと考えられます。例えば、家賃の変数として、駅からの距離と地価を変数にした場合、駅からの距離と地価に強い相関があると、どちらかの数字がt値またはP値の基準がNGになってしまいます。

 

相関係数・回帰分析を用いる際の注意点
分析の前提・次のアクションにつながるかを押さえる
回帰分析は、現象の傾向を表すのに非常に有効なツールです。しかし、回帰分析はやり方次第で、いくらでもそれらしい線を引くことができます。うまく近似曲線をひけたとしても、その近似線で説明できる前提を押さえたり、その近似曲線がわかることで次にどんなアクションにつなげられるかを考えたりすることが非常に重要です。


相関があるからといって因果関係があるわけではない
回帰分析で高い相関が発見できても、それらに因果関係があるとまでは言い切れないません。実際にグラフに示したみたり、定性的に考えて第3の因子を考えたりすることが重要になります。(例えば、年収に対する糖尿病患者の割合に相関があっても、2者には直接的な因果はなく、それは第3の因子である食生活との因果関係である可能性が高いといえます。)


相関から外れたところの扱いに注意
回帰分析をしてグラフを見ると、近似線から明らかに外れたデータが出てくる場合があります。こうしたデータにはビジネス上の大きなヒントが隠されている場合があるので注意して掘り下げてみることも必要です。もちろん単なるノイズとして、データを省ける場合もあります。


相関の高低の判断はビジネスの種類によって違う
相関があるというためには、相関係数が上述のように一般的に絶対値で0.7くらい(R2値だと0.5くらい)必要ですが、ビジネスの性質によってはそれ以下でも相関関係を深堀して考える場合があります。例えば相関があった場合のリスクが極めて大きい場合などは、相関係数(あるいはR2値)が低くてもしっかり内容を調査していきます。(例えば、医薬品の副作用などは、相関があった場合のリスクが高いものの代表です)

 

まとめ

いかがでしたでしょうか。相関係数と回帰分析は、事象同士の関連性を明らかにするのに有効な手法です。しかも、エクセルを使えば、すぐに求められます。

 

プレゼンや資料の中に相関係数と回帰分析を織り交ぜることで、内容が一段とスマートに見えるようになることでしょう。

 

定量分析をもっと知りたい方は

定量分析の教科書―ビジネス数字力養成講座

定量分析の教科書―ビジネス数字力養成講座

 
MBA定量分析と意思決定

MBA定量分析と意思決定

  • 作者: グロービス・マネジメント・インスティテュート
  • 出版社/メーカー: ダイヤモンド社
  • 発売日: 2014/05/19
  • メディア: Kindle版
  • この商品を含むブログを見る