合同会社モリカワのブログ

森川敬一。CTOとして30年やってきました。集大成としてCTOを増やすという事を目標にやってます。

因果関係と相関関係の違い

因果推論が最近流行ってますね。
きっと機械学習やディープ・ラーニングで因果に関しての考察の場が増えた事で話題になってるんだと思います。
重要な言葉の定義として、因果関係と相関関係の違いを把握しておく必要があります。
# 因果関係があるとは
Aという事象でBが起きた時に因果関係があるといいます。
Aが原因でBが結果です。原因の因と結果の果で因果関係と言われてます。(多分。。汗)
事象Aが発生すると事象Bが発生する。事象Aをやると事象Bが発生する。
事象Aは、不可抗力の場合もあれば、意識的な場合もあるかもしれませんが、事象Bは自動的に発生します。こちらは不可抗力の場合が多いでしょう。

相関関係とは

相関関係は、AとBが同時に起きた相関が高いという事です。相関係数は、一緒に起きているだけなので、どちらかが原因でどちらかが結果という事ではありません。
「目が覚める」と「顔を洗う」は、相関関係はありますが、因果関係はありません。
因果関係と相関関係の違いは、
「雨が降った」 → 「傘が売れた」
これは、因果関係があります。
「英語が得意」 → 「数学が得意」
これは、因果関係はありません。英語が得意でも数学が苦手な人は沢山います。しかし、勉強ができる人は英語も数学も得意な場合が多いことも事実です。なので相関関係が存在します。

因果関係と相関関係の混同の罠

高校の学力テストのデータ分析を行うと、結果として英語の点数が良い人は、数学の点数が良い傾向が高いと出るかも知れません。これは、英語の点数と数学の点数が因果関係しているのではなく、相関として勉強を頑張っている人は、英語も数学も点数が高いという事なので、英語を頑張って勉強すれば数学の点数が上がる訳ではありません。
英語の点数と因果関係があるのは、英語の勉強時間だったり、家庭環境(親が英語喋れたり、海外旅行好き)だったりするでしょう。
この因果関係と相関関係を混同する事で問題なのは、数学の点数を上げるために英語の勉強しても意味がないという事です。逆もしかり、英語の点数を上げるために数学の勉強しても意味がありません。
ここを間違えて対策している事が多いので因果関係と相関関係の混同の罠があると言えます。

因果関係の向きにも注目

バスケット分析で有名な「おむつとビールが同時に購入されていた」という有名な話があります。この現象は、おむつとビールが相関が高いという結果です。因果関係でいうと、母親が日常品の買い物時におむつを一緒に買おうとすると荷物が大変なので、父親が別途おむつを買いに行く。そのついでにビールを買っているという因果関係が存在しそうです。(母親、父親の役目がステレオタイプなのは、ここでは、ご勘弁下さい)
しかし、ビールを買うと、おむつを買うという逆の因果関係にしてしまうと、ビールを買う人におむつをゴリ押しして大失敗に終わる恐れがあります。

それって相関はあるかもだけど、本当に因果関係あるの?

これ言えるとカッコいいですよね。いや、嫌味な奴と思われるでしょうか。。
この図を見て下さい

画像


夏と気温が高いは、因果関係があります。気温が高いとアイスが売れるは、因果関係があります。
しかし、夏とアイスが売れるは、因果関係がありません。相関関係です。
理由は、夏でなくても、気温が高ければアイスは売れるからです。
これが因果関係と相関関係のややこしい所です。 

どうすれば、因果関係が見えるのか

「夏」と「アイスが売れる」に相関が見えた時に、もう一歩踏み込んで見ることです。「夏」と因果関係が深い項目を洗い出し、そこと因果関係がないかという見方です。「夏「」と「気温が高い」の因果関係が見えれば、「気温が高い」と「アイスが売れる」にたどり着く事ができます。そーすれば、秋や冬でも「気温が高い」と「アイスが売れる」という因果の法則が導き出せます。
因果関係があるのか相関関係だけなのか注意深く考えてみる癖をつけるのは、問題の本質を見抜く第一歩だと思います。