相関(分析)では、相関係数という統計値を求めることによって、物事の因果関係を突き止めようとします。
原因となることが大きければ、結果となることも大きくなる、そうした仮説に基づいて分析するのです。
たとえば、
(1)気温が高くなると清涼飲料がよく売れる。
(2)お店の万引きが増えると仕入原価が高くなる。
(3)スタッフの残業時間が増えると顧客からのクレームが多くなる。
のような因果関係です。
(1)であれば、気温が○度の日に、清涼飲料が△本売れた、という「実際のデータ」をたくさん集めて分析します。
気温が説明変数で、清涼飲料の本数が目的変数です。
(2)と(3)の例でいえば、万引きの数と残業時間が説明変数で、原価とクレームの数が目的変数です。
相関係数は、−1から+1までの値をとります。
0という数値が出たら、それは「まったく相関していない(因果関係がない)」ことを意味しています。
1であるなら、「完全に相関している」ことになります。
たいていは、0.1とか、0.2とか、大きくても0.8とかの数字に近いものが得られます。
マイナスの符号が着く場合もありますが、これは「逆相関」と言って、データ数値の並び方が逆になるような相関を意味します。
さて、この相関係数は、どのくらいの数値であると「相関している」、つまり「因果関係がある」ことになるのでしょう。
実は、これは決まっていることではありません。
単に、相関係数0.1なら、「0.1の相関がある」という意味しかありません。
社会現象には、上記の(2)や(3)など直感的には因果関係が分かりにくいものがたくさんあります。
そうした場合、どのあたりで線引きをすべきか。
筆者は今までの経験を通して、0.4〜0.5としております。
PR
【統計てきめん2プレミア】出店判断に必要不可欠な商圏データ(人口や世帯数など)を、簡単スピーディ、安価に集計できるソフトウェア。