疑似相関 – 本当の相関関係ではないのに相関関係のように見えてしまう現象
AI初心者
先生、疑似相関ってなんですか?
AI研究家
疑似相関は、実際には相関関係のない二つの事象があたかも相関関係があるように見えてしまう現象のことだよ。
AI初心者
例えば、なんですか?
AI研究家
例えば、人口が増えると犯罪数も増加するという相関関係と人口が増えるとお店の数も増加するという相関関係が存在する場合、あたかもお店の数が増加すると犯罪数も増加するという相関関係があるように見えてしまうんだ。でも実際にはそんな相関関係はないんだよ。この場合、人口の増加という第3の定数によって疑似相関が生じているんだ。
疑似相関とは。
「疑似相関」とは、実際には関係のない2つの現象が、あたかも相関関係があるかのように見えてしまう現象のことです。
例えば、人口の増加に伴い、犯罪数も増加するという強い相関関係があり、一方、人口の増加に伴い、店舗数も増加するという強い相関関係があるとしてみましょう。このとき、一見、店舗数の増加が犯罪数の増加につながるという相関関係があるかのように見えます。しかし、実際にはそのような関係はありません。
この場合、人口の増加という第3の要因が、疑似相関を引き起こしています。すなわち、人口の増加が犯罪数と店舗数の両方に影響しているのです。
疑似相関とは
疑似相関とは、2つの事象の間に相関関係があるように見えているものの、実際には何の関係もない現象です。これは、タイミングが偶然重なったり、第三の変数が影響を与えたりするため、相関関係が偽って示される場合があります。 疑似相関の例としては、アイス クリームの売上がサメの襲撃数の増加と相関しているといったものが挙げられます。しかしながら、単に夏の間はどちらも増える傾向があるだけで、実際には因果関係はありません。
疑似相関の例
疑似相関とは、実際の相関関係が存在しないにもかかわらず、まるで相関があるかのように見える現象です。この錯覚が起きる理由は、第三の要因が両方の変数に同時に影響を与えるためです。
疑似相関の例としては、アイスクリームの販売量と溺死者の数の相関関係が挙げられます。一見すると、両者が正の相関があるように思えるかもしれませんが、実際には暑い気温という第三の要因が両者に影響を与えています。つまり、気温が高いとアイスクリームの販売量が増加し、同時に水泳や水辺でのアクティビティが増加するため、溺死者の数も増加するのです。
疑似相関を防ぐ方法
-疑似相関を防ぐ方法-
疑似相関によるデータ解釈の過ちを防ぐには、以下の方法が役立ちます。
* –変数の有意性を調べる-有意な相関関係であることを確認し、単なる偶然ではないことを確認します。統計的手法(t検定やカイ二乗検定など)を使用して、相関関係が統計的に有意かどうかを決定します。
* –外れ値を特定する-単一の外れ値が相関関係に影響を与えていないことを確認します。外れ値とは、他のデータポイントから大きく異なるデータポイントです。相関関係を確認する前に、外れ値を削除または変形します。
* –共変量を考慮する-潜在的な共変量(両方の変数に影響を与える第三の要因)を特定します。共変量は、相関関係に影響を与える可能性があるため、共変量を考慮した上で相関関係を分析します。
* –理論的根拠を確認する-相関関係が合理的な理論的根拠に基づいていることを確認します。相関関係の意味が理解できるかどうか検討し、直感的に理にかなっているかどうかを調べます。
疑似相関と真の相関関係の違い
疑似相関と真の相関関係の違い
疑似相関とは、2つの変数が互いに影響を与えていないにも関わらず、統計的に関係があるように見える現象のことを指します。この種の相関は、偶然によって生じたり、他の共有原因によって引き起こされたりします。一方、真の相関関係は、2つの変数が互いに直接または間接的に影響を与えていることを示しています。例えば、気温の上昇とアイスクリームの売上量の増加の間には、より高い気温が人々をアイスクリームを求めさせるという因果関係があります。これは真の相関関係の一例です。疑似相関と真の相関関係を区別することは、データから有効な結論を導き出すために重要です。
疑似相関に注意すべき理由
疑似相関に注意すべき理由として、それらは科学的推論を誤らせてしまうためです。疑似相関はしばしば、一見関係がありそうに思える2つの変数間の相関関係を表していますが、実際には何の因果関係もありません。このような誤った関連性を信じてしまうと、間違った結論を導き、適切でない決定を下す可能性があります。さらに、疑似相関は科学的進歩を妨げる可能性があります。本来関連のない変数間の相関関係があると誤って信じ込んでしまうと、真の因果関係の発見が遅れることになりかねません。