形式:テキスト
ウェブサイト
言語/秒:英語
対象読者:自己指向学習
学部
短い説明:
この記事では、相関または関連が因果関係と混同されてい
:
- 1-3 関連は因果関係と同じではありません
詳細
悲しいことに、あなたがそれを何度言っても、あなたはまだ次のような見出しが表示されます:
- ポルノを見ることは脳を収縮させる
- 光を当てて寝ることは肥満のリスクを増加させる
- 目的意識は”人生に年を加える”。
上記の主張はすべて、物語自体が基づいていた証拠に基づいて根拠がありません。 これらの根拠のない主張は、人々が因果関係との関連(相関)を混同しているために生じている。
だから、あなたがこの現象を説明し、なぜそれに惑わされないことが重要なのかを理解するのを助けるために、私たちは小さな資源を集めました。
ビデオを見る
チャンス協会
ジャスティンビゲンは、スプリアス相関と呼ばれる華麗なウェブサイトを作成しました。 彼はデータセットをトロールし、彼が関連付けを思い付くまでパラメータを一致させます。 例えば、下のグラフでは、彼は米国のモッツァレラチーズの一人当たりの消費量と土木工学で授与された博士号の数との間に強い関連を示しています。
チーズ桁をhazできますか?
相関係数は、2つの変数がどの程度密接に関連しているかの尺度です。 関連の良い例は、身長と体重です–背の高い人は重くなる傾向があります。 相関係数が1に近いほど、変数が関連しています。 上記の例では、相関係数は0.95であり、強い関連性を示唆しています。
しかし、相関の統計的検定は”盲目”であり、彼らは数字のパターンについてのみ教えてくれます。 彼らは考えられる因果関係、または私たちが知らない他の要因については何も言いません。
Justinが強調している問題は、データをトロールするほど、より多くのパターンが表示されるということです。 そして、より多くの我々はパターンのためにトロール、より多くの可能性が高いそれは我々が見つけるパターンは、単にチャンスの関連付けを反映してい
プールでの溺死による死亡とNicolas Cageをフィーチャーした映画の数(相関0.66)、またはノルウェーからの米国の石油輸入対列車で死亡した運転手(0.95)など、明らかに無関係な変数を比較している限り、これは問題ないかもしれません。
しかし、私たちはちょうどもっともらしい接続を持っていることが起こる二つの変数の間の偶然の関連付けを見つけた場合はどうなりますか? 私たちはチーズを食べることはあなたに悪夢を与えると思うとしましょう。 これは投げ、回り、あなたのベッドシーツでもつれさせて得るかもしれない。 たぶん、あなたは座って、悲鳴を上げ、ベッドから落ちて、あなたの手足がすべて絡み合っていて、あなたの秋を壊すことができないので、あなたの首を
相関co-efficient=0.94。 警告してないと言うな!
その例があなたにとってあまりにも愚かな場合、コンピュータゲームに対するヒステリーはどうですか? 私達は頻繁に激しいコンピュータゲームをすることからの潜在的な害についての媒体のレポートを見る。 最近、イギリスの検死官は、コンピュータゲームのコールオブデューティを「10代の若者の死に関する3つまたは4つの調査」の要因として引用しました。 しかし、これは驚くべきことではありません:あなたはハード最近の過去に暴力的なコンピュータゲームをプレイしていないティーンエイジャーを見つ
この傾向は稀な事象に限定されない。 ビッグデータは、例えば、パターンを探して大規模なデータセットをトロール。 私達は頻繁にヘルスケアの研究のこのアプローチの潜在的な利点についての要求を見る。 その意味は明確でなければなりません–必然的に膨大な数の偽の相関がスローされます。 そして、”信じる”ことはあまりにも頻繁に”見る”ことです。
相関関係への過度の依存は、それが偶然である可能性があるときに2つの現象の間に因果関係があると信じる本当のリスクを作り出します。 実際には、それはリスクではない、それは避けられません。
漫画をクリックして記事全文を読む
レトロスペクティブではなく、
これが、システマティックレビューがデータ分析を行う前に関心のある変数を定義することを主張する理由である。 この”前向き”(”遡及的”とは対照的に)アプローチは、偶然の相関によって脱線する可能性ははるかに低い。
同じルールは、治療の公正なテストのために行きます。 試験のためのプロトコルは、研究の前に、どの関係が調査されるべきかを明確に定義しなければならない。
試験が実施された後に研究者が相関関係を探しに行くならば、彼らはおそらく誤解を招く発見を思いつくでしょう。
これは最近の統計的に面白いブログで包括的にカバーされています”最初は成功しない場合は、お風呂の中で赤ちゃんを探しに行かないでください”
未テストの理論と希望的観測の力
“捜せば、あなたがたは見つけるであろう”(マタイによる福音書第7章7節)。
誰も彼らが時間を無駄にしていると思うのが好きではありません。 あなたが何らかの行動をとり、望ましい結果がそれに続くならば、それをもたらしたのはあなたの行動であったに違いないと仮定する誘惑は常に
タバコの喫煙の初期には、あらゆる種類の健康上の利点がそれに起因していました。 私たちが他の場所で指摘しているように、スコットランドのジェームズVIは、彼の”タバコへの対抗”でこのすべての上にありました。 人々は風邪をひいた、人々はタバコを吸った、彼らは良くなったので、彼らはタバコがそれらを治癒したと信じていた。
彼らを治したのはタバコだったのか? それとも、彼らはとにかく良くなっているだろうか? 私たちが信じているものは、私たちが信じることを期待する(または望む)ものに非常によく依存するかもしれません。
これは優れたxkcdウェブコミックでうまく説明されています:
私たちは、テストの治療法を読むことで、治療に関する主張をよりよく評価することができると思いますが、誰かが無作為化試験を行うまで確信することはできません。
一方、人々が相関と因果関係の違いを見分けるのを助けるために、あなたの有益な例を送ってください。
Matt PenfoldとRobin Massartに感謝します。
- 男性の脳収縮に関連するポルノを見ています。 NHSの選択肢30th May2014
- ポルノを見ることは脳を収縮させる:研究者は、ポルノを見ることと身体的危害との間の最初の可能性のあるリンクを見つ Daily Mail,May30 2014
- は肥満に関連する明るい部屋で眠っていますか? NHS Choices,30Th May2014
- 光で寝ることは肥満のリスクを増加させます。 The Daily Telegraph,May30 2014
- 人生の目的を持つ人々は”長生きする”と研究は助言しています。 NHS Choices,14Th May2014
- 目的の感覚は”人生に年を追加します”。 BBCニュース、2014年5月14日
- 偽の相関。 Accessed2nd June2014
- 義務と自殺の呼び出し:両親は心配すべきですか? The Guardian,28Th May2014
- Kayyali B,Knott D and van Kuiken S.米国のヘルスケアにおけるビッグデータ革命:価値と革新を加速させる。 McKinsey&Co,April2013
- Shah S,Horne A and Capellá J. 良いデータは良い決定を保証するものではありません。 Harvard Business Review,April2012
- Bastian H.最初に成功しない場合は、風呂の中で赤ちゃんを探しに行かないでください,統計的に面白いです,16Th March2014.