Korrelaation ja syyn aiheuttaman sekaannuksen selvittäminen 

Tässä on historiallinen tidbit, jota et ehkä tiedä. 1860in ja 1940in välisenä aikana New Englandissa asuvien metodistiministerien määrä lisääntyi, joten myös Bostoniin tuodun Kuuban rommin määrä lisääntyi - ja molemmat kasvoivat erittäin samankaltaisesti. Näin ollen metodistiministerit ovat ostaneet paljon rommia tuona aikana!

Oikeastaan ​​ei, se on typerä johtopäätös. Se, mitä todella tapahtuu, on, että molemmat määrät - metodistiministerit ja Kuuban rommi - johtuivat muista tekijöistä, kuten väestönkasvusta.

Saavuttaessamme tämän väärän johtopäätöksen olemme tehneet aivan liian yleisen virheen sekaannusta syy-yhteyden kanssa.

Mitä eroa?

Kaksi määrää sanotaan olevan korreloi  jos molemmat kasvavat ja laskevat yhdessä ("positiivisesti korreloivat"), tai jos se kasvaa, kun muut vähenevät ja päinvastoin ("negatiivinen korrelaatio").

Korrelaatio havaitaan helposti tilastollisten mittausten avulla Pearsonin korrelaatiokerroin, joka osoittaa, kuinka tiiviisti lukittu yhteen nämä kaksi määrää, vaihtelevat -1: sta (täydellisesti negatiivisesti korreloitu) 0: n (ei ollenkaan korreloitu) ja 1: n (täysin positiivisesti korreloitu) kautta.


sisäinen tilausgrafiikka


 causation1tylervigen.com

Mutta vain siksi, että kaksi määrää korreloidaan, ei välttämättä tarkoita, että yksi on suoraan aiheuttaen toinen muuttuu. Korrelaatio ei tarkoita syy-yhteyttä, samoin kuin pilvinen sää ei tarkoita sademäärää, vaikka päinvastoin on totta.

Jos kaksi määrää korreloidaan, voi olla todellinen syy-seuraus-suhde (kuten sademäärät ja sateenvarjo-myynti), mutta ehkä muut muuttujat ajavat molempia (kuten merirosvojen numerot ja ilmaston lämpeneminen), tai ehkä se on vain sattumaa (kuten Yhdysvaltain juuston kulutus ja strangulations-by-bedsheet).

Vaikka syy-yhteys on olemassa, meidän on oltava varovaisia, ettemme sekoita syytä vaikutukseen, tai voisimme esimerkiksi päätellä, että lämmittimien lisääntynyt käyttö aiheuttaa kylmempää säätä.

Syy-seurauksen määrittämiseksi meidän on mentävä tilastojen ulkopuolelle ja etsittävä erillisiä todisteita (tieteellistä tai historiallista luonnetta) ja loogista päättelyä. Korrelaatio voi kehottaa meitä etsimään tällaisia ​​todisteita ensinnäkin, mutta se ei missään tapauksessa ole todiste itsestään.

Hienoja ongelmia

Vaikka edellä mainitut esimerkit olivat ilmeisesti typeriä, korrelaatio on usein virheellinen syy-yhteydellä tavalla, joka ei ole heti ilmeinen reaalimaailmassa. Tilastojen lukemisen ja tulkinnan yhteydessä on huolehdittava siitä, että ymmärrämme tarkasti, mitä tietoja ja sen tilastot viittaavat - ja mikä tärkeintä, mitä he ovat emme mikä.

 causation2

Viime aikoina esimerkki siitä, että tietojen tulkinnassa on oltava varovaisuutta, on tänä vuonna jännittävä ilmeinen uraauurtava jännitys gravitaatioaaltojen havaitseminen - ilmoitus, joka näyttää olevan tehty ennen aikojaan, ennen kuin kaikki tiedot vaikuttavat muuttujat on otettu huomioon.

Valitettavasti tilastojen, todennäköisyyksien ja riskien analysointi ei ole taitosjoukko, joka on yhdistetty meidän ihmisen intuitio, ja niin on liian helppo johtaa harhaan. Koko kirja on kirjoitettu hienovaraisilla tavoilla, joilla tilastoja voidaan tulkita väärin (tai käyttää harhaan). Jotta voisit säilyttää vartijasi, tässä on joitakin tavallisia liukkaita tilastollisia ongelmia, joista sinun pitäisi olla tietoinen:

1) Terveellisen työntekijän vaikutus, jossa joskus kahta ryhmää ei voida suoraan verrata tasapuolisiin toimintaedellytyksiin.

Tarkastellaan hypoteettista tutkimusta, jossa verrataan toimistotyöntekijöiden ryhmän terveyttä astronauttien ryhmän terveyteen. Jos tutkimuksessa ei ilmene merkittävää eroa näiden kahden - ei terveydentilan ja työympäristön välisen korrelaation - välillä, päätellään, että avaruudessa asuvalla ja työskentelevällä ei ole pitkäaikaisia ​​terveysriskejä astronauteille?

Ei! Ryhmät eivät ole samassa asemassa: astronauttijoukkojen näytön hakijat etsivät terveitä ehdokkaita, jotka sitten ylläpitävät kattavaa kuntojärjestelmää, jotta taistellaan ennalta ehkäisevästi "mikrograviteetissa".

Siksi odotamme, että ne ovat keskimäärin huomattavasti terveempiä kuin toimistotyöntekijät, ja heidän pitäisi olla oikeutetusti huolissaan, jos he eivät olisi.

2) Luokittelu ja vaiheen muuttoliike - ihmisten sekoittaminen ryhmien välillä voi vaikuttaa dramaattisesti tilastollisiin tuloksiin.

Tätä kutsutaan myös nimellä Will Rogers sen jälkeen, kun USA: n koomikko, joka ilmoitti väitetysti

Kun Okies lähti Oklahomasta ja muutti Kaliforniaan, he nostivat keskimääräistä älykkyystasoa molemmissa valtioissa.

Kuvittele, kuvittele, että suuri joukko ystäviä jaetaan "lyhyeksi" ryhmäksi ja "korkealle" ryhmäksi (ehkä järjestääkseen ne valokuvaan). Tämän jälkeen on yllättävän helppoa nostaa molempien ryhmien keskimääräinen korkeus kerralla.

Yksinkertaisesti kysy "korkeimman" ryhmän lyhyimmältä henkilöltä "lyhyt" -ryhmään. ”Pitkä” -ryhmä menettää lyhyimmän jäsenensä, jolloin se törmää keskikorkeuteensa - mutta ”lyhyt” ryhmä saa vielä korkeimman jäsenensä ja siten myös keskimääräisen korkeuden.

Tällä on merkittäviä vaikutuksia lääketieteellisiin tutkimuksiin, joissa potilaat lajitellaan usein "terveiksi" tai "epäterveiksi" ryhmiksi uuden hoidon testauksen aikana. Jos diagnoosimenetelmät paranevat, joitakin hyvin vähän-epäterveellisiä potilaita voidaan luokitella uudelleen - mikä johtaa molempien ryhmien terveydellisiin tuloksiin, riippumatta siitä, kuinka tehokas (tai ei) hoito on.

 causation3Tietojen kerääminen ja valinta voi johtaa virheellisiin johtopäätöksiin. Skeptikot näkevät jäähdytysajan (sininen), kun tiedot osoittavat todella pitkäaikaisen lämpenemisen (vihreä). skepticalscience.com 

3) Tietojen louhinta - kun tietoja on runsaasti, bittejä ja paloja voidaan kirsikkailla valita halutun johtopäätöksen tueksi.

Tämä on huono tilastokäytäntö, mutta jos se tehdään tarkoituksella voi olla vaikea havaita ilman alkuperäistä täydellistä tietokokonaisuutta.

Tarkastellaan yllä olevaa kaaviota, jossa esitetään esimerkiksi kaksi globaalilämpötietojen tulkintaa. Tai fluoridi - pieninä määrinä se on yksi tehokkaimmista ennalta ehkäisevistä lääkkeistä historiassa, mutta positiivinen vaikutus häviää kokonaan, jos harkitaan vain myrkyllisiä määriä fluoria.

Samanlaisista syistä on tärkeää, että tietyn tilastokokeen menettelyt vahvistetaan paikalleen ennen kokeen alkamista ja pysyvät muuttumattomina, kunnes koe päättyy.

4) klusterointi - joka on odotettavissa jopa täysin satunnaisissa tiedoissa.

Harkitse lääketieteellistä tutkimusta, jossa selvitetään, miten tietty tauti, kuten syöpä tai multippeliskleroosi, on maantieteellisesti. Jos sairaus sattuu satunnaisesti (ja ympäristöllä ei ole vaikutusta), odotamme tietysti nähdä lukuisia potilaiden klustereita. Jos potilaat jakautuvat täydellisesti tasaisesti, jakautuminen olisi todellakin satunnaisinta!

Joten yhden klusterin läsnäolo tai joukko pieniä tapausryhmiä on täysin normaalia. Hienostuneita tilastollisia menetelmiä tarvitaan, jotta voidaan määrittää, kuinka paljon klustereita tarvitaan, jotta voidaan päätellä, että jotain tällä alueella saattaa aiheuttaa sairauden.

Valitettavasti mikä tahansa klusteri - jopa ei-merkittävä - tekee helpon (ja ensi silmäyksellä, pakottavan) uutisotsikon.

 causation4

Tilastollista analyysia, kuten mitä tahansa muuta tehokasta työkalua, on käytettävä hyvin huolellisesti - ja erityisesti on aina oltava varovainen, kun tehdään päätelmiä, jotka perustuvat siihen, että kaksi määrää korreloidaan.

Sen sijaan meidän on aina vaadittava erillisiä todisteita syyn ja seurauksen toteamiseksi - ja että todisteet eivät tule yhdeksi tilastolliseksi numeroksi.

Näennäisesti pakottavia korrelaatioita, eli annettujen geenien ja skitsofrenia tai välillä a runsasrasvainen ruokavalio ja sydänsairaudet voivat perustua hyvin epäilyttävään menetelmään.

Olemme kenties kognitiivisesti huonosti valmistautuneita lajeja käsittelemään näitä asioita. Kanadan kouluttajana Kieran Egan laita se kirjansa Väärinkäytön aloittaminen:

Huono uutinen on, että evoluutiomme tarjosi meille elää pienissä, vakaissa, metsästäjä-keräilijöissä. Me olemme Pleistocene-ihmisiä, mutta kielen aivomme ovat luoneet massiivisia, monikulttuurisia, teknologisesti kehittyneitä ja nopeasti muuttuvia yhteiskuntia, jotta voimme elää.

Tämän vuoksi meidän on jatkuvasti vastustettava kiusausta nähdä sattumanvaraisuus ja sekoittaa korrelaatio ja syy-yhteys.Conversation

Tämä artikkeli julkaistiin alunperin Conversation
Lue alkuperäinen artikkeli.


Tietoja Tekijät

borwein jonathanJonathan Borwein (Jon) on Newcastlen yliopiston matematiikan professori. Hän on matematiikan professori Newcastlen yliopistossa ja tietojenkäsittelytieteen matematiikan keskuksen johtaja ja sen sovellukset (CARMA). Hän on työskennellyt Carnegie-Melonissa, Dalhousessa, Simon Fraserissa ja Waterloon yliopistossa ja hänellä on ollut kaksi Kanadan tutkimusjohtajaa laskennassa.

nousi michaelMichael Rose on tohtorikoulutettava, Newcastlen yliopiston matematiikan ja fysiikan tiedekunta. Matematiikan tohtorikoulutettava professori Jon Borweinin valvonnassa Newcastlen yliopistossa Australiassa. Tällä hetkellä autetaan tutkimuksessa fractal-matematiikan soveltamisesta aivojen synapsien jakautumiseen.

Tiedonanto: Kirjoittajat eivät toimi, konsultoivat, omistavat osakkeita tai saavat rahoitusta yrityksiltä tai organisaatioilta, jotka hyötyvät tästä artikkelista. Heillä ei myöskään ole asiaankuuluvia sidoksia.


Suositeltu kirja:

Raha, Seksi, Sota, Karma: Huomautuksia buddhalaiselle vallankumoukselle
esittäjä (t): David R. Loy.

Raha, sukupuoli, sota, Karma: David R. Loyn buddhalaisen vallankumouksen muistiinpanot.David Loy on tullut yksi buddhalaisen maailmankuvan voimakkaimmista kannattajista, joka selittää kuin kukaan muu sen kyvystä muuttaa nykyajan maailman sosiopolitiikkaa. Sisään Raha, Seksi, Sota, Karma, hän tarjoaa teräviä ja jopa järkyttäviä selkeitä esityksiä väärin ymmärretyistä buddhalaisista niitteistä - karman toiminnasta, itsensä luonteesta, ongelmien syistä sekä yksilöllisestä että yhteiskunnallisesta tasosta - ja todellisista syistä, jotka johtavat kollektiiviseen "koskaan tarpeeksi , "onko se aika, raha, sukupuoli, turvallisuus ... jopa sota. Davidin "buddhalainen vallankumous" ei ole mitään muuta kuin radikaalia muutosta tapoissa, joilla voimme lähestyä elämäämme, planeettamme, kollektiivisia harhaluuloja, jotka kieltävät kielemme, kulttuurimme ja jopa hengellisyytemme.

Klikkaa tästä saadaksesi lisätietoja ja / tai tilata tämän kirjan Amazonista.