Yksityisyys & evästeet
tämä sivusto käyttää evästeitä. Jatkamalla hyväksyt niiden käytön. Lue lisää, mukaan lukien evästeiden hallinta.
(Varoitus: pitkä ja hieman vonkainen)
jos olet kuin minä, olet jatkuvasti turhautunut siihen, että perustutkinto-opiskelijat kamppailevat tilastojen ymmärtämisestä. Itse asiassa, se on lievästi sanottuna: suuri osa opiskelijoista yksinkertaisesti kieltäytyvät ymmärtämästä tilastoja; mainitse vaatimus tilastotietojen analysointiin kurssillasi ja saat silmille pyörivän, vaikeroivan, tai (jos se on tarpeeksi aikaisin lukukaudella) ihottuma tietenkin pudottamalla.
tämä häiritsee minua, koska emme voi tehdä päättelyä tieteessä ilman tilastoja*. Miksi opiskelijat eivät ota vastaan jotain niin tärkeää? Vartioimattomina hetkinä olen syyttänyt oppilaita siitä, että he ovat etukäteen ja itseään toteuttavassa ennustuksessa päättäneet, että tilastot ovat matematiikkaa, eivätkä he osaa matematiikkaa. Olen syyttänyt lukion matematiikan opettajia siitä, että he tekevät matematiikasta tylsää. Olen syyttänyt siitä lukion opinto-ohjaajia, jotka sanovat oppilaille, että jos he eivät pidä matematiikasta, heistä pitäisi tulla biologian pääaineita. Olen syyttänyt vanhempia siitä, että he antavat lastensa inhota matematiikkaa. Olen jopa syyttänyt boogieta.
kaikki nämä osapuolet (paitsi boogie) ovat syyllisiä. Mutta olen ymmärtänyt, että listallani jätettiin pois kaikkein syyllisin osapuoli: meidät. By ”meille” tarkoitan yliopiston tiedekunnan jäseniä, jotka opettavat tilastoja – ovatko he osastot matematiikan, osastot tilastojen, tai (gasp) osastot biologian. Teemme tilastoista tarpeettoman vaikeita oppilaillemme, enkä ymmärrä miksi.
ongelma on yllä olevassa kuvassa-Welchin t-testin laskemiseen tarvittavat kaavat. Ne ovat aritmeettisesti hieman monimutkaisia, ja niitä käytetään tietyssä tilanteessa.: vertaamalla kahta keinoa, kun otoskoot ja varianssit ovat epätasa-arvoisia. Jos haluat vertailla kolmea keinoa, tarvitset erilaisia kaavoja; jos haluat testata ei-nolla-rinnettä, tarvitset toisen joukon uudelleen; jos haluat vertailla onnistumisprosentteja kahdessa binäärikokeessa, toinen joukko vielä; ja niin edelleen. Ja jokainen kaavojen joukko toimii vain, kun otetaan huomioon sen omien oletusten paikkansapitävyys tiedoista.
kun otetaan huomioon tämä, voimmeko syyttää opiskelijoita siitä, että he ajattelevat tilastojen olevan monimutkaisia? Emme voi, mutta voimme syyttää itseämme siitä, että annamme heidän luulla niin. He ajattelevat niin, koska me jatkuvasti aliarvioimme tilastoissa tärkeintä yksittäistä asiaa: että tämä komplikaatio on illuusio. Itse asiassa jokainen merkityksellisyystesti toimii täsmälleen samalla tavalla.
jokainen merkitsevyystesti toimii täsmälleen samalla tavalla. Meidän pitäisi opettaa tätä ensin, opettaa sitä usein, ja opettaa sitä äänekkäästi, mutta emme tee. sen sijaan teemme valtavan virheen: me whiz sen ja alkaa opettaa testi toisensa jälkeen, pommittamalla oppilaita johdannaisia testi tilastot ja jakaumia ja kiinnittämällä enemmän huomiota eroja testien kuin niiden ratkaiseva, taustalla identiteetti. Ei ihme, että opiskelijat paheksuvat tilastoja.
mitä tarkoitan ”jokainen merkityksellisyystesti toimii tismalleen samalla tavalla”? Kaikki (NHST) tilastolliset testit vastaavat yhteen ongelmaan kahdella yksinkertaisella askeleella.
ongelma:
- näemme näennäisen kuvion, mutta emme ole varmoja, pitäisikö meidän uskoa sitä todeksi, koska tietomme ovat meluisia.
kaksi askelta:
- Vaihe 1. Mittaa kuvion vahvuus tiedoissamme.
- Vaihe 2. Kysykäämme itseltämme: onko tämä malli niin vahva, että siihen voidaan uskoa?
ongelman opettaminen motivoi tilastojen käyttöä ylipäätään (monet matematiikkaa ja lähes kaikki biologiaa opettavat kurssit tekevät hyvää työtä). Opetus kaksi vaihetta antaa opiskelijoille työkaluja testata mitään hypoteesia-ymmärtää, että se on vain kysymys valita oikea aritmeettinen heidän tietonsa. Tässä me näytämme kaatuvan.
Vaihe 1 on tietysti testin tilastollinen tulos. Meidän tehtävämme on löytää (tai keksiä) luku, joka mittaa vahvuus tietyn kuvion. Se ei ole yllättävää, että yksityiskohdat computing tällainen määrä riippuu kuvio haluamme mitata (ero kahdella tavalla, kaltevuus linjan, mitä tahansa). Mutta nämä yksityiskohdat aina liittyy kolme asiaa, että me intuitiivisesti ymmärtää olla osa kuvion ”vahvuus” (kuvattu alla): raaka koko näennäisen vaikutuksen (Welchin t, ero kahden näytteen tarkoittaa); melun määrä tietojen (Welchin t, kaksi näytteen keskihajonta), ja tietojen määrä kädessä (Welchin t, kaksi näytteen kokoa). Voit nähdä tarkastamalla, että nämä käyttäytyvät Welchin kaavoissa juuri niin kuin niiden pitääkin: t suurenee, jos välineet ovat kauempana toisistaan, näytteet ovat vähemmän meluisia ja/tai otoskoot ovat suurempia. Kaikki muu on epäkiinnostavaa aritmeettista yksityiskohtaa.
Vaihe 2 on p-arvo. Meidän on saatava testitilastoamme vastaava p-arvo, mikä tarkoittaa sitä, että tiedämme, täyttyvätkö oletukset (joten voimme käyttää hakutaulukkoa) vai emme (joten meidän pitäisi käyttää satunnaistamista tai vaihtaa toiseen testiin***). Jokainen testi käyttää eri taulukkoa-mutta kaikki taulukot toimivat samalla tavalla, joten erot ovat jälleen vain aritmeettisia. P-arvon tulkitseminen, kun meillä on se, on helppoa, koska sillä ei ole väliä, mitä aritmetiikkaa teimme matkan varrella: p-arvo mille tahansa testille on todennäköisyys kuviolle, joka on yhtä vahva kuin meidän (tai vahvempi), ilman todellista taustalla olevaa vaikutusta. Jos tämä on alhainen, uskomme mieluummin, että kuviomme syntyi todellisesta biologiasta kuin uskomme sen syntyneen huikeasta yhteensattumasta (Deborah Mayo selittää filosofiaa tämän takana tässä, tai katso hänen erinomainen bloginsa).
testien eroissa on toki paljon yksityiskohtia. Näillä on väliä, mutta niillä on toisarvoinen merkitys: Ennen kuin ymmärrämme, miten jokainen testi toimii, ei ole mitään järkeä murehtia eroja. Ja silloinkin, erot eivät ole asioita meidän täytyy muistaa, ne meidän täytyy tietää etsiä tarvittaessa. Siksi jos osaan tehdä yhden tilastollisen testin – minkä tahansa tilastollisen testin-osaan tehdä ne kaikki.
tarkoittaako tämä, että kannatan ”keittokirjan” tilastojen opettamista? Kyllä, mutta vain, jos käytämme metaforaa huolellisesti, emmekä pejoratiivisesti. Keittokirjasta ei ole paljon hyötyä sellaiselle, joka ei tiedä ruoanlaitosta yhtään mitään, mutta jos tiedät kourallisen perusperiaatteita, keittokirja opastaa sinut tuhansien keittotilanteiden läpi eri raaka-aineiden ja eri tavoitteiden saavuttamiseksi. Kaikki kokit omistavat keittokirjoja, harva muistaa niitä ulkoa.
joten jos opetamme tilastoja aivan väärin, näin se tehdään oikein: järjestetään kaikki taustalla olevan identiteetin ympärille. Aloita se, viettää paljon aikaa sitä, ja havainnollistaa sitä yhdellä testillä (mikä tahansa testi) työskenteli läpi yksityiskohtaista huomiota ei laskelmia, mutta miten tämä testi vie meidät läpi kaksi vaihetta. Älä yritä kattaa ”8 testit jokaisen perustutkintoa pitäisi tietää”; ei ole tällaista luetteloa. Tarjoa tilastollinen ongelma: joitakin todellisia tietoja ja malli, ja kysy oppilailta, miten he voisivat suunnitella testin käsitellä tätä ongelmaa. Ei tule olemaan yhtä oikeaa tapaa, ja vaikka olisikin, se olisi vähemmän tärkeää kuin ajattelun harjoittaminen taustalla olevan identiteetin vaiheiden kautta.
vihdoin: miksi ohjaajat tilastoivat eroja, eivät taustalla olevaa identiteettiä? Sanoin, etten tiedä, mutta voin spekuloida.
kun matemaatikot opettavat tilastoja, näen kiusauksen. Matemaattisessa mielessä testien erot ovat mielenkiintoisin osa. Tässä matemaatikot näyttävät kyljyksensä, ja siinä he tekevät vaikean ja tärkeän työn keksiessään uusia reseptejä valmistaakseen luotettavia tuloksia uusista raaka-aineista uusissa tilanteissa. Tilastojen käyttäjät, kuitenkin, mielellään todeta, että matemaatikot ovat olleet nokkelia, ja että olemme kaikki kiitollisia heille, jotta voimme saada työtä tehdä tilastoja meidän täytyy tehdä.
kun biologit opettavat tilastoja, mysteeri syvenee. Luulen (toivon!) ne meistä, jotka opettavat tilastoja, ymmärtävät kaikkien testien perimmäisen identiteetin, mutta se ei näytä estävän meitä kokeiden paraati-lähestymistavasta. Yksi hypoteesi: voimme vastata paine (koettu tai todellinen) matematiikan osastot, jotka voivat paheksua tilastojen opetetaan ulkopuolella niiden yksiköiden ja ovat nopeita vaatia riittämätön matemaattinen kurinalaisuutta, kun se on. Keskittyä paljon matemaattisia yksityiskohtia antaa viilu näennäisen kurinalaisuutta. En ole varma, onko hypoteesini oikea, mutta olen varmasti ollut mukana keskusteluissa matematiikan osastojen kanssa, jotka olivat sen mukaisia.
oli syy mikä tahansa, teemme todellista vahinkoa opiskelijoillemme, kun teemme tilastoista monimutkaisia. Ei ole. Muista, että jokainen tilastollinen testi toimii täsmälleen samalla tavalla. Opeta se oppilaalle tänään.
Huomautus: keittokirja-tilastot-metaforasta löytyy melko erilainen näkemys Joan Strassmannin mielenkiintoisesta postauksesta täältä. Olen hänen kanssaan samaa mieltä vain osittain, joten lue sinäkin hänen juttunsa.
tässä on Christie Bahlain toinen aiheeseen liittyvä teos: ”Hei, rentoutukaamme vain tilastoista” – mutta laajemmalla viestillä nhst: stä yli kenttien.
lopuksi, tässä on tarina kahdesta ekologista, jotka oppivat rakastamaan tilastoja-ja se on hauskaa.
© Stephen Heard ([email protected] 6, 2015
*^tässä viestissä aion keskustella frequentist päätelty tilastot, tai perinteinen ”null-hypoteesi merkitys testaus”. Jätän sivuun väittelyt siitä, ovatko Bayesilaiset menetelmät ylivertaisia ja saavatko P-arvot väärin sovellettuja (katso p-arvon puolustukseni). Pidättäydyn nuuskimasta pilkallisesti väitteille, joiden mukaan emme tarvitse päättelytilastoja lainkaan.
* * ^OK, ei oikeastaan, mutta tuon sinne lipsauttaminen antaa minulle linkin tähän. Samoin tekisi mieli syyttää sateesta, Kainista, bossa novasta ja Riosta. OK, lopetan nyt, mutta jos sinulla on yksi kaipasin, miksi ei pudota linkkiä vastauksia?
***^sisältäisin datan muuttamisen ”vaihda toiseen testiin”, mutta jos haluat tehdä eron, se sopii.