Tilgátapróf

Einföld og stutt kennsla um tilgátuprófanir með Python

Mynd frá: http://www.advanceinnovationgroup.com/blog/median-based-hypothesis-testing

Í þessu bloggi mun ég gefa stutt námskeið um prufu á tilgátu með tölfræðilegum aðferðum í Python. Tilraunapróf eru hluti af vísindalegu aðferðinni sem við þekkjum öll, nokkuð sem við lærðum líklega á fyrstu menntunarárum okkar. Í tölfræði eru þó margar tilraunir gerðar á úrtaki íbúa.

„Að ákvarða hvað sýnishorn af athugunum segir okkur um fyrirhugaða skýringu, almennt, krefst þess að við gerum ályktun eða eins og við tölfræðingar köllum það til að rökstyðja með óvissu. Rökstuðningur með óvissu er kjarni tölfræðilegrar ályktunar og er venjulega gerður með aðferð sem kallast Null hypothesis Significance Testing. “ - Ofnar.

Sem dæmi fyrir þetta blogg mun ég nota evrópskt knattspyrnugagnasett sem er að finna á Kaggle og mun framkvæma tilgátupróf. Gagnapakkann er að finna hér.

1. skref

Gerðu athugun

Fyrsta skrefið er að fylgjast með fyrirbærum. Í þessu tilfelli mun það vera: Er það áhrif varnar árásargirni á leyfileg mörk að meðaltali?

2. skref

Athugaðu rannsóknirnar

Gott hugarfar til að ganga eftir er að vinna klárari en ekki erfiðara. Eitt gott að gera er að sjá hvort rannsóknir sem tengjast athugun þinni eru þegar til. Ef svo er getur það hjálpað til við að svara spurningu okkar. Að vera meðvitaður um rannsóknir eða tilraunir sem þegar eru til hjálpar okkur að skipuleggja tilraun okkar betur, eða jafnvel svara spurningu okkar og þurfa ekki að gera tilraunina í fyrsta lagi.

3. skref

Formaðu núlltilgátu og aðra tilgátu

Önnur tilgáta er menntaðar ágiskanir okkar og núlltilgáta er einfaldlega hið gagnstæða. Ef önnur tilgátan segir að það sé verulegt samband milli tveggja breytna, segir að núlltilgátan sé engin marktæk tengsl.

Núll tilgáta okkar verður: Það er enginn tölfræðilegur munur á mörkum leyfð hjá liðum með varnarárásarárás sem er hærri en eða jöfn 65 á móti liðum undir 65.

Val tilgáta: Tölfræðilegur munur er á mörkum leyfð hjá liðum með varnarárásarárás sem er hærri en eða jöfn 65 á móti liðum undir 65.

4. skref

Ákvarðuðu hvort tilgáta okkar er próf sem er eitt halað eða próf með tveimur halum.

Einhert próf

„Ef þú ert að nota mikilvægisstig 0,05, gerir próf með einu hala öllum alfa þínum kleift að prófa tölfræðilega þýðingu í eina átt sem vekur áhuga.“ Dæmi um próf með einu hali væri „Knattspyrnulið með yfirgangsáritun lægra en 65 leyfa tölfræðilega marktækt fleiri mörk en lið með lægri einkunn en 65.“

Tvíhert próf

„Ef þú ert að nota marktæknigildi 0,05, gerir tvíhalað próf hálfan alfa þinn kleift að prófa tölfræðilega þýðingu í aðra áttina og helming alfa þinnar til að prófa tölfræðilega þýðingu í hina áttina. Þetta þýðir að 0,025 er í hvorum hala á dreifingu prófatölfræðinnar. “

Með tvíhertu prófi ertu að prófa tölfræðilega þýðingu í báðar áttir. Í tilviki okkar erum við að prófa tölfræðilega þýðingu í báðar áttir.

5. skref

Stilla þröskuld mikilvægisstig (alfa)

(alfa gildi): Jaðarþröskuldinn sem við erum í lagi með að hafna núlltilgátunni. Alfa gildi getur verið hvaða gildi sem við setjum á milli 0 og 1. Algengasta alfa gildi í vísindum er 0,05. Alfa stillt á 0,05 þýðir að við erum í lagi með að hafna núlltilgátunni þó að það séu 5% eða minni líkur á að niðurstöðurnar séu vegna handahófs.

P-gildi: Reiknaðir líkur á að komast að þessum gögnum af handahófi.

Ef við reiknum út p-gildi og það kemur út í 0,03, getum við túlkað þetta eins og að segja „Það eru 3% líkur á að árangurinn sem ég sé sé í raun og veru vegna handahófs eða hreinnar heppni“.

Mynd frá Learn.co

Markmið okkar er að reikna p-gildi og bera það saman við alfa okkar. Því lægra sem alfa er, strangari prófið.

6. skref

Framkvæma sýnatöku

Hér höfum við gagnapakkann okkar sem heitir fótbolti. Við þurfum aðeins tvo dálka í gagnapakkanum okkar til að prófa: team_def_aggr_rating og goals_allowed. Við munum sía það út í þessa tvo dálka og búum til tvo undirhópa fyrir lið með varnarárásarárás sem er hærri en eða jöfn 65 og lið með varnarárásarálag undir 65.

Bara til að gera grein fyrir tilgátuprófinu okkar:

Áhrif varnar árásargirni að meðaltali leyfileg mörk. Null tilgáta: Það er enginn tölfræðilegur munur á mörkum leyfð hjá liðum með varnarárásarárás sem er meiri en eða jöfn 65 á móti liðum undir 65. Aðrar tilgátur: Það er tölfræðilegur munur á mörkum leyfð hjá liðum með varnarárásarárás sem er meiri en eða jafnt og 65 á móti liðum undir 65. Tvístiga próf Alpha: 0,05

Nú höfum við tvo lista yfir sýnishorn sem við getum keyrt tölfræðipróf á. Áður en það skref mun ég samsama dreifingunum tveimur til að fá sjón.

7. skref

Framkvæma tveggja sýni T-próf

Tvísýni t-prófsins er notað til að ákvarða hvort tveir stofnstuðlar eru jafnir. Við munum nota Python eininguna sem kallast statsmodels. Ég mun ekki fara of mikið ítarlega um statsmodels en þú getur séð skjölin hér.

8. skref

Meta og álykta

Muna að alfa sem við settum var = 0,05. Eins og við sjáum af niðurstöðum prófsins að p-gildi er minna en alfa okkar. Við getum hafnað núlltilgátu okkar og með 95% sjálfstrausti tekið við annarri tilgátu okkar.

Þakka þér fyrir að lesa! Til að fá ítarlegri upplýsingar um tilgátuprófanir er hægt að skoða þetta hópverkefni á GitHub sem ég tók þátt í í tilgátuprófunum hér.

Aðföng:

Ofnar, Matteus. „Tölfræði og„ vísindalega aðferðin “Sótt af YourStatsGuru. https://www.yourstatsguru.com/secrets/scimethod-stats/?v=4442e4af0916

Kynning á SAS. UCLA: tölfræðileg ráðgjafahópur. frá https://stats.idre.ucla.edu/other/mult-pkg/faq/general/faq-what-are-the-differences-between-one-tailed-and-two-tailed-tests/ (nálgast maí 16, 2019).

Handbók um verkfræðideild. https://www.itl.nist.gov/div898/handbook/eda/section3/eda353.htm