Gå til innhold

Statistikk - signifikanssannsynlighet


Melodii

Anbefalte innlegg

Hei!

 

Jeg sliter litt med å forstå når jeg skal teste en hypotese ved å finne k og dermed komme fram til en konklusjon om å forkaste H0 eller ikke, og når jeg skal bruke signifikanssannsynlighet til å komme frem til hvilken hypotese som skal forkastes.

 

Noen som kan forklare meg dette?

Lenke til kommentar
Videoannonse
Annonse

Du regner ut sannsynligheten for å få det resultatet testen ga eller et enda skjevere resultat DERSOM H0 gjelder.

Hvis denne sannsyligheten ("p-verdien") er mindre enn signifikansnivået (ofte 5 %),  forkaster du H0 og aksepterer den alternative hypotesen.

 

Problemet er jo at du i 5 % av tiilfellene vil forkaste H0 selv om resultatet av testen bare skyldtes tilfelidgheter, ikke at H0 var feil---
 

Lenke til kommentar

Så signifikanssannsynligheten viser sannsynligheten for at H0 er feil selv om testen sa den var riktig...? Og den sannsynligheten kalles p-verdi? Og hvis P-verdien er mindre enn signifikansnivået, forkaster man H0 uansett hva den første (kritisk verdi) sa? :p Men da sitter man også igjen med det at man i 5% av tilfellene forkaster H0 selv om man ikke skal det...?

Lenke til kommentar

Testen sier aldri at H0 er riktig, bare at vi ikke har grunnlag for å forkaste den.

p-verdtien (="signifikanssannsyligheten")  er sannsynligheten for å få testresultatet eller et enda mer avvikende resultat selv om H0 er riktig.

 

Jo lavere verdi p har jo mer tvilsomt er det at H0 er riktig. Og på et visst nivå (oftest 5 %, i noen tilfeller 1%) velger vi som sagt å forkaste H0, og akseptere den alternative hypotesen..

Lenke til kommentar

Lurer på en liten ting til...

 

Holder på med kji-kvadrattester nå. Har for eksempel en oppgave nå hvor jeg skal teste nullhypotesten; blodtype uavhengig av folkegruppe mot H1: blodetype avhengig av folkegruppe. Men hvordan vet jeg egentlig at H0 må være akkurat den formuleringen og ikke omvendt? Dersom jeg hadde valgt H0; blodtype avhengig av folkegruppe, ville jeg altså formulert hypotesene omvendt og kommet til ulikt svar. Er det noen regler på det?

Lenke til kommentar

Du velger alltid det du ønsker å påvise som H, mens H0 er den uinteressante , konservative påstanden du tester ut fra. 

Du kan ikke regne på at blodtypefordelingen er ulik i ulike grupper (hvor forskjellig da?). men du kan regne på en gitt fordeling som H0.

Lenke til kommentar

OK. Har dukket opp mer som jeg lurer på... =/

Holder på med følgende eksamensoppgave;

I en storby har man studert den delen av befolkningen som bruker bil for å kjøre mellom hjemmet og arbeidsplassen. Når vi bruker ordet person i denne oppgaven, mener vi en person fra denne gruppen. La X være antall minutter det tar for en tilfeldig person å kjøre fra hjemmet til arbeidsplassen i bil. X antas å være normalfordelt med forventning 26,8 og standardavvik 6,4.

Hva er sannsynligheten for at gjennomsnittlig reisetid for 4 tilfeldig valgte personer er større enn 34 minutter?

 

I fasiten bruker sensor fordelingsfunksjonen til X i standardnormalfordelingen. Det er greit, men han dividerer standardavviket på kvadratroten av 4. Svaret blir altså 0,0122. Hvorfor dividerer han egentlig på kvadratroten av 4? Jeg skjønner jo hvor tallet 4 kommer fra, men hadde aldri kommet på å dividere med det selv.

Lenke til kommentar

Ok. Utleding av formelen finner du i læreboken, så det er ikke noe poeng å ta det her. På et helt overfladisk nivå så gir det mening at spredningen i et stort utvalg er mindre enn i et lite, ikke sant?

 

Et terningkast har en forventet verdi på 3,5. Kaster du én gang vil du garantert ikke få 3,5, og det er absolutt ikke urimelig om du får 1 eller 6 (dette gir maks spredning). Kaster du to ganger må du enten få [1,1] eller [6,6] for at det skal gi like stor spredning som ved ett kast.

 

Regner du ut dette finner du at ved å gjenta terningkastet x antall ganger så er forventningen uforandret ift. ett enkelt kast (3,5), mens spredningen er varians/x. Variansen deles på antall gjentakelser. Dette er det samme som å dele standardavviket på roten av antall gjentakelser.

Endret av Sheasy
  • Liker 1
Lenke til kommentar
  • 2 uker senere...

Nå lurer jeg på noe annet :p

3 over 0 blir det 0? Tenker på eksempelvis formelen for hypergeometrisk fordeling, hvor det står M over y (ikke noe deletegn). Er det slik at så lenge det står 0 under, så er svaret alltid 0?

Lenke til kommentar

Ok, flott!

 

Noen som kan gi meg en kort forklaring på når man bruker følgende tilnærminger;

 

- Binomisk

- Hypergeometrisk

- Poisson

 

Trodde jeg hadde grei oversikt over dette, men så fikk jeg følgende oppgave som jeg var sikker på at hadde en binomisk sannsynlighetsfordeling, men så var fasiten hypergeometrisk;

 

Man vet at ca. 20 per 10 000 av kinesiske barn har en genetisk feil som kan føre til utvikling av en alvorlig sykdom senere i livet. Anta at 1 000 tilfeldig valgte kinesiske barn gen-testes. La X være antall barn i utvalget som har den genetiske feilen.

 

a) Hvilken sannsynlighetsfordeling har X? Begrunn svaret.

 

Sier det seg selv at dette er UTEN tilbakelegging? :S Og når jeg skal finne sannsynligheten for at det eksempelvis er 6 barn med den genetiske feilen, skal jeg bruke en Poisson-tilnærming. Tror jeg blir forvirra av at noe kan ha en type sannsynlighetsfordeling, men at man bruker en annen tilnærming.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...