Gå til innhold
🎄🎅❄️God Jul og Godt Nyttår fra alle oss i Diskusjon.no ×

Kan noen løse denne gåten for meg?


pergint

Anbefalte innlegg

Julie skulle finne ut hvor mange fisker det var i et fiskevann. Hun fanget og merket 75 fisker og slapp dem tilbake i innsjøen. En måned senere fanget hun 50 fisker, av disse var 10 merket. Hvor mange fisker kan man anta at det fantes i det fiskevannet?

Lenke til kommentar
Videoannonse
Annonse

Hun kan ikke anta noe annet enn at det er minst 115 fisk i vannet. Problemet hennes er at hun bare har gjort en måling og ikke har nok data til å si noe med sikkerhet om fiskebestanden i vannet.

Forsøket hun gjorde kan gi resultatet hun fikk uansett om det er 375 eller 10 millioner fisk i vannet. Det er mindre sannsynlig at forsøket vil få det utfallet hvis det er 10 millioner fisk i vannet, men hun kan ikke utelukke det.

Hvis det er 375 fisk i vannet vil man forvente at 10 av 50 fisk er merket, i snitt. Det betyr ikke at utfallet av et gitt eksperiment må gi dette resultatet. Forventningsverdien til et terningkast er 3.5, men vi vet alle at hvis man gjør et lite antall kast så kan snitte ligge langt unna den verdien. Hvem har vel ikke kastet to seksere på rad? Konklusjonen om at det er 375 fisk i vannet er kun gyldig hvis man har gjort et stort antall forsøk.

Når dere bruker begrepet representativt utvalg så brukere dere det på en måte litt feil. Når man snakker om et representativt utvalg så er det fordi man ønsker at objektene man har valgt skal være en god representasjon av den underliggende befolkningen. Det betyr at man må ha kunnskap om den befolkningen man trekker fra, noe vi ikke har. Vi lager ikke en spørreundersøkelse der vi vil forsikre oss om at fisken vi har spurt speiler samfunnet fisken lever i, vi vil finne ut informasjon om det samfunnet.

Jeg forstår at det dere mener er at vi antar at de fiskene vi trekker opp er et snitt av fisken i vannet og at de 50 fiskene representerer de statistiske egenskapene til resten av bestanden. Det er en antagelse vi ikke har noen god grunn til å anta.

Lenke til kommentar

(...) Jeg forstår at det dere mener er at vi antar at de fiskene vi trekker opp er et snitt av fisken i vannet og at de 50 fiskene representerer de statistiske egenskapene til resten av bestanden. Det er en antagelse vi ikke har noen god grunn til å anta.

Selvsagt. Svaret mitt er basert på antagelser, noe jeg også deklarerte. Det er det beste svaret vi har, med den informasjonen som er tilgjengelig.

Lenke til kommentar

 

(...) Jeg forstår at det dere mener er at vi antar at de fiskene vi trekker opp er et snitt av fisken i vannet og at de 50 fiskene representerer de statistiske egenskapene til resten av bestanden. Det er en antagelse vi ikke har noen god grunn til å anta.

Selvsagt. Svaret mitt er basert på antagelser, noe jeg også deklarerte. Det er det beste svaret vi har, med den informasjonen som er tilgjengelig.

 

 

Nei, svaret ditt er feil. Dine antagelser er rett og slett ikke gode. Derfor er svaret du kommer med heller ikke godt nok.

Lenke til kommentar

Det er jeg ikke enig i. Det er godt nok.

 

Jo nærmere bestanden er 375, desto mer sannsynlig er utfallet av testen som ble utført.

 

Det har du rett i. Problemet vårt er hypergeometrisk og vi kan lett regne ut sannsynligheten for å trekke 50 fisk og få 10 merka som en funksjon av hvor stor bestanden er. Jeg skrev et kort python3 program for å regne ut akkurat det. Her er resultatet

post-117224-0-78719900-1487775366_thumb.png

 

Den sorte vertikale linja markerer 375 og det er rett som du sier, det er det er det antallet fisk som gir høyest sannsynlighet for å få det resultatet vi fikk. Samtidig ser du at den ikke er mye større en 15%!

For 500 fisk er sannsynligheten bare 5% lavere.

 

Gitt at det er 375 fisk i vannet vil du kun forvente å at forsøket gir det resultatet vi fikk i 15% av tilfellene. Du kan rett og slett ikke trekke så sterke konklusjoner på bakgrunn av en test.

 

Hvis du tenker at 15% er ganske bra så vil jeg påstå at det ikke har noe å si om det er 15% eller 99%. Hva gjør du den gangen du er i den 1%-delen? Hvis jeg vinner i lotto første gang jeg spiller er det da rett av meg å konkludere at man vinner i lotto 100% av gangene man spiller?

 

Når du drar trekker fisk ut av vannet har du ingen måte å vite om du har flaks og får en mengde som representerer den underliggende befolkningen godt eller om du har uflaks og finner uproporsjonalt mye merka fisk.

from scipy.special import binom as bm
import numpy as np
import matplotlib

#Uviktige greier for å lage pene plot
import matplotlib.pyplot as plt
from matplotlib.ticker import AutoMinorLocator

matplotlib.rcParams['axes.linewidth'] = 2
matplotlib.rcParams['xtick.major.size'] = 8
matplotlib.rcParams['xtick.major.width'] = 2
matplotlib.rcParams['xtick.minor.size'] = 4
matplotlib.rcParams['xtick.minor.width'] = 1.5

matplotlib.rcParams['ytick.major.size'] = 8
matplotlib.rcParams['ytick.major.width'] = 2
matplotlib.rcParams['ytick.minor.size'] = 4
matplotlib.rcParams['ytick.minor.width'] = 1.5

#N er antall fisk i sjøen. Jeg lar den gå fra 115 til 1000.
N = np.linspace(115,1000)
#Funksjonen som regner ut sannsynligheten:
def prop(fisk,merka_fisk,trekk,merka):
    return bm(merka_fisk,merka)*bm(fisk-merka_fisk,trekk-merka)/bm(fisk,trekk)

#Regn ut sannsynligheten gitt tallene vår.
#Antall fisk er N, merka fisk er 75, trekk er 50, og merka er 10.
#Vi varier altså størrelsen til populasjonen og regner ut sannsynligheten for 
#å at vi fanger 10 merka fisk hvis vi trekker opp 50. Gitt at vi har merka 75.
p = prop(N,75,50,10)

#Her lager jeg figuren.
f,ax = plt.subplots(figsize=(9,6),nrows=1,ncols=1)
plt.xlim([100,1000])
plt.ylim([-0.01,0.17])
plt.plot(N,p,'#377eb8',lw=4)

#Mer uviktige greier for å få plottet til å se ok ut.
ax.yaxis.set_minor_locator(AutoMinorLocator(5))
ax.xaxis.set_minor_locator(AutoMinorLocator(5))
ax.set_xlabel("Totalt antall fisk")
ax.set_ylabel("Sansynlighet for å trekke 10 merka fisk")
ax.vlines(375,-0.01,0.17,'k',lw=4,linestyles='dashed')
plt.savefig("bi.png")

Lenke til kommentar

Nei, svaret ditt er feil. Dine antagelser er rett og slett ikke gode. Derfor er svaret du kommer med heller ikke godt nok.

For å snu på det: hvor mange fisk mener du man må observere før man har et representativt utvalg? Avhenger dette antallet av den totale bestanden/populasjonen? Hovrdan ser du for deg at man skal beregne hvor mange fisk man må observere når målet i utgangspunktet er å predikere størrelsen på populasjonen?

 

Eller har jeg fullstendig misforstått hva du mener er feil her?

Lenke til kommentar

 

Nei, svaret ditt er feil. Dine antagelser er rett og slett ikke gode. Derfor er svaret du kommer med heller ikke godt nok.

For å snu på det: hvor mange fisk mener du man må observere før man har et representativt utvalg? Avhenger dette antallet av den totale bestanden/populasjonen? Hovrdan ser du for deg at man skal beregne hvor mange fisk man må observere når målet i utgangspunktet er å predikere størrelsen på populasjonen?

 

Eller har jeg fullstendig misforstått hva du mener er feil her?

 

 

Det vet du ikke, du vet ikke hvor stor befolkningen er. Enda viktigere, du vet ikke at du trekker et representativt utvalg. Når man designer spørreundersøkelser så velger man ofte de man spør på en slik måte at de representerer befolkningen. Da har du allerede informasjon om befolkningen du ønsker å representere. I dette tilfellet har vi ikke mulighet til å gjøre dette. vi velger fisken tilfeldig, har ingen måte å garantere at vi velger en del av fiskestammen som representerer resten på en god måte.

 

Det du må gjøre i dette tilfellet er flere forsøk. Du må gjenta forsøket du har gjort flere ganger. Når du har nok data kan du med en hvis sikkerhet si at antall fisk ligger i et gitt intervall.

Endret av Flin
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...