//

Noter i statistik

Konfidensintervaller

Når man i statistisk sammenhæng beregner en parameter, så er det vigtigt at være opmærksom på at det beregnede tal ikke er identisk med den sande værdi af parameteren. Når man f.eks. som på side 4.4 beregner spredningen på et antal kontrolmålinger, så er denne spredning ikke identisk med analysens sande analyseusikkerhed, men den skulle selvfølgelig gerne være tæt på. Ligeledes hvis man beregner gennemsnittet af målingerne, så forventer man selvfølgelig, at dette gennemsnit er tæt på kontrollens sande koncentration, men ikke at det er præcist identisk med denne.

Det er derfor relevant at spørge hvor tæt en beregnet parameter ligger på den sande værdi? Som så meget andet i statistik, kan heller ikke dette spørgsmål besvares præcist, men man kan give et bud. Dette kan bla. gøres vha. de såkaldte konfidensintervaller.

Betydningen af et 95%-konfidensinterval for en parameter, beregnet på grundlag af en stikprøve kan beskrives på følgende måde:

Hvis det udførte forsøg gentages uendeligt mange gange, og der hver gang beregnes et konfidensinterval for stikprøven, vil 95% af disse konfidensintervaller indeholde den sande værdi. A priori (før forsøgets udførelse) er der altså 95% sandsynlighed for at man får et konfidensinterval som indeholder parameterens sande værdi.

Bemærk: Så snart man har beregnet et konkret konfidensinterval giver det ikke længere mening at tale om sandsynligheden for at dette konfidensinterval indeholder den sande værdi. Enten indeholder det den sande værdi, eller også gør det ikke (desværre ved man bare ikke hvilken situation man er i).

En alternativ beskrivelse af betydningen af et 95%-konfidensinterval er følgende:

Enten indeholder konfidensintervallet den sande værdi af parameteren, eller også er der sket en "usædvanlig" hændelse.

"Usædvanlig" betyder i dette tilfælde en sandsynlighed mindre end (100-95)% = 5%, og den usædvanlige hændelse er, at man har fået et konfidensinterval som ikke indeholder den sande værdi. Igen er det vigtigt at pointere at man desværre ikke kan afgøre hvilken af de to situationer man befinder sig i.

En stor stikprøve resulterer i at man får en meget præcis viden om parameteren, og dermed får man et snævert konfidensinterval, mens en mindre stikprøve medfører et bredere konfidensinterval, som det vil fremgå af de følgende sider.

Konfidensintervaller kan i princippet beregnes for alle typer af parametre, f.eks. middelværdier, spredninger, endepunkter for referenceintervaller, hældningen i forbindelse med lineær regression osv. I det følgende gennemgås beregning af konfidensintervaller for middelværdi, differens mellem 2 middelværdier samt spredning, og der præsenteres en regnemaskine til beregning af konfidensintervaller for proportioner.

© Thomas Bendsen • 2009 - 2022 • thbe@via.dk