//

Noter i statistik

Konfidensinterval for proportioner

Som nævnt på side 5.1 kan man beregne konfidensintervaller for alle mulige parametre, som er bestemt med statistiske metoder. Konfidensintervallet er jo blot et udtryk for at bestemmelsen af parameteren er behæftet med en vis usikkerhed, og da en sådan usikkerhed altid er til stede, bør man i princippet altid oplyse et konfidensinterval. I praksis er der nok visse situationer hvor konfidensintervaller er vigtigere end andre.

En af de situationer hvor det kan være relevant at beregne et konfidensinterval, er ved bestemmelsen af visse sandsynligheder (eller proportioner), som f.eks. i følgende eksempel:

Eksempel

I rapporten "Sundhed og sygelighed 2010" har man undersøgt forekomsten af en lang række sygdomme i forskellige befolkningsgrupper. Blandt meget andet har man undersøgt forekomsten af astma hos kvinder over 75 år. I den forbindelse undersøgte man 6347 kvinder og fandt at 597 af dem havde astma. Baseret på disse tal er det naturligvis nemt at beregne et estimat for andelen af kvinder over 75 år som har astma:

Andel kvinder over 75 år med astma = 597 / 6347 = 9,4%

Det principielle spørgsmål er nu hvor stor usikkerheden er på denne andel. En måde at besvare dette spørgsmål på, er ved at beregne et konfidensinterval for andelen, hvilket kan gøres vha. regnemaskinen på næste side. Gøres dette får man:

95%-konfidensinterval for andelen = [8,7% ; 10,2%]

Fortolkningen af dette konfidensinterval adskiller sig ikke fra den som er præsenteret på de foregående sider.

Næste side indeholder yderligere forklaring på hvordan regnemaskinen anvendes, samt nogle kommentarer af mere teknisk karakter.

På side 10.6 findes yderligere et eksempel på beregning af konfidensintervaller for en proportion (eller en andel hvis man foretrækker det ord).


Formlen

Regnemaskinen på næste side, anvender den såkaldte Clopper-Pearson formel. Her er den medtaget for fuldstændighedens skyld - man behøver ikke at forstå den:

$$ (1-\alpha)\textit{-konfidensinterval}=\\ \left[\left(1+\frac{n-x+1}{xF\left[\frac{\alpha}{2};2x;2(n-x+1)\right]}\right)^{-1};\left(1+\frac{n-x}{(x+1)F\left[1-\frac{\alpha}{2};2(x+1);2(n-x)\right]}\right)^{-1}\right] $$

hvor \(F(c,d1,d2)\) er c-fraktilen i F-delingen med \(d1,d2\) frihedsgrader. \(n\) er det samlede antal forsøg, og \(x\) er antal succes'er.

© Thomas Bendsen • 2009 - 2022 • thbe@via.dk