Noter i statistik

Vælg sektion:

10.1	Introduktion
10.2	Begreber
10.3	Eksempler
10.4	Sensititvitet og specificitet
10.5	Prædiktive værdier
10.6	Konfidensintervaller
10.7	ROC-kurver
10.8	ROC-kurver - eksempel

Statistisk kvalitetskontrol

Uddrag af metodevalidering

Tabeller

Powerpoints

Lidt matematik

ROC-kurver - eksempel

125 personer har fået målt koncentrationen af hormonet T4, og har samtidig fået målt TSH der bruges som guldstandard i forhold til at diagnosticere hypotyreose. Formålet er at undersøge om man kan anvende koncentrationen af T4 til at stille diagnosticere hypotyreose. Dette gav følgende resultater:

T4 koncentration pmol/L	Antal raske (dvs. normal TSH)	Antal syge (dvs. forhøjet TSH)
0-1	0	2
1,1-2	0	3
2,1-3	0	1
3,1-4	0	8
4,1-5	1	4
5,1-6	6	4
6,1-7	11	3
7,1-8	19	3
8,1-9	17	1
9,1-10	20	0
10,1-11	11	2
11,1-12	4	1
12,1-13	4	0

Tabel 1

Indledningsvist kan man passende lave en afbildning af antal raske hhv syge som funktion af T4-koncentration. Dette ser ud som følger:

Figur 1

På figur 1 ses at de syge generelt har lavere værdier end de raske, men desværre også at det ikke er muligt at vælge en T4-koncentration som perfekt adskiller syg og rask.

Man kan nu for enhver mulig diskriminationsgrænse beregne metodens sensitivitet og specificitet. Vælges f.eks. en diskriminationsgrænse på 7 pmol/L (dvs. at alle personer med en koncentration på 7 pmol/L eller derunder erklæres for positive, mens alle personer med en koncentration over 7 pmol/L erklæres for negative), så fås følgende følgende ved at sammentælle tallene i tabel 1:

Antal syge	32
Heraf positive (dvs.7 eller derunder)	25
Antal raske	93
Heraf negative (dvs. over 7)	75

Andelen af syge som er positive er dem der betegnes sandt positive, og andelen af raske som er negative er dem der betegnes sandt negative. På baggrund af disse tal kan man nu beregne sensitivitet og specificitet (se side 10.4).

Sensitivitet = 25/32 = 0,78

Specificitet = 75/93 = 0,81

Hvis denne beregning foretages for alle mulige diskriminationsgrænser, og hvis man herefter afbilder sensitiviteten som funktion af 1-specificiteten, så fremkommer nedenstående ROC-diagram:

Figur 2

Brug af ROC-kurven

Denne kurve kan anvendes til flere ting, men det er vigtigt at understrege at den aldrig kan stå alene i en vurdering af en metode. Det endelig valg må altid tage hensyn til de konkrete kliniske forhold og øvrige relevante parametre (f.eks. økonomi, arbejdsbelastning mm).

Når man husker dette forbehold, kan kurven bla. anvendes til at give en vurdering af den mest optimale diskriminationsgrænse. Typisk vil man vælge den grænse som giver den største afstand mellem identitetslinien (den røde linie på figur 2) og ROC-kurven. I dette tilfælde vil dette nok være diskriminationsgrænsen 6 pmol/L. Kliniske hensyn kan så rykke valget til den ene eller den anden side, afhængigt af om man ønsker at fange flest muligt syge, eller frikende flest muligt raske.

ROC-kurverne kan også anvendes til at sammenligne to metoder. En ideel metode vil have en kurve som går lodret op til øverste venstre hjørne, og herefter vandret til højre. Diskriminationsgrænsen svarende til øverste venstre hjørne svarer til at analysen skelner perfekt mellem syge og raske. En ROC-kurve som følger identitetslinien er totalt værdiløs, idet denne linie kan opnås ved at slå plat eller krone om udfaldet. Skal man vælge mellem to metoder, baseret på ROC-kurver, vil man således vælge den kurve der ligger tættest på øverste venstre hjørne. I denne forbindelse beregnes ofte en størrelse der betegnes AUC (area under curve, altså arealet under kurven), og man foretrækker så den kurve med det største areal. Denne metode er lidt omdiskuteret, da den jo tager hensyn til metodens opførsel ved en masse diskriminationsgrænser, som man aldrig anvender.