//

Noter i statistik

Prædiktive værdier

Sensitivitet og specificitet er interessante parametre set fra et sundhedsøkonomisk synspunkt, idet de angiver hvor mange korrekt og forkert diagnosticerede personer man får - f.eks. ved indførelse af en screening. Derimod er de knap så interessante i forbindelse med en undersøgelse af en konkret patient.

Når man går til lægen eller bliver indlagt på sygehuset, så får man et analysesvar, dvs. positiv eller negativ. Men det interessante spørgsmål - både for lægen og patienten - er naturligvis: Hvad er sandsynligheden for at patienten er syg eller rask? Dette spørgsmål kan ikke besvares ved hjælp af sensitiviteten eller specificiteten, idet de jo angiver "den omvendte" sandsynlighed: Altså hvis man er syg hvad er så sandsynligheden for at man bliver erklæret postiv.

Til at angive sandsynligheden for at en person med et positivt analysesvar faktisk er syg (eller en med et negativt svar faktisk er rask) beregnes de såkaldt prædiktive værdier:

PPV

Den positivt prædiktive værdi er sandsynligheden for at en person med et positivt analysesvar faktisk er syg. Dvs. at den positivt prædiktive værdi er defineret som:

PPV = Antal sandt positive / Antal positive

(idet de sandt positive jo netop er den del af de positive som faktisk er syge).

NPV

Den negativt prædiktive værdi er sandsynligheden for at en person med et negativt analysesvar faktisk er rask. Dvs. at den negativt prædiktive værdi er defineret som:

NPV = Antal sandt negative / Antal negative

Eksempler

Nedenfor beregnes de prædiktive værdier for tallene i eksempel 1 og 2 på side 10.3.

Angiv PPV for eksempel 1 (decimaltal med 2 betydende cifre)
Angiv NPV for eksempel 1 (decimaltal med 2 betydende cifre)
Angiv PPV for eksempel 2 (decimaltal med 2 betydende cifre)
Angiv NPV for eksempel 2 (decimaltal med 2 betydende cifre)

Bemærk at i modsætning til med sensitivitet og specificitet, så er de prædiktive værdier forskellige i de to eksempler. Dvs. at de prædiktive værdier afhænger af prævalensen (altså forekomsten af sygdommen i den betragtede population).

Når sensitiviteten ikke afhænger af prævalensen, så skyldes at der i beregningen af denne kun indgår syge personer. Dvs. forholdet mellem syge og raske er uden betydning. I beregning af PPV indgår derimod alle positive personer - hvilket jo både er de sandt positive (syge) og de falsk positive (raske). Dermed kommer forholdet mellem syge og raske til at påvirke PPV.

En anden ting man kan hæfte sig ved er at PPV i eksempel 1 er meget lav. Selv med en positiv diagnose fra mammografien er der stadig kun 10% sandsynlighed for at man faktisk har brystkræft. Dette er et af de helt store problemer med at indføre screeninger, og skyldes selvfølgelig at prævalensen er meget lav. Dermed får man - selv om både specificitet og sensitivitet er "høje" - et stort antal falsk positive i forhold til antallet af sandt positive. 

© Thomas Bendsen • 2009 - 2022 • thbe@via.dk