//

Noter i statistik

Måleskalaer

Den første forudsætning for at statistik er interessant, er selvfølgelig at man har et antal målinger af en eller anden observerbar størrelse. Det kan være målinger af koncentrationen af et stof i en blodprøve, målinger af blodtryk eller klassifikation af røntgenbilleder, biopsier mm.

Resultatet af en sådan måling angives som et tal eller en værdi på en skala. Ofte anvendes en helt almindelig talskala - f.eks. ved koncentration eller blodtryk, men andre skalaer kan også være relevante. Det kan være en skala der kun består af to værdier f.eks.

  • positiv
  • negativ

eller en skala der består af flere værdier, f.eks i forbindelse med klassifikation af celleprøver:

  • Normal
  • Atypiske celler
  • Let dysplasi
  • Moderat dysplasi
  • Svær dysplasi
  • Karcinom

Generelt inddeles måleskalaer som de ovenfor nævnte i 3 klasser:

  • Nominal-skalaer
  • Ordinal-skalaer
  • Interval/ratio-skalaer

(Som navnet antyder så dækker "interval/ratio" i virkeligheden over to forskellige typer af skalaer, men forskellen mellem disse to er ikke relevant i disse noter, hvorfor de slås sammen til en skala).

Nominal

En nominal-skala er er en skala hvor målingerne blot kategoriseres efter et "navn". F.eks. når man registrerer måleresulatet som positiv/negativ eller klassifikation af blodtyper.

Ordinal

Når man bruger en ordinal-skala er der egentlig stadig tale om at man kategoriserer målingerne efter et navn, men nu har disse navne en indbyrdes rangorden. Det kan f.eks. være klassifikation af cervix-cytologiske prøver efter WHO skala normal/atypiske celler/let dysplasi/..... hvor graden af celleforandringer vokser.

Da der netop findes en indbyrdes rangorden mellem kategorierne vælger man ofte at bruge tal i stedet for navne - som f.eks. i en karakterskala.

Det er væsentligt at de fleste beregninger IKKE giver mening på nominal- og ordinal-skalaer, omend man på ordinal-skalaer nogen gange tillader sig at beregne gennemsnit. På ordinal-skalaer giver median (se side 2.9) altid mening - i hvert fald fra en matematisk synspunkt.

Interval/ratio

Dette er den klassiske talskala, som f.eks. bruges når måleresultatet er en koncentration, blodtryk, højde og meget andet. På denne skala giver alle statistike beregninger mening.

De følgende kapitler beskæftiger sig med hvordan man laver statistik på resultater på en interval/ratio-skala, mens kapitel 9 gennemgår nogle få metoder der kan bruges, når man har data på nominal- og ordinal-skalaer.

© Thomas Bendsen • 2009 - 2022 • thbe@via.dk