Noter i statistik

Wilcoxon-testen

Wilcoxon-testen bruges til at sammenligne to parrede stikprøver, dvs. den er en ikke-parametrisk udgave af t-testen med to parrede stikprøver. Wilcoxon-testen omtales også som "Wilcoxon Signed Rank" eller "Wilcoxon One Sample".

Præcist som med t-testen, er det altså en forudsætning at der foreligger to lige store stikprøver, og at der findes en naturlig måde at parre data fra disse to stikprøver.

Beregning af teststørrelsen

Som med Mann-Whitney-testen er det en forudsætning at der ikke optræder "ties" (dvs. identiske tal i de to stikprøver). Hvis antallet af "ties" er lille, kan disse slettes fra stikprøverne, og testen gennemføres som forklaret herunder. Hvis antallet af ties er for stort, må man finde alternative metoder til at sammenligningen.

Først beregnes de parvise differencer (med fortegn) mellem stikprøverne. Herefter opskrives den numeriske værdi af differencerne (dvs. differencen uden fortegn), og disse rangordnes (se f.eks. 3.8). Nu sammentælles rangnumrene for enten de positive eller de negative differencer. Dette er teststørrelsen. Hvis der er numerisk identiske differencer, skal disse have samme rang (dvs. de skal tildeles en rang som er gennemsnittet af rangnumrene for de identiske differencer - se eksemplet nedenfor).

På samme måde som for Mann-Whitney testen er det ikke muligt at beregne en p-værdi  i Excel. P-værdien kan alternativt beregnes vha. side 13.3.

Eksempel

To sygehuse har analyseret for stof X på et antal patientprøver. Dette gav følgende resultater:

Prøve nr Sygehus 1 Sygehus 2
1 53,4 54,7
2 40,6 41,7
3 45,8 45,6
4 44,3 44,5
5 50,6 51,0
6 51,4 51,7
7 49,9 49,0
8 44,4 46,0
9 41,9 40,9
10 39,7 40,5

Beregning af teststørrelsen foretages relativt simpelt i Excel, som vist nedenfor. Data indtastes, og differens og absolut differens beregnes i de næste kolonner (absolut differens i f.eks. celle E2 beregnes som "=abs(D2)"). Herefter sorteres tallene efter de absolutte differencer. Når man markerer kolonne E, og vælger "sorter", bliver man spurgt om man ønsker at udvide markeringen. Det er vigtigt at man vælger dette, hvorved de øvrige kolonner bliver sorteret på samme måde. Dvs. at rækkerne bliver ved at "hænge sammen" på den rigtige måde.

Endelig tilføjes rangnumre. Bemærk nummereringen af de to laveste differencer. Havde de været forskellige ville de have fået nummer 1 og 2; nu er de ens, og så bliver deres rang gennemsnittet af 1 og 2. Der skal gælde, at summen af alle rangnumre er lig \(n\cdot(n+1)/2\), hvor \(n\) er antal målinger i hver stikprøve. Dette kan med fordel anvendes til at kontrollere om nummereringen er korrekt. 

Når man skal summere rangnumrene hørende til de negative eller de positive differencer, er det nemmeste først at sortere efter kolonne D (og igen vælge "udvid markeringen"). Herved får man samlet alle rangnumre hørende til de negative differencer øverst, og kan let summere disse.

Nedenstående spørgsmål tager udgangspunkt i ovenstående eksempel:

Angiv rangsummen for de positive differencer (dvs. den lavest mulige af de to rangsummer):
Angiv p-værdien for Wilcoxon-testen (2 betydende cifre):
Angiv om nulhypotesen accepteres eller forkastes:
Nul-hypotesen forkastes
Nul-hypotesen accepteres

Normalfordelingsapproximation

Hvis stikprøverne er tilstrækkeligt store kan man anvende en normalfordelingsapproximation til at beregne p-værdien. Denne er baseret på at, hvis nul-hypotesen gælder, er teststørrelsen tilnærmelsesvist normalfordelt med middelværdi

$$\mu=\frac{n(n+1)}{4}$$

og spredning

$$\sigma=\sqrt{\frac{n(n+1)(2n+1)}{24}}$$

hvor n er antal elementer i stikprøverne. Hvorledes disse parametre anvendes er nærmere beskrevet på side 8.6.

© Thomas Bendsen • 2009 - 2017 • VIA University College Bioanalytikeruddannelsen