Wilcoxon-testen
Wilcoxon-testen bruges til at sammenligne to parrede stikprøver, dvs. den er en ikke-parametrisk udgave af t-testen med to parrede stikprøver. Wilcoxon-testen omtales også som "Wilcoxon Signed Rank" eller "Wilcoxon One Sample".
Præcist som med t-testen, er det altså en forudsætning at der foreligger to lige store stikprøver, og at der findes en naturlig måde at parre data fra disse to stikprøver.
Beregning af teststørrelsen
Som med Mann-Whitney-testen er det en forudsætning at der ikke optræder "ties" (dvs. identiske tal i de to stikprøver). Hvis antallet af "ties" er lille, kan disse slettes fra stikprøverne, og testen gennemføres som forklaret herunder. Hvis antallet af ties er for stort, må man finde alternative metoder til at sammenligningen.
Først beregnes de parvise differencer (med fortegn) mellem stikprøverne. Herefter opskrives den numeriske værdi af differencerne (dvs. differencen uden fortegn), og disse rangordnes (se f.eks. 3.8). Nu sammentælles rangnumrene for enten de positive eller de negative differencer. Dette er teststørrelsen. Hvis der er numerisk identiske differencer, skal disse have samme rang (dvs. de skal tildeles en rang som er gennemsnittet af rangnumrene for de identiske differencer - se eksemplet nedenfor).
På samme måde som for Mann-Whitney testen er det ikke muligt at beregne en p-værdi i Excel. P-værdien kan alternativt beregnes vha. side 13.3.
Eksempel
To sygehuse har analyseret for stof X på et antal patientprøver. Dette gav følgende resultater:
Prøve nr |
Sygehus 1 |
Sygehus 2 |
1 |
53,4 |
54,7 |
2 |
40,6 |
41,7 |
3 |
45,8 |
45,6 |
4 |
44,3 |
44,5 |
5 |
50,6 |
51,0 |
6 |
51,4 |
51,7 |
7 |
49,9 |
49,0 |
8 |
44,4 |
46,0 |
9 |
41,9 |
40,9 |
10 |
39,7 |
40,5 |
Beregning af teststørrelsen foretages relativt simpelt i Excel, som vist nedenfor. Data indtastes, og differens og absolut differens beregnes i de næste kolonner (absolut differens i f.eks. celle E2 beregnes som "=abs(D2)"). Herefter sorteres tallene efter de absolutte differencer. Når man markerer kolonne E, og vælger "sorter", bliver man spurgt om man ønsker at udvide markeringen. Det er vigtigt at man vælger dette, hvorved de øvrige kolonner bliver sorteret på samme måde. Dvs. at rækkerne bliver ved at "hænge sammen" på den rigtige måde.
Endelig tilføjes rangnumre. Bemærk nummereringen af de to laveste differencer. Havde de været forskellige ville de have fået nummer 1 og 2; nu er de ens, og så bliver deres rang gennemsnittet af 1 og 2. Der skal gælde, at summen af alle rangnumre er lig \(n\cdot(n+1)/2\), hvor \(n\) er antal målinger i hver stikprøve. Dette kan med fordel anvendes til at kontrollere om nummereringen er korrekt.
Når man skal summere rangnumrene hørende til de negative eller de positive differencer, er det nemmeste først at sortere efter kolonne D (og igen vælge "udvid markeringen"). Herved får man samlet alle rangnumre hørende til de negative differencer øverst, og kan let summere disse.
Nedenstående spørgsmål tager udgangspunkt i ovenstående eksempel: |