//

Noter i statistik

Ikke-parametrisk hypotesetest

Fælles for de hypotesetest der er gennemgået i kapitel 6, er at de alle forudsætter, at de bagvedliggende fordelinger er normalfordelinger. Eller mere generelt at fordelingerne kan beskrives ved en eller flere parametre (deraf navnet parametriske test). Hvis man ikke har noget kendskab til de bagvedliggende fordelinger, kan man således, principielt, ikke anvende t-tests. I praksis er t-testene rimeligt robuste overfor afvigelser fra normalfordeling, og kan ofte anvendes selvom de underliggende populationer ikke er normalfordelte.

Som alternativ til t-testene er der udviklet en række test, der ikke forudsætter at de bagvedliggende populationer er normalfordelte, nemlig de såkaldte ikke-parametriske test. I disse noter gennemgås Mann-Whitney testen, som bruges til at sammenligne to uparrede stikprøver, Wilcoxon testen som bruges til at sammenligne to parrede stikprøver, og endelig \(\chi^2\)-testen (det græske bogstav "chi"; udtales "ki i anden") som bruges til at analysere antalstabeller.

Forudsætninger

Mann-Whitney og Wilcoxon-testene fremstilles ofte som test der ikke har nogen forudsætninger om de bagvedliggende fordelinger, og som tester den nulhypotese at fordelingerne er ens. Dette er imidlertid ikke korrekt. Nulhypotesen for begge test er at fordelingerne har identiske medianer, og især for Mann-Whitney-testen er det en vigtig forudsæting at fordelingerne er identiske bortset fra at de evt. har forskellig median. Hvis denne forudsætning ikke er opfyldt, så vil testens type-1 fejl ikke være identisk med signifikansniveauet. Dette kan man overbevise sig om på side 7.4 ved at sætte MIREDIF=0 (hvorved man får en beregning af type-1 fejlen) og indtaste forskellig spredning og forskellig antal målinger for de to stikprøver. Afhængigt af om man angiver flest målinger for populationen med den største eller den mindste spredning, kan man få type-1 fejlen til at blive både større og mindre end signifikansniveauet.

Alt dette betyder at man i praksis ofte vil være bedre stillet ved at anvende en t-test (specielt den udgave hvor man korrigerer for at populationerne kan have forskellige varians).

Inden man læser de følgende sider, kan det være en god idé at genopfriske den overordnede teori bag de statistiske hypotesetest, som gennemgået på siderne 6.1, 6.2, 6.3 og 6.4, da dette forudsættes kendt.

© Thomas Bendsen • 2009 - 2022 • thbe@via.dk