//

Noter i statistik

F-test

Formål

T-testene på de foregående sider har til formål at sammenligne middelværdierne i to populationer. Man kan  imidlertid også være interesseret i at sammenligne spredninger. Dette gælder f.eks. hvis man skal gennemføre en t-test med to uparrede stikprøver (side 6.9). Et andet eksempel er sammenligning af analyseusikkerheden (som jo udtrykkes ved en spredning) på to forskellige apparater.

Til at sammenligne spredninger (eller varianser) bruges en F-test. Principperne for denne test er identiske med principperne for t-testene. Blot beregnes test-størrelsen naturligvis på en anden måde, og der skal bruges en anden fordeling (F-fordelingen) til at beregne testsandsynligheden.

Forudsætninger og notation

F-testen har (ligesom t-testene) som forudsætning at stikprøverne stammer fra normalfordelte populationer. Spredningerne i de to populationer benævnes \(\sigma_1\) og \(\sigma_2\), antallet af målinger i de to stikprøver benævnes \(n_1\) og \(n_2\) og spredningerne i stikprøverne benævnes \(SD_1\) og \(SD_2\).

Bemærk at hypoteserne traditionelt opskrives med varianserne (dvs. kvadratet på spredningerne)

Fremgangsmåde

Først opstilles (som for alle andre hypotesetests) de to hypoteser:

$$H_0: \sigma_1^2=\sigma_2^2$$

$$H_1: \sigma_1^2\neq\sigma_2^2$$

Teststørrelsen (F) beregnes som

$$F=\frac{SD_1^2}{SD_2^2}$$

dvs. F er forholdet mellem varianserne i de to stikprøver.

Beregning af p-værdien

 

Figur 1: F-fordelingen med 10 frihedsgrader i tæller og nævner. Arealet af det røde område markerer sandsynligheden for at få en F-værdi under 0,4.

Ovenstående figur viser hvordan F-teststørrelsen fordeler sig, hvis nul-hypotesen er sand. Bemærk først at denne fordeling afhænger af antallet af frihedsgrader for den spredning der står i tælleren i teststørrelsen, og antallet af frihedsgrader for den spredning der står i nævneren. Disse frihedsgrader bestemmes på samme måde som for alle andre spredninger (se side 4.11).

Dernæst kan man bemærke en række andre egenskaber: Umiddelbart kunne man forestille sig at den oftest forekomne værdi (kurvens toppunkt) ville være 1 (som jo er den værdi der stemmer bedst overens med nul-hypotesen). Men dette er altså ikke tilfældet. Hvis antal frihedsgrader for de to spredninger er identiske, så vil fordelingens median være 1 - dvs. at der er 50% sandsynlighed for at \(SD_1\) er størst, og 50% sandsynlighed for at \(SD_2\) er størst, men median og toppunkt er generelt ikke sammenfaldende.

P-værdien for en to-sidet F-test er 2 gange det røde areal (idet F-værdier som er større end 1 også taler imod nul-hypotesen, hvis testen er to-sidet). Det røde areal kan beregnes i nyere udgaver af Excel som: "=F.FORDELING(\(F\),frihedsgrader tæller, frihedsgrader nævner,SAND)" - hvor \(F\) er den beregnede teststørrelse (stikprøverne skal nummereres så den mindste spredning er nummer 1, eller med andre ord så \(F\) bliver mindre end 1).

Hvis man skal lave en enkeltstidet test, så undlader man blot at gange med 2, idet p-værdien her svarer til arealet af det røde område på figuren.

 

© Thomas Bendsen • 2009 - 2022 • thbe@via.dk