CURSUS R statistic

 

 

One sample t-test.

De one sample t-test gebruik je bij een scale variabele. Je verwacht een bepaalde uitkomst van het gemiddelde , en die wil je vergelijken met de werkelijke uitkomst.

B.v. een paar jaar geleden is onderzoek gedaan naar de oppervlakte van kamers van studenten. Daar kwam uit dat de gemiddelde woonoppervlakte 26 m2 was. Met het mean() commando heb je al kunnen zien dat het gemiddelde nu 34.6171 is. Dit is hoger. Toetsen we tweezijdig, dan is:

H0 : De gemiddelde woonoppervlakte is 26
H1 : De gemiddelde woonoppervlakte is niet gelijk aan 26.

Het commando om de t-test uit te voeren is t.test(Naam variabele, mu= verwachte gemiddelde).

> t.test(WoOppnu,mu=26)

De p-waarde geeft de kans aan, uitgaande dat het gemiddelde 26 is, er uit de steekproef 34,6171 komt. Die kans is 0,03579 is kleiner dan 5% dus uitzonderlijk klein. Is die kans kleiner dan 5% dan verwerp je de H0 hypothese ten gunste van de H1 (alternatieve hypothese).

In dit geval wijkt de gevonden waarde significant af van 26.

Misschien was het handiger eenzijdig te toetsen omdat de uitkomst echt groter is.
R toetst standaard tweezijdig. Willen we echt eenzijdig toetsen dan geven dat als volgt op:

> t.test(WoOppnu,mu=26,alternative = "greater",conf.level = 0.95)

Eenzijdig en groter dan (alternative = "greater").
Hier is α=5% conf.level=0.95.
Wil je een α=1% dan stel je in conf.level=0.99
De kans uitgaande van een gemiddelde kamergrootte van 26, dat er 34.6171 uitkomt of meer is 0.0179 is 1,79% is dus kleiner dan 5%. In dat geval is de echte waarde van het gemiddelde groter dan 26.

Hier is:

H0 : De gemiddelde woonoppervlakte is kleiner of gelijk aan 26.
H1 : De gemiddelde woonoppervlakte is groter dan 26.

Voorbeeld 2:

Stel het verwachte maandinkomen is €655. We testen dit als volgt:

> t.test(Inkomen,mu=655)

We zien dat de kans 8,873% is bij tweezijdig toetsen. Dit is groter dan 5% dus handhaven we de HO. Die was, Het gemiddelde maandinkomen is gelijk aan 655.

 

Zouden we eenzijdig toetsen, met als alternatieve hypothese H1 : het gemiddelde inkomen ligt beneden de 655 dan krijgen we de volgende instellingen:

> t.test(Inkomen,mu=655,alternative = "less")

Wat we hier zien is dat de p-waarde wel beneden de 5% zit. Dus het gemiddelde inkomen zit significant beneden de 655.