Binomiaal toets.
De binomiale toets wordt gebruikt om te toetsen bij variabelen die maar uit twee waarde bestaan, of waarvan we twee waarden kunnen maken. We toetsen of een bepaald percentage van de ene variabele overeenkomt met onze verwachtingen.
Stel we weten dat op het instituut bedrijfskunde 55% mannelijke studenten zijn. Kijken we naar onze steekproef dan zien we dat:
> table(Geslacht)
Geslacht
man vrouw
132 137
dat percentage 132/269*100%= 49% (269=132+137)
Dit wijkt dus af van de aangenomen 55%. De vraag is of het significant afwijkt. Daarvoor dienen we de binomiaal toets binom.test() uit te voeren en wel als volgt:
> binom.test(132,269,p=0.55)
Exact binomial test
data: 132 and 269
number of successes = 132, number of trials = 269, p-value = 0.05728
alternative hypothesis: true probability of success is not equal to 0.55
95 percent confidence interval:
0.4294987 0.5521209
sample estimates:
probability of success
0.4907063
Uitleg: 132 is het aantal mannelijke studenten, 269 is het totaal aantal studenten.
p=0.55 De verwachte waarde is 0.55 is 55%.
Er wordt tweezijdig getoetst:
H0 : Het percentage mannelijke studenten is 55%
H1 : Het aantal mannelijke studenten is niet gelijk aan 55%.
De P-waarde = 0.05728 is 5,728 % is groter dan 5%. D.w.z. de H0 wordt niet verworpen.
Stel we toetsen eenzijdig d.w.z.
H0 : Het aantal mannelijke studenten is hoger of gelijk aan 55%.
H1 : Het aantal mannelijke student is lager dan 55%
Dit wordt als volgt getoetst:
> binom.test(132,269,p=0.55,alternative = "less")
Alternative = "less" wil zeggen dat we de alternatieve hypothese "minder dan" toetsen.
Wat we zien is dat de kans hierop p-waarde = 0.02939 ofwel 3%. Deze waarde is minder dan 5%. Dus gaan we voor de alternatieve hypothese H1.
Voorbeeld 2.
Stel het aantal bedrijfskunde MER studenten is 30%. We zien de volgende verdeling in de steekproef:
> table(Opleiding)
D.w.z. 41 van 269 studenten is 15,24% is maar MER student. De vraag is nu, of onze steekproef wel representatief is. De binomiale toets geeft daarop het volgende resultaat:
> binom.test(41,269,p=0.3)
De kans op 15% MER studenten uitgaande dat er 40% MER studenten zijn is p-value = 2.476e-08. Dit is in ieder geval kleiner dan 5%, en we moeten dus gaan voor de alternatieve hypothese, het percentage is niet gelijk aan 30%, maar dat is dan heel erg jammer, want de MER studenten zijn niet voldoende vertegenwoordigd in de steekproef, dus de steekproef is niet representatief.