CURSUS R statistic

 

 

Chi-kwadraattoets twee variabelen.

Om te toetsen of er verschil is in de uitkomsten van waarden van twee variabelen met kwalitatief meetniveau (Nominaal of ordinaal) wordt de Chi-kwadraattoets gebruikt.

De Chi-kwadraat toets wordt toegepast op een tabel.

Voorbeeld 1.

Stel we willen weten of de verdeling van mannen en vrouwen per opleiding gelijk is. Dan onderzoeken we dat door de volgende stappen te nemen.

Maak in een nieuwe variabele FrequentieTabel een table van opleiding en geslacht.

> FrequentieTabel=table(Opleiding,Geslacht)
> FrequentieTabel

Om te zien of de verdeling per opleiding ongeveer gelijk is maken we van deze tabel een tabel met percentages.

> PerFreqTable=prop.table(FrequentieTabel,1)
> PerFreqTable

De percentages moeten rij percentages zijn (vandaar de 1 in prop.table, 2 is kolom percentages).
In de tabel zien we dat er bij logistiek 71% mannen en 29% vrouwen zijn, terwijl bij Human Resource Management 41% mannen en 59% vrouwen. Dit is zeker niet gelijk. We gaan dit toetsen met:

H0 : De verdeling van mannen en vrouwen over de opleidingen is gelijk.
H1 : De verdeling van mannen en vrouwen over de opleidingen is niet gelijk.

Toetsen doen we met de functie chisq.test die we toepassen op de Table.

> chisq.test(FrequentieTabel)

Van belang is de p-waarde. Deze is kleiner dan 5%. D.w.z. dat we de aanname dat de verdeling van mannen en vrouwen per opleiding gelijk is verwerpen. Er is een significant verschil in de verdeling van mannen en vrouwen over een opleiding. Bij FM en HRM zijn verhoudingsgewijze veel meer vrouwen.

Voorbeeld 2

In de enquĂȘte zijn foto's en beschrijvingen van woningen bevraagd. Bij woonbeeld 2 valt bij een eerste onderzoek het op dat er een verschil is in de keuzes per opleiding. We gaan onderzoeken of dit verschil significant is.
H0 : Er is geen verschil in keuzes bij woonbeeld twee tussen de opleidingen.
H1 : Er is wel een verschil in keuzes bij woonbeeld twee tussen de opleidingen.

In R geven we de volgende commando's:

> FrequentieTabel=table(Woonbeeld.2,Opleiding)
> PerFreqTable=prop.table(FrequentieTabel,2)
> PerFreqTable

We zien dat bij logistiek een groot deel de woning wel vindt passen (29%+37%+9%),
en bij HRM en facility management een groot deel niet (16%+ 37% Fac.Man. 20%+33% HRM)

De vraag is, of dit verschil significant is. Dit toetsen we met de Chi kwadraat toets.

> chisq.test(Woonbeeld.2,Opleiding)

We zien dat de p-waarde weer kleiner is dan 5% dus er is een significant verschil.
R geeft een waarschuwing. Eigenlijk mag de Chi-kwadraat toets niet uitgevoerd worden omdat bepaalde combinaties te weinig waarnemingen hebben. B.v. bij past volledig hebben maar twee mensen van Bedrijfskunde MER "past volledig" ingevuld. Zo ook bij FM en HRM. Hierdoor is de berekening niet helemaal zuiver, maar wij accepteren hem wel.