CURSUS R statistic

 

 

Kruistabel tussen twee of meer categoriale variabelen.

Ga na dat je de dataset waarop je analyses wilt uitvoeren geattached is. Zo niet attach alsnog.

> attach(DataWoonwensenStudenten)

Wil je de samenhang of het verschil zien tussen twee variabelen dan gebruik je een kruistabel. Een kruistabel wordt gemaakt op basis van de "Table" functie. Stel je wilt kijken of er een verschil is tussen mannen en vrouwen in hun woonsituatie dan begin je met het maken we de volgende tabel:

> table(WoSitnu,Geslacht)

Omdat je deze tabel vaker nodig hebt om berekeningen op los te laten voeg je hem toe aan een nieuwe variabele, die je "Kruistabel" noemt.

> Kruistabel= table(WoSitnu,Geslacht)

Wil je de inhoud zien dan toets je kruistabel in geef je een Enter.

> Kruistabel

Om verschillen of samenhang te kunnen aantonen moet je percentages vergelijken, want aantallen kunnen de zaak vertekenen, zeker als er een groot verschil in totaal aantal is tussen mannen en vrouwen.
Het percentage kun je berekenen door op de net aangemaakte tabel de prop.table functie los te laten.

> prop.table(Kruistabel,2)

Het cijfer 2 na kruistabel geeft aan dat de percentages per kolom berekend moeten worden. Merk op dat 80% (0.83030303) van de mannen thuis woont bij ouders tegen 70% (0.700729927) van de vrouwen. Vrouwen wonen iets meer opkamers (21%) tegen mannen (14%).

Indien we cijfer 1 invoeren krijgen we de volgende tabel

> prop.table(Kruistabel,1)

Cijfer 1 geeft de rijpercentages.
In deze tabel kunnen je zien dan van de studenten die bij hun ouders wonen 52% man is en 47% vrouw. Maar dit zegt niets over of er verschil is in manier van wonen tussen mannelijke en vrouwelijke studenten.

Met R kun je ook rekenen. Willen je echte percentages hebben dan doe je dat als volgt:

> prop.table(Kruistabel,2)*100

Willen je meer dan twee variabelen in een tabel dan kan dat ook. Stel dat we willen weten of er per woonsituatie een verschil is tussen mannen en vrouwen of ze in die gemeente wonen, dan kan dat als volgt:

Met het commando xtabs combineren eerst de drie variabelen en wel als volgt:

> xtabs(~WoSitnu+Geslacht+WoGemstu)

Merk op, dat de laatste variabele gesplitst wordt. De lay-out is niet mooi maar daarvoor kun je "ftable" gebruiken.

> ftable(xtabs(~WoSitnu+Geslacht+WoGemstu))

Vergemakkelijk het typen door de pijltoets omhoog te gebruiken, en dan voor de regel ftable (, en op het einde ) in te toetsen. Wil je percentages, plaats dan weer voor dit geheel prop.table.

Wil je berekeningen zoals afronden toets dit dan op de niuewe regel erbij:

> prop.table( ftable(xtabs(~WoSitnu+Geslacht+WoGemstu)),1)
> round(prop.table( ftable(xtabs(~WoSitnu+Geslacht+WoGemstu)),1)*100,digits =1)

Er is veel mogelijk in R, maar mijn ervaring is dat je steeds dingen moet proberen met de tabellen. Op een gegeven moment krijg je ervaring in het opbouwen van de commando's, simpel beginnen, oude commando oproepen met pijl omhoog, en dan aanpassen.