CURSUS R statistic

 

 

Frequentieverdeling Ordinale variabele.

Ga na dat je de tabel waarop je analyses wilt uitvoeren geattached is. Zo niet attach alsnog.

> attach(DataWoonwensenStudenten)

In de enquête is de vraag opgenomen hoe belangrijk studenten veiligheid van de woonwijk vinden. Het betreft de variabele "Omgeveilig". Dit is een ordinale variabele (ga na). Door in R na de prompt de naam van de variabele in te toetsen krijg je alle waarden te zien.


Om in dit geval het aantal keer dat een waarde voorkomt te tellen gebruik je de "table" functie.

> table(Omgeveilig)

Je ziet dat 67 studenten het aspect veiligheid zeer belangrijk vinden.

Vaak willen we i.p.v. absolute aantallen percentages (relatieve aantallen) hebben. Dit kunnen we doen met de functie "prop.table".

Let Op: de prop.table functie werkt niet direct op variabele maar op de uitkomsten van een table functie, oftewel op een tabel.

> prop.table(table(Omgeveilig))

Als laatste plaatsen we vaak de cumulatieve relatieve percentages in een tabel. Dit kun je doen met de cumsum functie.

> cumsum(prop.table(table(Omgeveilig)))

De opbouw om te komen tot de cumulatieve percentages is mooi te zien aan de commando's. Eerst pas je de table functie toe. Op de uitkomst daarvan pas je de prop.table functie toe en daarop de cumsum.

De volgorde speelt bij een ordinale variabele een belangrijke rol. Daarom staan de nummers voor de labels in het CSV bestand. Dit zorgt dat de sortering goed is. Zou je dit niet doen, dan wordt gesorteerd op alfabet. Dan komt "zeer belangrijk" niet als eerste te staan maar als vierde net voor "zeer onbelangrijk". Voor de berekening van de mediaan en kwartielen is de volgorde o.a. van groot belang.

Bovenstaande tabellen geven de waarden wel goed aan maar zijn niet zo mooi in een rapport. Je kunt de waarden wel kopiëren naar Excel en daar een mooie tabel in maken, maar het kan ook in R. Je moet dan alleen meer handelingen uitvoeren. Die handelingen kun je ook eenmaal uitvoeren en in een script (programmaatje) plaatsen. Zo heb ik een script gemaakt voor het maken van een frequentie tabel voor een ordinale variabele. Dit script kun je hier downloaden. Frequentietabel Ordinale variabele Script.

Wil je de achtergrond weten van de werking van dit script, bekijk dan "Uitleg script Ordinale Variabele".

Open het script bestand. (Hoe script bestand openen)

Toepassen van het script bestand voor het maken van een frequentietabel.

Indien je het script bestand geopend hebt, zie je het volgende scherm:

Vul op de plaats waar de ***** staan de naam van je te analyseren variabele in, b.v. "Omgeveilig". Selecteer dan alle regels in het script venster door de toetsen combinatie "CTRL A".

Klik dan op Run (of CTRL Enter) om het script uit te voeren. Het resultaat is:

Wil je dit in je rapport opnemen, dan moet je deze tabel wel voorzien van begeleidende teksten b.v dat het hier gaat om een frequentietabel die weergeeft hoe belangrijk studenten het aspect veiligheid vinden.

Wil je van een andere ordinale variabele de frequentietabel maken, voer dan in het script achter "Variabele=" de naam in van die ordinale variabele waarvan je een frequentietabel wilt maken.

Doe dit b.v. om te oefenen voor de variabele "Reistijd". Deze geeft als resultaat:

 

Als je R verlaat, sla dit script dan niet op, want dan worden de laatste veranderingen (waarschijnlijk de namen van de variabele die je als laatste hebt ingevoerd) opgeslagen.