CURSUS R statistic

 

 

Groepsvergelijking.

Bij een groepsvergelijking wil je bij iedere waarde van de categoriale waarde descriptives (beschrijvingen) hebben van je scale variabele.

Zo zou je voor de variabele Geslacht , dus per man of per vrouw waardes als gemiddelde, min, max enz. van de variabele leeftijd of Woonlast willen hebben.

In R gebruik je hiervoor de functie aggregate.

> aggregate(WoLastnu,by= list(Geslacht),FUN=summary)

Group.1    x.Min.    x.1st Qu.    x.Median    x.Mean    x.3rd Qu.   x.Max.
1   man      0.00          0.00           0.00       91.33         0.00   850.00
2   vrouw    0.00          0.00           0.00     136.10      300.00   900.00

Bovenstaande tabel geeft wel wat vertekening doordat er veel waarden 0.00 zijn. Je zou kunnen kijken of je een beter beeld zou krijgen als je de de woonsituatie er bij bekijkt:

> aggregate(WoLastnu,by= list(WoSitnu,Geslacht),FUN=summary)

Wat je ook zou kunnen doen is alleen die personen onderzoeken die daadwerkelijke woonlasten hebben. Deze groep kun je filteren als volgt:

> DataWoonwensenStudentenWolastGroterNul=DataWoonwensenStudenten[WoLastnu>0,]

Ga na met de DIM functie dat deze tabel maar 80 respondenten bevat.

Omdat DataWoonwensenStudenten nog geattached is, detach ik hem en attach ik DataWoonwensenStudentenWolastGroterNul zodat ik hetzelfde commando kan gebruiken.

> detach(DataWoonwensenStudenten)
> attach(DataWoonwensenStudentenWolastGroterNul)
> aggregate(WoLastnu,by= list(Geslacht),FUN=summary)


> detach(DataWoonwensenStudentenWolastGroterNul)
> attach(DataWoonwensenStudenten)

Wil je meer functies gebruiken, dan maak je gebruik van het Package "psych". Dit moet je eenmalig installeren. Zie Installeren Packages.

Voordat je een package gebruik moet je deze activeren. Doe dit. (hoe zie Installeren Packages)

In het package "psych" zit het commando "describeby". Je gebruikt het als volgt:

> describeBy(scale Var,Categoriale Var)

Uitgaande van dat we waarden als min, max, gemiddelde enz. voor zowel mannen als vrouwen willen hebben, geven we het volgende commando:

> describeBy(Leeftijd,Geslacht)

Waarden die je niet wilt gebruiken in je rapport verwijder je eenvoudig. Wil je weer een andere lay-out gebruik dan Excel. In R kun je de lay-out als volgt iets aanpassen als je daar de voorkeur aan geeft.

Het describeby commando kan je zelfs toepassen op een scale variabele en gebruiken als aanvulling op wat in Descriptives is uitgelegd, en wel als volgt:

> describeBy(Leeftijd,Geslacht,mat = TRUE)

De waarschuwing mag je laten voor wat die is.

Een ander voorbeeld is om de woonlasten per woonsituatie te bekijken. Dit kan als volgt:

> describeBy(WoLastnu,WoSitnu,mat = TRUE)

Het kan zijn dat je scherm te klein, maar je kunt je console waar de tabel in verschijnt vergroten, het commando weer uitvoeren en kijken of het past. Ook ga je niet alle kolommen gebruiken.
En je kunt onder tools, Global options het lettertype verkleinen.