CURSUS R statistic

 

 

Boxplot voor twee variabelen.

Wil je de scale waarden van een categoriale variabele per waarde bekijken dan gebruik je een boxplot. De functie van een boxplot is:

boxplot(Scale Var~Cat var)

Stel je wilt kijken of er verschil is in leeftijden binnen de opleidingen. Dit doe je dat als volgt:

> boxplot(Leeftijd~Opleiding)

Dit levert de volgende grafiek:

Je kunt deze grafiek weer verfraaien voor het rapport door de volgende toevoegingen:

main="Boxplot van de verdeling van de leeftijden per opleiding" (titel Boxplot)
xlab="Opleiding"
ylab="Aantal"
ylim=c(0,30) (leeftijden beginnen bij 0 en gaan door tot 30)

In commando:

> boxplot(Leeftijd~Opleiding,main="Boxplot van de verdeling van de leeftijden per opleiding",xlab="Opleiding",ylab="Aantal",ylim=c(0,30))

Resultaat:

Je ziet dat leeftijden bij logistiek lager liggen.
Ook kun je de boxen een kleurtje geven:

> boxplot(Leeftijd~Opleiding,main="Boxplot van de verdeling van de leeftijden per opleiding",xlab="Opleiding",ylab="Aantal",ylim=c(0,30),col="light blue")

 

Probleem met lange namen waarden.

Een probleem waarbij ik bij de Boxplot regelmatig tegen aanliep was, dat niet alle waarden op de x-as te zien waren. B.v. bij de volgende boxplot.

> boxplot(WoLastnu~WoSitnu)

De grafiek laat niet alle waarden op de x-as zien, ook al vergroot ik het venster.

Gedeeltelijk los je dit als volgt op:

Door las=2 toe te voegen zullen de labels van de x-as verticaal komen te staan.

> boxplot(WoLastnu~WoSitnu,las=2)

Maar nu passen ze verticaal nog niet.

Dit kan ik aanpassen door de marges van het grafisch venster aan te passen. Die staan normaal op:

mar=c(5,4,4,2)+0.1 , waarbij de 5 staat voor de ondergrens, de 4 voor rechts, de volgende 4 voor de top en de 2 voor links. Als ik de ondergrens aanpas (is even uit proberen maar bij mij moet die op 20 staan).
Het aanpassen doe je met het par commando en wel als volgt:

> par(mar=c(20,4,4,2)+0.1)
> boxplot(WoLastnu~WoSitnu,las=2)

Daarna het boxplot commando geven en dan zie je dat de grafiek past.

Vervolgens titels aanpassen, eventueel kleuren, en als laatste vooral niet vergeten, de marges terug te zetten met onderstaand commando.

> par(mar=c(5,4,4,2)+0.1)