CURSUS R statistic

 

 

Histogram Scale variabele.

Zorg dat je het databestand geattached hebt.

> attach(DataWoonwensenStudenten)

Een histogram is essentieel anders dan een staafdiagram. Een histogram wordt gebruikt voor scale variabelen. Kenmerk is dat een staaf in een histogram niet uit een waarde bestaat maar uit meerdere waarden (interval). R berekend automatisch de afstand van ieder interval, maar die afstand is ook zelf in te stellen. Je maakt een histogram met de functie "hist". De verdeling van de variabele WoLastwens ziet er als volgt uit.

> hist(WoLastwens)

We zien dat waarschijnlijk een iemand een erg hoge woonlast wens heeft. Van de andere zien we dat de verdeling tot 1000 erg grof is. Ik zou die liever verdelen in meer klassen. Dit kan met het commando break en wel als volgt:

> hist(WoLastwens,breaks=20)

Een grafiek als bovenstaande kun je niet zo opnemen in je rapport. Je zult de titels aan moeten passen en eventueel de staven een kleurtje moten geven. Zo heb ik de grafiek met onderstaand commando als volgt verfraaid:

> hist(WoLastwens,breaks = 20,col = "#99ffff",main="Verdeling van het maximale bedrag dat men voor wonen wil betalen",xlab = "Woonlasten per maand",ylab="aantal")

Met het commando "col = " kun je iedere gewenste kleur aan de staven geven. Je kunt het eenvoudig doen door col = "blue" b.v. in te vullen, maar ook iedere kleur is te geven als je de kleurcode weet.
Met main, xlab en ylab kan ik de titels naar eigen wens aanpassen.

De verdeling van een histogram van een variabele wordt vaak vergeleken met de normale verdeling. Kijken we b.v. naar de woonlasten wens per maand dan lijkt die erg normaal verdeeld op die ene uitzondering na. Daarom willen we graag de normaal kromme in de grafiek tonen.

Hiervoor is weer een script t.w. NormaalKrommeGrafiek.R.

Open het script bestand. (Hoe script bestand openen).

Pas Variabele en titels aan, selecteer alle regels in het script (CTRL A) en run het script (CTRL Enter)

Pas het script toe op de WoLastwens dan zit die er als volgt uit:

Probeer deze als volgt aan te passen in het script:

Maak ook de volgende verdeling van de leeftijd:

Sla het script daarna niet op.