CURSUS R statistic

 

 

Spreidingsdiagram.

Om het verband tussen twee scale variabelen te laten zien gebruik je een spreidingsdiagram. In een spreidingsdiagram wordt onafhankelijke variabele op de X-as geplaatst en de afhankelijke op de Y-as.

In de dataset "DataWoonwensenStudenten" wordt het inkomen bepaald door de leeftijd. Het inkomen (y) is de afhankelijke variabele en de leeftijd (x) de onafhankelijke.
De functie voor een spreidingsdiagram is plot(x,y).

> plot(Leeftijd,Inkomen)

In het spreidingsdiagram is te zien dat het verband tussen leeftijd en inkomen niet erg groot is (punten liggen niet erg op een lijn. In "Lineaire regressie" hebben we dit ook gezien want de correlatie coëfficiënt was 0,4850048. In "Lineaire regressie" hebben we ook gezien hoe we de vergelijking opstellen voor de lijn door de punten. Daarvoor maakten we gebruik van de "lm" functie. Om niet steeds de lange formule in te toetsen hadden we de uitkomst van de "lm" functie vastgelegd in een nieuwe variabele t.w. LinRegModel en wel als volgt:

> LinRegModel=lm(Inkomen~Leeftijd)

Wil je regressie lijn tekenen in de grafiek, dan pas je de "abline()" functie toe op het net gemaakte LinRegModel, en wel als volgt:

> abline(LinRegModel)

Natuurlijk kun je deze grafiek niet zo opnemen in ons rapport. Je moet eerst de lay-out wat aanpassen. Dit doe je als volgt:

main = "Spreidingsdiagram leeftijd, Inkomen" (Titel grafiek)
xlab = "leeftijden studenten" (Titel x-as)
ylab = "inkomsten per maand" (Titel y-as)

> plot(Leeftijd,Inkomen,main ="Spreidingsdiagram leeftijd, Inkomen",xlab = "leeftijden studenten",ylab = "inkomsten per maand",col = "red")
> LinRegModel=lm(Inkomen~Leeftijd)
> abline(LinRegModel,col="blue")