CURSUS R statistic

 

 

95% betrouwbaarheidsinterval categoriale variabele.

In R is er voor het berekenen van het 95% Betrouwbaarheidsinterval (CI Confidence Interval) geen directe functie. Er zijn wel packkages voor die het CI berekenen en er is een interne functie, maar het is net zo makkelijk om het betrouwbaarheids interval gewoon uit te rekenen.

Voor een categoriale variabele is de standaardschattingsfout:

De frequentietabel van de variabele Geslacht in de dataset DataWoonwensenStudenten is:

P=49%
q=(100%-49%)=51%
n= 132+137=269

Ondergrens mannen 49%-2*3,05=42,9
Bovengrens mannen 49%+2*3,05=55,1

We kunnen dus met 95% zekerheid zeggen dat het percentage mannen van de populatie zit in het interval [42,9 ; 55,1]

In R berekenen we dit als volgt:

Uitleg: Op de derde regel wordt de variabele standaardschattingsfout aangemaakt (STschatf)
Hierin wordt de functie sqrt (wortel functie) gebruikt.
Length(Geslacht) berekent het totaal aantal waarnemingen n (in dit geval 269).

 

Stel we willen weten wat het 95% betrouwbaarheidsinterval van die studenten die minder dan 10 min. reistijd hebben, dan berekenen we dit als volgt:
De frequentietabel van de variabele Reistijd is:

Ga na dat we de volgende commando's in R moeten geven

en dat het 95% betrouwbaarheidsinterval is: [9,77 ; 18,23]