CURSUS R statistic

 

 

Workdirectory aanmaken en CSV bestand laden.

Handig is om al je bestanden die je aan het analyseren bent, en dus vaker gaat gebruiken in een directory te plaatsen en Rstudio te laten weten dat dat de standaard directory is. Zoals je in de tutorials van Mike Marin hebt kunnen zien doe je dit door de volgende opties in het menu te kiezen:

Kies dan de directory waar je CSV bestand in zit.

Voor het inladen van het bestand geef je het volgende commando:

> DataWoonwensenStudenten=read.csv(choose.files(),sep = ";",dec = ",")

Het commando om een .CSV bestand in te lezen is : read.csv()
De tabel met zijn gegevens wordt opgeslagen in de variabele "DataWoonwensenStudenten" (Je kunt iedere naam voor de variabele kiezen maar voor de duidelijkheid heb ik dezelfde naam gekozen als het databestand).
Door de optie "Choose.files()" krijg je de mogelijkheid via de verkenner je bestand te kiezen.
kies voor deze cursus het bestand "DataWoonwensenStudenten.CSV".
Als je het DataWoonwensenStudenten.CSV bestand zou bekijken in de kladblok, dan ziet dat er als volgt uit:

Wat je ziet is dat de verschillende velden gescheiden worden door de ";". Vandaar de optie sep=";".
Dan is er een verschil in het gebruik van cijfers na de comma. In Nederland gebruiken we de "," om decimale cijfers weer te geven. In Amerika wordt de "." gebruikt. De gebruikte notatie moeten we aangeven, vandaar de dec=",".

Geef daarna het commando:

> View(DataWoonwensenStudenten)

om de data in het bovenste deel van het scherm te laten zien.

De inhoud van het bestand wordt linksboven getoond, rechtsboven wordt aangegeven dat deze tabel uit 269 objecten bestaat met 35 variabelen. Links onder kun je commando's geven.

Het commando dat ik dan altijd als eerste geef is het attach commando waardoor bij het geven van de volgende commando's duidelijk is dat het om het "DataWoonwensen" bestand gaat.

> attach(DataWoonwensenStudenten)

Door het geven van dit commando hoef ik niet steeds de naam van het CSV bestand te benoemen in b.v. commando's die betrekking hebben op variabelen van dat bestand.

> WoSitnu ipv > DataWoonwensenStudenten$WoSitnu

om de variabele WoSitnu weer te geven.

Rstudio heeft ook de mogelijkheid om via het menu bestanden in te laden. Onder "Import Dataset" kun je in het menu voor "From CSV" kiezen.

Ik raad deze methode af omdat de niet getallen variabelen dan van het type Character zijn en niet van het type Factor.