Hoofdstuk 4 HET STATISTISCH PAKKET R
Doorheen deze cursus en het vak Biostatistics in de Master opleiding maken we gebruik van een pakket om alle statistische analyses uit te voeren en figuren te maken. Dit pakket is gratis te downloaden van op volgende locatie. Wanneer je het bestand hebt opgehaald kan je het openen zodat het pakket geïnstalleerd wordt. Klik op het R-icoon en het volgende venster zal openen:

Het kan vrij teleurstellend zijn, maar in dit pakket moet je alles zelf intikken en programmeren. Laat dit je vooral niet ontmoedigen, je hoeft al die codes en details niet van buiten te leren, je mag op het examen een formularium gebruiken (wat je op BB terug kan vinden). De console is het venster dat je toelaat om met R ‘te communiceren’. Hier wordt uiteindelijk de code naartoe gestuurd en verschijnt de output. Hoewel je rechtstreeks in de console je code kan intikken is het aangewezen om met scripts te werken. Klik op file en dan op new script om een nieuw venster te openen:

Dit nieuwe venster is niet meer dan een eenvoudige tekst editor waarin je code en commentaren kan intikken en bewaren (want als je R afsluit ben je anders al je werk kwijt!). Tik onderstaande code in je nieuwe script:
Dit laat je toe om enkele eenvoudige berekeningen te laten maken door R. Wanneer je een ‘#’ vooraan plaatst, zal dit stukje code niet uitgevoerd worden, zo kan je dus commentaren aan je code toevoegen. Merk ook op dat bij het intikken van de code er niets gebeurd. Inderdaad, nu moet je aan het pakket duidelijk maken dat die berekeningen uitgevoerd moeten worden. Hiervoor selecteer je het stuk van de code dat je uitgevoerd wil zien, en klik je via de rechter muisknop op Run line or selection. De code wordt naar de R console gekopieerd en uitgevoerd zodanig dat je de resultaten te zien krijgt:

De output in R ziet er als volgt uit:
## [1] 12
## [1] 6
## [1] 2
## [1] 21
Voeg nu onderstaande code toe:
Hier worden een aantal eenvoudige functies geïllustreerd (10-delig en natuurlijk logaritme, de vierkantswortel en de absolute waarde). Je kan de resultaten op exact dezelfde manier als hierboven bekomen.
Het is natuurlijk niet enkel de bedoeling om R als rekenmachine te gebruiken. Voordat we verder gaan moet eerst het concept ‘objecten’ duidelijk gemaakt worden. Hieronder wordt geïllustreerd hoe R met objecten werkt. Dit zijn namelijk geheugenplaatsen waar informatie in geplaatst kan worden. Ga na aan de hand van volgende code wat er gebeurt
Tot slot wordt hieronder nog toegelicht hoe een reeks getallen of labels aan een object (we noemen het dan een vector) toegewezen kan worden.
#invoeren van een getallen rij of reeks ‘labels
d<-c(1,2,5,3.5,6,10)
sum(d)
length(d)
e<-c('eten','drinken','verzekeringen','reizen','auto','aankoop vakantiehuis')
We hebben nu de werking van het pakket kort ingeleid. Verder in de cursus zullen nog tal van functies en stukken code geïllustreerd worden om gegevens grafisch weer te geven, beschrijvende statistieken te berekenen en statistische tests uit te voeren. Op zich is het niet noodzakelijk alle codes uit het hoofd te leren. Achteraan de cursus vind je een formularium met daarin alle R codes die je nodig hebt om alle oefeningen uit de cursus op te lossen en dus ook het examen met succes af te leggen. Dit formularium krijg je op het examen als geheugensteun. Hierbij wil ik ook benadrukken dat deze cursus een cursus statistiek is, en geen cursus R. We gebruiken R als hulp bij het uitvoeren van alle berekeningen en tests. De essentie van de cursus is dat je statistische principes aanleert en de juiste methode toepast voor specifieke (biologische) problemen. Wanneer je over enkele jaren een volwaardig afgestudeerde bioloog zal zijn, kan het natuurlijk zijn dat je voor je betrekking een ander statistisch pakket zal gebruiken. De code of manier van werken zal anders zijn, de tests die je moet uitvoeren zal identiek zijn en de output die je krijgt heel vergelijkbaar met wat R produceert. R is een van de meest veelzijdige pakketten die je kunt vinden EN het is GRATIS. Het werken met code i.p.v. met vensters gestuurde pakketten (zoals bv. SPSS) kan misschien in het begin wat frustrerend zijn, maar het is de investering waard om de R code onder de knie te krijgen.