<- "Tim"
name name
[1] "Tim"
Datentypen sind ein etwas komplizierteres Thema, das vor allem zu Beginn häufiger zu Verwirrung führen kann. Für uns ist zuerst einmal die Unterscheidung von Zahlen und Text relevant. Außerdem wollen wir uns logische Werte, fehlende Werte und Faktoren noch kurz anschauen.
Wie Du wahrscheinlich schon vermutet hast, sind 12
, 42
, 873485
und 1.87
Zahlen. Hier müssen wir nur beachten, dass R einen Punkt als Trennzeichen zwischen Vor- und Nachkommastelle verwendet. Wollen wir also die Zahl \(1,987\) in R schreiben, müssen wir 1.987
eingeben.
R kann nicht nur Zahlen verarbeiten, sondern auch Text (Zeichenfolgen). Wenn wir beispielsweise den Namen “Tim” in der Variable name
speichern wollen, müssen wir diesen in R in Anführungszeichen schreiben:
<- "Tim"
name name
[1] "Tim"
Wenn wir Zahlen und Text mischen, kann es zu Fehlern kommen:
<- "Tim"
name + 123 name
Error in name + 123: non-numeric argument to binary operator
Hier will R uns mitteilen, dass Text und Zahlen nicht einfach addiert werden können. Probiere einmal, zwei Texte zu addieren.
<- "Tim"
name + "Müller" name
Error in name + "Müller": non-numeric argument to binary operator
Was ist “123”?
<- "123" what_is_this
Handelt es sich um Text oder um eine Zahl?
Es handelt sich um Text. Um das zu überprüfen, können wir beispielsweise versuchen, eine Zahl zu addieren:
"123" + 5
Error in "123" + 5: non-numeric argument to binary operator
"123"
als Text sieht und 5
als Zahl. Als Daumenregel können wir uns merken: Wenn Anführungszeichen zu sehen sind, handelt es sich um Text!
Logische Werte können nur wahr oder falsch sein. Beispielsweise können wir mit logischen Werten speichern, ob bei einer Person eine Depression diagnostiziert wurde. In R nutzen wir hierfür die Worte TRUE
, oder FALSE
.
<- TRUE
depression <- FALSE anxiety_disorder
Fehlende Werte sind in der Psychologie leider sehr häufig. Diese kommen beispielsweise vor, wenn Teilnehmer:innen eine Studie abbrechen oder vergessen, auf eine der Fragen zu antworten. Da fehlende Werte so häufig sind, gibt es in R eine einfache Möglichkeit, diese auszudrücken: Die Werte sind “Not Available” oder NA
. Wenn beispielsweise eine Depressions-Diagnose fehlt, können wir dies speichern mit:
<- NA
depression <- FALSE anxiety_disorder
Faktoren können nur wenige vorgegenbene Ausprägungen annehmen. Wenn wir beispielsweise das Geschlecht von Personen mit den Kategorieren “männlich”, “weiblich” und “non-binär” erfassen, können wir dies folgendermaßen mit einem Faktor speichern:
<- factor("männlich",
gender levels = c("männlich", "weiblich", "non-binär"))
Wir besprechen in den kommenden Kapiteln noch im Detail, was das c()
bedeutet und was es mit factor()
auf sich hat.