Ex03: iris
Download Exercise (Right Click - Save Link as…)
Dataframes
Zum Testen von Funktionen und zur Übung stellt R verschiedene Datensätze zur Verfügung. Der wohl bekannteste Datensatz davon ist iris
er kann folgendermaßen geladen werden:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
- Teste folgende Funktionen mit dem Iris Datensatz:
length()
, nrow()
, ncol()
, summary()
, colnames()
.
- Speichere die Species Spalte in einer neuen Variablen. Um was für ein R Objekt handelt es sich nun?
- Wie viele Species sind im Datensatz enthalten und wie oft kommt jede Species vor?
Dataframe subsetting
- Erstelle einen neuen data.frame der nur die Beobachtungen der Species “virginica” enthält.
- Erstelle einen neuen data.frame der nur die Beobachtungen der Species “setosa” und “versicolor” enthält.
- Erstelle einen neuen data.frame der extakt die erste Hälfte der Beobachtungen enthält.
- Erstelle einen neuen data.frame der nur Beobachtungen enthält mit einer Sepal.Length zwischen 5.5 und 7.
Dataframe additions
- Füge dem iris data.frame eine neue Spalte names “Genus” hinzu die in allen Reihen das Wort “iris” enthält.
- Füge dem iris data.frame eine neue Spalte names “ID” hinzu in der jede Reihe eine fortlaufende Zahl enthält.
- Füge dem iris data.frame zwei neue Spalten hinzu die jeweils den Flächeninhalt der Sepal und Petal beinhaltet (also length x width).
Ein bisschen Statistik
- Was ist die durchschnittliche Sepal.Length von “virginica”?
- Zeichne ein Histogramm der Sepal.Width.
- Berechne die Varianz und Standardabweichung der Sepal.Width.
- Erstelle einen Scatterplot mit der Sepal.Length auf der x-Achse und der Petal.Length auf der y-Achse.