Datenvisualisierung: Auseinandersetzung mit Form, Farbe und Ordnungsprinzipien, um Zusammenhänge in größeren Datenmengen sichtbar zu machen. Das Ergebnis ist ein programmierter, interaktiver Prototyp.
Die Daten werden ohne Zuhilfenahme von bildhaften Elementen (Piktogramme, Fotografien, …) interaktiv dargestellt. Alphanumerische Zeichen (Text, Zahlen) sollen so sparsam wie möglich verwendet werden. Umso wichtiger wird es, gezielt Farbe, Form und Position einzusetzen, um
Mengen sichtbar zu machen,
Kategorien zu kodieren,
Gruppen zu bilden,
Zeitabläufe nachverfolgbar zu machen,
…
Die Darstellung von Daten zwingt schon an sich zu einer parametrischen Denkweise. D.h. die grafischen Elemente müssen flexibel gedacht werden, so dass sie unterschiedliche Zahlenwerte und Bedeutungen annehmen können. Das Denken in Varianten ist also essenziell. Zudem erlauben unterschiedliche Gesamtdarstellungen neue Einblicke in die Zusammenhänge innerhalb der Daten. Durch Interaktion können weitere Zusammenhänge vom Nutzer entdeckt werden.
Aus dem Kaggle-Datensatz mit 30.000 Zeilen und 18 Spalten habe ich sieben relevante Spalten ausgewählt, die demografische, akademische und lebensstilbezogene Faktoren abbilden.
Dazu gehören die Spalten:
Depression (yes/no)
Have you ever had suicidal thoughts
Study hours
Financial stress
Family history of mental problems
Age
Gender
Academic Performance
Prozess
Ich hatte zwei Ideen: Die erste besteht aus freieren Formen bzw. Strichen, die zweite aus geometrischen Formen – vor allem aus Punkten. Ich habe mich für die zweite entschieden, da sie geordneter und strukturierter wirkt. Diese Idee habe ich weitergedacht wodurch folgendes Layout für das Diagramm entstand.
Die Personen werden durch Punkte dargestellt, wobei ein Punkt jeweils für zehn Personen steht.
Die Grafik ist vertikal in zwei Gruppen unterteilt: links Personen mit Depressionen, rechts Personen ohne Depressionen. Horizontal ist sie nach verschiedenen Faktoren gegliedert, die sich in der Regel mit „Ja“ oder „Nein“ beantworten lassen – mit Ausnahme des Geschlechts, das in „männlich“ und „weiblich“ unterschieden wird.
Die nach außen größer werdenden Ringe stellen Faktoren dar, die auf Skalen basieren – wie zum Bespiel das Alter, das in diesem Fall von 18 bis 35 Jahren reicht.
Endergebnis
Auf der linken Seite der Datengrafik befindet sich eine Auswahl an Buttons, mit denen sich verschiedene Eigenschaften von Personen mit und ohne Depression ein- und ausblenden lassen. Die Merkmale sind in zwei Kategorien unterteilt:
– Skalierte Eigenschaften, wie z. B. Alter
– Dichotome Eigenschaften, also Merkmale mit zwei Ausprägungen (z. B. Mann/Frau)
Werden Eigenschaften abgewählt, ordnen sich die Punkte der Datenvisualisierung neu: Die Punkte ordnen sich in konzentrischen Kreisen an. Diese Anordnung erleichtert den direkten Vergleich der Mengenverhältnisse zwischen verschiedenen Gruppen.
Zusätzliche Informationen zu den Personen erhält man durch Hovern über die Punkte: Unter der Button-Auswahl erscheint eine Infobox mit detaillierten Angaben zur jeweils ausgewählten Personengruppe. Gleichzeitig werden alle anderen Punkte mit denselben Eigenschaften visuell hervorgehoben.