Datenvisualisierung: Auseinandersetzung mit Form, Farbe und Ordnungsprinzipien, um Zusammenhänge in größeren Datenmengen sichtbar zu machen. Das Ergebnis ist ein programmierter, interaktiver Prototyp.
Die Daten werden ohne Zuhilfenahme von bildhaften Elementen (Piktogramme, Fotografien, …) interaktiv dargestellt. Alphanumerische Zeichen (Text, Zahlen) sollen so sparsam wie möglich verwendet werden. Umso wichtiger wird es, gezielt Farbe, Form und Position einzusetzen, um
Mengen sichtbar zu machen,
Kategorien zu kodieren,
Gruppen zu bilden,
Zeitabläufe nachverfolgbar zu machen,
…
Die Darstellung von Daten zwingt schon an sich zu einer parametrischen Denkweise. D.h. die grafischen Elemente müssen flexibel gedacht werden, so dass sie unterschiedliche Zahlenwerte und Bedeutungen annehmen können. Das Denken in Varianten ist also essenziell. Zudem erlauben unterschiedliche Gesamtdarstellungen neue Einblicke in die Zusammenhänge innerhalb der Daten. Durch Interaktion können weitere Zusammenhänge vom Nutzer entdeckt werden.
Die Datenvisualisierung stellt die Verteilung der verschiedenen Diabetes-Typen dar und macht Zusammenhänge sowie Unterschiede zwischen ihnen sichtbar.
Datensatz
Der verwendete Datensatz stammt von Kaggle und umfasst 70.000 Zeilen und 34 Spalten. Die Spalten enthalten Informationen wie Alter, Geschlecht, Body-Mass-Index (BMI), Blutzuckerwerte, Blutdruck, Insulinspiegel und das Vorhandensein verschiedener Diabetes-Typen. Die Daten wurden ursprünglich von der National Institute of Diabetes and Digestive and Kidney Diseases bereitgestellt und zielen darauf ab, Faktoren zu identifizieren, die das Auftreten von Diabetes beeinflussen.
Erste Visualisierungen
Um die relevantesten Spalten für die Visualisierung zu bestimmen, habe ich zunächst erste Visualisierungen erstellt und verschiedene Variablen-Kombinationen getestet. Dies half mir, die Struktur der Daten zu verstehen und aussagekräftige Zusammenhänge zu identifizieren. Schließlich entschied ich mich für Alter und BMI als Einstieg, da sie allgemein verständlich und für alle Diabetes-Typen relevant sind. Um die Darstellung klarer zu strukturieren, habe ich relevante Gruppen definiert und gezielt aussagekräftige Diabetes-Typen ausgewählt, basierend auf zusätzlicher Recherche und Gegenüberstellungen.
Skizzen
Anschließend habe ich verschiedene Skizzen angefertigt und experimentell unterschiedliche Visualisierungsansätze getestet, um die bestmögliche Darstellungsform zu finden. Dieser Prozess half mir dabei, ein besseres Verständnis für die Daten zu entwickeln und herauszufinden, welche Methoden sich für eine klare und intuitive Darstellung eignen. Dabei fiel mir auf, dass man bei diesem Datensatz automatisch dazu neigt, Cluster zu bilden, da die Vielzahl an Punkten sonst schwer zu interpretieren ist.
Finaler Entwurf
Schließlich führte dieser Ansatz zum finalen Entwurf, der die gewonnenen Erkenntnisse in strukturierte und aussagekräftige Darstellungen zusammenführt.
1. Screen: Alter und BMI - Heatmap
Der erste Screen stellt eine Heatmap dar, die Alter und BMI als zentrale Achsen verwendet. Die Größe der Kreise gibt an, wie viele Fälle innerhalb eines bestimmten Clusters (z. B. 0–5 Jahre und BMI 10–15) auftreten. Die verschiedenen Diabetes-Typen sind als Ringe farblich unterschieden. Die Dicke des Rings sagt außerdem noch die Anzahl des jeweiligen Diabetestypen dar. Diese Darstellung ermöglicht eine erste Übersicht darüber, wie sich Diabetes-Typen in unterschiedlichen Alters- und BMI-Gruppen verteilen.
2. Screen: Detailansicht Blutwerte - Boxchart
Wenn man auf einen Cluster in der Heatmap klickt, öffnet sich eine Detailansicht, die eine genauere Analyse der Blutwerte innerhalb dieses Clusters ermöglicht. Hier werden die Glucose-, BMI- und Cholesterinwerte der verschiedenen Diabetes-Typen dargestellt. Dadurch lassen sich Unterschiede und Gemeinsamkeiten innerhalb derselben Alters- und BMI-Gruppe besser erkennen und vergleichen.
3. Screen: Blutwertevergleich - Kreisdiagramm
Wenn man stattdessen auf der Hauptseite den Button “Blutwerte” klickt, gelangt man zu einer Kreisdiagramm-Ansicht, die die verschiedenen Diabetes-Typen anhand ihrer Blutwerte vergleicht. Im Gegensatz zur Detailansicht zeigt dieser Screen alle Daten auf einen Blick, unabhängig von einzelnen Clustern. Die Größe der Kreise bestimmt den Durchschnitt der jeweiligen Werte. Nutzer*innen können hier Cholesterin-, Insulin- und Glucosewerte direkt vergleichen und so einen Überblick über die Unterschiede zwischen den Diabetes-Typen erhalten.