Datenvisualisierung: Auseinandersetzung mit Form, Farbe und Ordnungsprinzipien, um Zusammenhänge in größeren Datenmengen sichtbar zu machen. Das Ergebnis ist ein programmierter, interaktiver Prototyp.
Die Daten werden ohne Zuhilfenahme von bildhaften Elementen (Piktogramme, Fotografien, …) interaktiv dargestellt. Alphanumerische Zeichen (Text, Zahlen) sollen so sparsam wie möglich verwendet werden. Umso wichtiger wird es, gezielt Farbe, Form und Position einzusetzen, um
Mengen sichtbar zu machen,
Kategorien zu kodieren,
Gruppen zu bilden,
Zeitabläufe nachverfolgbar zu machen,
…
Die Darstellung von Daten zwingt schon an sich zu einer parametrischen Denkweise. D.h. die grafischen Elemente müssen flexibel gedacht werden, so dass sie unterschiedliche Zahlenwerte und Bedeutungen annehmen können. Das Denken in Varianten ist also essenziell. Zudem erlauben unterschiedliche Gesamtdarstellungen neue Einblicke in die Zusammenhänge innerhalb der Daten. Durch Interaktion können weitere Zusammenhänge vom Nutzer entdeckt werden.
Unsere Aufgabe war es einen Datensatz auszusuchen und diesen zu visualisieren. Ich habe mich für den Datensatz “Movie Industry” entschieden. Da der Datensatz sehr viele Filme und dazugehörige Eigenschaften beinhaltet, mache ich mir zu erst Gedanken dazu, auf welche Eigenschaften ich mich konzentrieren möchte und welche Faktoren sehr interessant im Zusammenspiel sein könnten. Dazu formuliere ich folgende Leitfragen:
Ist die Popularität des Filmes abhängig vom Regisseur?
Welches Genre ist am populärsten/beliebtesten?
Welche Filme haben am meisten Einnahmen gemacht?
Visualisierung
Ich habe mich hauptsächlich auf Regisseure konzentriert da ich Leitfragen in diesem Zusammenhang spannend finde. Ich habe überlegt die Filme auf der x- und y-Achse in einem Raster nach director und star zu sortieren. Ich finde es interessant zu sehen ob gewisse Regisseure mit einem Hauptdarsteller vermehrt Filme gedreht haben. Diese Idee finde ich spannend aber die Umsetzung diese über die Verteilung auf der x- oder y-Achse darzustellen finde ich problematisch, da es so nur Sinn machen würde Regisseure und Hauptdarsteller reinzubringen die öfter miteinander Filme gedreht haben und das meinen Datensatz zu sehr einschränken würde und möchte diesen Faktor über einen anderen Weg visulisieren.
Eingrenzung Datensatz
Der Datensatz beinhaltet insgesamt 7512 Filme. Da ich diese nicht zuammenfassen möchte und jeden Film einzeln darstellen möchte habe ich mir überlegt wie ich die Anzahl der Filme reduzieren kann, da der Umfang für die Umsetzung sonst deutlich zu groß wäre. Ich filtere die Filme anhand der Regisseure. So werden nur noch Filme von Regisseuren dargestellt, die mehr als 6 Filme gedreht haben. Alle anderen Regisseure und deren Filme werden nicht berücksichtigt.
Umsetzung
Da ich die Filme nach Regisseuren filtere möchte ich diese auf der y- Achse auflisten. Als zweite Eigenschaft entscheide ich mich für den IMDb Score (Internet Movie Database) da dieser die Qualität des Filmes und deren Popularität darstellt. Ich finde es spannend zu sehen ob Regisseure die viele Filme gedreht haben einen höheren Durchschnittsscore haben, als Regisseure die eher wenige Filme gedreht haben. Die Regisseure werden auf der y-Achse links aufgeliset, während der Score von 1-10 auf der x-Achse liegt.
Wenn ein Regisseur nun mehrere Filme gedreht hat die alle den selben score haben, liegen diese übereinander und man kann nicht erkennen wieviele Filme an der Position sind. Um das Problem zu beheben ändere ich die Transparenz der einzelnen Punkte. So erkennt man direkt wenn ein Regisseur mehrere Filme gedreht hat, die den selben score bekommen haben. Außerdem möchte ich die Einnahmen erkennbar machen und habe diese durch die Größe des Punktes sichtbar gemacht. Hierbei finde ich es vorallem spannend zu sehen ob ein Film mit hohem score auch automatisch hohe Einnahmen erziehlt.
Sobald man einen Film mit einem Klick auswählt wird dieser farblich markiert, alle anderen Filme mit dem gleichen Hauptdarsteller werden ebenfalls farblich hervorgehoben. Ich finde es interessant zu sehen welcher Regisseur vermehrt Filme mit einem Hauptdarsteller gedreht hat.
Für jedes Genre habe ich eine Farbe festegelegt. Dabei finde ich es spannend zu sehen welches Genre besonders erfolgreiche Filme hat, oder ob Regisseure nur Filme in einem Genre drehen oder dabei variieren.
Finaler Prototyp
Wenn man über die Filme hovert bekommt man über die Hoverbox den Namen des Filmes und weitere Informationen wie Erscheinungsjahr, Budget und Einnahmen, und die Namen des Hauptdarstellers und Regisseurs angezeigt.
Hinterlasse einen Kommentar