Pandemien produzieren gewaltige Zahlenberge: Wo gibt es wie viele Infizierte, wie viele sind neu hinzugekommen, wie viele Menschen haben sich bereits erholt. Wo sind aktuell die Brandherde. Das ist auch in Zeiten von Corona nicht anders. Diese Daten zu visualisieren kann helfen, Zusammenhänge zu verstehen, Infektionsketten zu sehen und damit einen Beitrag leisten, die Krankheit zu bekämpfen. In diesem Artikel stelle ich die besten und meist kostenlosen Tools vor, mit denen Daten visualisiert werden können.
Ein historisches Beispiel für eine derartige Datenvisualisierung ist die Karte des Choleraausbruchs in der Londoner Broad Street von 1854. Der britische Chirurg setzte seinerzeit kleine Balkendiagramme auf Häuserblocks der Stadt, um die Anzahl an Todesfällen durch Cholera in jedem Haushalt eines Londoner Stadtviertels anzuzeigen. So konnte er schnell erkennen, dass die Haushalte, die am meisten unter der Cholera litten, allesamt ihr Trinkwasser aus demselben Brunnen bezogen. Das war damals eine geradezu revolutionär neue Erkenntnis und der Ausbruchsherd konnte so schnell eingedämmt werden.
Datenvisualisierung in Zeiten von Corona
Jeden Tag erfassen das Robert Koch Institut und andere staatliche Stellen die Zahl der nachweislich an Coronavirus infizierten Menschen. Tatsächlich vermitteln diese Zahlen aber nur ein ungenaues Bild, da die Zahl der tatsächlich infizierten um ein vielfaches höher sein dürfte. Das liegt zum einen daran, dass viele Infektionen recht milde verlaufen und zum Teil auch von den Betroffenen gar nicht erkannt werden, zum anderen daran, dass die Inkubationszeit mehrere Tage andauert und Erkrankte somit bis zum Auftritt erster Symptome schon mehrere Menschen in ihrem Umfeld angesteckt haben können. Ein weiterer Faktor sind beschränkte Testkapazitäten. Die Labore arbeiten schon heute am Rande ihrer Möglichkeiten Je stärker sich das Virus ausbreitet, desto schwieriger wird es, mit den Tests hinterherzukommen.
Trotzdem liefern die Datenreihen wertvolle Erkenntnisse. Sie geben Trends an und zeigen, wo sich das Virus besonders stark ausbreitet. Um diese Muster aufzuzeigen und zu erkennen können Datenvisualisierungen hilfreich sein. Strukturen, Zusammenhänge, Relationen, Prozesse und Proportionen werden so auf einen Blick sichtbar.
Die räumliche Verteilung anzeigen
Welche Regionen besonders vom Virus betroffen sind, lässt sich mit einer Choropletenkarte darstellen. Hinter dem wirklich sperrigen Begriff verbirgt sich eine thematische Karte, bei der die Gebiete im Verhältnis zur Verteilungsdichte des thematischen Objektes eingefärbt, schattiert, gepunktet oder schraffiert sind. Und so eine Karte lässt sich kostenlos mit Datawrapper erstellen. Dort sind bereits die Umrisse von diversen Gebietskörperschaften von der Gemeindeebene über Bundesländer in Deutschland und weltweit hinterlegt und können recht einfach mit Daten befüllt werden. Sollten diese Karten nicht ausreichen, können eigene hochgeladen werden (siehe Bonustipp am Ende dieses Artikels)
Link zum Tool: Datawrapper
Die Entwicklung der Fallzahlen anzeigen
#Flattenthecurve ist der Hashtag. Gemeint ist damit, dass die Pandemie nicht mehr aufgehalten werden kann. Es geht im Moment darum, das exponentielle Wachstum der Zahl der Infizierten zu verlangsamen. Dazu haben Bundesregierung und Bundesländer ein umfassendes Kontaktverbot erlassen. Um zu erkennen, ob diese Maßnahme die gewünschte Wirkung entfaltet, lohnt ein Blick auf die Entwicklung der Fallzahlen, die täglich vom Robert Koch Institut aktualisiert werden. Diese ließen sich auch mit Datawrapper visualisieren.
Link zum Tool: Datawrapper
Gerade für Anfänger ist das Tool in diesem Bereich mMn etwas sperrig, da man sich mit .csv-Dateien auseinandersetzen muss oder Excel-Tabellen hochladen und zum Teil noch nacharbeiten muss. Deutlich bedienerfreundlicher ist hier Infogram, das ebenfalls kostenlos nutzbar ist.
Link zum Tool: Infogram
Die räumliche Ausbreitung im Verlauf der Zeit visualisieren
Ein wirklich tolles Tool, um die Entwicklung einer Pandemie auf Karten zu visualisieren, ist Carto. In den ersten 12 Monaten ist es kostenlos nutzbar. Danach kostet es 199 Euro im Monat.
Link zum Tool: Carto
Hier noch eine Beispielkarte, die ich vor geraumer Zeit mit Carto erstellt habe. Zu sehen ist eine völlig willkürliche Auswahl von bewaffneten Konflikten seit 1945. Mit Corona hat die Karte also nichts zu tun. Aber ich denke, es wird deutlich, wie man das Tool auch für die aktuelle Pandemie nutzen kann:
Hintergrundinformationen zu Liniendiagrammen liefern
Ein weiteres, wirklich sehr nützliches (und dazu noch vollkommen kostenloses) Werkzeug ist Storyline. Damit könnt ihr Datenreihen mit Zeitleisten verbinden. Im Ergenbis erhaltet ihr eine interaktive Grafik, anhand derer ihr eure Leser mit Hintergrundinformationen versorgen könnt. Der User klickt sich dabei entlang eines Liniendiagramms und bekommt zu wichtigen Ereignissen Erklärboxen eingeblendet. So könnt ihr zum Beispiel ein Abflachen der Kurve mit dem Inkrafttreten von Ausgangssperren oder Schulschließungen in Verbindung setzen.
Link zum Tool: Storyline
Den Weg des Virus aufzeigen
Flowmap eignet sich hervorragend, um die Ausbreitung des Virus auf einer Karte zu zeigen. Auch hier verweise ich auf ein Beispiel, dass ich bereits vor geraumer Zeit erstellt habe:
Link zum Tool: Flowmap
Ortsdaten auf Karten projizieren
Wo ist das nächste Krankenhaus, wie viele gibt es überhaupt und welche Klinik ist auf Covid19-Patienten eingestellt. Daten wie diese lassen sich auf eine Google-Mymaps-Karte projizieren. Wer es sich leicht machen möchte, exportiert die dafür nötigen Daten aus einer Wikipedia-Liste. Das habe ich in vereinfachter Form mal für die Krankenhäuser in München gemacht. Die Erstellung der Karte hat nicht einmal fünf Minuten gedauert. Die Originaldaten stammen aus dieser Liste: https://de.wikipedia.org/wiki/Liste_von_Krankenh%C3%A4usern_in_München
Link zum Tool: myMaps von Google
Das Datenvisualisierungsvokabular der Financial Times
Wie ihr seht, gibt es unzählige Möglichkeiten, Daten zu visualisieren. Ganz wichtig: Zu einer guten Datenvisualisierung gehört immer auch die Nennung der Quelle. Über die genannten Beispiele hinaus findet ihr im Datavizcatalogue unzählige weitere Tools, die Euch bei der täglichen Arbeit nützlich sein können: https://datavizcatalogue.com/
Doch welche Darstellungsform ist für meine Daten richtig? Hier hilft ein Blick auf das Visual Vocabulary der Financial Times, das ihr unter folgendem Link findet: https://ft-interactive.github.io/visual-vocabulary/
Es unterteilt die unterteilt die Datenvisualisierung in 9 Typen: Abweichung, Korrelation, Veränderung im Zeitverlauf, Rangfolge, Verteilung, Anteil am Ganzen, Größe, räumliche Verteilung, Fluss. Per Klick auf eine der Oberkategorien zeigt das Visual Vocabulary an, welche Darstellungsformen am besten passt. Schnell seht ihr so, welche Arten von Diagrammen am besten funktionieren könnten.
Ganz nett gemacht ist auch das Handbuch zur Datenvisualisierung von Tableau (einem weiteren wirklich guten, aber doch manchmal für Anfänger etwas sperrigen Tool zur Datenvisualisierung), das ihr hier findet: https://www.tableau.com/de-de/learn/articles/data-visualization
Am Ende dieses Beitrags noch ein paar ergänzende Links zur Datenvisualisierung.
- https://wambachers-osm.website/boundaries/ -> Mit diesem Tool könnt ihr Kartendaten (Kreisgrenzen etc.) aus OpenStreetMap exportieren, um sie dann in Datawrapper für eure Zwecke zu nutzen.
- https://www.lizenzhinweisgenerator.de/ ->Bilder aus Wikipedia lizenzkonform nutzen
- https://www.google.de/intl/de/forms/about/ ->Umfragen etc. Mit Google erstellen
Welche Tools zur Datenvisualisierung nutzt Du in deiner täglichen Arbeit? Lass es mich wissen. In den kommenden Tagen liefere ich dann noch einen Beitrag nach, in dem ihr erfahrt, wo ihr zuverlässige Daten für eure Projekte erhaltet.