Daten sind Daten sind Daten.
Und deshalb gilt auch hier: Bilder sagen mehr als tausend Worte. Denn wirklich spannend und aussagekräftig wird die Daten-Arbeit wenn es uns gelingt, unseren Partnern und Auftraggebern mit Grafiken oder Animation aufzuzeigen, was wirklich Sache ist.
Die Erstellung von aussagekräftigen Grafiken oder Animationen ist ein wichtiges Aufgabengebiet von Data Scientists: Der Experte findet Mittel und Wege, den Daten essentielle Aussagen zu entlocken, die vorher verborgen waren.
Was zu sehen ist
Die Stadt Zürich erwacht. Dieser Plot zeigt den Standort aller Fahrzeuge des städtischen öffentlichen Verkehrs ab 04:34Uhr im Zehn-Sekunden-Takt während der ersten rund fünf Stunden.
Datenquelle(n)
Open Data der Stadt Zürich, Stand 9. Mai 2019.
Verwendete Werkzeuge / Technologien
SQL, R
Arbeitsaufwand
< 1/2 PT
Nutzen / mögliche nachfolgende Schritte
Auf einfache Weise wird die Abdeckung durch den öffentlichen Verkehr mit zeitlicher Abhängigkeit transparent gemacht. Eventuell können Optimierungsmöglichkeiten rein auf Grund von Bewegungsmustern vorgenommen werden. Und zudem sieht es einfach gut aus.
Was zu sehen ist
Wir haben im Datensatz der Adressen des Kantons Zürich nach der Anzahl der vorhandenen Hausnummern sortiert. Ein offensichtlicher und fast nicht durch Zufall zu erklärender Ausreisser bei der Hausnummer 13 lässt den Schluss zu, dass diese Zahl als Hausnummer überdurchschnittlich häufig ausgelassen wurde. Honi soit, qui mal y pense...
Datenquelle(n)
Open Data des Kantons Zürich, Stand 3. Mai 2019.
Verwendete Werkzeuge / Technologien
SQL, R
Arbeitsaufwand
< 1/2 PT
Nutzen / mögliche nachfolgende Schritte
Eindrücklicher Beweis der gefühlten Wahrnehmung, dass die Hausnummer 13 das eine oder andere Mal ganz zufällig übersprungen wird. Nein, nein, in der westlichen Welt gibt es keinen Aberglauben...
Was zu sehen ist
Wir haben die Anzahl der belegten Betreuungsplätze in den Schulkreisen der Stadt Zürich etwas genauer angeschaut und neben der einen oder anderen Auffälligkeit auch einen Ausreisser im Jahr 2013 festgestellt, welcher mit grosser Sicherheit durch einen Daten-Fehler erzeugt wurde.
Datenquelle(n)
Open Data der Stadt Zürich, Stand TBD
Verwendete Werkzeuge / Technologien
SQL, R
Arbeitsaufwand
< 1/2 PT
Nutzen / mögliche Schritte
Hinweis mit der Bitte um Bereinigung der Daten. Am besten, bevor Massnahmen wie der Bau von neuen Kindertagesstätten geplant und umgesetzt werden.
Was zu sehen ist
Im Datensatz der Postleitzahlen und Kreiszugehörigkeiten der Stadt Zürich ist erkennbar, dass es die eine oder andere auffällige Anomalie gibt. Sprich: Postleitzahl und Kreiszugehörigkeit sind in Teilen von Affoltern (rot markiere Gebäude) nicht deckungsgleich.
Datenquelle(n)
Open Data der Stadt Zürich, Stand 25. April 2019
Verwendete Werkzeuge / Technologien
SQL, R
Arbeitsaufwand
1/2 PT
Nutzen / mögliche Schritte
Wir vermuten, dass dieses Phänomen bekannt ist und historische Gründe hat. Ob dies im Alltag für die Bewohner (auf welches Kreisbüro muss ich nun schon wieder?) oder Postboten (wieso steht hier schon wieder die falsche Postleitzahl?) negative Folgen hat, könnte abgeklärt werden.