Offene Daten fördern heisst Fehler fördern

Diskussionen um mehr offene Daten kommen früher oder später nahezu immer zu den folgenden beiden Punkten:

Die relevanten Daten sind zu kompliziert für den Grossteil der Öffentlichkeit. Es besteht die Gefahr, dass unsere Daten falsch interpretiert werden. Dies könnte ein schlechtes Licht auf uns zurückwerfen.
Unserer Daten sind nicht relevant für die Öffentlichkeit.

Als erstes müssen wir einsehen, dass falsche Informationen oder eben «Fake News» heute zum Alltag gehören. Auf einer Skala von «Frei erfunden» bis «Wissenschaftlich fundiert» sind allfällige Falschinterpretationen bereits ein Schritt in die richtige Richtung. Dabei ist es völlig egal, ob die Falschinterpretation böswillig oder versehentlich zustande gekommen ist. Warum? Es existiert eine gemeinsame Datengrundlage. Um frei erfundene Aussagen zu widerlegen, muss erst eine Datengrundlage geschaffen werden. Bei falscher Interpretation existiert diese bereits. Bei nicht böswilligen falschen Interpretationen sind Diskussionen möglich, es können Fehler im Prozess aufgezeigt werden, evtl. findet ein Austausch für neue Verwendungszwecke statt. Offene Daten können Datenproduzenten aufzeigen, dass ihre Daten von der Öffentlichkeit besser verstanden werden als erwartet, anders genutzt werden als erwartet oder eben vielleicht auch nicht so selbsterklärend sind wie erwartet. Jede dieser Möglichkeiten ist positiv. In kurz: Datenkompetenz wird gefördert und zwar dort, wo es die Leute interessiert.

Selbstverständlich wird es immer Personen geben, welche Daten absichtlich verdrehen und durch offizielle Datenquellen ihren «neuen Fakten» als seriös präsentieren möchten. Dies können wir nicht ändern. Aber mit offenen Daten können sich Interessierte und Journalisten schneller selbst ein Bild der Situation machen.

Ebenso falsch ist es auf die Veröffentlichung von Daten zu verzichten, weil sie „nicht relevant“ sind. Absoluter Schwachsinn. Denn immer, wenn ich vorschlage die Bewirtschaftung nicht relevanter Datenbanken einzustellen, finden sich schnell Gründe dies nicht zu tun. «Interessant für uns, aber nicht für die anderen. Und bei genauerem betrachten sind die Daten ja schon sehr komplex. Und der Kontext darf auf keinen Fall vergessen werden. Ausserdem existieren die Daten ja zum Zweck X und dieser wird bereits durch die institutionseigene Webseite vollumfänglich abgedeckt. Die Daten zu veröffentlichen würde keinen Mehrwert bieten…» Der Entscheid, welche Daten für die Öffentlichkeit relevant sind, sollte nicht beim Datenproduzenten liegen. Alle Daten sind relevant. Datensammlungen der Bundesverwaltung sollen einer begründeten Widerspruchslösung unterliegen. Nur mit vorliegender Begründung werden Daten nicht veröffentlicht. Die Veröffentlichung von Daten mit geringem Impact ist ein Schritt vorwärts. Ewige Diskussionen um sogenannte High Impact Datensets, mit diversen involvierten Stellen und genauso vielen Bedenken zur Veröffentlichung hingegen ist ein Lauf im Kreis, bei dem doch eher selten etwas Produktives rauskommt.

Wir sollten uns darauf konzentrieren mit kleinen Schritten eine Umgebung zu schaffen, die weitere Schritte fördert. Damit besser früher als später eine Umgebung vorhanden ist, welche auch umstrittenen Grossprojekten freundlich gesinnt ist, weil durch die gewonnenen Erfahrungen die Baustellen automatisch kleiner werden als heute.

Und für alle jene die Angst vor negativer Presse haben, falls Fehler gefunden werden: Die Wiederverwendung von offenen Daten ist im Internet nicht immer nachvollziehbar. Das ist nicht optimal aber die totale Kontrolle über offene Daten würde ebenfalls nicht dem Sinn der Sache entsprechen. Gefundene und zurückgemeldete Fehler sind nichts anderes als ein Beweis für die Nutzung der Daten. Ein Beweis der aktiven Nutzung, der gleichzeitig die Datenqualität fördert. Gefundene Fehler in offenen Daten gehören zu den besten Dingen, die einem nach der Veröffentlichung passieren können.