Der Schlüssel für saubere Daten
Im Zeitalter von Data Science und Künstlicher Intelligenz ist jedem klar, dass mehr Daten zu haben, besser ist. Unsere IT Anwendungen und Webseiten sind deshalb mit Feldern zur Datenerfassung und Anzeige überladen. Gleichzeitig erleben wir jeden Tag als Mitarbeiter oder Kunde selbst, dass die vielen Daten zu erfassen, aufwändig und teuer ist, unzufrieden macht, und damit letztlich leider oft auch zu Nachlässigkeit verleitet: Felder bleiben frei oder werden mit Platzhaltern befüllt, Tippfehler werden inkauf genommen, in der DropDown Liste wird unreflektiert der erste Eintrag gewählt, und so weiter, und so weiter. Das ganze Problem wird noch verschärft, wenn wir erwarten, dass verschiedene Menschen bei der Dateneingabe vermeintlich das Gleiche tun.
„Daten sollen aktuell, konsistent und vollständig erfasst werden – eine Aufgabe, für die das menschliche Gehirn nicht optimal ausgelegt ist.“
Die Daten, die wir uns dann für Analysen aus unseren Systemen zusammen suchen oder auch zukaufen, sind deshalb in der Regel ‚unsauber‘ und müssen mit großem Aufwand so weit aufgearbeitet werden, dass sie zumindest ‚gut genug‘ sind.
Data Quality by Design
Wenn wir heute also einen IT-unterstützten Prozess wie eine Web-Seite entwerfen, ist es deshalb wichtiger denn je, mit der Frage, welche Daten wir einsammeln wollen, von Anfang an auch zu berücksichtigen, wie wir sie in einer guten Qualität bekommen.
Weil der Anwender hier nicht immer der beste Partner ist, unterstützen wir ihn für eine zuverlässigere Datenerfassung besser mit der Maschine:
- In den Hintergrund verbannen – Big Data Technologie ist mittlerweile so billig, dass wir mit Sensoren, Scannern und ähnlichen technischen Geräten eine lückenlose Spur entlang unseres Prozesses aufzeichnen können, ohne den Anwender zu behelligen. Dazu gehören übrigens auch die schon immer produzierten technischen Logfiles unserer Anwendungen, die jetzt zunehmend auch für Geschäftszwecke ausgewertet werden
- Wiederverwenden – wir geben immer wieder die gleichen Daten ein. Auto-Complete und Auto-Korrektur Funktionen, z.B. bei der Adresseingabe, entlasten den Menschen, garantieren konsistente Formate und vermeiden Tippfehler
- Priorisieren – nicht alle Daten sind gleich wichtig. Mit Regeln und künstlicher Intelligenz kann die Maschine bestimmen, welche Daten im aktuell bearbeiteten Zusammenhang wirklich gebraucht werden
Mit diesen und ähnlichen Ansätzen lässt sich der Aufwand für die Datenerfassung erheblich senken und gleichzeitig die Qualität verbessern.
Bei all dem immer auch die menschliche Psychologie im Auge behalten: wenn der Anwender versteht, wie eine falsche Dateneingabe seinen eigenen Bedürfnissen schadet, wird er viel besser aufpassen: eine Lieferadresse beim Online-Händler ist mit hoher Zuverlässigkeit richtig angegeben, genau so wie die Mobilnummer oder Mail-Adresse für eine dringend erwartete Rückmeldung. Ein ganzes Bündel von Maßnahmen also, das Vertrauen in die Daten zu steigern.

Michael Colombo
Michael Colombo
Michael Colombo
Hinterlasse einen Kommentar
An der Diskussion beteiligen?Hinterlasse uns deinen Kommentar!