80% Aufwand für die Datenaufbereitung – das kann sich doch nicht lohnen!

Sie hören es am Anfang jeder Präsentation von Ergebnissen einer Datenanalyse oder eines Data Science Projekts: ‚ 80% des Aufwands mussten wir erst einmal in die Aufbereitung der Daten stecken, bevor wir überhaupt mit den Analysen loslegen konnten‘. Und die spontane Reaktion des Managements postwendend: ‚Wundert mich nicht, dass unsere Daten so schlecht sind‘ und der dann meist stillschweigende Schluss ‚Wir sollten die Finger davon lassen. Das lohnt sich doch alles nicht‘.

Wir bei STRADIGTY sehen das Ganze ein wenig anders. Sicher, die Daten aus verschiedenen Systemen zu laden, zu sichten, zu säubern, inhaltlich zusammenzuführen und dann zu transformieren und anzureichern – das alles ist aufwändig. Aber es lohnt definitiv, wenn Sie hinterher Dinge sehen, die so noch keiner gesehen hat.

Data Science braucht kein Data Warehouse

Und hier kommen wir zu den eigentlichen Gründen für die Bedenken des Managements. Datenaufbereitung haben sie oft und schmerzvoll in klassischen Data Warehouse Projekten erlebt. Mit größtem Aufwand waren hier Daten extrahiert, transformiert und in Datenbanken geladen worden, um alle erdenklichen Fragen des Unternehmens beantworten zu können. Gewaltige fachliche und technische Stolpersteine waren zu überwinden, um die Daten konsistent und verlässlich zu machen. Aber wofür eigentlich? Außer ein paar Reports hatte dann keiner wirklich etwas mit den teuer erkauften Daten gemacht, geschweige denn sie als Grundlage für bedeutende Entscheidungen zu nehmen.

 

„Wo helfen mehr oder bessere Daten wirklich? ‚Gut genug‘ reicht doch vollkommen aus.“

 

Dort genau liegt auch die Lösung des Problems: vom Ende her Denken und sich zuerst fragen, welche Entscheidung Daten und Analyse eigentlich unterstützen sollen. Dann wird auch klarer, welche Anforderungen die Daten erfüllen müssen und was konkret zu tun ist. Iterativ im Gleichschritt mit den Analysen wird die Datenqualität gezielt verbessert. Alles mit dem klaren Verständnis, dass ‚gut genug‘ ausreicht.

Sicher am Ende haben Sie sicher auch 80% in die Datenaufbereitung gesteckt. Aber Sie wissen wofür: Daten sind ein Aktivposten, der diese Investition leicht zurückzahlt.

0 Kommentare

Hinterlasse einen Kommentar

An der Diskussion beteiligen?
Hinterlasse uns deinen Kommentar!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert