Wie lernt meine Maschine eigentlich, Entscheidungen zu treffen?

‚Dann bringen Sie das der Maschine doch endlich bei. Kann ja nicht so schwer sein. Andere haben das ja auch geschafft.‘ Ihr Chef ist aufgebracht und Sie fragen sich, wie Sie das jetzt am besten angehen.

Im Ergebnis soll das System für eine eingegrenzte Fragestellung anhand eines Satzes von Eingangsdaten eine Entscheidung treffen: Ist auf dem Bild eine rote Ampel zu sehen? Was ist angesichts der Bedarfszahlen der optimale Ausstoß von Maschine X? Mit den Messungen der Sensoren, wann muss die Maschine Y spätestens gewartet werden?

‚Die Maschine lernt komplexe Muster zu erkennen, um menschliche Entscheidungen zu imitieren.‘

Technisch gesehen liegt dahinter jeweils ein statistisches Modell, das aus den Eingangsdaten, jeweils eine Wahrscheinlichkeit berechnet, dass die Entscheidung gut ist. Damit das funktioniert, wird das statistische Modell im Vorfeld so aufgestellt, dass es für eine Anzahl bekannter Fälle aus der Vergangenheit – den Trainingsdaten – mit hoher Zuverlässigkeit, die Entscheidung ‚richtig‘ getroffen hätte.

Geeignete Trainingsdaten als Schlüssel für maschinelles Lernen

Dieses ‚überwachtes Lernen‘ genannte Verfahren erfordert also Trainingsdaten, die einen Satz von Eingangsdaten mit der jeweils erwarteten Entscheidung, dem Feedback, verbinden. Solche Trainingsdaten müssen mit gewissem Aufwand erstellt werden, weil sie in der Regel nicht vorliegen.

Ein relevanter Aufwandstreiber ist natürlich, wieviele Trainingsdatensätze erforderlich sind. Als Faustregel gilt, je mehr Stellschrauben Ihr statistisches Modell hat, desto mehr Trainingsdaten brauchen Sie. Ein vergleichsweise einfaches Regressionsmodell mit wenigen Parametern kann schon mit einigen 100 Trainingsdatensätzen angelernt werden, während ein tiefes künstliches neuronales Netz typischerweise viele 10.000 Datensätze braucht. Insofern startet hier die Arbeit:

Entscheidungsproblem formulieren – In vielen Fällen Ihres unternehmerischen Alltags können Sie schon mit vergleichsweise einfachen Modellen starten, um Ihre Prozesse zu verbessern oder Ihr Produkt aufzuwerten. Hier zählen das 80:20 Prinzip sowie Erfahrungen und Kreativität Ihrer Data Scientists.
Eingangsdaten konstruieren – auswählen und zusammen stellen der wahrscheinlich aussagekräftigsten Elemente des Datensatzes, typischerweise aus verschiedenen internen und möglicherweise externen Quellen. Auch hier kann weniger mehr sein. Datenelemente ohne relevanten Informationsgehalt für die Entscheidung wirken wie ein Rauschen. Oft hilft nur Ausprobieren.
Feedback zu jedem Datensatz ergänzen – Idealerweise haben Sie die bislang von Menschen getroffenen Entscheidungen festgehalten Sie liegen allerdings meist nicht strukturiert und oft auch nur mittelbar vor. Wägen Sie ab, ob Sie eine kleine Anwendung für die Datentransformation schreiben, oder ob die Trainingsdaten vielleicht besser manuell durch billige Aushilfen ergänzt werden.

Eine mit solchen Trainingsdaten erstmals angelernte Maschine ist aber nur der erste Schritt. Viel relevantere und größere Mengen von Feedback sammeln Sie anschließend im laufenden Betrieb, um damit das Entscheidungsmodell weiter zu verfeinern. Und dieses Feedback hat dann nur Ihr Unternehmen, keiner sonst. Letztlich das Prinzip mit dem die ‚Big Five‘ Internetunternehmen ihre Monopolstellungen systematisch aufgebaut haben, für Ihr Unternehmen angewandt. Dort liegt dann der eigentliche strategische Wert Ihrer lernenden Maschine: sie baut systematisch Wissen für Sie auf.

Wie lernt meine Maschine eigentlich, Entscheidungen zu treffen?

Geeignete Trainingsdaten als Schlüssel für maschinelles Lernen

Hinterlasse einen Kommentar

Schreibe einen Kommentar Antwort abbrechen

Interessante Links

Seiten

Kategorien

Archiv