Machine Learning - drei wichtige Lernverfahren auf einen Blick
Nachdem wir in einem vorherigen Artikel einen allgemeinen Einblick in das Machine Learning gegeben haben, möchte ich auf ein anderes Thema eingehen. Und zwar darauf welche Methoden oder Teildisziplinen eigentlich unter diesem großen Thema KI stehen. Dabei sind nicht die mathematischen Methoden wie neuronale Netze, Deep Learning oder andere statistische Lernverfahren gemeint, sondern die Kategorisierung dieser Methoden.
Muss ich meine KI überwachen? Überwachtes und unüberwachtes Lernen

Grundsätzlich lassen sich die statistischen Lernmethoden, die hinter dem Begriff KI stehen in zwei Gruppen unterteilen, dem sogenannten überwachten Lernen (supervised learning) und dem unüberwachten Lernen (unsupervised learning).
Dabei ist der Begriff des Überwachens etwas irreführend und bezieht sich darauf ob der Lernfortschritt des neuronalen Netzes überwacht werden kann. Konkret bedeutet dies also, dass beim überwachten Lernen ein Zusammenhang zwischen Eingangsgrößen und (bekannten!) Ausgansgrößen gefunden werden soll. Diese werden dem Algorithmus gemeinsam zur Verfügung gestellt, beispielsweise in Form von Hunden- und Katzenbildern, die jeweils als solche betitelt sind oder Bilder von akzeptablen und Ausschuss Produkten, die ebenfalls das jeweilige Label tragen.
Abbildung 2 zeigt ein Beispiel des überwachten Lernens, bei dem der Zusammenhang zwischen der Form einer geometrischen Figur und der Anzahl ihrer Ecken gelernt werden soll.

Im Gegensatz dazu steht beim unüberwachten Lernen so eine Zielvorgabe und Wissen über Zusammenhänge nicht fest. Vielmehr soll der Algorithmus selbst Zusammenhänge in Datensätzen finden, umso mehr über die Struktur eines Datensatzes zu lernen. Und folglich Information zu gewinnen, die durch reine menschliche Analyse nicht oder nur sehr schwer gefunden werden kann.
Die zwei wichtigsten Anwendungen sind die Clusterung, also Gruppenbildung, oder die Erkennung von Anomalien. Bild 3 zeigt ein Beispiel für die Anwendung eines Cluster Algorithmus. Es ist eine Gruppe von geometrischen Objekten gegeben, die in zwei Gruppen unterteilt werden sollen, sodass sich die Objekte innerhalb der Gruppen möglichst ähnlich sind aber möglichst unterschiedlich zu denen der anderen Gruppe. Die möglichen Gruppenzuweisungen sind durch die zwei Farben auf der rechten Seite gegeben.

Ein gängiges Beispiel für die Anomalieerkennung findet sich beim Online Shopping das sogenannte Fraud Detection, also das Erkennen auffälliger Käufer oder Käufe, die auf Missbrauch hindeuten. Darüber hinaus wird die Clustererkennung oft in der Medizin verwendet, um Probanden mit ähnlichen medizinischen Voraussetzungen zu finden und zusammenzufassen.
Maschinen lernen wie Kinder: Bestärkendes Lernen
Die bisherigen sehr einfachen Beispiele zeigen die Grundzüge des maschinellen Lernens, wirken aber noch nicht wirklich „intelligent“. Daher bedient man sich in vielen Anwendungen des sogenannten bestärkenden Lernens (Reinforcement learning). Diese Idee basiert darauf, wie Menschen oder Tiere lernen. Das Problem muss hierfür so formuliert werden, dass es einen sogenannten Agenten gibt, der von der KI gesteuert wird, bestimmten Regeln unterliegt und bestimmte Handlungsmöglichkeiten hat. Außerdem muss nach jedem Durchspielen eines Szenarios eine Bewertung ob die Aufgabe gut oder schlecht gelöst wurde möglich sein. Grundsätzlich gibt es zwei mögliche Verhaltensweise für die Agenten: Zum einen das Erforschen von neuem Wissen (exploration) und zum anderen das Ausnutzen von existierendem Wissen (exploitation).
Das Training erfolgt in mehreren Phasen, die aus vielen einzelnen Durchläufen eines oder mehrerer Szenarios bestehen. In den frühen Phasen versucht die KI durch verschiedene Operationen zunächst die gebotenen Möglichkeiten auszuloten und durch eine Vielzahl von Durchläufen Referenzen für „gute“ und „schlechte“ Handlungen zu finden, basierend auf der Bewertung. Nach Abschluss einer Phase werden die „besten“ Durchläufe als Basis für das reguläre Training der KI verwendet. Hier lässt sich das überwachte Lernen wiederfinden. In den späteren Phasen wird die KI versuchen ihr Wissen immer weiter auszunutzen und immer öfter ein Verhalten bevorzugen, das sicher zu einem besseren Ergebnis führt.
Eines der eindrucksvollsten Beispiele für reinforcement learning der jüngeren Zeit kommt von dem OpenAI Team. Diesen Forschern ist es gelungen einer Roboterhand beizubringen einen Zauberwürfel zu lösen ohne eine spezifische Programmierung der Hand oder wie der Zauberwürfel funktioniert. Die KI hat am Anfang „wahllos“ die einzelnen Motoren der Hand angesteuert. Das Ergebnis wurde danach bewertet, ob der Zauberwürfel näher an einer Lösung war als zu Beginn des Durchlaufes. Das Video dazu finden Sie hier!
Ein weiteres Beispiel für Reinforcement Learning findet sich bei der Simulation eines Versteckspiels, bei dem zwei KI-Teams gegeneinander antreten und bei der Lösung der involvierten Probleme Wege finden Fehler in der Spiele-Engine selbst auszunutzen, um das Spiel zu gewinnen.
Künstliche Intelligenz vs Allgemeine Künstliche Intelligenz
So eindrucksvoll die genannten Beispiele des Einsatzes von KI auch sind, teilen diese doch alle dasselbe Manko. Jedes dieser Beispiele erforderte Expertenteams, die sich Monatelang mit den Problemen beschäftigten und Zugriff auf sehr große Rechenleistungen hatten.
Daher ist es eines der größten Ziele führender KI-Forscher, zum Beispiel um das Team von Deepmind, eine sogenannte Allgemeine Künstliche Intelligenz zu erschaffen. Das heißt ein KI-System, das ähnlich dem Menschen ein Problem selbstständig verstehen und sich sozusagen autodidaktisch anlernen kann.
Bis solche allgemeinen künstlichen Intelligenzen existieren und in der Breite verfügbar sind, ist die KI ein Werkzeug das zwar sehr mächtig ist, aber auch sehr fragil sein kann und immer großen initialen Aufwandes zur Problemdefinition, Setup, Training und Validierung mit sich bringt.
Hier unterstützen wir als pragmatic industries zusammen mit den Experten von pragmatic minds unsere Kunden bei der Auswahl und der Durchführung von KI-Projekten. Spezialisiert haben wir uns auf Maschinendaten, also Produkt- oder Produktionsdaten, die im Umfeld des Shopfloor anfallen.