Maschinelles Lernen

Verstärkendes Lernen (reinforcement learning)

Lesen Sie sich die Anleitung des Spiels "Schlag den Roboter" durch und spielen Sie es mehrmals. Hier der direkte Link zum Spiel.

Warum wird der Roboter im Laufe des Spiels immer besser?

Beim verstärkenden Lernen (reinforcement learning) vollzieht ein System Aktionen (z.B: Spielzüge) und erhält am Ende jeweils eine Bewertung, meist in Form einer Zahl. Anhand der Bewertungen erlernt das System eine Strategie deren Ziel es ist, die Bewertung bei nachfolgenden Aktionen möglichst zu maximieren.

Beispiele:

Schach-Programm
Optimierung einer Verkehrsflusssteurung durch Ampeln

Aufgabe: Sehen Sie Ähnlichkeiten zum menschlichen Lernen? Recherchieren Sie zum Begriff Verstärkung in der Psychologie!

Überwachtes Lernen

Beim "Gute Äffchen-Böse Äffchen-Spiel sind Sie als Tierpflegerin bzw. Tierpfleger in einem Zoo für die Fütterung der Äffchen zuständig. Sie wissen bereits, welche der bisher im Zoo befindlichen Äffchen beißen und welche nicht (→Trainingsdaten!). Allerdings werden bald neue Tiere zur Gruppe hinzukommen (→Testdaten!) und wir müssen uns nun überlegen, wie wir herausfinden können, welche neuen Äffchen beißen und welche nicht – am besten, ohne ihren Zähnen zu nahe zu kommen. Es gilt also, eine möglichst gute Klassifikation der Äffchen als “beißt” bzw. “beißt nicht” zu erzielen.

Erstellen Sie in Gruppen einen Entscheidungsbaum, der geeignet ist, die Äffchen der Trainingsdaten in "beißende" und "nicht beißende" Äffchen zu klassifizieren (1. Seite des Arbeitsblatts).
Verifizieren Sie den Entscheidungsbaum dann mithilfe der Testdaten auf der zweiten Seite des Arbeitsblatts.

Wichtig: Sehen Sie sich die zweite Seite des Arbeitsblatts erst an, nachdem Sie den Entscheidungsbaum erstellt haben!

Arbeitsblatt

Für Lehrkräfte: Das Spiel und die dazugehörigen Materialien sind hier unter freier Lizenz erhältlich.

Beim überwachten Lernen sollen Datensätze bewertet werden (z.B. Äffchen beißt/beißt nicht), wobei zunächst eine Reihe von Trainingsdaten zur Verfügung steht, bei denen die korrekte Bewertung bekannt ist. Anhand dieser wird ein Modell gebildet, das bei möglichst vielen Datensätzen zur korrekten Bewertung kommt. Anschließend wird die Güte des Modells überprüft, indem es auf bisher unbekannte Daten (Testdaten) angewandt wird.

Beispiele:

KI zum Finden von Tumoren auf Röntgenbildern
KI in einem autonom fahrenden Auto, die anhand von Kamerabildern das Verhalten von Fußgängern vorhersagen soll

Unüberwachtes Lernen

(Quelle des Bildes: https://computingeducation.de/proj-it2school/)

In einem Wüstengebiet in Texas wurden von Reisenden in letzter Zeit immer wieder einzelne kleine Gold-Nuggets am Boden gefunden. Sie haben drei Grabungs-Teams für je eine Woche zur Verfügung. Jedes Grabungsteam kann in dieser Zeit eine quadratische Fläche von 9 Kästchen (drei nach rechts, drei nach unten) durchsuchen.

Wo würden Sie sie platzieren?

Für Lehrkräfte: Das Spiel und die dazugehörigen Materialien sind hier unter freier Lizenz erhältlich.

Ziel des unüberwachten Lernens (unsupervised learning) ist es, Muster in den Eingabedaten zu erkennen um diese so z.B. in mehrere Gruppen einzuteilen. Es gibt dabei keine in Vornhinein bekannten Zielwerte und keine Belohnung des Algorithums wie beim überwachten Lernen.

Beispiele:

Ein Algorithmus soll Anfragen an einen Webserver in mehrere Gruppen einteilen um ungewöhnliche Anfragen herauszufiltern, die Angriffe beinhalten könnten.
Die Kunden eines Unternehmens sollen in Gruppen eingeteilt werden damit Produkte entwickelt werden können, die an die spezifischen Bedürfnisse der einzelnen Gruppen angepasst sind.