Maschinelles Lernen

Verstärkendes Lernen (reinforcement learning)

Lesen Sie sich die Anleitung des Spiels "Schlag den Roboter" durch und spielen Sie es mehrmals. Hier der direkte Link zum Spiel.

Warum wird der Roboter im Laufe des Spiels immer besser?

Beim verstärkenden Lernen (reinforcement learning) vollzieht ein System Aktionen (z.B: Spielzüge) und erhält am Ende jeweils eine Bewertung, meist in Form einer Zahl. Anhand der Bewertungen erlernt das System eine Strategie deren Ziel es ist, die Bewertung bei nachfolgenden Aktionen möglichst zu maximieren.

Beispiele:

Schach-Programm
Optimierung einer Verkehrsflusssteurung durch Ampeln

Aufgabe: Sehen Sie Ähnlichkeiten zum menschlichen Lernen? Recherchieren Sie zum Begriff Verstärkung in der Psychologie!

Überwachtes Lernen

Beim "Gute Äffchen-Böse Äffchen-Spiel sind Sie als Tierpflegerin bzw. Tierpfleger in einem Zoo für die Fütterung der Äffchen zuständig. Sie wissen bereits, welche der bisher im zoo befindlichen Äffchen beißen und welche nicht (→Trainingsdaten!). Allerdings werden bald neue Tiere zur Gruppe hinzukommen (→Testdaten!) und wir müssen uns nun überlegen, wie wir herausfinden können, welche neuen Äffchen beißen und welche nicht – am besten, ohne ihren Zähnen zu nahe zu kommen. Es gilt also, eine möglichst gute Klassifikation der Äffchen als “beißt” bzw. “beißt nicht” zu erzielen.

Überlegen Sie sich in Gruppen Regeln, die festlegen, welche der Äffchen beißen oder nicht. Überlegen Sie sich, wie Sie die Regeln darstellen können, so dass eine andere Gruppe sie später auf einfache Art auf die Testdaten anwenden kann.

Für Lehrkräfte: Das Spiel und die dazugehörigen Materialien sind hier unter freier Lizenz erhältlich.

Beim überwachten Lernen sollen Datensätze bewertet werden (z.B. Äffchen beißt/beißt nicht), wobei zunächst eine Reihe von Trainingsdaten zur Verfügung steht, bei denen die korrekte Bewertung bekannt ist. Anhand dieser wird ein Modell gebildet, das bei möglichst vielen Datensätzen zur korrekten Bewertung kommt. Anschließend wird die Güte des Modells überprüft, indem es auf bisher unbekannte Daten (Testdaten) angewandt wird.

Beispiele:

KI zum Finden von Tumoren auf Röntgenbildern
KI in einem autonom fahrenden Auto, die anhand von Kamerabildern das Verhalten von Fußgängern vorhersagen soll