====== Maschinelles Lernen ======
===== Verstärkendes Lernen (reinforcement learning) =====
Lesen Sie sich die [[https://computingeducation.de/proj-schlag-das-kroko/|Anleitung des Spiels "Schlag den Roboter"]] durch und spielen Sie es mehrmals. Hier der [[https://www.stefanseegerer.de/schlag-das-krokodil/?robots=true|direkte Link zum Spiel]]. \\ \\
* Warum wird der Roboter im Laufe des Spiels immer besser?
Beim **verstärkenden Lernen** (reinforcement learning) vollzieht ein System Aktionen (z.B: Spielzüge) und erhält am Ende jeweils eine Bewertung, meist in Form einer Zahl. Anhand der Bewertungen erlernt das System eine Strategie deren Ziel es ist, die Bewertung bei nachfolgenden Aktionen möglichst zu maximieren. \\ \\
**Beispiele:**
* Schach-Programm
* Optimierung einer Verkehrsflusssteurung durch Ampeln
**Aufgabe:** Sehen Sie Ähnlichkeiten zum menschlichen Lernen? Recherchieren Sie zum Begriff [[https://de.wikipedia.org/wiki/Verst%C3%A4rkung_(Psychologie)|Verstärkung in der Psychologie]]!
===== Überwachtes Lernen =====
Beim "Gute Äffchen-Böse Äffchen-Spiel sind Sie als Tierpflegerin bzw. Tierpfleger in einem Zoo für die Fütterung der Äffchen zuständig. Sie wissen bereits, welche der bisher im Zoo befindlichen Äffchen beißen und welche nicht (->//Trainingsdaten//!). Allerdings werden bald neue Tiere zur Gruppe hinzukommen (->//Testdaten//!) und wir müssen uns nun überlegen, wie wir herausfinden können, welche neuen Äffchen beißen und welche nicht – am besten, ohne ihren Zähnen zu nahe zu kommen. Es gilt also, eine möglichst gute Klassifikation der Äffchen als “beißt” bzw. “beißt nicht” zu erzielen. \\ \\
Überlegen Sie sich in Gruppen Regeln, die festlegen, welche der Äffchen beißen oder nicht. Überlegen Sie sich, wie Sie die Regeln darstellen können, so dass eine andere Gruppe sie später auf einfache Art auf die Testdaten anwenden kann.
Für Lehrkräfte: Das Spiel und die dazugehörigen Materialien sind [[https://computingeducation.de/proj-it2school/|hier unter freier Lizenz erhältlich]].
Beim **überwachten Lernen** sollen Datensätze bewertet werden (z.B. Äffchen beißt/beißt nicht), wobei zunächst eine Reihe von Trainingsdaten zur Verfügung steht, bei denen die korrekte Bewertung bekannt ist. Anhand dieser wird ein Modell gebildet, das bei möglichst vielen Datensätzen zur korrekten Bewertung kommt. Anschließend wird die Güte des Modells überprüft, indem es auf bisher unbekannte Daten (**Testdaten**) angewandt wird. \\ \\
**Beispiele:** \\
* KI zum Finden von Tumoren auf Röntgenbildern
* KI in einem autonom fahrenden Auto, die anhand von Kamerabildern das Verhalten von Fußgängern vorhersagen soll
===== Unüberwachtes Lernen =====
Beim Spiel Goldrush leiten Sie eine Goldgräber-Firma, die drei Grabungsteams zur Verfügung hat. Jedes Grabungsteam wird durch Spielstein auf dem Spielfeld-Koordinatensystem dargestellt. \\ \\
Tag für Tag gibt es neue Meldungen von kleinen Goldfunden an der Oberfläche, die euch Hinweise geben, wo die dicke Goldadern liegen könnten. Bei jeder Meldung dürft Ihr die Position eines eurer Teams verändern. Nach 20 Funden wird ausgewertet, wie gut eure Teams platziert sind: Je Goldfund im 5'er Quadrat um ein Team gibt es eine Punkt.
\\ \\
**Wichtig:** \\
Überlegt euch vor Beginn des Spiels den Algorithmus, nach dem ihr die Teams jeweils versetzen wollt!
Für Lehrkräfte: Das Spiel und die dazugehörigen Materialien sind [[https://computingeducation.de/proj-it2school/|hier unter freier Lizenz erhältlich]].
Ziel des **unüberwachten Lernens (//unsupervised learning//)** ist es, Muster in den Eingabedaten zu erkennen um diese so z.B. in mehrere Gruppen einzuteilen. Es gibt dabei keine in Vornhinein bekannten Zielwerte und keine Belohnung des Algorithums wie beim überwachten Lernen. \\ \\
**Beispiele:**
* Ein Algorithmus soll Anfragen an einen Webserver in mehrere Gruppen einteilen um ungewöhnliche Anfragen herauszufiltern, die Angriffe beinhalten könnten.
* Die Kunden eines Unternehmens sollen in Gruppen eingeteilt werden damit Produkte entwickelt werden können, die an die spezifischen Bedürfnisse der einzelnen Gruppen angepasst sind.