Was ist Bestärkendes Lernen?

Question

Accepted Answer

Mit Hilfe verschiedener Trial-and-Error-Erfahrungen in einer sich ändernden Umgebung kann ein Computer-Agent durch eine Machine-Learning-Methode namens Bestärkendes Lernen (Reinforcement Learning) lernen, eine Aufgabe zu erfüllen. Mit dieser Lernstrategie kann der Agent die Aufgabe ohne menschliche Hilfe und ohne explizit programmiert zu werden, durchführen, indem er eine Reihe von Aktionen auswählt, die eine Belohnungsmetrik maximieren. Im Gegensatz zum überwachten Lernen verwendet das Bestärkende Lernen Feedback, um den Agenten autonom zu trainieren, ohne auf gelabelte Daten zurückzugreifen. Der Agent kann nur aus seinen eigenen Erfahrungen lernen, da keine gelabelten Daten vorhanden sind. Eine bestimmte Klasse von Problemen, wie z. B. in der Robotik, im Gaming und anderen langfristigen Vorhaben, wird mit RL gelöst. Der Agent interagiert mit der Umgebung und erkundet sie eigenständig. Beim Bestärkenden Lernen besteht das Hauptziel eines Agenten darin, positive Verstärkung zu maximieren, während er gute Leistungen erbringt. Es ist ein grundlegender Bestandteil der künstlichen Intelligenz, und das Konzept des Bestärkenden Lernens bildet die Grundlage für alle KI-Agenten.

Verwandte Begriffe