Diskussion:Markow-Entscheidungsproblem

Letzter Kommentar: vor 10 Jahren von 109.90.216.187 in Abschnitt Belohnungsfunktion

Belohnungsfunktion

Letzter Kommentar: vor 10 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Die Belohnungsfunktion ist in der Regel eine Abbildung auf den State Action Space, nicht auf den State Space.

--109.90.216.187 21:49, 17. Mär. 2014 (CET)Beantworten

Abschnitt hinzufügen

Abgerufen von „https://de.wikipedia.org/w/index.php?title=Diskussion:Markow-Entscheidungsproblem&oldid=128619714“