Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
scientific article; zbMATH DE number 1356140 - MaRDI portal

scientific article; zbMATH DE number 1356140

From MaRDI portal

Publication:4700316

Jump to:navigation, search

zbMath0930.93048MaRDI QIDQ4700316

Paweł Cichosz

Publication date: 1 November 1999

Title: zbMATH Open Web Interface contents unavailable due to conflicting licenses.

zbMATH Keywords

dynamic programming intelligent control reinforcement learning Q-learning temporal difference multidimensional action spaces Q-V-learning

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05) Multivariable systems, multidimensional control systems (93C35)

Related Items (1)

Imitation learning of car driving skills with decision trees and random forests

This page was built for publication:

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4700316&oldid=18932728"