Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Policy iterations for reinforcement learning problems in continuous time and space -- fundamental theory and methods - MaRDI portal

Policy iterations for reinforcement learning problems in continuous time and space -- fundamental theory and methods

From MaRDI portal

Publication:2664203

Jump to:navigation, search

DOI10.1016/j.automatica.2020.109421zbMath1461.93143arXiv1705.03520OpenAlexW3128350768MaRDI QIDQ2664203

Richard S. Sutton, Jae Young Lee

Publication date: 20 April 2021

Published in: Automatica (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1705.03520

zbMATH Keywords

adaptive systems reinforcement learning policy iteration iterative schemes optimization under uncertainties continuous time and space

Mathematics Subject Classification ID

Existence of optimal solutions belonging to restricted classes (Lipschitz controls, bang-bang controls, etc.) (49J30) Control/observation systems governed by ordinary differential equations (93C15) Iterative learning control (93B47)

Related Items (2)

Policy iterations for reinforcement learning problems in continuous time and space -- fundamental theory and methods ⋮ Approximate Q Learning for Controlled Diffusion Processes and Its Near Optimality

Cites Work

This page was built for publication: Policy iterations for reinforcement learning problems in continuous time and space -- fundamental theory and methods

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2664203&oldid=15506252"