Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Temporal difference-based policy iteration for optimal control of stochastic systems - MaRDI portal

Temporal difference-based policy iteration for optimal control of stochastic systems

From MaRDI portal

Publication:467477

Jump to:navigation, search

DOI10.1007/s10957-013-0418-1zbMath1306.93074OpenAlexW2080453320MaRDI QIDQ467477

Xiao-Mei Liu, Kang Cheng, Kanjian Zhang, Haikun Wei, Shu-Min Fei

Publication date: 3 November 2014

Published in: Journal of Optimization Theory and Applications (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1007/s10957-013-0418-1

zbMATH Keywords

stochastic optimal control approximate dynamic programming learning algorithms: discrete-time systems least squares policy evaluation algorithm

Mathematics Subject Classification ID

Dynamic programming in optimal control and differential games (49L20) Discrete-time control/observation systems (93C55) Dynamic programming (90C39) Optimal stochastic control (93E20) Stochastic systems in control theory (general) (93E03) Existence of optimal solutions to problems involving randomness (49J55)

Related Items (2)

Potential-based least-squares policy iteration for a parameterized feedback control system ⋮ Suboptimal control for nonlinear systems with disturbance via integral sliding mode control and policy iteration

Cites Work

This page was built for publication: Temporal difference-based policy iteration for optimal control of stochastic systems

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:467477&oldid=12345347"