Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
A stability criterion for two timescale stochastic approximation schemes - MaRDI portal

A stability criterion for two timescale stochastic approximation schemes

From MaRDI portal

Publication:2409333

Jump to:navigation, search

DOI10.1016/j.automatica.2016.12.014zbMath1371.93208OpenAlexW2184204218MaRDI QIDQ2409333

Shalabh Bhatnagar, Chandrashekar Lakshminarayanan

Publication date: 11 October 2017

Published in: Automatica (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.automatica.2016.12.014

zbMATH Keywords

simulation reinforcement learning two-timescale stochastic approximation limiting ODE stability of iterates

Mathematics Subject Classification ID

Time-scale analysis and singular perturbations in control/observation systems (93C70) Identification in stochastic control theory (93E12) Stochastic learning and adaptive control (93E35)

Related Items

Sequential online subsampling for thinning experimental designs, Convergence of stochastic approximation via martingale and converse Lyapunov methods, Whittle index based Q-learning for restless bandits with average reward

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2409333&oldid=15054236"