Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Ordinary Differential Equation Methods for Markov Decision Processes and Application to Kullback--Leibler Control Cost - MaRDI portal

Ordinary Differential Equation Methods for Markov Decision Processes and Application to Kullback--Leibler Control Cost

From MaRDI portal

Publication:4602532

Jump to:navigation, search

DOI10.1137/16M1100204zbMath1388.90122arXiv1605.04591WikidataQ115246950 ScholiaQ115246950MaRDI QIDQ4602532

Ana Bušić, Sean P. Meyn

Publication date: 12 February 2018

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1605.04591

zbMATH Keywords

Markov decision processes computational methods distributed control

Mathematics Subject Classification ID

Computational methods in Markov chains (60J22) Optimality conditions and duality in mathematical programming (90C46) Optimal stochastic control (93E20) Applications of Markov chains and discrete-time Markov processes on general state spaces (social mobility, learning theory, industrial processes, etc.) (60J20) Stochastic learning and adaptive control (93E35) Markov and semi-Markov decision processes (90C40)

Related Items

Kullback–Leibler-Quadratic Optimal Control, Sparse randomized shortest paths routing with Tsallis divergence regularization

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4602532&oldid=18759598"