Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Accelerating Primal-Dual Methods for Regularized Markov Decision Processes - MaRDI portal

Accelerating Primal-Dual Methods for Regularized Markov Decision Processes

From MaRDI portal

Publication:6202767

Jump to:navigation, search

DOI10.1137/21m1468851arXiv2202.10506MaRDI QIDQ6202767

Lexing Ying, Inderjit S. Dhillon, Haoya Li, Unnamed Author

Publication date: 27 February 2024

Published in: SIAM Journal on Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2202.10506

zbMATH Keywords

primal-dual method Markov decision process reinforcement learning entropy regularization

Mathematics Subject Classification ID

Minimax problems in mathematical programming (90C47) Numerical optimization and variational techniques (65K10) Learning and adaptive systems in artificial intelligence (68T05) Lyapunov and storage functions (93D30) Markov and semi-Markov decision processes (90C40) Acceleration of convergence in numerical analysis (65B99)

Cites Work

This page was built for publication: Accelerating Primal-Dual Methods for Regularized Markov Decision Processes

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6202767&oldid=35700035"