Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Global optimality guarantees for policy gradient methods - MaRDI portal

Global optimality guarantees for policy gradient methods

From MaRDI portal

Publication:6655175

Jump to:navigation, search

DOI10.1287/opre.2021.0014MaRDI QIDQ6655175

Jalaj Bhandari, Daniel J. Russo

Publication date: 20 December 2024

Published in: Operations Research (Search for Journal in Brave)

zbMATH Keywords

dynamic programming reinforcement learning policy iteration policy gradient methods gradient dominance

Mathematics Subject Classification ID

Mathematical programming (90Cxx)

This page was built for publication: Global optimality guarantees for policy gradient methods

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6655175&oldid=40232114"