Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Truncated policy iteration methods - MaRDI portal

Truncated policy iteration methods

From MaRDI portal

Publication:1060136

Jump to:navigation, search

DOI10.1016/0167-6377(84)90054-3zbMath0567.90097OpenAlexW1999380740MaRDI QIDQ1060136

Ron S. Dembo, Moshe Haviv

Publication date: 1984

Published in: Operations Research Letters (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/0167-6377(84)90054-3

zbMATH Keywords

Markov chains modified policy iteration methods preassigned rate-of- convergence

Mathematics Subject Classification ID

Numerical mathematical programming methods (65K05) Stochastic programming (90C15) Dynamic programming (90C39) Markov and semi-Markov decision processes (90C40)

Related Items

Hierarchic Markov processes and their applications in replacement models ⋮ (Approximate) iterated successive approximations algorithm for sequential decision processes ⋮ A \(K\)-step look-ahead analysis of value iteration algorithms for Markov decision processes

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1060136&oldid=13079177"