Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
On iterative optimization ol structured Markov decision processes with discounted rewards - MaRDI portal

On iterative optimization ol structured Markov decision processes with discounted rewards

From MaRDI portal

Publication:3221982

Jump to:navigation, search

DOI10.1080/02331938408842960zbMath0556.90089OpenAlexW2140922432MaRDI QIDQ3221982

Marcel Hendrikx, J. A. E. E. Van Nunen, Jaap Wessels

Publication date: 1984

Published in: Mathematische Operationsforschung und Statistik. Series Optimization (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1080/02331938408842960

zbMATH Keywords

iterative methods test problems successive approximation optimal policy total reward criterion survey on solution techniques

Mathematics Subject Classification ID

Numerical mathematical programming methods (65K05) Markov and semi-Markov decision processes (90C40)

Related Items

Serial and parallel value iteration algorithms for discounted Markov decision processes, The numerical exploitation of periodicity in Markov decision processes, On using discrete random models within decision support systems, Optimal claim behaviour for third-party liability insurances or To claim or not to claim: that is the question, Aggregation and disaggregation in Markov decision models for inventory control

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3221982&oldid=16367477"