Mean, variance and probabilistic criteria in finite Markov decision processes: A review

From MaRDI portal

Publication:1821706

Jump to:navigation, search

DOI10.1007/BF00938524zbMath0616.90096MaRDI QIDQ1821706

Douglas J. White

Publication date: 1988

Published in: Journal of Optimization Theory and Applications (Search for Journal in Brave)

zbMATH Keywords

survey mean variance finite-horizon probabilistic criteria discounted formulations infinite-horizon nondiscounted formulations nonstandard Markov decision process criteria

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Related Items

Risk measurement and risk-averse control of partially observable discrete-time Markov systems, Optimal models for the first arrival time distribution function in continuous time -- with a special case, Experiments with dynamic programming algorithms for nonseparable problems, Reliability of internal prediction/estimation and its application. I: Adaptive action selection reflecting reliability of value function, Analyzing operational risk-reward trade-offs for start-ups, Markov Decision Problems Where Means Bound Variances, Non-homogeneous Markov decision processes with a constraint, Survey of linear programming for standard and nonstandard Markovian control problems. Part I: Theory, Discounting axioms imply risk neutrality, Variance minimization for constrained discounted continuous-time MDPs with exponentially distributed stopping times, Markov decision processes with average-value-at-risk criteria, Unnamed Item, Threshold probability of non-terminal type in finite horizon Markov decision processes, Optimal control by random sequences with constraints, Markov decision processes, Risk-Constrained Reinforcement Learning with Percentile Risk Criteria, On the total reward variance for continuous-time Markov reward chains, A Sensitivity‐Based Construction Approach to Variance Minimization of Markov Decision Processes, Optimization models for the first arrival target distribution function in discrete time, A note on maximal mean/standard deviation ratio in an undiscounted MDP, An Inequality for Variances of the Discounted Rewards, Minimizing risk models in Markov decision processes with policies depending on target values, Optimal policy for minimizing risk models in Markov decision processes, Mean-variance criteria in an undiscounted Markov decision process, On mean reward variance in semi-Markov processes, Computational Methods for Risk-Averse Undiscounted Transient Markov Models, Process-based risk measures and risk-averse control of discrete-time systems, Notes on average Markov decision processes with a minimum-variance criterion

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1821706&oldid=14183438"