Partially Observable Total-Cost Markov Decision Processes with Weakly Continuous Transition Probabilities

DOI10.1287/moor.2015.0746zbMath1338.90445arXiv1401.2168OpenAlexW2963292203MaRDI QIDQ2806825

Eugene A. Feinberg, Pavlo O. Kasyanov, Michael Z. Zgurovsky

Publication date: 19 May 2016

Published in: Mathematics of Operations Research (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1401.2168

zbMATH Keywords

total cost partially observable Markov decision processes optimal policy optimality inequality

Mathematics Subject Classification ID

Dynamic programming (90C39) Markov and semi-Markov decision processes (90C40)

Related Items (28)

Risk measurement and risk-averse control of partially observable discrete-time Markov systems ⋮ STOCHASTIC SETUP-COST INVENTORY MODEL WITH BACKORDERS AND QUASICONVEX COST FUNCTIONS ⋮ Robustness to Incorrect Priors and Controlled Filter Stability in Partially Observed Stochastic Control ⋮ Markov Decision Processes with Incomplete Information and Semiuniform Feller Transition Probabilities ⋮ Partially observed discrete-time risk-sensitive mean field games ⋮ Semi-uniform Feller stochastic kernels ⋮ Equivalent conditions for weak continuity of nonlinear filters ⋮ Approximate Nash Equilibria in Partially Observed Stochastic Games with Mean-Field Interactions ⋮ Convergence theorems for varying measures under convexity conditions and applications ⋮ Robustness to Incorrect System Models in Stochastic Control ⋮ Fatou's Lemma in Its Classical Form and Lebesgue's Convergence Theorems for Varying Measures with Applications to Markov Decision Processes ⋮ A Universal Dynamic Program and Refined Existence Results for Decentralized Stochastic Control ⋮ Optimal Control of Partially Observable Piecewise Deterministic Markov Processes ⋮ Convergence of probability measures and Markov decision models with incomplete information ⋮ Average Cost Markov Decision Processes with Semi-Uniform Feller Transition Probabilities ⋮ Robustness to Approximations and Model Learning in MDPs and POMDPs ⋮ Unnamed Item ⋮ Uniform Fatou's lemma ⋮ Weak Feller property of non-linear filters ⋮ Fatou's Lemma for Weakly Converging Measures under the Uniform Integrability Condition ⋮ Strong Uniform Value in Gambling Houses and Partially Observable Markov Decision Processes ⋮ MDPs with setwise continuous transition probabilities ⋮ A Fenchel-Moreau-Rockafellar type theorem on the Kantorovich-Wasserstein space with applications in partially observable Markov decision processes ⋮ Robustness to Incorrect Priors in Partially Observed Stochastic Control ⋮ Stochastic Comparative Statics in Markov Decision Processes ⋮ Convergence for varying measures ⋮ Continuity of equilibria for two-person zero-sum games with noncompact action sets and unbounded payoffs ⋮ On the optimality equation for average cost Markov decision processes and its validity for inventory control

Cites Work

This page was built for publication: Partially Observable Total-Cost Markov Decision Processes with Weakly Continuous Transition Probabilities