Estimation and control in Markov chains

DOI10.2307/1426206zbMath0281.60070OpenAlexW2320680700WikidataQ100640305 ScholiaQ100640305MaRDI QIDQ4766345

Publication date: 1974

Published in: Advances in Applied Probability (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.2307/1426206

Mathematics Subject Classification ID

Markov chains (discrete-time Markov processes on discrete state spaces) (60J10) Markov processes (60J99)

Related Items

Finite-state approximations for denumerable multidimensional state discounted Markov decision processes, Parameter estimation in continuous-time stochastic processes, Bounds for the regret loss in dynamic programming under adaptive control, Markov decision processes with a minimum-variance criterion, A unified approach to adaptive control of average reward Markov decision processes, Unnamed Item, Adaptive policy-iteration and policy-value-iteration for discounted Markov decision processes, Density estimation and adaptive control of Markov processes: Average and discounted criteria, Stochastic approximations for finite-state Markov chains, Central limit theorem for the estimator of the value of an optimal stopping problem, An expected average reward criterion, Nonparametric adaptive control of discrete-time partially observable stochastic systems, Discretization procedures for adaptive Markov control processes, Unnamed Item, Estimation and control in discounted stochastic dynamic programming, Strong 0-discount optimal policies in a Markov decision process with a Borel state space, Markov control models with unknown random state-action-dependent discount factors, Unnamed Item, Adaptive discounted control for piecewise deterministic Markov processes, Adaptive control of Markov chains with local updates, Nonparametric adaptive control of discounted stochastic systems with compact state space, Statistical inference for a finite optimal stopping problem with unknown transition probabilities, Existenz durelisehnittsoptimaler Strategien in einem Markoffschen Entscheidungsmodell mit unbekaimter Parameterfolge, Optimal adaptive inventory control for a multi-location model with redistribution, Nonparametric estimation and adaptive control in a class of finite Markov decision chains, Ergodic and adaptive control of nearest-neighbor motions, Estimation and control in multichain processes, Computationally efficient algorithms for on-line optimization of Markov decision processes, Optimal ergodic control of Markov diffusion processes with minimum variance, Adaptive control of stochastic systems with unknown disturbance distribution: discounted criteria, Unnamed Item, Estimation of the coefficients of a diffusion from discrete observations, Semi-Markov control models with partially known holding times distribution: discounted and average criteria, Unnamed Item, Asymptotic Normality of Discrete-Time Markov Control Processes, Recursive adaptive control of Markov decision processes with the average reward criterion, Ergodic control of multidimensional diffusions. II: Adaptive control, Adaptive control of diffusion processes with a discounted reward criterion, The Kumar-Becker-Lin scheme revisited, A Central Limit Theorem for Temporally Nonhomogenous Markov Chains with Applications to Dynamic Programming, Revisiting the ODE method for recursive algorithms: fast convergence using quasi stochastic approximation, Unnamed Item, Sample complexity for Markov chain self-tuner, Optimal adaptive control of priority assignment in queueing systems, Adaptive control of service in queueing systems, Adaptive control of discounted Markov decision chains, Unnamed Item, Nonstationary value-iteration and adaptive control of discounted semi- Markov processes, Variance-minimization of Markov control processes with pathwise constraints, Adaptive control of Markov processes with incomplete state information and unknown parameters, On the Milito-Cruz adaptive control scheme for Markov chains, Notes on average Markov decision processes with a minimum-variance criterion