Adaptive policy-iteration and policy-value-iteration for discounted Markov decision processes (Q3984139)

scientific article; zbMATH DE number 25720

Language	Label	Description	Also known as
English	Adaptive policy-iteration and policy-value-iteration for discounted Markov decision processes	scientific article; zbMATH DE number 25720

Statements

instance of

scholarly article

0 references

title

Adaptive policy-iteration and policy-value-iteration for discounted Markov decision processes (English)

0 references

published in

ZOR Zeitschrift f�r Operations Research Methods and Models of Operations Research

0 references

publication date

27 June 1992

0 references

zbMATH Keywords

discounted Markov decision process

0 references

nonstationary value iteration

0 references

policy-iteration

0 references

policy-value-iteration

0 references

asymptotically discount optimal policies

0 references

0 references

0 references

Nonstationary Markov decision problems with converging parameters

0 references

Adaptive Markov control processes

0 references

Q5599448

0 references

A unified approach to adaptive control of average reward Markov decision processes

0 references

Q5649557

0 references

Adaptive Policies in Markov Decision Processes with Uncertain Transition Matrices

0 references

Learning algorithms for Markov decision processes

0 references

Estimation and control in Markov chains

0 references

A set of successive approximation methods for discounted Markovian decision problems

0 references

Modified Policy Iteration Algorithms for Discounted Markov Decision Problems

0 references

Q3312038

0 references

Estimation and control in discounted stochastic dynamic programming

0 references

Approximations of Dynamic Programs, I

0 references

Identifiers

zbMATH Open document ID

0748.90076

0 references

DOI

10.1007/BF01415991

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:3984139