An empirical study of policy convergence in Markov decision process value iteration (Q1886733)

scientific article; zbMATH DE number 2116802

Language	Label	Description	Also known as
English	An empirical study of policy convergence in Markov decision process value iteration	scientific article; zbMATH DE number 2116802

Statements

instance of

scholarly article

0 references

title

An empirical study of policy convergence in Markov decision process value iteration (English)

0 references

0 references

0 references

Computers \& Operations Research

0 references

publication date

19 November 2004

0 references

zbMATH Keywords

Markov decision processes

0 references

Dynamic programming

0 references

Convergence results

0 references

0 references

0 references

Finding Optimal Survey Policies via Adaptive Markov Decision Processes

0 references

Q3795523

0 references

The convergence of value iteration in discounted Markov decision processes

0 references

Geometric bounds for eigenvalues of Markov chains

0 references

Time will tell: Behavioural scoring and the dynamics of consumer credit assessment

0 references

A New Value Iteration method for the Average Cost Dynamic Programming Problem

0 references

Dynamic programming and stochastic control

0 references

full work available at URL

https://doi.org/10.1016/s0305-0548(03)00207-7

0 references

Identifiers

zbMATH Open document ID

1076.90066

0 references

DOI

10.1016/S0305-0548(03)00207-7

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:1886733