Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Optimal average value convergence in nonhomogeneous Markov decision processes - MaRDI portal

Optimal average value convergence in nonhomogeneous Markov decision processes (Q1323097)

From MaRDI portal

Jump to:navigation, search

This is the item page for this Wikibase entity, intended for internal use and editing purposes.

Please use this page instead for the normal view: Optimal average value convergence in nonhomogeneous Markov decision processes

scientific article; zbMATH DE number 566468

Language	Label	Description	Also known as
English	Optimal average value convergence in nonhomogeneous Markov decision processes	scientific article; zbMATH DE number 566468

Statements

scholarly article

0 references

Optimal average value convergence in nonhomogeneous Markov decision processes (English)

0 references

0 references

0 references

Robert L. Smith

0 references

Journal of Mathematical Analysis and Applications

0 references

publication date

9 May 1994

0 references

full work available at URL

http://hdl.handle.net/2027.42/30450

0 references

This paper deals with an infinite state nonhomogeneous Markov decision process with average reward criterion. The authors proved the following two structural results: (1) Under the Doeblin condition, the problem is equivalent to a discounted problem. (2) Under the same condition, the optimal finite horizon average values converge to the infinite horizon optimal one.

0 references

zbMATH Keywords

infinite state nonhomogeneous Markov decision process

0 references

average reward criterion

0 references

0 references

MaRDI profile type

0 references

Recommended article

Average Optimality in Nonhomogeneous Infinite Horizon Markov Decision Processes

Similarity Score

0.95075023

Recommender Run

Recommender Run 3

0 references

The convergence of value iteration in average cost Markov decision chains

Similarity Score

0.92867434

Recommender Run

Recommender Run 3

0 references

Average optimality for continuous-time Markov decision processes under weak continuity conditions

Similarity Score

0.92690045

Recommender Run

Recommender Run 3

0 references

Average optimality for continuous-time Markov decision processes with a policy iteration approach

Similarity Score

0.92452943

Recommender Run

Recommender Run 3

0 references

New sufficient conditions for average optimality in continuous-time Markov decision processes

Similarity Score

0.9161515

Recommender Run

Recommender Run 3

0 references

Similarity Score

0.9156485

Recommender Run

Recommender Run 3

0 references

Optimization of Average Rewards of Time Nonhomogeneous Markov Chains

Similarity Score

0.9128974

Recommender Run

Recommender Run 3

0 references

Verifiable conditions for average optimality of continuous-time Markov decision processes

Similarity Score

0.910993

Recommender Run

Recommender Run 3

0 references

On strong average optimality of Markov decision processes with unbounded costs

Similarity Score

0.90341

Recommender Run

Recommender Run 3

0 references

Identifiers

zbMATH Open document ID

0 references

Mathematics Subject Classification ID

0 references

zbMATH DE Number

0 references

0 references

10.1006/JMAA.1993.1367

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:1323097

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q1323097&oldid=43029200"