A learning algorithm for communicating Markov decision processes with unknown transition matrices (Q2844160)

scientific article; zbMATH DE number 6202348

Language	Label	Description	Also known as
English	A learning algorithm for communicating Markov decision processes with unknown transition matrices	scientific article; zbMATH DE number 6202348

Statements

instance of

0 references

0 references

0 references

0 references

0 references

28 August 2013

0 references

zbMATH Keywords

adaptive policy

0 references

average case

0 references

communicating case

0 references

learning algorithm

0 references

Markov decision processes

0 references

reward-penalty type

0 references

unknown transition matrix

0 references

MaRDI profile type

Publication

0 references

title

A learning algorithm for communicating Markov decision processes with unknown transition matrices (English)

0 references

published in

Bulletin of Informatics and Cybernetics

0 references

Identifiers

zbMATH Open document ID

1270.90097

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:2844160