A reinforcement learning algorithm based on policy iteration for average reward: Empirical results with yield management and convergence analysis (Q1771225)

scientific article; zbMATH DE number 2153946

Language	Label	Description	Also known as
English	A reinforcement learning algorithm based on policy iteration for average reward: Empirical results with yield management and convergence analysis	scientific article; zbMATH DE number 2153946

Statements

instance of

scholarly article

0 references

title

A reinforcement learning algorithm based on policy iteration for average reward: Empirical results with yield management and convergence analysis (English)

0 references

0 references

0 references

7 April 2005

0 references

zbMATH Keywords

reinforcement learning