Logarithmic regret bounds for continuous-time average-reward Markov decision processes (Q6608781)

scientific article; zbMATH DE number 7916661

Language	Label	Description	Also known as
English	Logarithmic regret bounds for continuous-time average-reward Markov decision processes	scientific article; zbMATH DE number 7916661

Statements

instance of

scholarly article

0 references

title

Logarithmic regret bounds for continuous-time average-reward Markov decision processes (English)

0 references

0 references

0 references

SIAM Journal on Control and Optimization

0 references

publication date

20 September 2024

0 references

zbMATH Keywords

continuous-time Markov decision processes

0 references

average reward

0 references

instance-dependent regret bounds

0 references

upper confidence reinforcement learning

0 references

stochastic comparison

0 references

MaRDI profile type

Publication

0 references

cites work

UCB revisited: improved regret bounds for the stochastic multi-armed bandit problem

0 references

Bandits With Heavy Tail

0 references

Optimal Adaptive Policies for Markov Decision Processes

0 references

Queueing Network Controls via Deep Reinforcement Learning

0 references

Solving Semi-Markov Decision Problems Using Average Reward Reinforcement Learning

0 references

Continuous-time Markov decision processes. Theory and applications

0 references

Reinforcement Learning for Linear-Convex Models with Jumps via Stability Analysis of Feedback Controls

0 references

Q2896090

0 references

A Queueing Reward System with Several Customer Classes

0 references

Continuous-Time Markov Decision Processes

0 references

Technical Note—An Equivalence Between Continuous and Discrete Time Markov Decision Processes

0 references

Q4626283

0 references

Optimal Scheduling of Entropy Regularizer for Continuous-Time Linear-Quadratic Reinforcement Learning

0 references

Q5149240

0 references

Comparing counting processes and queues

0 references

Identifiers

DOI

10.1137/23m1584101

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6608781