Off-policy RL algorithms can be sample-efficient for continuous control via sample multiple reuse (Q6539379)

scientific article; zbMATH DE number 7848775

Language	Label	Description	Also known as
English	Off-policy RL algorithms can be sample-efficient for continuous control via sample multiple reuse	scientific article; zbMATH DE number 7848775

Statements

instance of

scholarly article

0 references

title

Off-policy RL algorithms can be sample-efficient for continuous control via sample multiple reuse (English)

0 references

0 references

0 references

0 references

0 references

0 references

14 May 2024

0 references

zbMATH Keywords

continuous control

0 references

sample efficiency

0 references

reinforcement learning

0 references

0 references

0 references

0 references

Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and Variance Reduction

0 references

Multi-actor mechanism for actor-critic reinforcement learning

0 references

Convergence results for single-step on-policy reinforcement-learning algorithms

0 references

Q2934059

0 references

Q4626283

0 references

\({\mathcal Q}\)-learning

0 references

Identifiers

Mathematics Subject Classification ID

0 references

0 references

0 references

10.1016/J.INS.2024.120371

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6539379