Finite-time analysis of natural actor-critic for POMDPs (Q6633040)

scientific article; zbMATH DE number 7938968

Language	Label	Description	Also known as
English	Finite-time analysis of natural actor-critic for POMDPs	scientific article; zbMATH DE number 7938968

Statements

instance of

scholarly article

0 references

title

Finite-time analysis of natural actor-critic for POMDPs (English)

0 references

0 references

0 references

0 references

SIAM Journal on Mathematics of Data Science

0 references

publication date

5 November 2024

0 references

zbMATH Keywords

reinforcement learning

0 references

partially observable Markov decision processes

0 references

natural policy gradient

0 references

actor-critic method

0 references

filter stability

0 references

0 references

0 references

0 references

Dynamic programming and optimal control. Vol. 2

0 references

Inference in hidden Markov models.

0 references

OnActor-Critic Algorithms

0 references

Partially observed Markov decision processes. From filtering to controlled sensing

0 references

Markov chains and stochastic stability

0 references

Regret Bounds for Reinforcement Learning via Markov Chain Concentration

0 references

Convergence Rates for Markov Chains

0 references

Q3996430

0 references

Understanding Machine Learning

0 references

The Optimal Control of Partially Observable Markov Processes over a Finite Horizon

0 references

Q5054599

0 references

Stability properties of some particle filters

0 references

Recurrent policy gradients

0 references

On Near Optimality of the Set of Finite-State Controllers for Average Cost POMDP

0 references

Identifiers

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6633040