A Q-Learning Algorithm for Discrete-Time Linear-Quadratic Control with Random Parameters of Unknown Distribution: Convergence and Stabilization

From MaRDI portal

Publication:5093265

Jump to:navigation, search

DOI10.1137/20M1379605zbMath1493.49034arXiv2011.04970OpenAlexW4297626836MaRDI QIDQ5093265

Kai Du, Fu Zhang, Qingxin Meng

Publication date: 26 July 2022

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2011.04970

zbMATH Keywords

convergence stabilization random parameters Q-learning linear quadratic optimal control

Mathematics Subject Classification ID

Sensitivity, stability, well-posedness (49K40) Optimal feedback synthesis (49N35) Stabilization of systems by feedback (93D15) Linear-quadratic optimal control problems (49N10) Stochastic learning and adaptive control (93E35)

Related Items (2)

Deterministic optimal control for discrete-time systems with multiplicative noises and random coefficients ⋮ A distributed stochastic approximation algorithm for stochastic LQ control with unknown uncertainty

Cites Work

This page was built for publication: A Q-Learning Algorithm for Discrete-Time Linear-Quadratic Control with Random Parameters of Unknown Distribution: Convergence and Stabilization

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5093265&oldid=19600632"