Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Exponential Convergence and Stability of Howard's Policy Improvement Algorithm for Controlled Diffusions - MaRDI portal

Exponential Convergence and Stability of Howard's Policy Improvement Algorithm for Controlled Diffusions

From MaRDI portal

Publication:5111071

Jump to:navigation, search

DOI10.1137/19M1236758zbMath1441.93343arXiv1812.07846WikidataQ114978697 ScholiaQ114978697MaRDI QIDQ5111071

Lukasz Szpruch, B. Kerimkulov, David Šiška

Publication date: 26 May 2020

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1812.07846

zbMATH Keywords

stochastic control backward stochastic differential equation policy improvement algorithm

Mathematics Subject Classification ID

Stochastic ordinary differential equations (aspects of stochastic analysis) (60H10) Optimal stochastic control (93E20) Exponential stability (93D23)

Related Items

Rates of convergence for the policy iteration method for mean field games systems ⋮ Market based mechanisms for incentivising exchange liquidity provision ⋮ Reinforcement Learning for Linear-Convex Models with Jumps via Stability Analysis of Feedback Controls ⋮ Policy iteration method for time-dependent mean field games systems with non-separable Hamiltonians ⋮ Linear Convergence of a Policy Gradient Method for Some Finite Horizon Continuous Time Control Problems ⋮ A modified MSA for stochastic control problems ⋮ A neural network-based policy iteration algorithm with global \(H^2\)-superlinear convergence for stochastic games on domains ⋮ A policy iteration method for mean field games ⋮ A Modified Method of Successive Approximations for Stochastic Recursive Optimal Control Problems ⋮ Exploratory LQG mean field games with entropy regularization

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5111071&oldid=19635156"