Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
scientific article; zbMATH DE number 7370555 - MaRDI portal

scientific article; zbMATH DE number 7370555

From MaRDI portal

Publication:4998920

Jump to:navigation, search

MaRDI QIDQ4998920

Ruszczyński, Andrzej, Umit Köse

Publication date: 9 July 2021

Full work available at URL: https://jmlr.csail.mit.edu/papers/v22/20-168.html

Title: zbMATH Open Web Interface contents unavailable due to conflicting licenses.

zbMATH Keywords

stochastic approximation reinforcement learning temporal difference methods dynamic risk measures linear function approximation

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Related Items

Discrete-time risk-aware optimal switching with non-adapted costs, An Integrated Transportation Distance between Kernels and Approximate Dynamic Risk Evaluation in Markov Systems, Conditionally Elicitable Dynamic Risk Measures for Deep Reinforcement Learning, Mini-Batch Risk Forms, Reinforcement learning with dynamic convex risk measures, Risk-averse autonomous systems: a brief history and recent developments from the perspective of optimal control

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4998920&oldid=19452005"