Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Learning parametric policies and transition probability models of Markov decision processes from data - MaRDI portal

Learning parametric policies and transition probability models of Markov decision processes from data

From MaRDI portal

Publication:2220059

Jump to:navigation, search

DOI10.1016/j.ejcon.2020.04.003zbMath1502.90190OpenAlexW3031673669MaRDI QIDQ2220059

Henghui Zhu, Ioannis Ch. Paschalidis, Ting-Ting Xu

Publication date: 21 January 2021

Published in: European Journal of Control (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.ejcon.2020.04.003

zbMATH Keywords

regularization maximum likelihood estimation Markov decision processes policy learning learning transition dynamics

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Cites Work

This page was built for publication: Learning parametric policies and transition probability models of Markov decision processes from data

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2220059&oldid=14757679"