Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
scientific article; zbMATH DE number 6860778 - MaRDI portal

scientific article; zbMATH DE number 6860778

From MaRDI portal

Publication:4636981

Jump to:navigation, search

zbMath1434.68463MaRDI QIDQ4636981

Jan Peters, Gerhard Neumann, Herke van Hoof

Publication date: 17 April 2018

Full work available at URL: http://jmlr.csail.mit.edu/papers/v18/16-142.html

Title: zbMATH Open Web Interface contents unavailable due to conflicting licenses.

zbMATH Keywords

kernel methods reinforcement learning robotics policy search

Mathematics Subject Classification ID

Nonparametric estimation (62G05) Learning and adaptive systems in artificial intelligence (68T05) Optimal stochastic control (93E20) Stochastic learning and adaptive control (93E35) Markov and semi-Markov decision processes (90C40)

Related Items (2)

Variational policy search using sparse Gaussian process priors for learning multimodal optimal actions ⋮ Unnamed Item

Uses Software

Cites Work

This page was built for publication:

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4636981&oldid=18821047"