Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Feel-Good Thompson Sampling for Contextual Bandits and Reinforcement Learning - MaRDI portal

Feel-Good Thompson Sampling for Contextual Bandits and Reinforcement Learning

From MaRDI portal

Publication:5089723

Jump to:navigation, search

DOI10.1137/21M140924XOpenAlexW3202341388MaRDI QIDQ5089723

No author found.

Publication date: 15 July 2022

Published in: SIAM Journal on Mathematics of Data Science (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2110.00871

zbMATH Keywords

reinforcement learning contextual bandits Thompson sampling

Mathematics Subject Classification ID

Computational learning theory (68Q32) Learning and adaptive systems in artificial intelligence (68T05)

Cites Work

This page was built for publication: Feel-Good Thompson Sampling for Contextual Bandits and Reinforcement Learning

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5089723&oldid=19597806"