Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Combinatorial bandits - MaRDI portal

Combinatorial bandits

From MaRDI portal

Publication:439986

Jump to:navigation, search

DOI10.1016/j.jcss.2012.01.001zbMath1262.91052OpenAlexW2914156981WikidataQ59538560 ScholiaQ59538560MaRDI QIDQ439986

Gábor Lugosi, Nicolò Cesa-Bianchi

Publication date: 17 August 2012

Published in: Journal of Computer and System Sciences (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.jcss.2012.01.001

zbMATH Keywords

online linear optimization adversarial bandit problems online prediction

Mathematics Subject Classification ID

Inference from stochastic processes and prediction (62M20) Decision theory (91B06)

Related Items

Bounded Regret for Finitely Parameterized Multi-Armed Bandits, Bandit online optimization over the permutahedron, Continuous Assortment Optimization with Logit Choice Probabilities and Incomplete Information, Combining initial segments of lists, Online learning of network bottlenecks via minimax paths, Multi-armed bandits with censored consumption of resources, Variable Selection Via Thompson Sampling, Online team formation under different synergies, Nonstochastic Multi-Armed Bandits with Graph-Structured Feedback, Unnamed Item, Online learning of energy consumption for navigation of electric vehicles, A combinatorial multi-armed bandit approach to correlation clustering, Multi-channel transmission scheduling with hopping scheme under uncertain channel states, Per-Round Knapsack-Constrained Linear Submodular Bandits, Learning in Combinatorial Optimization: What and How to Explore, An improved upper bound on the expected regret of UCB-type policies for a matching-selection bandit problem, Sequential Shortest Path Interdiction with Incomplete Information, Adaptive policies for perimeter surveillance problems, Polynomial-Time Algorithms for Multiple-Arm Identification with Full-Bandit Feedback, A Combinatorial Metrical Task System Problem Under the Uniform Metric, Online Learning over a Finite Action Set with Limited Switching, Learning Unknown Service Rates in Queues: A Multiarmed Bandit Approach, Asymptotically optimal algorithms for budgeted multiple play bandits, Nested-Batch-Mode Learning and Stochastic Optimization with An Application to Sequential MultiStage Testing in Materials Science

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:439986&oldid=12316002"