Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Min Max Generalization for Deterministic Batch Mode Reinforcement Learning: Relaxation Schemes - MaRDI portal

Min Max Generalization for Deterministic Batch Mode Reinforcement Learning: Relaxation Schemes

From MaRDI portal

Publication:2873838

Jump to:navigation, search

DOI10.1137/120867263zbMath1284.49012OpenAlexW2057088773MaRDI QIDQ2873838

Raphael Fonteneau, Quentin Louveaux, Damien Ernst, Bernard Boigelot

Publication date: 27 January 2014

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.711.5580

zbMATH Keywords

computational complexity nonconvex optimization relaxation schemes batch mode reinforcement learning min--max problem

Mathematics Subject Classification ID

Minimax problems in mathematical programming (90C47) Abstract computational complexity for mathematical programming problems (90C60) Nonconvex programming, global optimization (90C26) Learning and adaptive systems in artificial intelligence (68T05) Existence of solutions for minimax problems (49J35) Methods involving semicontinuity and convergence; relaxation (49J45)

Uses Software

SeDuMi

This page was built for publication: Min Max Generalization for Deterministic Batch Mode Reinforcement Learning: Relaxation Schemes

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2873838&oldid=15818431"