Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Approximate Dynamic Programming - MaRDI portal

Approximate Dynamic Programming

From MaRDI portal

Publication:5310431

Jump to:navigation, search

DOI10.1002/9780470182963zbMath1156.90021OpenAlexW2487144912MaRDI QIDQ5310431

Warren B. Powell

Publication date: 11 October 2007

Published in: Wiley Series in Probability and Statistics (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1002/9780470182963

zbMATH Keywords

dynamic programming Markov process stochastic optimization problem algorithmic strategies post-decision state variable

Mathematics Subject Classification ID

Stochastic programming (90C15) Management decision making, including multiple objectives (90B50) Stochastic network models in operations research (90B15) Deterministic network models in operations research (90B10) Dynamic programming (90C39) Research exposition (monographs, survey articles) pertaining to operations research and mathematical programming (90-02)

Related Items (only showing first 100 items - show all)

Dynamic Programming Deconstructed: Transformations of the Bellman Equation and Computational Efficiency ⋮ APPROXIMATE DYNAMIC PROGRAMMING TECHNIQUES FOR THE CONTROL OF TIME-VARYING QUEUING SYSTEMS APPLIED TO CALL CENTERS WITH ABANDONMENTS AND RETRIALS ⋮ Optimal Liquidation in a Level-I Limit Order Book for Large-Tick Stocks ⋮ Randomized Shortest-Path Problems: Two Related Models ⋮ Integrated Multiresource Capacity Planning and Multitype Patient Scheduling ⋮ Asymptotic analysis for multi-objective sequential stochastic assignment problems ⋮ Approximately adaptive neural cooperative control for nonlinear multiagent systems with performance guarantee ⋮ Approximation algorithms for stochastic online matching with reusable resources ⋮ An approximate dynamic programming approach for <scp>production‐delivery</scp> scheduling under non‐stationary demand ⋮ Defense and security planning under resource uncertainty and multi‐period commitments ⋮ Dimension reduction based adaptive dynamic programming for optimal control of discrete-time nonlinear control-affine systems ⋮ Maritime inventory routing: recent trends and future directions ⋮ H_∞ optimal control of unknown linear systems by adaptive dynamic programming with applications to time‐delay systems ⋮ A deep real options policy for sequential service region design and timing ⋮ Capacity and surgery partitioning: an approach for improving surgery scheduling in the inpatient surgical department ⋮ Modified general policy iteration based adaptive dynamic programming for unknown discrete‐time linear systems ⋮ Adaptive optimal control of continuous-time nonlinear affine systems via hybrid iteration ⋮ optimal control of unknown continuous time linear periodic systems by adaptive dynamic programming with applications to magnetic attitude control ⋮ Blood component preparation‐inventory problem with stochastic demand and supply ⋮ Operational Research: Milestones and Highlights of Canadian Contributions ⋮ Dynamic surgery management under uncertainty ⋮ Global optimization on non-convex two-way interaction truncated linear multivariate adaptive regression splines using mixed integer quadratic programming ⋮ On the sample complexity of actor-critic method for reinforcement learning with function approximation ⋮ STOCHASTIC OPTIMAL DYNAMIC CONTROL OF GI_m/GI_m/1_n QUEUES WITH TIME-VARYING WORKLOADS ⋮ Optimizing vaccine distribution in developing countries under natural disaster risk ⋮ Four Canadian Contributions to Stochastic Modeling ⋮ Compromise policy for multi-stage stochastic linear programming: variance and bias reduction ⋮ Cross-docking based factory logistics unitisation process: an approximate dynamic programming approach ⋮ Controlling a Fleet of Unmanned Aerial Vehicles to Collect Uncertain Information in a Threat Environment ⋮ SOLUTIONS AND DIAGNOSTICS OF SWITCHING PROBLEMS WITH LINEAR STATE DYNAMICS ⋮ Ellipsoidal Methods for Adaptive Choice-Based Conjoint Analysis ⋮ Experience replay–based output feedback Q‐learning scheme for optimal output tracking control of discrete‐time linear systems ⋮ Process Flexibility for Multiperiod Production Systems ⋮ Easy Affine Markov Decision Processes ⋮ On the Taylor Expansion of Value Functions ⋮ Spare Parts Inventory Management with Substitution-Dependent Reliability ⋮ Sampling Scenario Set Partition Dual Bounds for Multistage Stochastic Programs ⋮ OPTIMALLY REPLACING MULTIPLE SYSTEMS IN A SHARED ENVIRONMENT ⋮ Network-Based Approximate Linear Programming for Discrete Optimization ⋮ An Approximation Approach for Response-Adaptive Clinical Trial Design ⋮ Strategic capacity decision-making in a stochastic manufacturing environment using real-time approximate dynamic programming ⋮ An approximate dynamic programing approach to the development of heuristics for the scheduling of impatient jobs in a clearing system ⋮ Long-term planning of a container terminal under demand uncertainty and economies of scale ⋮ Quadratic approximate dynamic programming for input‐affine systems ⋮ A Machine Learning Approach to Adaptive Robust Utility Maximization and Hedging ⋮ Optimal Bayesian adaptive trials when treatment efficacy depends on biomarkers ⋮ Online H∞ control for completely unknown nonlinear systems via an identifier–critic-based ADP structure ⋮ THE SEQUENTIAL STOCHASTIC ASSIGNMENT PROBLEM WITH POSTPONEMENT OPTIONS ⋮ Computable approximations for average Markov decision processes in continuous time ⋮ What you should know about simulation and derivatives ⋮ Minimising average passenger waiting time in personal rapid transit systems ⋮ Opportunistic Transmission over Randomly Varying Channels ⋮ What you should know about approximate dynamic programming ⋮ Value and Policy Function Approximations in Infinite-Horizon Optimization Problems ⋮ Two-Armed Restless Bandits with Imperfect Information: Stochastic Control and Indexability ⋮ Observer‐based adaptive optimal output containment control problem of linear heterogeneous Multiagent systems with relative output measurements ⋮ Output‐feedback H_∞ quadratic tracking control of linear systems using reinforcement learning ⋮ Intelligent Human–Robot Interaction Systems Using Reinforcement Learning and Neural Networks ⋮ A perturbation approach to approximate value iteration for average cost Markov decision processes with Borel spaces and bounded costs ⋮ Time-varying Markov decision processes with state-action-dependent discount factors and unbounded costs ⋮ Suboptimal Policies for Stochastic $$N$$-Stage Optimization: Accuracy Analysis and a Case Study from Optimal Consumption ⋮ The locomotive assignment problem: a survey on optimization models ⋮ A Continuous-Time Markov Decision Process for Infrastructure Surveillance ⋮ TIME-INCONSISTENT MARKOVIAN CONTROL PROBLEMS UNDER MODEL UNCERTAINTY WITH APPLICATION TO THE MEAN-VARIANCE PORTFOLIO SELECTION ⋮ Distributionally robust optimization for sequential decision-making ⋮ A Review Selection Method for Finding an Informative Subset from Online Reviews ⋮ Multistage Stochastic Power Generation Scheduling Co-Optimizing Energy and Ancillary Services ⋮ Unnamed Item ⋮ Empirical Q-Value Iteration ⋮ Approximate dynamic programming via iterated Bellman inequalities ⋮ Unnamed Item ⋮ Unnamed Item ⋮ Approximation of average cost Markov decision processes using empirical distributions and concentration inequalities ⋮ Adaptive Bin Packing with Overflow ⋮ Concentration of Contractive Stochastic Approximation and Reinforcement Learning ⋮ Homotopic policy iteration-based learning design for unknown linear continuous-time systems ⋮ Approximate policy iteration: a survey and some new methods ⋮ A review of stochastic algorithms with continuous value function approximation and some new approximate policy iteration algorithms for multidimensional continuous applications ⋮ Stochastic system controller synthesis for reachability specifications encoded by random sets ⋮ New integer optimization models and an approximate dynamic programming algorithm for the lot-sizing and scheduling problem with sequence-dependent setups ⋮ Approximate dynamic programming for an energy-efficient parallel machine scheduling problem ⋮ Approximate dynamic programming with state aggregation applied to UAV perimeter patrol ⋮ Experimental Design for Partially Observed Markov Decision Processes ⋮ Unnamed Item ⋮ Unnamed Item ⋮ Algorithms for Optimal Control of Stochastic Switching Systems ⋮ Particle methods for stochastic optimal control problems ⋮ Resilient reinforcement learning and robust output regulation under denial-of-service attacks ⋮ Providing Consistent Opinions from Online Reviews: A Heuristic Stepwise Optimization Approach ⋮ Dynamic pooled capacity deployment for urban parcel logistics ⋮ Model-free finite-horizon optimal tracking control of discrete-time linear systems ⋮ Neuro-optimal tracking control for a class of discrete-time nonlinear systems via generalized value iteration adaptive dynamic programming approach ⋮ Markov Reward Models and Markov Decision Processes in Discrete and Continuous Time: Performance Evaluation and Optimization ⋮ Policy iterations for reinforcement learning problems in continuous time and space -- fundamental theory and methods ⋮ Time-optimal control of large-scale systems of systems using compositional optimization ⋮ Efficient algorithms of pathwise dynamic programming for decision optimization in mining operations ⋮ Mature offshore oil field development: solving a real options problem using stochastic dual dynamic integer programming ⋮ A stochastic control formalism for dynamic biologically conformal radiation therapy ⋮ Optimal patient and personnel scheduling policies for care-at-home service facilities ⋮ Solving the dynamic ambulance relocation and dispatching problem using approximate dynamic programming

This page was built for publication: Approximate Dynamic Programming

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5310431&oldid=19983889"