Adaptive stepsizes for recursive estimation with applications in approximate dynamic programming

DOI10.1007/s10994-006-8365-9zbMath1475.90122OpenAlexW2146917784MaRDI QIDQ851872

Publication date: 22 November 2006

Published in: Machine Learning (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1007/s10994-006-8365-9

zbMATH Keywords

adaptive learning Kalman filter approximate dynamic programming stochastic stepsize

Mathematics Subject Classification ID

Dynamic programming (90C39)

Related Items (21)

A stochastic successive minimization method for nonsmooth nonconvex optimization with applications to transceiver design in wireless communication networks ⋮ ASD+M: automatic parameter tuning in stochastic optimization and on-line learning ⋮ Approximate dynamic programming for lateral transshipment problems in multi-location inventory systems ⋮ A stochastic gradient method for a class of nonlinear PDE-constrained optimal control problems under uncertainty ⋮ Block-cyclic stochastic coordinate descent for deep neural networks ⋮ Cross-docking based factory logistics unitisation process: an approximate dynamic programming approach ⋮ Reinforcement learning algorithms with function approximation: recent advances and applications ⋮ Minimizing total tardiness in a stochastic single machine scheduling problem using approximate dynamic programming ⋮ Integrated condition-based maintenance and multi-item lot-sizing with stochastic demand ⋮ Stochastic model predictive control with adaptive constraint tightening for non-conservative chance constraints satisfaction ⋮ Benchmarking a Scalable Approximate Dynamic Programming Algorithm for Stochastic Control of Grid-Level Energy Storage ⋮ Autonomous reinforcement learning with experience replay ⋮ A unified framework for stochastic optimization ⋮ Scalable estimation strategies based on stochastic approximations: classical results and new insights ⋮ A Stochastic Line Search Method with Expected Complexity Analysis ⋮ Risk-Averse Approximate Dynamic Programming with Quantile-Based Risk Measures ⋮ Bayesian Exploration for Approximate Dynamic Programming ⋮ Projected Stochastic Gradients for Convex Constrained Problems in Hilbert Spaces ⋮ Probabilistic Line Searches for Stochastic Optimization ⋮ Convergence Rates and Decoupling in Linear Stochastic Approximation Algorithms ⋮ An inexact restoration-nonsmooth algorithm with variable accuracy for stochastic nonsmooth convex optimization problems in machine learning and stochastic linear complementarity problems

Cites Work

This page was built for publication: Adaptive stepsizes for recursive estimation with applications in approximate dynamic programming