Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Optimal policy evaluation using kernel-based temporal difference methods - MaRDI portal

Optimal policy evaluation using kernel-based temporal difference methods (Q6656605)

From MaRDI portal

Jump to:navigation, search

This is the item page for this Wikibase entity, intended for internal use and editing purposes.

Please use this page instead for the normal view: Optimal policy evaluation using kernel-based temporal difference methods

scientific article; zbMATH DE number 7961543

Language	Label	Description	Also known as
English	Optimal policy evaluation using kernel-based temporal difference methods	scientific article; zbMATH DE number 7961543

Statements

scholarly article

0 references

Optimal policy evaluation using kernel-based temporal difference methods (English)

0 references

0 references

0 references

Martin J. Wainwright

0 references

The Annals of Statistics

0 references

publication date

3 January 2025

0 references

zbMATH Keywords

dynamic programming

0 references

Markov reward process

0 references

nonparametric estimation

0 references

policy evaluation

0 references

reinforcement learning

0 references

reproducing kernel Hilbert space

0 references

sequential decision-making

0 references

temporal difference learning

0 references

MaRDI profile type

0 references

Practical kernel-based reinforcement learning

0 references

0 references

0 references

0 references

Discrete Dynamic Programming

0 references

Discounted Dynamic Programming

0 references

Markov decision processes in practice

0 references

Linear least-squares algorithms for temporal difference learning

0 references

ON RATE OPTIMALITY FOR ILL-POSED INVERSE PROBLEMS IN ECONOMETRICS

0 references

Regularized policy iteration with nonparametric function spaces

0 references

Minimax PAC bounds on the sample complexity of reinforcement learning with a generative model

0 references

Smoothing spline ANOVA models

0 references

A Lower Bound on the Risks of Non-Parametric Estimates of Densities in the Uniform Metric

0 references

0 references

Is Temporal Difference Learning Optimal? An Instance-Dependent Analysis

0 references

Some results on Tchebycheffian spline functions and stochastic processes

0 references

Policy Evaluation in Continuous MDPs With Efficient Kernelized Gradient Temporal Difference

0 references

0 references

Optimal Oracle Inequalities for Projected Fixed-Point Equations, with Applications to Policy Evaluation

0 references

0 references

Instrumental Variable Estimation of Nonparametric Models

0 references

Kernel-based reinforcement learning

0 references

Instance-Dependent ℓ<sub>∞</sub>-Bounds for Policy Evaluation in Tabular Reinforcement Learning

0 references

0 references

Minimax-optimal rates for sparse additive models over kernel classes via convex programming

0 references

The variance of discounted Markov decision processes

0 references

Optimal global rates of convergence for nonparametric regression

0 references

0 references

An analysis of temporal-difference learning with function approximation

0 references

0 references

High-Dimensional Statistics

0 references

Instrumental Variables Regression with Independent Observations

0 references

0 references

Randomized sketches for kernels: fast and optimal nonparametric regression

0 references

Error Bounds for Approximations from Projected Linear Equations

0 references

Learning Bounds for Kernel Regression Using Effective Data Dimensionality

0 references

Identifiers

Mathematics Subject Classification ID

0 references

0 references

zbMATH DE Number

0 references

10.1214/24-AOS2399

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6656605

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q6656605&oldid=42409214"