Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Plateau Phenomenon in Gradient Descent Training of RELU Networks: Explanation, Quantification, and Avoidance - MaRDI portal

Plateau Phenomenon in Gradient Descent Training of RELU Networks: Explanation, Quantification, and Avoidance

From MaRDI portal

Publication:5157837

Jump to:navigation, search

DOI10.1137/20M1353010zbMath1487.65070arXiv2007.07213OpenAlexW3203168519MaRDI QIDQ5157837

Yeonjong Shin, Mark Ainsworth

Publication date: 20 October 2021

Published in: SIAM Journal on Scientific Computing (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2007.07213

zbMATH Keywords

neural networks gradient flow plateau phenomenon adaptive regime

Mathematics Subject Classification ID

Nonlinear programming (90C30) Numerical optimization and variational techniques (65K10) Dynamical systems in numerical analysis (37N30)

Related Items (1)

Active Neuron Least Squares: A Training Method for Multivariate Rectified Neural Networks

Cites Work

This page was built for publication: Plateau Phenomenon in Gradient Descent Training of RELU Networks: Explanation, Quantification, and Avoidance

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5157837&oldid=19713567"