认知颠覆 · COGNITIVE OVERTURN
学习率是优化中最敏感的“超参数之王”
很多人认为模型结构或优化器类型最重要,但书中反复暗示并论证:**学习率及其调度策略**往往对训练成功与否的影响最大。一个糟糕的学习率能让最好的优化器失效,而一个精巧的学习率调度(如预热+余弦退火)能让简单的SGD表现卓越。
来自这本书的解读报告
《深度学习优化》
这本书回答了如何为深度神经网络这一复杂系统找到高效训练方法的问题,其答案是构建一套以梯度为核心、融合多种技巧的优化算法工具箱。
阅读完整解读报告 →