认知颠覆 · COGNITIVE OVERTURN
梯度噪声是朋友,不是敌人
传统优化视噪声为干扰。但在深度学习中,SGD引入的梯度噪声(源于数据采样随机性)帮助模型逃离尖锐的局部极小值,寻找更平坦的极小值,从而**提升泛化能力**。这是深度优化与传统凸优化一个根本性的思维差异。
来自这本书的解读报告
《深度学习优化》
这本书回答了如何为深度神经网络这一复杂系统找到高效训练方法的问题,其答案是构建一套以梯度为核心、融合多种技巧的优化算法工具箱。
阅读完整解读报告 →