认知颠覆 · COGNITIVE OVERTURN

梯度噪声是朋友,不是敌人

传统优化视噪声为干扰。但在深度学习中,SGD引入的梯度噪声(源于数据采样随机性)帮助模型逃离尖锐的局部极小值,寻找更平坦的极小值,从而**提升泛化能力**。这是深度优化与传统凸优化一个根本性的思维差异。
来源

《深度学习优化》随机梯度下降部分

可迁移到

创新与创业管理。计划外的随机尝试(“噪声”)虽然可能失败,但能帮助团队突破思维定式(“局部最优”),发现新的市场机会(“平坦极小值”)。

来自这本书的解读报告

《深度学习优化》

梁锡军 · 机器学习 / 计算科学

这本书回答了如何为深度神经网络这一复杂系统找到高效训练方法的问题,其答案是构建一套以梯度为核心、融合多种技巧的优化算法工具箱。

深度学习·优化算法·梯度下降·机器学习
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →