可迁移模型 · TRANSFERABLE MODEL
正则化的本质是控制有效容量
Dropout、L2、早停、数据增强——表面上是不同技术,本质都在约束模型的有效容量。理解这个统一视角后,可以根据场景自由组合或发明新正则化方法。
来自这本书的解读报告
《深度学习》
这本书回答了「如何系统理解深度学习」的问题,它的答案是从数学基础、表示学习、优化理论三维度建立统一框架
阅读完整解读报告 →
Dropout、L2、早停、数据增强——表面上是不同技术,本质都在约束模型的有效容量。理解这个统一视角后,可以根据场景自由组合或发明新正则化方法。
这本书回答了「如何系统理解深度学习」的问题,它的答案是从数学基础、表示学习、优化理论三维度建立统一框架