可迁移模型 · TRANSFERABLE MODEL

正则化的本质是控制有效容量

Dropout、L2、早停、数据增强——表面上是不同技术，本质都在约束模型的有效容量。理解这个统一视角后，可以根据场景自由组合或发明新正则化方法。

《深度学习》第7章 / 正则化

超参调优——不必逐个尝试，而是从"容量是否匹配数据量"角度系统评估；设计新正则化时寻找"约束有效容量"的新方式。

这本书回答了「如何系统理解深度学习」的问题，它的答案是从数学基础、表示学习、优化理论三维度建立统一框架

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP