可迁移模型 · TRANSFERABLE MODEL

正则化 = 先验知识的数学表达，不是"调参技巧"

L2正则化等价于高斯先验，L1正则化等价于拉普拉斯先验。这意味着：当你选择正则化策略时，你实际上是在声明"我认为参数应该长什么样"。这个视角将"超参数调优"提升为"知识表达"。

PRML第3章，最大似然与正则化等价性

深度学习权重衰减的理论解释；任何模型中正则化强度的先验知识表达

这本书回答了机器学习如何统一于概率框架，答案是用贝叶斯推断作为核心语言将所有学习问题转化为不确定性量化问题

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP