可迁移模型 · TRANSFERABLE MODEL

正则化 = 先验知识的数学表达,不是"调参技巧"

L2正则化等价于高斯先验,L1正则化等价于拉普拉斯先验。这意味着:当你选择正则化策略时,你实际上是在声明"我认为参数应该长什么样"。这个视角将"超参数调优"提升为"知识表达"。
来源

PRML第3章,最大似然与正则化等价性

可迁移到

深度学习权重衰减的理论解释;任何模型中正则化强度的先验知识表达

来自这本书的解读报告

《模式识别与机器学习》

Christopher M. Bishop · 机器学习 / 概率统计

这本书回答了机器学习如何统一于概率框架,答案是用贝叶斯推断作为核心语言将所有学习问题转化为不确定性量化问题

机器学习·贝叶斯推断·概率图模型·模式识别·统计学习
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →