可迁移模型 · TRANSFERABLE MODEL

正则化的本质是先验,而选择模型就是选择一个关于世界如何运行的假设

L1正则化(稀疏性)对应拉普拉斯先验,L2正则化(小权重)对应高斯先验。选择哪种正则化,绝非一个纯粹的工程调参,而是在**编码我们关于问题结构的先验信念**:我们是否相信只有少数特征是真正有用的(L1)?还是相信所有特征都有一些小的贡献(L2)?模型选择(如树的深度、神经网络的宽度)同理,是在选择世界运行的复杂度假设。
来源

关于先验与正则化的讨论章节

可迁移到

任何机器学习项目的模型设计阶段。团队不应再争论“用L1还是L2”,而应讨论“我们对这个问题中特征的重要性有什么先验假设?哪种假设更符合业务逻辑?”

来自这本书的解读报告

《贝叶斯推理与机器学习》

David J.C. MacKay · 机器学习 / 概率统计 / 信息论

这本书回答了如何在不确定性下从数据中学习的问题,其答案是用概率的语言建模并更新信念,并通过计算近似来实现。

机器学习·概率建模·贝叶斯推断·信息论
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →