可迁移模型 · TRANSFERABLE MODEL

正则化的本质是先验，而选择模型就是选择一个关于世界如何运行的假设

L1正则化（稀疏性）对应拉普拉斯先验，L2正则化（小权重）对应高斯先验。选择哪种正则化，绝非一个纯粹的工程调参，而是在**编码我们关于问题结构的先验信念**：我们是否相信只有少数特征是真正有用的（L1）？还是相信所有特征都有一些小的贡献（L2）？模型选择（如树的深度、神经网络的宽度）同理，是在选择世界运行的复杂度假设。

来源

关于先验与正则化的讨论章节

可迁移到

任何机器学习项目的模型设计阶段。团队不应再争论“用L1还是L2”，而应讨论“我们对这个问题中特征的重要性有什么先验假设？哪种假设更符合业务逻辑？”

来自这本书的解读报告

《贝叶斯推理与机器学习》

David J.C. MacKay · 机器学习 / 概率统计 / 信息论

这本书回答了如何在不确定性下从数据中学习的问题，其答案是用概率的语言建模并更新信念，并通过计算近似来实现。

机器学习·概率建模·贝叶斯推断·信息论

阅读完整解读报告 →

PRESS YOUR OWN BOOK

找一本想读的书，解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →