可迁移模型 · TRANSFERABLE MODEL
正则化的本质是先验,而选择模型就是选择一个关于世界如何运行的假设
L1正则化(稀疏性)对应拉普拉斯先验,L2正则化(小权重)对应高斯先验。选择哪种正则化,绝非一个纯粹的工程调参,而是在**编码我们关于问题结构的先验信念**:我们是否相信只有少数特征是真正有用的(L1)?还是相信所有特征都有一些小的贡献(L2)?模型选择(如树的深度、神经网络的宽度)同理,是在选择世界运行的复杂度假设。
来自这本书的解读报告
《贝叶斯推理与机器学习》
这本书回答了如何在不确定性下从数据中学习的问题,其答案是用概率的语言建模并更新信念,并通过计算近似来实现。
阅读完整解读报告 →