跨书共振 · CROSS-BOOK RESONANCE

机器学习的成功条件:训练分布必须接近测试分布

泛化是机器学习的核心概念——模型在未见数据上的表现。但泛化有一个隐含前提:训练数据的分布必须近似于测试数据的分布。一旦这个前提被打破(数据分布偏移),再强大的模型也会崩溃。这与 Nassim Taleb 在《黑天鹅》中的论证形成共振——基于历史的归纳推理在结构性断裂面前完全失效。
来源

第18-20章,泛化理论

可迁移到

任何基于历史数据的预测系统(销售预测、风控模型、招聘算法)都需要定期检查数据分布是否发生了偏移,否则可能在最需要它的时候失效。 ```

来自这本书的解读报告

《人工智能》

阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →