跨书共振 · CROSS-BOOK RESONANCE
机器学习的成功条件:训练分布必须接近测试分布
泛化是机器学习的核心概念——模型在未见数据上的表现。但泛化有一个隐含前提:训练数据的分布必须近似于测试数据的分布。一旦这个前提被打破(数据分布偏移),再强大的模型也会崩溃。这与 Nassim Taleb 在《黑天鹅》中的论证形成共振——基于历史的归纳推理在结构性断裂面前完全失效。
来自这本书的解读报告
《人工智能》
阅读完整解读报告 →
泛化是机器学习的核心概念——模型在未见数据上的表现。但泛化有一个隐含前提:训练数据的分布必须近似于测试数据的分布。一旦这个前提被打破(数据分布偏移),再强大的模型也会崩溃。这与 Nassim Taleb 在《黑天鹅》中的论证形成共振——基于历史的归纳推理在结构性断裂面前完全失效。