可迁移模型 · TRANSFERABLE MODEL
集成学习的核心不是"更多模型"而是"更多样性"
随机森林的效果好,不是因为用了"很多树",而是因为每棵树看到了"不同的数据子集+不同的特征子集"。如果多样性不足(如所有模型都受同一偏差影响),集成只是在放大错误而非减少错误。
来自这本书的解读报告
《数据挖掘:实用机器学习工具与技术》
这本书回答了非专家如何用结构化流程做数据挖掘的问题,答案是CRISP-DM方法论+工具化执行。
阅读完整解读报告 →