跨书共振 · CROSS-BOOK RESONANCE
"不预处理"有时是最优预处理
不是所有模型都需要归一化(树模型不需要)、不是所有缺失值都需要填充(有些算法可以直接处理)、不是所有异常值都需要处理(可能包含重要信息)。预处理的目标不是"让数据好看",而是"让数据适配模型"——没有普适的预处理方案。
来自这本书的解读报告
《数据挖掘:实用机器学习工具与技术》
这本书回答了非专家如何用结构化流程做数据挖掘的问题,答案是CRISP-DM方法论+工具化执行。
阅读完整解读报告 →