可迁移模型 · TRANSFERABLE MODEL
问题定义是整个链条中最被低估的环节
大量数据项目的失败不是因为算法不好,而是因为从一开始就问错了问题。"帮我预测客户流失"和"帮我理解为什么客户流失"是两个完全不同的问题,需要不同的数据、不同的方法、产出不同的价值。在动手分析之前,多花一小时确认问题定义,可以省下十小时的返工。
来自这本书的解读报告
《数据科学导论》
这本书回答了数据科学是什么以及如何做的问题,答案是以统计思维为核心、以编程为工具、以业务洞察为目标的系统方法论
阅读完整解读报告 →