跨书共振 · CROSS-BOOK RESONANCE

粒度选择是被低估的模型设计决策

同一个任务在不同粒度窗口下的表现可能天差地别——基于字的 NER 和基于词的 NER 是两个完全不同的模型,各有优劣。粒度选择不是"预处理参数",而是"核心架构决策"。这与《思考,快与慢》中"框架效应"(同一问题的不同表述导致不同决策)形成有趣呼应——同一数据的不同粒度表述也会导致不同的模型决策。
来源

《自然语言处理入门》第 2 章和第 4 章 · 分词与 NER

可迁移到

任何数据分析中的"聚合粒度"选择——时间序列分析的采样频率、财务分析的汇总周期、社交网络分析的社区粒度。

来自这本书的解读报告

《自然语言处理入门》

何晗 · 人工智能·自然语言处理

这本书回答了NLP如何从分词到理解层层递进的问题,答案是用序列标注统一范式串联全栈任务。

自然语言处理·机器学习·中文NLP·序列标注·深度学习
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →