可迁移模型 · TRANSFERABLE MODEL

数据稀疏是统计语言模型的原罪

N-gram模型的指数级增长(V^N)意味着大部分可能的词组合在任何有限语料中都从未出现过。平滑技术的本质是"用没有见过的证据做预测"——这个困境在所有依赖数据的领域都存在(推荐系统、风控模型)。
来源

《语音与语言处理》第3-4章N-gram模型部分

可迁移到

任何需要从稀疏数据中学习的场景——理解"为什么你的模型在长尾case上表现差",以及为什么正则化和先验知识如此重要

来自这本书的解读报告

《语音与语言处理》

Daniel Jurafsky & James H. Martin · 自然语言处理 / 计算语言学

这本书回答了如何让机器理解人类语言的问题,系统整合了从语音到语义的完整技术栈

自然语言处理·语音识别·深度学习·语言模型
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →