跨书共振 · CROSS-BOOK RESONANCE
语言结构是归纳偏置,不是自由变量
选择什么样的语言结构表示(短语结构 vs 依存结构,树 vs 图),本质上是在为模型注入不同的归纳偏置。好的归纳偏置让模型在有限数据下学得更好(如依存语法让模型"知道"句子以动词为中心),但也会限制模型发现数据中非预期模式的能力。这与深度学习的核心哲学——"让数据说话"——形成了深层张力。
来自这本书的解读报告
《自然语言处理导论》
这本书回答了机器如何理解和生成人类语言的问题,它的答案是从概率建模到神经网络,从数据中学习语言的统计规律与层级结构。
阅读完整解读报告 →