可迁移模型 · TRANSFERABLE MODEL
预测能力与推理能力之间存在结构性鸿沟
"预测下一个最可能的输出"和"推导出唯一正确的输出"是两种本质不同的认知操作。前者是概率性的、局部最优的、不保证全局一致性的;后者是确定性的、全局性的、保证逻辑一致性的。ChatGPT擅长前者但不擅长后者,这个鸿沟不是规模能消除的,而是机制决定的。
来自这本书的解读报告
《这就是ChatGPT:深入解析其背后的原理》
这本书回答了ChatGPT为何能看似理解人类语言的问题,其答案是:它本质上只做预测下一个词,但这种简单机制在海量数据上产生了理解的涌现。
阅读完整解读报告 →