跨书共振 · CROSS-BOOK RESONANCE
规模是涌现的前提,但不是保证
大模型的涌现能力(如 GPT 的推理能力)不是设计出来的,而是训练过程中「意外」产生的。但这种涌现需要临界规模——太小的模型不会涌现,太大的模型成本不可承受。这与「量变引起质变」的哲学原理形成呼应。
来自这本书的解读报告
《神经网络与深度学习》
这本书回答了如何让机器自动学习复杂模式,答案是通过反向传播训练多层神经网络
阅读完整解读报告 →
大模型的涌现能力(如 GPT 的推理能力)不是设计出来的,而是训练过程中「意外」产生的。但这种涌现需要临界规模——太小的模型不会涌现,太大的模型成本不可承受。这与「量变引起质变」的哲学原理形成呼应。
这本书回答了如何让机器自动学习复杂模式,答案是通过反向传播训练多层神经网络