可迁移模型 · TRANSFERABLE MODEL

预训练的本质是学习一个可迁移的归纳偏置

预训练不只是"用大数据训练一个好模型"。它的真正机制是：预训练过程将数据分布中的结构信息编码进了网络权重，这些编码构成了一种"归纳偏置"——它告诉模型"这类数据的规律大概长这样"。当你在小数据上微调时，这个偏置极大地缩小了搜索空间，等价于用大数据"买"了一份对目标问题的先验知识。

《Deep Learning》第15.2节

人才管理——一个在大公司经历过完整产品周期的工程师，其"预训练表征"（系统思维、质量意识、流程经验）在小公司微调后会表现极好——因为大公司经历提供了强归纳偏置，小公司只需要针对性调整。

这本书回答了深度学习凭何成立的问题，答案是用概率框架统一表征学习的核心原理

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP