可迁移模型 · TRANSFERABLE MODEL

预训练的本质是学习一个可迁移的归纳偏置

预训练不只是"用大数据训练一个好模型"。它的真正机制是:预训练过程将数据分布中的结构信息编码进了网络权重,这些编码构成了一种"归纳偏置"——它告诉模型"这类数据的规律大概长这样"。当你在小数据上微调时,这个偏置极大地缩小了搜索空间,等价于用大数据"买"了一份对目标问题的先验知识。
来源

《Deep Learning》第15.2节

可迁移到

人才管理——一个在大公司经历过完整产品周期的工程师,其"预训练表征"(系统思维、质量意识、流程经验)在小公司微调后会表现极好——因为大公司经历提供了强归纳偏置,小公司只需要针对性调整。

来自这本书的解读报告

《Deep Learning(深度学习》

Ian Goodfellow, Yoshua Bengio, Aaron Courville · 机器学习 / 人工智能

这本书回答了深度学习凭何成立的问题,答案是用概率框架统一表征学习的核心原理

深度学习·表征学习·概率框架·机器学习理论
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →