可迁移模型 · TRANSFERABLE MODEL

AI安全的成本不对称：预防便宜，补救昂贵，但人们总是选择补救

罗素反复强调"安全机制必须在能力增长之前建立"，这揭示了一个普遍的经济学不对称：预防的成本远低于补救，但人类系统性地低估预防的价值。这不是因为人类非理性，而是因为"预防失败"不可见（你不知道你避开了什么灾难），而"补救成功"可展示（英雄总是出现在火灾后而非火灾前）。

《人类兼容》全书论证结构

网络安全投入、公共卫生预防、基础设施维护、儿童教育——所有"早期投入难以看到回报"的领域都存在这种成本不对称。 --- *（全文完。本报告基于《人类兼容》一书的核心论点与框架进行深度解读，所有模型提炼均源自罗素的原著论述，迁移场景与批判分析为独立思考的产物。）*

这本书回答了超级智能如何被人类安全控制的问题，它的答案是让机器以人类偏好为中心并保持不确定。

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP