可迁移模型 · TRANSFERABLE MODEL
AI安全的成本不对称:预防便宜,补救昂贵,但人们总是选择补救
罗素反复强调"安全机制必须在能力增长之前建立",这揭示了一个普遍的经济学不对称:预防的成本远低于补救,但人类系统性地低估预防的价值。这不是因为人类非理性,而是因为"预防失败"不可见(你不知道你避开了什么灾难),而"补救成功"可展示(英雄总是出现在火灾后而非火灾前)。
来自这本书的解读报告
《人类兼容:人工智能与人类的控制问题》
这本书回答了超级智能如何被人类安全控制的问题,它的答案是让机器以人类偏好为中心并保持不确定。
阅读完整解读报告 →