可迁移模型 · TRANSFERABLE MODEL
辅助博弈:不完美的控制胜过完美的执行
让AI(或任何执行者)"不确定你想要什么"不是缺陷,而是安全机制——它创造了学习动机,保留了人类的修正能力。完美执行错误指令比不完美的执行更危险。
来自这本书的解读报告
《人类兼容:人工智能与我们如何设计未来》
这本书回答了如何防止超级智能AI失控,答案是放弃让AI优化既定目标,转而构建理解人类不确定偏好的辅助型AI
阅读完整解读报告 →
让AI(或任何执行者)"不确定你想要什么"不是缺陷,而是安全机制——它创造了学习动机,保留了人类的修正能力。完美执行错误指令比不完美的执行更危险。
这本书回答了如何防止超级智能AI失控,答案是放弃让AI优化既定目标,转而构建理解人类不确定偏好的辅助型AI