可迁移模型 · TRANSFERABLE MODEL

辅助博弈：不完美的控制胜过完美的执行

让AI（或任何执行者）"不确定你想要什么"不是缺陷，而是安全机制——它创造了学习动机，保留了人类的修正能力。完美执行错误指令比不完美的执行更危险。

《人类兼容》第4-6章 / 辅助博弈框架

领导力、产品设计、教育、任何"服务-被服务"关系

这本书回答了如何防止超级智能AI失控，答案是放弃让AI优化既定目标，转而构建理解人类不确定偏好的辅助型AI

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP