可迁移模型 · TRANSFERABLE MODEL

控制悖论——管住比你聪明的东西的逻辑困境

传统控制依赖"比被控制者更聪明"(上级比下级更了解情况)。但当被控制者超越控制者时,传统控制逻辑崩溃——你需要在更聪明的对象面前保持控制,这在逻辑上类似于"棋艺差的人想赢棋艺好的人"。唯一的出路不是"更聪明地控制",而是"让对方从内部想被控制"。
来源

《超级智能》控制问题章节

可迁移到

管理高能力下属、设计AI监管制度、甚至教育青少年——所有"控制者能力低于被控制者"的场景。

来自这本书的解读报告

《超级智能:路线图、危险性与策略》

尼克·博斯特罗姆(Nick Bostrom) · AI安全 / 存在风险 / 技术哲学

这本书回答了超级智能可能毁灭人类的问题,它的答案是我们只有一次机会在它诞生前解决对齐问题。

AI安全·存在风险·对齐问题·控制问题·递归自我改进
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →