金句级表达 · PITHY EXPRESSION

控制权的时间窗口:你在弱的时候制定规矩,强了之后就太晚了

所有控制机制都必须在被控制者还比你弱的时候建立——一旦对方超过你,你再想加约束就不可能了。这不是AI特有的问题,而是所有权力关系的通则:父母在孩子年幼时建立规矩比在青春期才开始更有效;企业在小规模时建立文化比在大公司时代更可行。
来源

《人类兼容》第三章 / 大猩猩困境

可迁移到

组织制度设计、个人习惯培养、国际规则制定——任何"早期干预比晚期补救更有效"的场景。

来自这本书的解读报告

《人类兼容:人工智能与人类的控制问题》

斯图尔特·罗素 (Stuart Russell) · 人工智能安全 / AI伦理 / 控制论

这本书回答了超级智能如何被人类安全控制的问题,它的答案是让机器以人类偏好为中心并保持不确定。

AI安全·控制问题·偏好学习·机器伦理·对齐
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →