金句级表达 · PITHY EXPRESSION

不确定性是安全特性，不是缺陷

在AI领域，"不确定性"通常被视为需要消除的技术问题。但罗素翻转了这个假设——对"什么是好的"保持不确定，恰恰是防止AI做坏事的关键。

《人类兼容》第7章 / 不确定性偏好设计

决策系统设计、组织授权、任何需要保持"可修正性"的场景

这本书回答了如何防止超级智能AI失控，答案是放弃让AI优化既定目标，转而构建理解人类不确定偏好的辅助型AI

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP