跨书共振 · CROSS-BOOK RESONANCE

人类偏好是AI的真正目标，而非AI的真正知识

AI应该追求人类偏好，但不等于AI"知道"人类偏好是什么——这个区分是关键。AI需要通过行动-反馈循环来学习，而不是执行一个被假定为已知的"人类价值函数"。这与经济学中的"显示偏好"理论形成呼应。

《人类兼容》第5章 / 三原则体系

用户研究、需求分析、任何"理解他人意图"的场景

这本书回答了如何防止超级智能AI失控，答案是放弃让AI优化既定目标，转而构建理解人类不确定偏好的辅助型AI

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP