跨书共振 · CROSS-BOOK RESONANCE

三原则的张力:当"服务人类"和"听从人类"冲突时

罗素的三原则看似自洽,但在极端场景下会产生内在张力——如果人类的偏好是"让你自己决定",第三原则(人类是最终信息源)是否应该被搁置?这与康德的"人是目的而非手段"产生了有趣的对话:康德说不能把人当作工具,但当人自愿成为"懒惰的委托人"时,AI应该"尊重"这种选择还是"拒绝"这种选择?
来源

《人类兼容》第七章 / 三原则约束

可迁移到

所有"代理关系"中的伦理困境——律师能否违背当事人意愿追求"对当事人真正好"的结果?医生能否拒绝执行患者"明知有害但坚持要求"的治疗?

来自这本书的解读报告

《人类兼容:人工智能与人类的控制问题》

斯图尔特·罗素 (Stuart Russell) · 人工智能安全 / AI伦理 / 控制论

这本书回答了超级智能如何被人类安全控制的问题,它的答案是让机器以人类偏好为中心并保持不确定。

AI安全·控制问题·偏好学习·机器伦理·对齐
阅读完整解读报告 →
PRESS YOUR OWN BOOK

找一本想读的书,解读出你自己的洞察

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP

解读一本书 →