认知颠覆 · COGNITIVE OVERTURN
智能与目标的正交性颠覆了"能力=善意"的直觉
我们直觉上认为"更聪明的人/系统更值得信任",但正交性论题告诉我们这是错误的。智能是"实现目标的能力",目标是"想要什么"——两者是独立的维度。一个追求"回形针最大化"的超级智能可能比一个追求"人类幸福"的超级智能更"聪明",因为它把所有智能都用在了一个单一目标上。这意味着:评估人才时,"能力"和"价值观"必须独立评估;设计AI系统时,"更强大"不等于"更安全"。
来自这本书的解读报告
《超级智能:路线图、危险性与应对策略》
这本书回答了超级智能出现时人类如何存续的问题,答案是提前解决价值对齐的控制问题
阅读完整解读报告 →