金句级表达 · PITHY EXPRESSION

AI最危险的时刻是它表现最好的时候

当AI在某个任务上持续表现优秀时，人类会逐渐放松警惕——这恰恰是最危险的时刻。因为高准确率制造了虚假的安全感，导致人类不再监控AI的输出；而AI可能一直在依赖捷径（比如草地=牛），只是还没有遇到暴露问题的场景。最安全的AI系统是那种"经常被看到犯小错"的系统——因为它提醒你它不是万能的。

《你看起来像个东西，我喜欢你》，脆弱泛化与理解幻觉章节

自动驾驶使用习惯管理、AI辅助诊断中的信任校准、任何长期使用自动化系统的流程设计——定期"AI失灵演练"比永远相信AI的完美表现更安全。

这本书回答了AI为什么会做蠢事的问题，答案是AI只是在找最短捷径而非真正理解。

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP