认知颠覆 · COGNITIVE OVERTURN
智能体与环境的边界是任意的
Sutton指出:智能体和环境之间的边界不是由物理世界决定的,而是由"哪些部分你能控制、哪些部分你只能观察"决定的。你可以选择将什么纳入"自我"(智能体)、什么归入"世界"(环境)。这意味着——同一个人,选择不同的"自我边界",会做出完全不同的决策。把情绪纳入"你能控制的"vs."你只能观察的",会导致完全不同的人生策略。
来自这本书的解读报告
《Reinforcement Learning: An Introduction》
这本书回答了智能体如何在未知环境中通过试错学习最优决策,答案是时序差分学习。
阅读完整解读报告 →