可迁移模型 · TRANSFERABLE MODEL

探索-利用困境是所有持续性系统的元问题

强化学习的核心挑战不是"怎么利用已知好策略"，而是"该花多少资源探索未知"。这个问题出现在任何需要持续学习的系统中——个人、组织、市场。过度利用导致路径依赖，过度探索导致低效，最优平衡点本身也随环境变化。

《人工智能：一种新的综合》第21章强化学习

组织创新管理、个人职业发展、投资组合策略——所有"专注核心"vs"尝试新可能"的权衡。

这本书回答了如何构建智能系统，它的答案是用理性智能体框架统一整个AI领域

PRESS YOUR OWN BOOK

90 秒得到核心模型 · 行动接口 · 失效边界 · 三套 SOP