认知颠覆 · COGNITIVE OVERTURN
孔径问题揭示了视觉感知的本质不完备性
从局部信息推断全局结构是视觉的根本困难——在任意小的窗口内,运动信息都只有一维(垂直于梯度方向),要获得完整二维运动必须整合更大范围的信息,但更大范围又引入了"运动不恒定"的假设风险。这种"局部-全局"的张力贯穿所有视觉任务:特征检测需要小窗口保证局部性,但描述子需要大窗口保证区分度;分割需要全局一致性,但边界定位需要局部精度。
来自这本书的解读报告
《计算机视觉:算法与应用》
这本书回答了如何让机器像人一样理解图像的问题,答案是构建从像素到语义的分层计算体系。
阅读完整解读报告 →