视觉关注:从经验建模到数据驱动
2016-03-24
视觉关注是大脑处理视觉信息的重要机制之一。通过优先处理“显著”的视觉信息,并忽略“不重要”的视觉信息,大脑巧妙地绕过了信息处理的瓶颈:通过将有限的计算资源优先用于重要的信息,可以使用Billion级的脑细胞实时处理视网膜每秒接收到的Billion级比特信息。如果能够充份理解这种机制,将为当前对类脑计算(Brain-liked computing)和脑启发计算(Brain-inspired computing)的研究提供一定的启发。

那么,如何建模人脑的视觉关注机制呢?传统的视觉关注模型往往侧重于对视觉系统表示出的某种生理学或心理学特性进行模拟仿真,构建视觉关注模型。由于现在人们对视觉系统的各项特性的认识还不够充份,这类经验模型在建模视觉关注机制时往往失之偏颇。近年来,随着眼动等与视觉关注相关的数据不断增长,通过数据驱动的方式构建视觉关注模型成为了研究热点。该类方法将人脑的视觉关注机制看作一个黑盒,并尝试通过机器学习的方法,从大量的眼动数据中反推视觉关注机制。由于该类方法往往可以构建非常复杂的模型,因此其性能一般可以超过人工设计的经验模型。

最近,我校计算机学院的李甲副教授团队在构建数据驱动的视觉关注模型方面取得重要进展,研究成果发表在顶级期刊IEEE TPAMI上。该论文提出了模板对比度计算理论,首次从视觉关注建模研究的角度,阐述了傅里叶变换系数的内涵,揭示了频域和空域的视觉关注计算模型之间的隐含关联,使计算机具备了在频域中通过机器学习的方法构建多组级联滤波器的能力,为自动检测图像中的显著区域提供了新途径。

李甲,计算机学院,副教授,卓越百人,E-mail:jiali@buaa.edu.cn


参考文献
[1] Finding the Secret of Image Saliency in the Frequency Domain. IEEE TPAMI, In Press.