Algorithm 版 (精华区)

发信人: lofe (〖感激生活〗), 信区: Algorithm
标  题: computer vision 4
发信站: 哈工大紫丁香 (Sun Sep 10 16:43:44 2000), 转信

1.2.1 Marr(Marr)的视觉计算理论
  Marr的视觉计算理论立足于计算机科学,系统地概括了心理物理学、神经生理学、临
床神经病理学等方面已取得的所有重要成果,是迄今为止最系统的视觉理论。Marr的理论
的出现对神经科学的发展和人工智能的研究产生了深远的影响。
  Marr认为视觉是一个信息处理过程。这个过程根据外部世界的图象产生对观察者有用
的描述。这些描述依次由许多不同的,但固定的每个都记录了外界的某方面特征的表象(
representation)所构成或组合而成。一种新的表象之所以提高了一步是因为新的表象表
达了某种信息,而这种
信息将便于对信息作进一步解释。按这种逻辑来思考可得到这样的结论:即在对数据作进
一步解释以前我们需要关于被观察物体的某些信息,这就是所谓的本征图象。然而,数据
进入我们的眼睛是要经过光线为媒介的。灰度图象中至少要包含关于照明情况,观察者相
对于物体的位置的信息
。因此,按照Marr的方法面临的问题是如何把这些因素分解开。他认为低层视觉(即视觉
处理的第一阶段)的目的就是要哪些变化是由哪些因素引起的。大体上来说这个过程要经
过两个步骤来完成:第一步是获得表示图象中的变化和结构的表象。这包括检测灰度的变
化,表示和分析局部的
几何结构,以及检测照明的效应等处理。第一步得到的结果被称为初始简图(Primal 
Sketch)的表象;第二步对初始简图进行一系列运算得到能反映可见表面几何特征的表象
,这种表象被称为二维半(2.5 
D)简图或本征图象。这些运算中包括由立体视觉运算提取深度信息,根据灰度影调、纹
理等信息恢复表面方向,由运动视觉运算获取表面形状和空间关系信息等。这些运算的结
果都集成到本征图象这个中间表象层次。因为这个中间表象已经从原始的图象中去除了许
多的多义性,是纯粹地
表示了物体表面的特征,其中包括光照、反射率、方向、距离等。根据本征图象表示的这
些信息可以可靠地把图象分成有明确含义的区域(这称为分割),从而可得到的比线条、
区域、形状等更为高层的描述。这个层次的处理称为中层视觉处理(intermediate 
Processing)。Marr视觉理论中的下一个表象层次是三维模型,它适用于物体的识别。这
个层次的处理涉及物体,并且要依靠和应用与领域有关的先验知识来构成对景物的描述,
因此被称为高层视觉处理。
  Marr的视觉计算理论虽然是首次提出的关于视觉的系统理论,并已对计算机视觉的研
究起了巨大的推动作用,但还远未解决人类视觉的理论问题,在实践中也已遇到了严重困
难。对此现在已有不少学者提出改进意见,关于这个问题将在第二章中详细讨论。
 

--

--
☆ 来源:.哈工大紫丁香 bbs.hit.edu.cn.[FROM: lofe.bbs@smth.org]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:2.287毫秒