Graphics 版 (精华区)
发信人: champion (快乐流浪汉), 信区: Graphics
标 题: 计算机视觉(3)
发信站: 哈工大紫丁香 (Fri Sep 10 18:46:47 1999), 转信
发信人: hkw ( ), 信区: AI,
标 题: computer vision 4
发信站: BBS 水木清华站 (Sat Jan 9 20:50:14 1999)
1.2.1 Marr(Marr)的视觉计算理论
Marr的视觉计算理论立足于计算机科学,系统地概括了心理物理学、神经生理学、临
床神经病理学等方面已取得的所有重要成果,是迄今为止最系统的视觉理论。Marr的理论
的出现对神经科学的发展和人工智能的研究产生了深远的影响。
Marr认为视觉是一个信息处理过程。这个过程根据外部世界的图象产生对观察者有用
的描述。这些描述依次由许多不同的,但固定的每个都记录了外界的某方面特征的表象(
representation)所构成或组合而成。一种新的表象之所以提高了一步是因为新的表象表
达了某种信息,而这种信息将便于对信息作进一步解释。按这种逻辑来思考可得到这样的
结论:即在对数据作进一步解释以前我们需要关于被观察物体的某些信息,这就是所谓的
本征图象。然而,数据进入我们的眼睛是要经过光线为媒介的。灰度图象中至少要包含关
于照明情况,观察者相对于物体的位置的信息。因此,按照Marr的方法面临的问题是如何
把这些因素分解开。他认为低层视觉(即视觉处理的第一阶段)的目的就是要哪些变化是
由哪些因素引起的。大体上来说这个过程要经过两个步骤来完成:第一步是获得表示图象
中的变化和结构的表象。这包括检测灰度的变化,表示和分析局部的几何结构,以及检测
照明的效应等处理。第一步得到的结果被称为初始简图(Primal Sketch)的表象;第二
步对初始简图进行一系列运算得到能反映可见表面几何特征的表象,这种表象被称为二维
半(2.5 D)简图或本征图象。这些运算中包括由立体视觉运算提取深度信息,根据灰度
影调、纹理等信息恢复表面方向,由运动视觉运算获取表面形状和空间关系信息等。这些
运算的结果都集成到本征图象这个中间表象层次。因为这个中间表象已经从原始的图象中
去除了许多的多义性,是纯粹地表示了物体表面的特征,其中包括光照、反射率、方向、
距离等。根据本征图象表示的这些信息可以可靠地把图象分成有明确含义的区域(这称为
分割),从而可得到的比线条、区域、形状等更为高层的描述。这个层次的处理称为中层
视觉处理(intermediate Processing)。Marr视觉理论中的下一个表象层次是三维模型,
它适用于物体的识别。这个层次的处理涉及物体,并且要依靠和应用与领域有关的先验知
识来构成对景物的描述,因此被称为高层视觉处理。
Marr的视觉计算理论虽然是首次提出的关于视觉的系统理论,并已对计算机视觉的研
究起了巨大的推动作用,但还远未解决人类视觉的理论问题,在实践中也已遇到了严重困
难。对此现在已有不少学者提出改进意见,关于这个问题将在第二章中详细讨论。
--
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.68.179]
--
☆ 来源:.哈工大紫丁香 bbs.hit.edu.cn.[FROM: champaign.bbs@bbs.ne]
※ 修改:.champion 于 Sep 10 19:24:38 修改本文.[FROM: 202.118.228.139]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.437毫秒