Graphics 版 (精华区)

发信人: champion (快乐流浪汉), 信区: Graphics
标  题: 计算机视觉(7)
发信站: 哈工大紫丁香 (Fri Sep 10 18:54:15 1999), 转信

发信人: hkw (   ), 信区: AI,                 
标  题: computer vision 8
发信站: BBS 水木清华站 (Sat Jan  9 20:54:26 1999)

1.4 人类视觉与计算机视觉的比较
  目前人们所建立的各种视觉系统极大多数是只适用于某一特定环境或应用场合的专用
系统,而要建立一个可与人类的视觉系统相比拟的通用视觉系统是非常困难的。主要原因
有以下几点:
  1. 图象对景物的约束不充分。首先是图象本身不能提供足够的信息来恢复景物,其
次是当把二维景物投影成二维图象时丧失了深度信息。因此,需要附加的约束才能解决从
图象恢复景物时的多义性。
  2. 多种因素在图象中相互混淆。物体的外表受材料的性质、空气条件、光源角度、
背景光照、摄象机角度和特性等因素的影响。所有这些因素都归结到一个单一的测量,即
象素的灰度。要确定各种因素对象素灰度的作用大小是很困难的。
  3. 理解自然景物要求大量知识。例如,要用到阴影、纹理、立体视觉、物体大小的
知识;关于物体的专门知识或通用知识,可能还关于物体间关系的知识等。由于所需的知
识量极大,难以简单地用人工进行输入,可能要求通过自动知识获取方法来建立。
  4. 人类虽然自己就是视觉的专家,但它又不同于人的问题求解过程,难以通过自已
说出自己是如何看见事物的,从而给计算机视觉的研究提供直接的指导。
  视觉机理的复杂深奥使有些学者不禁感叹道:如果不是因为有人的视觉系统作为通用
视觉系统的实例存在的话,他都怀疑不能找到建立通用视觉系统的途径。从另一方面来看,
正如Rossen所说的:"从进化的观点来说,生理系统是人类解决复杂问题的最好的百科全
书。"对建立通用视觉系统这个难题来说,在长期进化过程中高度发展了的人类视觉系统
确实提供了最好的实例。例如,对人类视觉中可区别的独立视觉模块的研究就帮助我们
认识了在没有先验知识的条件下初级视觉处理能否获得丰富的有用描述的问题。
  许多心理物理学实验证明在人的视觉系统中似乎存在独立的特定模块。其中著名的例
子有Land[Lan 71]关于照明的计算和Julesz[Jul 71]关于立体视觉的实验。例如,Julesz
的实验证明了人的视觉系统可在对图象的内容一无所知的情况下进行立体视觉处理,获得
深度信息。他用计算机产生左、或两幅由随机点组成的图象。从单幅图象看,这两幅图都
不过是由一些随机分布的点组成的图案,并无物理含义。但当用立体镜观察,把这两幅图
融合在一起时就得到了立体信息(详见第五章)。这说明在人的视觉系统中似乎存在着独
立的立体视觉模块。除此以外还有其它的独立模块。Horn[Hor 75][Ike 81]研究了人类视
觉根据影调得到物体形状的能力,steven[ste 81]研究了人对表面轮廓作出三维形状解释
的能力等。更多的有关研究可参见[Bob 81]。显然,这些研究结果与70年代初期流行的认
为初级视觉处理难以得到丰富的有用描述的观点相反,并且标志着80年代的计算机视觉研
究的趋势与10年以前已大不相同。其主要特点是研究集中在与人类视视觉系统中的可区分
的独立模块相应的课题上,并且许多研究者希望他们的工作能与心理物理学和神经生理学
的理论有直接的联系。从长远来看,建立人类视觉的计算理论,并进而建成可与人类视觉
系统相比似的通用视觉系统是计算机视觉研究的最终目标。对人类视觉的研究涉及神经生
理学、心理物理学、心理学等多方面。对人类视觉机理的了解释为建立视觉的计算理论提
供有益的启示,与此同时,视觉计算理论的研究又促进了在上述领域中引入计算机技术。
这又推动了这些学科自身的发展。
  强调计算机视觉研究与人类视觉研究之间的紧密关系,并不意味着计算机视觉系统要
机械地模仿人类视觉系统。因为生物视觉系统是生存竞争中进化的产物,带有由此而来的
优点和局限性。[Bra 83][Per 83]其优点是具有高分辨率、有立体观察、优越的识别能力
和灵活的推理能力,可灵活地根据各种视觉线索进行推理:
  1. 能否根据距离的远近对不同的物体,特别是对不同的生物作出不同反应的能力应
该是视觉系统发展中的重要准则。视觉系统的优点在于不与环境直接接触就可以作出响应
。如果视觉系统不能反应距离远近,那么就使视觉系统的这个优点受到严重限制。
  2. 应用视觉的初等生物体需要有能力自动地对环境的刺激作出响应。理解能力是进
化的更高阶段中感知过程的结果。
  3. 感觉机制必然是在足以确保生存或对生存有利的基础上发展起来的。因此不能认
为这些机制是利用了从数学或计算机观点来看的最优解。所以有必要具体分析人类视觉系
统的特点。人类视觉系统大致有以下特点:
  (1) 深度感觉的首要性。可能初等生物体表面上的光敏区开始时只能提供关于光源的
方向信息,或者阴影可能表示一个捕食动物正在逼近的方向。感光区域上感知的阴影面积
的增加可能意着捕食者正在逼近,这可能是深度感知的早期形式。这样的进化过程只是一
种分析,但是有依据说明在人类视觉系统中探测阴影逼近的机能直接与感知物体在深度上
的移动有关。对人类试验者进化的心理物理学实验和对猫进行的生理学实验都支持这样机
理的存在。这种类型的机理与Marr提出的从视网膜上的二维表象开始,经过一个或多个中
间表象计算再作三维解释的机理不同。
  (2) 感知是个自动进行的过程。感知的特点在于它是一个自动进行的过程,并且它抵
制根据与其相矛盾的知识作出修改。实验证明,如果让一个观察者先观察一个旋转着的收
缩螺丝,那么在他习惯以后再去观察另一个物体,例如,一张人脸,就会感到人脸在膨
胀。观察者可能可已经知道人脸并没有膨胀,但这并不防碍得到这种膨胀的感觉。还有
许多例子可证明人会出现这种明知与常识或已知情况相矛盾的感觉。
  虽然与感觉相矛盾的知识不能改变人的感觉,但显然它可影响人对视觉刺激作出不同
的反应。一个人如果根据情况已知不会有大的物体正在逼近,那么当他看到出现一个影子
时不会逃跑。但当影子突然出现时,他还会不自觉地感到害怕。人类虽然已具有较高级的
理解能力,但视觉系统似乎保留着对某种刺激自动作出反应的能力。从进化的观点,感知
与知识相分离可能是有道理的,但对用于准确分析三维景物的视觉系统来说就是不可取
的。
  (3) 感知中对启发式知识的应用。自然环境中的许多物体是刚体,所以在进行化过程
中发展起来的人类视觉系统在根据视网膜上的物体投影分析物体时假设物体是刚体,以简
化分析是有道理的。例如,如果视网膜上成象的大小变化,而形状保持不变,就可认为物
休的远近起了变化。但在某些特殊情况下,在分析成象的大小变化时视觉系统并不采用通
常的刚性物体的假设,而是采用不同于刚性假设的其它特殊过程。例如,当在平面中旋转
图1.5(a)所示的由两个螺纹状图(图1.5(b)和(c))连接成的图形时,人在观察时通常会
感到这是一个正在变形的三维形状。这种情况下在视网膜上的成象是与刚体的运动不相符
合的,也即图形在平面内旋转,而这个运动的刺激图象似乎给人以图形的一部分正在膨胀
,而另一部分正收缩的印象。在刚体上是无法同时造成收缩和膨胀印象的。因此,这使人
感到是一个正在变形的三维物体。这种感觉并不因为刚性物体的假设而消失。

 
图1.5 (a)(b)(c)这个二维图形在平面内旋转时,使人感到是一个非刚性的三维形状,
(b)、(c),这两个图象在平面内旋转时似乎在膨胀或收缩,这要取决于旋转的方向。
  在计算机视觉系统中如果在计算中保持物体的刚性假设就可以避免上述这种不可靠的
感觉。虽然人类视觉中的这种近似过程有时会造成错误,但比单纯应用刚性假设可能有下
优点:(1) 这样的过程使系统不致于过分偏向于刚体运动的感知,不然就会反过来影响对
非刚体的感知;(2) 人类视觉系统所应用的启发式感知的过程对生理系统来说可能要比采
用通用的刚性物体假设简便;(3)人类视觉系统对几何问题不采用产生严格求解方法的原
因是这样可以更为迅速地求解。对动物的生存来说,一个可迅速地探测到潜在危险的近似
求解方法比虽然可准确识别,但费时过多的方法要有用得多。
  除了以上特点以外,人类视觉系统有分辨率高、识别能力优越、能进行灵活的推理等
优点,以及在根据外部视觉成象推论物体三维形状或姿态时会产生严重错误的弱点
[Perkins 83]。综上所述,从建立通用的计算机视觉系统的角度来看,关键之点不是机械
地模仿认类视觉系统,而是通过对人类视觉系统的研究发现是什么因素使人类视觉系统的
性能如此之好,并且把它结合到计算机视觉系统中去。
 

--
※ 来源:·BBS 水木清华站 bbs.net.tsinghua.edu.cn·[FROM: 166.111.68.179]

--
☆ 来源:.哈工大紫丁香 bbs.hit.edu.cn.[FROM: champaign.bbs@bbs.ne]
※ 修改:.champion 于 Sep 10 19:49:38 修改本文.[FROM: 202.118.228.139]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.771毫秒