Algorithm 版 (精华区)
发信人: ssos (存在与虚无), 信区: Algorithm
标 题: 基于内容的多媒体信息检索
发信站: 哈工大紫丁香 (2001年06月04日16:46:21 星期一), 站内信件
基于内容的多媒体信息检索
赵海霞
(北京大学信息管理系 100871)
文 摘 本文探讨了基于内容的多媒体信息检索的特点、类型、检索方式,并介绍了国外
几种主要的基于内容的多媒体信息检索系统。
关键词 内容 检索 CBR
1 概述
随着计算机技术、多媒体技术以及通讯技术的飞速发展,以图像、声音和视频为主
的多媒体信息迅速成为交流与服务的主流,传统的数据库检索中采用的基于关键词的检
索方式逐渐暴露出种种弊端,已不能满足人们的需要。由于多媒体信息的内容具有丰富
的内涵,在许多情况下仅用几个关键词难以充分描述,而且其特征描述极易带主观性,
于是基于内容的检索( Content—Based RetrievaI,CBR)技术应运而生。
所谓基于内容的检索,就是根据媒体对象的语义和上下文联系进行检索。它有如下特点
:
(1)从媒体内容中提取信息线索。基于内容的检索突破了传统的基于表达式检索的局
限,它直接对图像、视频、音频进行分析,抽取特征,利用这些内容特征建立索引,进
行检索。
(2)是一种近似匹配。CBR采用相似匹配的方法逐步求精,以获得查询结果。这一点
与常规数据库检索的精确匹配方法明显不同。
(3)大型数据库的快速检索。多媒体数据库不仅数据库巨大,而且种类和数量繁多,
要求 CBR技术能快速实现对大型库的检索。
(4)多种检索手段。除了利用多媒体内容的特征来进行检索外,CBR还提供了许多其
它检索手段,如可通过提供样本图像进行相似性检索,也可通过人机交互进行浏览检索
。
2 基于内容的多媒体信息检索
2.1 基于内容的图象检索
基于内容的图像检索( Content—Based Retrieval,CBIR)是一种新的检索技术,它
是指除了利用传统的数据库对图像描述的文字信息进行储存管理外,还利用图象的颜色
、纹理、形状等特征进行检索。它融合了传统的模式识别技术与多媒体良好的人机交互
技术,有着广泛的发展前景。
CBIR的检索内容主要包括:⑦颜色:图像颜色分布、相互关系、组成等;②纹理:
图像的纹理结构、方向、组成及对称关系等;③形状:图像轮廓组成、形状、大小等;
④对象:图像中子对象的关系、数量、属性、旋转等。
基于内容的图像检索目前常见有以下一些方式:①选择颜色的比例、层次以及纹理
图案的图样进行查询;②用工具生成表示物体和物体间空间关系的符号图像进行查询;
③用画图工具生成与希望查找的图像颜色分布相似的图像进行查询;④从当前窗口所陈
列的全部图像中选择接近自己意愿的图像进行查找,重复多次直至找到为止。⑤上述方
法与字符的关键词结合进行查找。
CBIR技术在数字图书馆建设中具有重要的意义,尤其是在资源以图像为主,或图像
是必不可少的学科,如地理、天文、生物、医药、建筑等方面,可以帮助用户从多途径
找到图像内容信息,从更深层次对图像媒体进行理解与控制,可以帮助文献部门更充分
地开发和利用信息资源。
2.2基于内容的视频检索
基于内容的视频检索( Content-Based Video RetrievaI)是目前 CBR研究的热点。
视频检索要求在大量的视频数据中找到所需的视频片断,但由于视频内容繁多且复杂,
对视频的检索十分困难,与图像检索在很大程度上不同。而视频是目前包含信息量最丰
富的数据,因而对视频的检索已成为实际生活中一个突出的问题。
视频可用幕、场景、镜头、帧等描述。视频检索的方式目前主要有两种。
(1)基于关键帧的检索,是对代表视频镜头的关健帧进行检索。关键帧是用于描述一
个镜头的关键图像,可以采用类似图像检索的方法来进行检索。一旦检索到目标关键帧
,用户就可利用播放来看它代表的视频片断。
(2)基于运动的检索,是基于镜头和视频象的时间特征来检索,是视频查询的进一步
要求。可以查询摄像机的移动、操作和场景移动,以及用运动方向和运动幅度等特征来
检索运动的主体对象。
基于内容的视频检索用途非常广泛,包括新闻视频信息的检索、各类比赛节目的检
索、卫星云图变化情况的检索等等。随着视频内容的增多和视频生成技术、拍摄技术的
提高,研究内容将更广泛。
2.3 其它
基于内容的多媒体信息检索还包括声音检索、图形检索和文本检索等。
声音检索是利用声学的和主观的特性进行检索。声音的一些感知特性,如音调、响
度、音色等,与音频信号的属性非常接近,在音频数据库中记录这些特征,并利用这些
特征进行示例和指定特征值进行检索。
图形检索是基于空间的约束关系进行检索。包括:点检索,查找某坐标处的坐标;
线检索,查找线状目标两侧的目标;区域检索,查找某区域内的图形目标;关联检索,
利用两个或多个图形对象之间的空间和拓扑关系来检索。空间约束关系可以是方向、邻
接、包含等。
以往文本资料的检索是利用关键词,采用传统的数据库技术来实现管理和检索。然
而,由于关键词标引工作量大,而且标引同用户的检索概念可能不一致,导致查准率和
查全率低。因此,需采用直接对文本进行任意词和字的检索。根据实现方法的不同,其
检索分为串搜索、串匹配和全文检索,以字和词以及它们的逻辑组合为条件进行检索。
3 应用实例分析
3.1 QBIC系统
QBIC( Query By lmage Content)图像检索系统是IBM公司90年代研制开发的图像和
动态影像检索系统,英文原意是“依靠图像的内容进行查询”。它主要为IBM的 DB2大型
数据库提供图像检索功能,并支持于Web的图像检索服务。
QBIC系统提供了静止图像和视频信号的检索手段。在静止图像检索中,QBIC通过友
好的图形界面,为使用者提供了颜色、纹理、草图、形状、多物体等多种检索方法,并
提供了根据样本进行相似性检索的方法。在视频检索中,包括了分镜头检测、主运动估
计、建立层描述、通过拼接完成代表帧生成等多种视频处理手段,并在此基础上提供了
通过物质运动、摄像机运动的附加视频检索手段。提供了将多种检索特征相融合的手段
,用户可以定义各检索特征在检索中的权重,从而可根据自己的需要控制检索方向。系
统还提供了浏览检索手段。
在用户输入图像、简图或影像片段时,QBIC对输入的查询图像进行色彩、纹理、运
动变化等特征的分析和抽取,然后根据用户选择的查询方式分别进行不同处理。例如在
旧金山美术博物馆数据库检索演示系统中,用户可以选择色彩百分比、色彩位置分布和
纹理结构三种检索方式。系统也提供各种标准范图,代表不同的色彩、纹理、轮廓结构
。用户可选择与要检索对象最接近的范图,以它作为“检索式”去检索相似的图像。
3.2 VisualSeek和VisualSeek 系统是万维网图像/影像检索工具,研制者John R S
mith毕业于哥伦比亚大学电子信息研究中心,现任 IBM公司华盛顿研究中心研究员,一
直致力于Content—based技术开发研究,创造出一系列成果,例如 VisualSeek,WebSE
EK,SAFE和 CBVQ等。VisualSeek提供一系列搜寻和检索万维网视频信息的工具,WebSE
EK实际上是这些工具中的一种。
比较其它多媒体信息检索系统,VisualSeek的优点在于:高效率的WEB图像信息检索
,采用了先进的特征抽取技术,用户界面强大,操作简单,查询途径丰富,结果输出画
面生动,支持用户直接下载信息。在 VisualSeek的众多工具中,WebSEEK具有较强功能
和特色,其本身就是一个独立的万维网可视化信息编目工具,已经对650000幅图像和10
000个影像片进行了编目。用户可使用目录浏览和特征检索方式进行图像检索。
4 小结
多媒体信息检索一直是信息检索与服务的重要内容,基于内容的检索技术大规模网
络化是多媒体信息检索的关键,在很多领域如科学实验、军事、公安、广告、家庭娱乐
等都将起到不可替代的作用。随着电子出版物、网络化信息资源的普及利用,CBR技术的
应用将会越来越普遍。目前 CBR仍处于初步研究探索阶段,我国急需跟踪这方面的前沿
研究和实际应用系统,引进国外先进技术与系统,早日将我们自己的多媒体信息检索系
统推上互联网。
参考文献
1张彦民.基于内容的检索技术.情报学报,1999(12):519-521
2黄晓斌.基于内容的图像检索技术.大学图书馆学报,1999(4):25—27
3曹莉华等.基于内容检索的视频处理技术研究.计算机工程与应用,1998(6)
4 http://www.qbic.almaden.Ibm.com
5 http://www.ctr.columbia.edu/webseek/
based Multimation Retrieval Zhao Haixia
( Department of lnformation Management,PekingUniversity)Abstract:The artie
le discusses the character,type and method of content-based multimedia info
rmation retrieval,and
introduces a few foreign retieval systems of multimedia imformation based on
contents.
Keyword:Contents RetrievaI CBR
--
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:6.767毫秒