Algorithm 版 (精华区)
发信人: Lerry (想不开·撞树), 信区: Algorithm
标 题: 以Pandango为代表的新一代搜索引擎揭秘
发信站: 哈工大紫丁香 (2002年06月05日17:26:19 星期三), 站内信件
以Pandango为代表的新一代搜索引擎揭秘
01-7-3 下午 09:07:23
----------------------------------------------------------------------------
----
搜索引擎的技术发展之快、竞争之激烈,有“三日不见,当刮目相看”之感。曾几何时
,Google搜索引擎还威风八面、傲视群雄。然而一个正在由Digital公司开发的全新搜索
引擎Pandango,以其先进的对等搜索理念将搜索引擎技术提升到一个新的层次,它的诞
生将有可能对在该领域领先的Google搜索引擎形成强大压力。
Digital公司的首席执行官利亚德-梅达(Liad Meidar)表示,Pandango搜索引擎目前已经
几近完成,公司正在与许多大名鼎鼎的门户网站、ISP以及网络公司协商合作事宜。分析
家认为,Pandango搜索引擎属于第三代搜索引擎,并将是其中的杰出代表之一,在这里
就让我们来一窥Pandango搜索引擎技术核心的奥秘吧。
Pandango搜索引擎与目前使用的其它各类搜索引擎相比,最大的优势在于它采用了其他
搜索引擎以往从未采用过的对等(P2P)搜索理念来对互联网络进行全方位的搜索;长久
以来,如何将搜索结果按照相关性进行排序一直是困扰搜索引擎技术的一大难题,Pand
ango搜索引擎从一个新的角度尝试解决了这一问题,即通过大规模检查网络计算机的访
问纪录决定搜索结果的排序顺序(在搜索的过程中,以点击率为基准,以降序来排列搜
索结果)。
我们不禁要问:对等(P2P)搜索理念是什么?它又带来了什么?改变了什么?
P2P是peer-to-peer的缩写,peer在英语里有“(地位、能力等)同等者”、“同事”和
“伙伴”等意思,国内的媒体一般将P2P翻译成“端对端”或者“点对点”。其在加强网
络上人的交流、文件交换、分布计算等方面大有前途。长久以来,人们习惯的互联网是
以服务器为中心,人们向服务器发送请求,然后浏览服务器回应的信息。而P2P将以用户
为中心,所有的用户都是平等的伙伴。相隔万里的用户可以通过P2P共享硬盘上的文件、
目录乃至整个硬盘。所有人都共享了他们认为最有价值的东西,这将使互联网上信息的
价值得到极大的提升。
把这一理念具体运用到搜索引擎技术上来:P2P将使用户能够深度搜索文档,而且这种搜
索无需通过Web服务器,也可以不受信息文档格式和宿主设备的限制,可达到传统目录式
搜索引擎(只能搜索到20%-30%的网络资源)无可比拟的深度(理论上将包括网络上
的所有开放的信息资源)。我个人认为能使互联网达到真正意义上的开放、自由。
目前的搜索引擎延续的搜索原理归根到底还是有搜索引擎公司提供服务器,人们在需要
搜索信息的时候要向服务器发出指令,由服务器把检索出来的相关目录通过一定的排序
法则呈现在用户面前,这就会不可避免的带来一些问题,比如:
1、如果服务器信息更新周期长,将有大量过时的信息产生。
2、如何服务器不加鉴别、只是一味的搜集信息,将带来许多无价值的垃圾信息。
3、服务器收集的信息有限(受设备条件影响)。
4、受服务器制约,一旦出现故障(也许发生的可能性不大,但毕竟还是要考虑的)其后
果不堪设想等等。
如果通过采用对等搜索技术的Pandango搜索引擎来搜索(Pandango搜索引擎目前还没有
用于商业运作)的话,那用户的搜索范围就不是局限于Pandango搜索引擎服务器提供的
信息量了!夸张一点地说:是囊括了所有接入互联网的个人电脑上的信息资源。通过它
采集到的信息不在多的是无用的,过期的内容,取而代之的是有用的,实时的信息。因
为人们普遍的行为是:在自己电脑里只存放那些对自己有用的(当然,对别人同样有用
)、具有最新价值的东西(谁会把陈芝麻烂谷子放在里面?呵呵,反正我不会)。
我们可以设想一下将来使用Pandango搜索引擎来进行Web搜索的前景:一台PC上的用户的
搜索请求通过网络同时发给网络上另外N台PC,如果搜索请求未得到满足,这N台PC中的
每一台都会把该搜索请求转发给另外N、N台PC,这样,搜索范围将在几秒钟内以几何级
数增长,几分钟内就可搜遍几百万台PC上的信息资源。可以说, Pandango搜索引擎的对
等(P2P)搜索理念的运用为互联网的信息搜索提供了全新的解决之道。
--
当一个女孩儿觉得她不太容易了解那个男人的时候,她会爱他。
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 天外飞仙]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.755毫秒