Algorithm 版 (精华区)
发信人: Lerry (想不开·撞树), 信区: Algorithm
标 题: 关于搜索引擎的胡说八道(4)
发信站: 哈工大紫丁香 (2002年06月05日17:14:31 星期三), 站内信件
关于搜索引擎的胡说八道(4)
版权所有:nio_tong 原作 提交时间:22:17:32 11月25日
关于robot链接的更新方法
索引信息库中变化周期为f的文档类记作DBF,文档变化周期的实际下限和上限分别记为
L和U;记时器T从搜索引擎的初始运行时刻开始记时,每当T的值等于L的倍数时,启动
下面的处理过程*/
Begin
For(f:=L;f<=U;f:=2x)
If(T是f的倍数) Then
While(DBF中还有文档信息的有效性没有验证时)
{任取一个未验证的文档作为当前文档,验证其有效性;
If(当前文档已不能被访问)Then
从索引信息库中删除对应的记录;
If(当前文档已经发生了变化)Then
{把当前文档URL加入到目标列表;
把当前文档的变化周期修改为Max(L,f/2),转移到相应的类中;
}
Else
把当前文档的变化周期修改为Max(L,2f),放入相应的文档类中;
}
以目标列表中的URL作为浏览起点启动机器人开始信息收集工作;
End
--
当一个女孩儿觉得她不太容易了解那个男人的时候,她会爱他。
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 天外飞仙]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.690毫秒