Algorithm 版 (精华区)

发信人: AA (积极的人生、美好的人生), 信区: Algorithm
标  题: 信息过滤中的用户建模[节译](zz)
发信站: 哈工大紫丁香 (2002年05月23日19:48:07 星期四), 站内信件

D. W. Oard [原作]
walt       [译]

信息过滤系统是从一串动态生成的文章中选出与用户的兴趣相关的部分呈现给
用户的软件系统. 对比之下, 信息检索系统则是对于一切可能的查询能够基于
一组相对静态的文件集的内容给出回应的软件系统. 它们虽然可以归入文本表
示与挑选技术这个大范畴下, 但它们本质的不同在于用户的模型不同.

二者最显著的差异是用户的信息需求的时间性. 用户有许多兴趣, 但不同兴趣
的生存期是很不一样的. 例如, 一个用户可能对股市行情有持久的兴趣, 但对
新闻报道的兴趣就短暂得多. 一些兴趣即使持续的时间很长, 但在其生存期内
也会发生重大的变化. 变化有时是逐渐的, 有时是突然的. 兴趣强度的变化是
很难预测的.

由于信息过滤系统要在一个较长的时间跨度里运行, 它对用户兴趣的持续、变
化和互相影响的观察、建模和适应就显得非常必要. 这方面已经取得了一些进
展. 许多信息检索系统允许再次查询和目标修正, 实际上体现了对兴趣的持续
和它们的内在变化的认同.

Jennings和Higuchi把一个神经网络模型嵌入到阅读USENET新闻的系统里,该模
型可以处理长期的兴趣. 在这个模型里, 虽然没有使用大规模的知识工程, 但
使用了有导师的学习来驾驭庞大的搜索空间.

Fischer和Stevens使用基于规则的技术来合成布尔查询, 也是用到阅读USENET
新闻的系统里. 由于他们使用的参数很容易被用户理解, 用户在设计阶段的参
与使得该系统从中受益甚大.

Sheth和Maes使用遗传算法来对布尔查询合成中的参数进行演化调优, 综合了
前两种方法的优点.

上述三种用户兴趣建模方法都对模型的变化有所准备.Jennings和Higuchi通过
持续的有导师的学习来使神经网络作出适应用户兴趣转移的调整, 尽管有时有
些滞后. 后两种方法所提供的人机交互手段看来可以挖掘出驾驭兴趣变化的更
主动的途径. 无论哪一种方法里, 用户模型本身的设计都使得用户的长期兴趣
能够被辨认出来. 我认为, 开发一个能够识别和表达人类的兴趣之持续、变化
和互相影响的用户模型很可能会提高信息过滤系统的性能和可用性. 尽管可能
导致搜索空间的结构变得更复杂, 机器学习技术还是可以带来很多的好处.


总之, 在坚信信息过滤会从信息检索研究中继续得到启迪的同时, 我也相信,
更加精确地刻画人类兴趣的本质的模型会被开发出来. 1992年12月号的CACM是
信息过滤的专辑, 有兴趣的读者可以在那里发现更详细的介绍.

信息过滤中的用户建模[节译] 
--
                人世间的事谁也无法掌握
                  该执著的  永不怨悔
                  改舍去的  不在牵挂
                  改珍惜的  好好把握

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: NLPCenter.hit.edu.cn]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:1.313毫秒