Database 版 (精华区)
发信人: wugang (Just do it), 信区: Database
标 题: 数据挖掘技术与过程1(转)
发信站: 哈工大紫丁香 (2001年09月04日09:15:21 星期二), 站内信件
普通会员
发表总数:25 发表於 - 2000/11/11 23:36:45
------------------------------------------------------------------------
--------
过去的几年,由于商业用户想利用优势技术作为竞争的资本,在数据挖掘的研究方
面
掀起一股热潮。IT行业,许多大公司都迅速地提出了利用数据挖掘技术发展业务的
计划?
在数据挖掘方面不断增长兴趣导致大量商业产品的出现,每个都使用一些大体差不
多词
语来进行描述,但事实上它们的功能和所基于的技术方法是非常不同的。
掌握着决策大权的 IT 经理们,面对着商业用户在这方面的需求感到形式非常紧迫
?
因为数据挖掘的概念远比一般的查询要复杂得多,另外又加上这方面的商业用户往
往应用
在紧急的决策方面,要求快速地作出决定。
然而, 当应用到数据挖掘上的各种方法看上去提供独特的功能和好处,事实上在大
多
数据挖掘系统中只用到了很少的基本技术。在这篇文章中描述这些基本技术的特征
;勾画
出了数据挖掘处理的框架;也为每个技术所适用的商业应用提供了建议。
文章的结构如下:首先,定义过程(processes)、 活动(activities)和数据挖
掘的用
户组(the user groups for data mining);然后讨论数据保留(data
retention)和
模式蒸馏(pattern
distillation)的区别。对于蒸馏模式,需要一种语言和一种形式----根据形式可
以分为
三类技术:等式(equations), 逻辑(logic)和交叉表(cross-tabulation)。
这里讨
论每种技术并且指出他们的优点(strengthes)和弱点(weaknesses).
数据挖掘可定义为:一个决策支持过程,通过它可以为我们搜索数据中的信息模式
(a decicion support process in which we search for patterns of
information in
data)。这种搜索如果由用户通过询问来完成是非常困难的;或者通过一个精制的
程序自
动地为用户搜索数据库并且去找有意义的模式。一旦发现,信息需要以合适的形式
呈现,
如图形,报告等等。从发现和预测的角度,而不是从人机交互的角度,这里讨论的方
法概
括了数据挖掘的一般方法。
--
·━━━━━━━━━━━━━━━━━━━━━━━━━━━·
‖看清楚、看明白、瞧准了,别说我没提醒你。我这个人不出类‖
‖拔萃但也不庸庸碌碌,不太玉树临风但也非歪瓜劣枣,不家财‖
‖万贯但也不一无所有。有点懒有点馋有点笨,也有点耐心有点‖
‖恒心有点信心,也就是说缺点不是没有但优点也有时会闪闪光‖
·━━━━━━━━━━━━━━━━━━━━━━━━━━━· Go! 天竺 @>>--,--'--- http://Beauty.hit.edu.cn
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: kiss.hit.edu.cn]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.569毫秒