Algorithm 版 (精华区)
发信人: ssos (存在与虚无), 信区: Algorithm
标 题: 数据开采工具及应用(三)
发信站: 哈工大紫丁香 (2001年06月14日16:03:25 星期四), 站内信件
数据开采应用
目前,数据开采应用最集中的领域包括以下7个方面,但每个领域
又有其特定的应用问题和应用背景。
1.金融
金融事务需要收集和处理大量数据,对这些数据进行分析,发现其
数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和
商业兴趣,并可观察金融市场的变化趋势。数据开采在金融领域应用
广泛,包括:
(1)数据清理、金融市场分析和预测
财经分析依赖各种来源的数据,这些数据可能包含错误信息或丢
失信息,有时还表达相互矛盾的信息。因此,对数据进行清理或联机验
证十分重要。Lockheed的Recon曾用于清理一个有2200个墨西哥和英
国政府债券及欧洲债券的数据库,以辅助投资决策,并进行预测。
(2)帐户分类、银行担保和信用评估
金融业务的利润和风险是共存的。为了保证最大的利润和最小的
风险,必须对帐户进行科学的分析和归类,并进行信用评估。The Leed
s就使用XpertRule Analyzer进行分析并建立模型,预测该组织内50万
贷款帐户的欠款情况,并分析可能欠款的帐户的关键特征。
2.医疗保健
医疗保健行业有大量数据需要处理。但这个行业的数据由不同的
信息系统管理,数据以不同的格式保存,从总体看,数据是无组织的。
在这个行业中,数据开采最关键的任务是进行数据清理,预测医疗保健
费用。例如,GTE实验室开发了KEFIR,从大型时变数据库中发现并解释
关键信息。这个系统能进行多维分析,用以分析GTE的医疗保健数据,
对比数据和预测数据,在定量范围内解释偏差,生成超文本报表。
3.市场业
市场业应用数据开采技术进行市场定位和消费者分析,辅助制定
市场策略。例如,Dicki nson Direct是个市场分析公司,他们为AT&T
、IBM、PowerSoft这样的客户工作。Dickinson Direct使用Informa
tion Harvester的规则归纳、模糊推理及统计能力对客户的历史数据
进行分析,得出产品的购买趋势。
4.零售业
零售业是最早应用数据开采技术的行业,目前主要应用于销售预
测、库存需求、零售点选择和价格分析。例如,Automated Wagering
公司使用Advanced Software Applications的ModelMax预测模型,结
合地理信息分析开发了Lottery Machine Site Selection,以决定在
佛罗里达州安装彩票机的最佳地点。
5.制造业
制造业应用数据开采技术进行零部件故障诊断、资源优化、生产
过程分析等。例如,HP 公司的工程师使用Angoss Software的Knowled
geSeeker来进行HPⅡc彩色扫描仪的生产过程分析。他们基于大约200
个参数建立了一个自动数据收集系统,产生了难以手工处理的大量数
据。通过使用KnowledgeSeeker,工程师们能够对数据进行分析,并对2
0个最重要的参数进行认定。工程师们还利用KnowledgeSeeker来减少
组装过程中使扫描光学仪器正确对齐的固定过程的错误。通过对生产
数据进行分析,还能发现一系列装配过程中哪一阶段最容易产生错误
。
6.司法
数据开采技术可应用于案件调查、诈骗监测、洗钱认证、犯罪组
织分析,可以给司法工作带来巨大收益。例如,美国财政部使用NetMap
开发了一个叫FAIS的系统。这个系统对各类金融事务进行监测,识别
洗钱、诈骗等。该系统从1993年3月开始运行,每周处理约20万个事务
,针对超过1亿美元并可能是洗钱的事务产生了400多个调查报告。
7.工程与科学
数据开采技术可应用于各种工程与科学数据分析。例如,Jet Pro
pulsion实验室利用决策树方法对上百万天体进行分类,效果比人工更
快、更准确。这个系统还帮助发现了10个新的类星体。
--
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它
※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.286毫秒