Algorithm 版 (精华区)

发信人: ssos (存在与虚无), 信区: Algorithm
标  题: 数据开采工具及应用(三)
发信站: 哈工大紫丁香 (2001年06月14日16:03:25 星期四), 站内信件

数据开采应用
    目前,数据开采应用最集中的领域包括以下7个方面,但每个领域
又有其特定的应用问题和应用背景。
    1.金融
    金融事务需要收集和处理大量数据,对这些数据进行分析,发现其
数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和
商业兴趣,并可观察金融市场的变化趋势。数据开采在金融领域应用
广泛,包括:
    (1)数据清理、金融市场分析和预测
    财经分析依赖各种来源的数据,这些数据可能包含错误信息或丢
失信息,有时还表达相互矛盾的信息。因此,对数据进行清理或联机验
证十分重要。Lockheed的Recon曾用于清理一个有2200个墨西哥和英
国政府债券及欧洲债券的数据库,以辅助投资决策,并进行预测。
    (2)帐户分类、银行担保和信用评估
    金融业务的利润和风险是共存的。为了保证最大的利润和最小的
风险,必须对帐户进行科学的分析和归类,并进行信用评估。The Leed
s就使用XpertRule Analyzer进行分析并建立模型,预测该组织内50万
贷款帐户的欠款情况,并分析可能欠款的帐户的关键特征。
    2.医疗保健
    医疗保健行业有大量数据需要处理。但这个行业的数据由不同的
信息系统管理,数据以不同的格式保存,从总体看,数据是无组织的。
在这个行业中,数据开采最关键的任务是进行数据清理,预测医疗保健
费用。例如,GTE实验室开发了KEFIR,从大型时变数据库中发现并解释
关键信息。这个系统能进行多维分析,用以分析GTE的医疗保健数据,
对比数据和预测数据,在定量范围内解释偏差,生成超文本报表。
    3.市场业
    市场业应用数据开采技术进行市场定位和消费者分析,辅助制定
市场策略。例如,Dicki nson Direct是个市场分析公司,他们为AT&T
、IBM、PowerSoft这样的客户工作。Dickinson  Direct使用Informa
tion Harvester的规则归纳、模糊推理及统计能力对客户的历史数据
进行分析,得出产品的购买趋势。
    4.零售业
    零售业是最早应用数据开采技术的行业,目前主要应用于销售预
测、库存需求、零售点选择和价格分析。例如,Automated Wagering
公司使用Advanced Software Applications的ModelMax预测模型,结
合地理信息分析开发了Lottery Machine Site Selection,以决定在
佛罗里达州安装彩票机的最佳地点。
    5.制造业
    制造业应用数据开采技术进行零部件故障诊断、资源优化、生产
过程分析等。例如,HP 公司的工程师使用Angoss Software的Knowled
geSeeker来进行HPⅡc彩色扫描仪的生产过程分析。他们基于大约200
个参数建立了一个自动数据收集系统,产生了难以手工处理的大量数
据。通过使用KnowledgeSeeker,工程师们能够对数据进行分析,并对2
0个最重要的参数进行认定。工程师们还利用KnowledgeSeeker来减少
组装过程中使扫描光学仪器正确对齐的固定过程的错误。通过对生产
数据进行分析,还能发现一系列装配过程中哪一阶段最容易产生错误

    6.司法
    数据开采技术可应用于案件调查、诈骗监测、洗钱认证、犯罪组
织分析,可以给司法工作带来巨大收益。例如,美国财政部使用NetMap
开发了一个叫FAIS的系统。这个系统对各类金融事务进行监测,识别
洗钱、诈骗等。该系统从1993年3月开始运行,每周处理约20万个事务
,针对超过1亿美元并可能是洗钱的事务产生了400多个调查报告。
    7.工程与科学
    数据开采技术可应用于各种工程与科学数据分析。例如,Jet Pro
pulsion实验室利用决策树方法对上百万天体进行分类,效果比人工更
快、更准确。这个系统还帮助发现了10个新的类星体。
 
--

   
<<社会契约论>>是一本好书,应当多读几遍
风味的肘子味道不错,我还想再吃它      

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: 202.118.230.220]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:3.286毫秒