Database 版 (精华区)

发信人: rhine (风雨无阻), 信区: Database
标  题: 数据仓库的开发流程
发信站: 哈工大紫丁香 (2000年07月05日19:42:23 星期三), 站内信件

     数据仓库系统是一种解决问题的过程,而不是一个可以买到
的现成产品。不同企业会有不同的数据仓库。企业人员往往不懂
如何建立和利用数据仓库,发挥其决策支持的作用,而数据仓库
公司人员又不懂业务,不知道建立哪些决策主题,从数据源中抽
取哪些数据。这需要双方互相沟通,共同协商开发数据仓库,因
此是一个不断往复前进的过程。开发数据仓库的流程包括以下几
步:

启动工程
建立开发数据仓库工程的目标及制定工程计划。计划包
括数据范围、提供者、技术设备、资源、技能、组员培训、责任、
方式方法、工程跟踪及详细工程调度等。

建立技术环境
选择实现数据仓库的软硬件资源,包括开发平台、
DBMS、网络通信、开发工具、终端访问工具及建立服务水平目标
(关于可用性、装载、维护及查询性能)等。


确定主题进行数据建模
 根据决策需求确定主题,选择数据源,对
数据仓库的数据组织进行逻辑结构设计。

设计数据仓库中的数据库
基于用户的需求,着重于某个主题,开发数据仓库中数据的物
理存储结构,即设计多维数据结构的事实表和维表。

数据转换程序
实现从源系统中抽取数据、清理数据、一致性格式化数据、
综合数据、装载数据等过程的设计和编码。

管理元数据
 定义元数据,即表示、定义数据的意义及系统各组成部件
之间的关系。元数据包括关键字、属性、数据描述、物理数
据结构、源数据结构、映射及转换规则、综合算法、代码、
缺省值、安全要求、变化及数据时限等。

开发用户决策的数据分析工具
 建立结构化的决策支持查询,实现和使用数据仓库的数据
分析工具,包括优化查询工具、统计分析工具、C/S工具、
OLAP工具及数据采掘工具等,通过分析工具实现决策支持
需求。数据采掘是帮助用户发现数据内部未知的、潜在的
关系,以及他们之间存在的趋向。因此,数据采掘在决策
支持、市场策略和金融预测等方面都有广泛的应用。

管理数据仓库环境
 数据仓库必须像其他系统一样进行管理,包括质量检测、
管理决策支持工具及应用程序,并定期进行数据更新,使数据仓库正常运行。
  
--
           海纳百川,
                   有容乃大,
                           壁立千尺,
                                   无欲则刚。    

※ 来源:·哈工大紫丁香 bbs.hit.edu.cn·[FROM: sy.hit.edu.cn]
[百宝箱] [返回首页] [上级目录] [根目录] [返回顶部] [刷新] [返回]
Powered by KBS BBS 2.0 (http://dev.kcn.cn)
页面执行时间:4.169毫秒