仓库及OLAP技术在物业管理系统中的应用

VIP免费
3.0 陈辉 2024-11-19 8 4 1.26MB 82 页 15积分
侵权投诉
传统的数据库一直被用于OLTP,从而由计算机管理来代替手工操作。然而,随
着管理信息系统日趋复杂,企业管理者发现他们还需要对其自身业务的运行以及整
个市场相关业务数据进行分析,从而作出有利的决策,这些决策需要对大量的业务
数据,包括历史业务数据进行分析,这种基于业务数据的决策分析,我们称之为
OLAP。数据仓库的数据概念模型是数据的多维视图,多维的概念是用来描述被定义
成多维的或按多维的访问信息的一个术语。大多数的商务模型实际上是用多维视图
表示的,多维概念视图是OLAP应用实现的关键所在。本课题主要研究的就是如何在
物业管理系统内建造适用于决策分析的数据仓库系统。
本课题从实际出发,结合本人以前参与开发的面向事务处理的物业管理数据库
系统,并以此数据库中的数据为源数据设计开发了面向决策支持的物业管理数据仓
OLAP应用的数据仓库系统的模型设计方法和实现过程。
第一章首先介绍了数据仓库的基本概念以及体系结构,其次简要阐述了决策支
持系统的主要组成部分和实现技术。
第二章主要介绍了基于OLAP的数据仓库系统的总体设计,以实例阐述了数据仓
库系统开发的策略、设计方法和数据仓库的建模技术
第三章主要介绍了基于OLAP的数据仓库系统的具体设计和实现方法,并介绍了
数据挖掘模型的创建过程。主要包括源数据库的分析、需求分析、事实/维度表的
设计、星型雪花架构的设计以及OLAP服务器的构建和数据挖掘模型AREAMODEL的创
建。
第四章主要是对数据仓库技术的未来发展进行了展望,并重点说明了OLAP技术
的新发展。
关键词:数据仓库 数据集市 多维数据集 OLTP OLAP 数据挖
掘 决策支持
I
ABSTRACT
Traditional database is always applied to OLTP which is designed to do the dayly
operation by computers. While managerial information system (MIS) is becoming more
and more complex, managers find that they need to analyse the data of their own
business and the whole market business, and then make advantaged decisions. The data
consists of not only the result of present business, but also the historical data. The
analyse procession which is based on business data is called OLAP.
D a t a c o n c e p t i o n m o d l e f o r D a t a W a r e h o u s e i s t h e m u l t i p h a s e v i e w f o r d a t a . T h e
conception of multiphase is a term for description of multiphase and visit in multiphase.
A majority of commercial models are expressed by multiphase view, multiphase view is
the key for implementation of OLAP.The purpose of this paper is to research how to
build a data wareh ouse sy stem w hich i s orien ted for prope rty ma nageme nt system to
decide-making and analyzing.
T h i s p a p e r s t a r t s w i t h t h e p r a c t i c e , a n d c o m b i n e w i t h t h e t r a n s a c t i o n- o r i e n t e d
database system for product-management, which is developed by author before. The
d a t a s o u r c e f r o m t h i s da t a b a s e i s a d o p te d a n d b a s e o n t h is d a t a t h e a n a l y s e - o r i e n t e d
p r o p e r t y -m a n a g e m e n t d a t a w a r e h o u s e i s d e s i g n e d a n d d e v e l o p e d . I t i s a l s o
expatiated how to design and how to implement the data warehouse system which bases
on OLAP.
In Cha p 1, introduce the conce ption a nd the fundament for data wareho use, and
describe the main components and implement for decision-making system in short.
In Chap 2, introduce the whole design for data warehouse which based on OLAP,
and make a sight of the policy for development, design, and model technology with the
instance.
I n C h a p 3 , i n t r o d u c e t h e d e t a i l e d d e s i g n a n d i m p l e m e n t a t i o n o f t h i s s y s t e m ,
include analyse of database, requirement analyse, design for fact/dimension table, star-
snow structure and the building of OLAP server.
In C ha p 4 , t a ke a p r o s pe c t f o r t h e fu t u re o f d a ta w a re h o us e , a n d e m p h as i z e t h e n e w
development of OLAP .
KeywordsData WarehouseDataMarket, Multi-dimension Dataset,
OLTPOLAPData MiningDSS
II
...............................................................................................................................I
ABSTRACT...................................................................................................................II
第一章 数据仓库系统概述........................................................................................1
1.1、从数据库到数据仓库.........................................................................................1
1.1.1、数据仓库的由来...........................................................................................1
1.1.2、数据仓库的定义...........................................................................................2
1.1.3、为什么需要一个分离的数据仓库...............................................................4
1.1.4、数据仓库的用户...........................................................................................5
1.2、数据仓库的体系化环境.....................................................................................5
1.2.1、数据仓库的结构...........................................................................................6
1.2.2、多层数据仓库的体系结构...........................................................................7
1.2.3、数据仓库的关键技术...................................................................................9
1.2.4、数据仓库的实现...........................................................................................9
1.3、数据仓库中的数据组织...................................................................................10
1.3.1、数据仓库的数据组织结构.........................................................................10
1.3.2、数据仓库的数据概念模型.........................................................................10
1.3.3、数据仓库的数据组织方式.........................................................................11
1.3.4、数据仓库的数据追加.................................................................................12
1.4、数据仓库的基本组成.......................................................................................13
1.4.1、关系数据库.................................................................................................13
1.4.2、数据集市.....................................................................................................13
1.4.3、数据源.........................................................................................................14
1.4.4、维度.............................................................................................................14
1.4.5、级别.............................................................................................................15
1.4.6、度量值.........................................................................................................16
1.4.7、单元.............................................................................................................16
1.4.8、多维数据集.................................................................................................16
1.4.9、分区和聚合.................................................................................................17
1.4.10、成员属性...................................................................................................18
1.5、决策支持系统...................................................................................................18
1.5.1、报表.............................................................................................................18
1.5.2、联机分析处理(OLAP..........................................................................18
1.5.3、数据挖掘.....................................................................................................22
第二章 基于OLAP的数据仓库的总体设计..............................................................26
III
2.1、物业管理信息化系统概述...............................................................................26
2.1.1、项目背景.....................................................................................................26
2.1.2、物业管理信息化的现状.............................................................................27
2.1.3、数据仓库技术的应用及其在物业管理方面的应用情况.........................27
2.1.4、物业管理系统模型概述.............................................................................28
2.1.5、软硬件平台.................................................................................................29
2.2、数据仓库系统的实现策略...............................................................................29
2.2.1、实现数据仓库系统的6种开发模式...........................................................29
2.2.2、物业管理数据仓库系统所采用的开发模式.............................................31
2.3、数据仓库的设计方法.......................................................................................32
2.4、确定数据仓库的主题、粒度及数据分.......................................................35
2.5、数据仓库建模...................................................................................................36
2.5.1、数据仓库的建模技术.................................................................................36
2.5.2、数据模式的设计.........................................................................................37
2.5.3、系统所采用的建模技术及数据模式.........................................................39
2.6、数据仓库维...................................................................................................41
2.6.1新数据仓库数据.....................................................................................41
2.6.2同步OLAP多维数据集..............................................................................42
2.6.3新数据集市.............................................................................................42
第三章 基于OLAP的数据仓库系统的实现..............................................................43
3.1SQL Server 2000数据仓库决方...............................................................43
3.2软数据挖掘概述...........................................................................................44
3.2.1、数据挖掘与OLAP......................................................................................44
3.2.2、数据挖掘模型.............................................................................................44
3.2.3、数据挖掘算法.............................................................................................44
3.3、数据仓库系统的实...............................................................................44
3.3.1、数据仓库的基本程.................................................................................44
3.3.2、数据仓库程的管理架构.........................................................................45
3.3.3、系统所采用的实.............................................................................46
3.4、源数据库简介...................................................................................................47
3.4.1WYGL数据库架构介绍.............................................................................48
3.4.2WYGL数据库表的关系.........................................................................52
3.5、需求分析...........................................................................................................54
3.6、确定事实与维度数据.......................................................................................56
3.7、设计事实表.......................................................................................................58
3.8、设计维度表.......................................................................................................62
IV
3.8.1、设计管理员维度.........................................................................................62
3.8.2、设计业维度.............................................................................................63
3.8.3、设计时间维度.............................................................................................63
3.8.4、设计区维度.............................................................................................65
3.8.5、设计居住类型维度.....................................................................................66
3.8.6、设计维人员维度.....................................................................................67
3.8.7、设计维修类别维度.....................................................................................68
3.8.8、设计维修耗材维度.....................................................................................68
3.9、星型雪花架构设计...........................................................................................69
3.10、多重维度架构.................................................................................................71
3.11、数据转移.........................................................................................................71
3.11.1、数据转移步骤.......................................................................................71
3.11.2、数据转移...........................................................................................72
3.12、构建OLAP服务器...........................................................................................73
3.13、创建数据挖掘模型.........................................................................................76
3.14、前展示.........................................................................................................78
3.15、物业管理数据仓库系统与OLTP数据库系统在决策支持方面的对.......79
第四章 数据仓库技术展望..........................................................................................82
4.1、数据仓库的未来发展.......................................................................................82
4.2OLAP的新发展——OLAM.............................................................................82
4.2.1、由来.............................................................................................................82
4.2.2、体系结构.....................................................................................................82
4.2.3功能特征.....................................................................................................83
4.2.4OLAM领域的主要发展方向.....................................................................84
4.3、数据挖掘的发展趋.......................................................................................84
..........................................................................................................................87
考文献........................................................................................................................88
V
第一章 数据仓库系统概述
第一章 数据仓库系统概述
1.1、从数据库到数据仓库
激烈的市场竞争中,信息对于企业的生存和发展关重要的作用。表
信息的数据随着时间和业务的发展而不断膨胀此有人惊叹道当今代是信
爆炸代。同时,数据分不同的系统平台上,具有多种存储形式,作为
和决策者如何从这复杂的数据环境中到有用的决策数据呢?随着分式结构
的 成 , 数 据 库 技 术 的 提 高 和 数 据 处 理 技 术 的 发 展 , 数 据 仓 库 ( D a t a
WarehouseDW)和决策支持系统(Decision Support SystemDSS)应运而
1.1.1、数据仓库的由来
在市场经济激烈竞争中,企业必须把业务经营同市场需求联系来,在此基
科学确的决策,以求生存。为此,企业纷纷立起了自的数据库系
统,由计算机管理代替手工操作,以此来集、存储、管理操作数据,改善办公
境,提高操作人员的工作效率如,人们日常生活经常会遇到这的情况:
市的经营将经常同时购买的商品放在一,以销售;保险公司知道
购买保险户一具有特征;医学研究人员望从有的成万份病历中
患某疾病人的共同特征,从而为治愈这种疾病提供一些帮助……对于以
上问题,现有的信息管理系统中的数据分析工具很难给答案传统的数据库应
用系统并不能很好的支持决策,是面向业务操作设计的,无论查询、统计
还是成报表,其处理方式是对定的数据进行简单的数处理。简化具
体操作人员的劳动强度,但不能对这些数据所包的内在信息进行提取,所以对于
企业的中领导来说并有相应的决策支持系统。企业需要新的技术来弥补原
数据库系统的不足,需要把已经广泛收集到的数据集成到数据仓库中,以从业务数
据中提取有用的信息,帮助他们在业务管理和发展上即时正确的判断
数据仓库是计算机和数据库应用发展到一定阶段物。如,信息处理部
的工作重点已不在于简单的数据集。随着企业计算机应用的不断深入,企业已经
积累了大量的生产业务数据,企业内的级人员都希能够快速交互并方便
从这些大量杂乱无数据中获取义的信息,决策者能够利用现有数据
指导企业决策和发掘企业的竞争优势。由此我们到数据仓库的目的是为了建
一种体系化的数据存储环境,分析决策所需的大量数据从传统的操作环境中分
离出来,使的操作数据转换成集成、统一的信息。企业内不同
不同角色的成员都可以在此单一的环境之过运用其中的数据与信息,发现
新的视和新的问题、新的分析和想法,进而发展出度化的决策系统,并获取更
经营效益。我们不妨再深入地想一想,要实现这个目的,必须获得大量的历史数
据和总数据。而与联机事务处理(Online Transaction Processing OLTP)系
使
(Online Analytiacal Processing OLAP)的应用。用户对这应用越迫切
需求推动了数据仓库技术的发展。
数据仓库同时也是适应决策支持系统的需要而产生的,所以采用的软件产品
该能支持决策过程的部内整的数据仓库应包括3个方面的技术内:数据
1
数据仓库及 OLAP 技术在物业管理系统中的应用
仓库技术、联机分析处理技术和数据挖掘(Data MiningDM)技术,是一个
大的系统。目前已经多商化的数据库软件,Oracle公司SAS公司
Microsoft公司Sybase公司都推出了自的数据库决方
1.1.2、数据仓库的定义
1.1.2.1、数据仓库的基本定义
数据仓库的定义历来有一个公认,而标准化的定义。过随着人们对大
型数据系统研究、管理和维护等方面的深刻认识不断完善,在总结、丰富并集中
多个企业信息的经验或多或少地指出了数据仓库有如下几点并到了
共识:数据仓库中的数据是面向主题的、集成的、不可更新的(定的)并随时间
不断变化的,建数据仓库的目的是为了更好地支持决策分析。
1面向主题
主题是一个抽象的概念,是在较高层次上企业信息系统中的数据合、归类
进行分析利用的抽象。在逻辑意义上,是对应企业中宏观分析领域
的分析对,是一决策问题而设的。面向主题的数据组织方式,就是在
层次上对分析对数据的一个整、统一并一的描述,能完整及统一地刻画各
个分析对及的有关企业的项数据,以及数据之的联系。
目前,数据仓库的实现主要是基于关系数据库,个主题由一组关系表或逻辑
视图实现。这些表和视图的内个运行系统数据源的数据本上是一
为了方便支持分析数据处理,对数据结构进行了重组,其中还可能增加一些冗余
数据。
2集成的数据
数据仓库中存储的数据从来分系统中提取出来,有数
据的简单,而是过统一并合。
对源数据的集成是数据仓库建设中关键,复杂的一
3数据不可更
从数据的使用方式上,数据仓库的数据不可更新。数据保存到数据仓库中
最终用户能通过分析工具进行查询和分析,而不能修改数据仓库的数据
最终用户而只读的。
从数据的内,数据仓库存储的是企业前和历史的数据,在一定时间间
前数据需要按一定的方法转换成历史数据。
数据仓库的数据不可更新问题与操作性环境中的数据录处理方式进行比较
中理,如图1-1
1-1 数据不可更新(非易失性)问题
4数据随时间不断变
2
第一章 数据仓库系统概述
数据仓库数据的不可更新是对应用而用户分析处理时不更新数据。
是说,数据从进数据仓库以永远不变,这些数据随时间变化而定新。
定的时间间抽取运行数据库系统中产生的数据,集成到数
据仓库中。
数据仓库按其关键技术分为数据抽取存储和管理,以及数据表现3个基本方
面。
1. 数据抽取:是数据进仓库的。由于数据仓库是一个的数据环境
所以需要抽取过程数据从联机处理事务系统、部数据源以及机的数据
导入到其中。
2. 存储和管理:是数据仓库的关键。数据仓库的组织管理方式决定了有别
于传统数据库,同时也决定了其对部数据的表现式。
3. 数据表现:相于数据仓库的面。其性主要集中在多维分析、数理统
计和数据挖掘方面,而多维分析是数据仓库的重要表现式。
1.1.2.2、数据仓库从数据库进化而来
市场需求是技术发展的源。在数据库应用的早期,计算机系统所处理的是
到有的问题,是传统手工业务自化的问题,例如行的系统和信的计
系统属于型的联机事务处理系统。当时,一个企业以简单地通有联机
事务处理的计算机系统而获得强大的市场竞争能
然而,联机事务处理系统应用到一定阶段时,企业便发现仅依赖拥有联
机事务处理系统已经不足获得市场竞争优势。他们需要对其自身业务的运行以
及整个市场相关行业的进行分析,从而出有利的决策。这些决策需要对大量
的业务数据,包括历史业务数据进行分析。而这种基于业务数据的决策分析,我们
把它称之为联机分析处理。如说传统联机事务处理的是新数据库,
在数据库中加信息,么联机分析处理就是要从数据库中获取并利用信息。
1.1.2.3、数据仓库与传统数据库的区别
从应用方面来,传统的数据库操作型数据库一直被用于OLTP,就是
事务处理中的数据以表的存放在数据库中,按用户要求对数据库的数据进
查询和处理。数据仓库主要是应用于决策支持系统,其主要目的是提取信息
并加以展,用来处理DSS的应用。
从数据的度,我们过表1-1中的比较看看操作型数据与DSS数据的区
别:
1-1 从传统数据库到数据仓库数据整体思想的
操作型数据 DSS数据
面向应用 面向主题
详细合的或
存取确的 代表过的数据
为日工作服务 为管理者服务
可更不更
重复运行 发式运行
处理需求事先可知 处理需求事先不知道
命周期符SDLC完全不同命周期
对性要求对性要求宽松
一个时刻存取一个集合
3
数据仓库及 OLAP 技术在物业管理系统中的应用
一个时刻存取一个单元
事务处理分析处理
主要及所有无更问题
高可松弛用性
整体管理 以集管理
冗余时常冗余
静态结构;可变的内结构
一次处理数据量一次处理数据量大
支持日操作 支持管理需求
访问的高可能性 访问的可能性或适度可能
1.1.3、为什么需要一个分离的数据仓库
数据仓库中的数据大多来源于操作型数据库中,为什么还要一个分离
的数据仓库呢?
分离的主要原因提高操作数据库系统和数据仓库系统个系统的性。操作
数据库是为已知务和负载设计的,如使用主关键索引检索定的
录和“罐装查询一方面,数据仓库的查询通常是复杂的,及大量数
据在总级的计算,可能需要的数据组织、存取方法和基于多维视图的实现方
法。在操作数据库上处理OLAP查询可能会大大降低操作务的性
,操作数据库支持多事务的并行处理,需要加和日并行
,以确性和事务的性。通常,DSS中如OLAP的查询需要对数据
录进行只读访问,以进行总和聚集。如并行复机用于这种OLAP
操作,就危害并行事务的运行,从而大大降低OLTP系统的吞吐量。
,数据仓库与操作数据库分离是由于这种系统中数据的结构、内和用
都不。决策支持需要历史数据,而操作数据库一般不历史数据。在这种
情况,操作数据库中的数据很丰富对于决策,常常还是远远不够的。决
策支持需要来自种源的数据统一(如聚集和总),产生高质量的、纯净的和
集成的数据。相,操作数据库详细数据(如事务),这些数据
在进行分析之前需要统一。由于个系统提供很不功能,需要不同类型的数
据,此需要维分离的数据库。
1.1.4、数据仓库的用户
数据仓库的用户称为DSS分析员。他首先是一个商务人员,其次是技术人员
DSS分析员的主要工作是定义和发展在企业决策中使用的信息。
DSS分析员的想法及他们对使用数据仓库的理重要的。DSS分析员有
一种想法,我说我想要的东西,然告诉你想要什么。
句话说,DSS分析员在发现模式工作。直到到报表或屏幕上的数据,他们
始探讨要进行DSS分析。
DSS分析员的度之所以重要的理由如
是合理的。
广泛的。
对数据仓库的开发方式和系统使用有影响
传统的系统开发命周期System Developing Loop Circle SDLC适用于
4
摘要:

摘要传统的数据库一直被用于OLTP,从而由计算机管理来代替手工操作。然而,随着管理信息系统日趋复杂,企业管理者发现他们还需要对其自身业务的运行以及整个市场相关业务数据进行分析,从而作出有利的决策,这些决策需要对大量的业务数据,包括历史业务数据进行分析,这种基于业务数据的决策分析,我们称之为OLAP。数据仓库的数据概念模型是数据的多维视图,多维的概念是用来描述被定义成多维的或按多维的访问信息的一个术语。大多数的商务模型实际上是用多维视图表示的,多维概念视图是OLAP应用实现的关键所在。本课题主要研究的就是如何在物业管理系统内建造适用于决策分析的数据仓库系统。本课题从实际出发,结合本人以前参与开发...

展开>> 收起<<
仓库及OLAP技术在物业管理系统中的应用.doc

共82页,预览9页

还剩页未读, 继续阅读

作者:陈辉 分类:高等教育资料 价格:15积分 属性:82 页 大小:1.26MB 格式:DOC 时间:2024-11-19

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 82
客服
关注