Sql server数据仓库的操作应用
Download
Report
Transcript Sql server数据仓库的操作应用
SQL SERVER 2005
数据仓库的操作应用 (BI)
示例数据库项目背景
这个教学案例是以一家虚构的公司
Adventure Works Cycles为基础。Adventure
Works Cycles是一家大型多语系制造公司,
制造及批发金属和合成器材自行车给北美、
欧洲和亚洲的商场。Adventure Works
Cycles的总公司在华盛顿Bothell,该公司雇
用500位员工。另外,Adventure Works
Cycles在它的市场基地还雇用了几个地区销
售团队。
在 2000 年,Adventure Works Cycles 购买一
间小型制造工厂 Importadores Neptuno,位
于墨西哥。Importadores Neptuno 为
Adventure Works Cycles 产品线制造几项重
要的子零件。这些子零件运送到 Bothell 地
点进行最后产品组装。在 2001 年,
Importadores Neptuno 成为自行车产品类的
唯一制造商和批发商。
在丰收的年度之后,现在 Adventure Works
Cycles 想要以这些方式来扩展它的市场占有
率:锁定最佳客户来打广告、透过外部网
站延伸产品可用性,并以减少实际成本来
降低销售成本。
这个例子麻雀虽小,五脏俱全。不论是新
学商业智能,或者是提高商业智能知识都
是相当有帮助。软件项目开发有迭代上升
的过程,那么看这个案例也会是这么一个
过程。
当前分析环境
为了支持销售和营销团队以及高级管理人
员的数据分析需要,公司当前从
AdventureWorks 数据库中提取事务数据,
从电子表格中提取诸如销售配额之类的非
事务信息,并将这些信息合并到
AdventureWorks DW 关系数据仓库。但是,
关系数据仓库存在下列问题:
报表是静态的。用户无法通过交互方式探测报
表中的数据以获取更详细的信息,例如他们可
以处理 Microsoft Office Excel 透视表。虽然现
有的一组预定义报表足以供许多用户使用,但
更高级的用户却需要对数据库进行直接查询访
问,以进行交互式查询和访问专用报表。但是,
由于 AdventureWorksDW 数据库非常复杂,因
此,这类用户需要花费大量时间来掌握如何创
建有效查询。
查询性能差异很大。例如,有些查询只需
几秒钟便可非常迅速地返回结果,而另一
些查询需要几分钟才能返回结果。
聚合表难以管理。在尝试缩短查询响应时
间方面,Adventure Works 的数据仓库团队
已在 AdventureWorks DW 数据库中生成几
种聚合表。例如,他们生成了一种按月汇
总销售额的表。然而,尽管这些聚合表可
显著提高查询性能,但是,他们所生成的
用于在一段时间内维护这些表的基础结构
却容易破坏并出现错误。
复杂的计算逻辑隐藏在报表定义中,所以
很难在报表之间共享。由于这种业务逻辑
针对每个报表单独生成,因此,各个报表
的汇总信息有时是不同的。所以,管理人
员对数据仓库报表数据的信任度是有限的。
用户所在的业务部门不同,其感兴趣的数
据视图也不同。每个组都很难理解与其不
相关的数据元素。
对于需要专用报表的用户而言,计算逻辑
非常具有挑战性。由于这类用户必须为每
个报表单独定义计算逻辑,因此,无法对
如何定义计算逻辑进行集中控制。例如,
有些用户知道他们应使用基本统计技术
(如移动平均值),但他们却不知道如何
构建此类计算,因而也就无从使用这些技
术。
组合相关的信息集时存在难度。业务用户
很难构造一些专用查询,以组合两个相关
的信息集(如销售额和销售配额)。此类
查询会占用大量的数据库空间,因此,公
司要求用户向数据仓库团队请求跨主题区
域的数据集。因此,仅定义了少数预定义
报表,这些报表可以用于组合来自多个主
题区域的数据。此外,由于这些报表非常
复杂,因此用户不愿尝试修改这些报表。
报表主要提供美国的业务信息。非美国分
公司的用户非常不满意只提供美国的业务
信息,他们希望能够查看不同货币和不同
语言的报表。
信息难以审核。财务部门当前仅将
AdventureWorks DW 数据库用作从中进行
大容量查询的数据源。然后,再将数据下
载到单个电子表格中,并花费大量时间准
备数据和处理电子表格。因此,很难在整
个公司内准备、审核和管理公司财务报表。
解决方案
数据仓库团队最近对当前分析系统执行了设计
评审。评审包括当前问题和未来需求之间的差
距分析。数据仓库团队确定 AdventureWorks
DW 数据库是一个设计良好的维度数据库,具
有相符的维度和代理键。相符的维度可使某个
维度用于多个数据集市中,例如时间维度或产
品维度。代理键是链接维度表和事实数据表的
假键,用于确保唯一性并提高性能。此外,数
据仓库团队确定当前在加载和管理
AdventureWorks DW 数据库中的基表方面没有
重大问题。因此,该团队已决定使用 Microsoft
SQL Server 2005 Analysis Services (SSAS) 来完
成下列各项:
通过一个通用的元数据层提供统一的数据访问以进行
分析和报告。
简化用户的数据视图,从而加速交互式查询、预定义
查询以及预定义报表的开发。
正确构造可组合来自多个主题区域的数据的查询。
管理聚合。
存储和重用复杂的计算。
为美国以外的业务用户提供本地化体验。
数据仓库
Adventure Works DW 除了包括从单独数据
源得到的财务信息外,还包括 OLTP 数据库
中的一些表。该数据与 OLTP 数据库保持同
步,以支持典型的 SQL Server 2005
Integration Services (SSIS) 方案(例如,加
载和更新数据仓库)。
Adventure Works DW 包含两个主题区域:
财务和销售。
财务
数据仓库的财务主题区域分为具有以下特征的
两个架构:
1.财务:
包含 Adventure Works 公司及其分公司的财务
数据。
包含使用相关组织的本地货币表示的数据。
支持 Analysis Services 财务度量值组。
2.货币汇率:
包含货币转换数据,其中包括以美元 (USD)
为基准的每日平均汇率和收盘汇率。 .
支持 Analysis Services 货币汇率度量值组。
销售
销售主题区域分为具有以下特征的四个架构:
1、分销商销售
仅包含对分销商的销售。
仅包含交付订单。
包含以 USD 为单位的数据,并跟踪原币。
支持 Analysis Services 分销商销售度量值组。
2、销售汇总
包含分销商和 Internet 销售数据的摘要视图。
与分销商以及 Internet 销售架构相比已经减
少了维数。
3、Internet 销售
包含个人客户 Internet 销售订单和详细信息数
据。
仅包含交付订单。
包含以 USD 为单位的数据,并跟踪原币。
支持 Analysis Services Internet 销售度量值组。
4、销售配额
包含销售代表的销售配额数据。
支持 Analysis Services 销售配额度量值组。
注:Internet 销售表可以支持数据挖掘方案,
而其他表可以支持 OLAP 方案。
作业:
使用Adventure Works DW构建OLAP方案,查
询主题为:2004年4月讲英语的国家里分经销
商对各个产品的销售量情况(数据)。
要求 1、完成详细设计步骤:数据源选择,数
据源视图的建立,构建多维数据集,部署数据
仓库,选择合适字段,完成报表显示。
2、一周时间完成在Word文档中,每步骤需有
适量贴图进行阐述说明。
3、发送至邮箱:[email protected] 截止日期:下
周二晚8点。