Sql server数据仓库的操作应用

Download Report

Transcript Sql server数据仓库的操作应用

SQL SERVER 2005
数据仓库的操作应用 (BI)
示例数据库项目背景
 这个教学案例是以一家虚构的公司
Adventure Works Cycles为基础。Adventure
Works Cycles是一家大型多语系制造公司,
制造及批发金属和合成器材自行车给北美、
欧洲和亚洲的商场。Adventure Works
Cycles的总公司在华盛顿Bothell,该公司雇
用500位员工。另外,Adventure Works
Cycles在它的市场基地还雇用了几个地区销
售团队。
 在 2000 年,Adventure Works Cycles 购买一
间小型制造工厂 Importadores Neptuno,位
于墨西哥。Importadores Neptuno 为
Adventure Works Cycles 产品线制造几项重
要的子零件。这些子零件运送到 Bothell 地
点进行最后产品组装。在 2001 年,
Importadores Neptuno 成为自行车产品类的
唯一制造商和批发商。
 在丰收的年度之后,现在 Adventure Works
Cycles 想要以这些方式来扩展它的市场占有
率:锁定最佳客户来打广告、透过外部网
站延伸产品可用性,并以减少实际成本来
降低销售成本。
 这个例子麻雀虽小,五脏俱全。不论是新
学商业智能,或者是提高商业智能知识都
是相当有帮助。软件项目开发有迭代上升
的过程,那么看这个案例也会是这么一个
过程。
当前分析环境
 为了支持销售和营销团队以及高级管理人
员的数据分析需要,公司当前从
AdventureWorks 数据库中提取事务数据,
从电子表格中提取诸如销售配额之类的非
事务信息,并将这些信息合并到
AdventureWorks DW 关系数据仓库。但是,
关系数据仓库存在下列问题:
 报表是静态的。用户无法通过交互方式探测报
表中的数据以获取更详细的信息,例如他们可
以处理 Microsoft Office Excel 透视表。虽然现
有的一组预定义报表足以供许多用户使用,但
更高级的用户却需要对数据库进行直接查询访
问,以进行交互式查询和访问专用报表。但是,
由于 AdventureWorksDW 数据库非常复杂,因
此,这类用户需要花费大量时间来掌握如何创
建有效查询。
 查询性能差异很大。例如,有些查询只需
几秒钟便可非常迅速地返回结果,而另一
些查询需要几分钟才能返回结果。
 聚合表难以管理。在尝试缩短查询响应时
间方面,Adventure Works 的数据仓库团队
已在 AdventureWorks DW 数据库中生成几
种聚合表。例如,他们生成了一种按月汇
总销售额的表。然而,尽管这些聚合表可
显著提高查询性能,但是,他们所生成的
用于在一段时间内维护这些表的基础结构
却容易破坏并出现错误。
 复杂的计算逻辑隐藏在报表定义中,所以
很难在报表之间共享。由于这种业务逻辑
针对每个报表单独生成,因此,各个报表
的汇总信息有时是不同的。所以,管理人
员对数据仓库报表数据的信任度是有限的。
 用户所在的业务部门不同,其感兴趣的数
据视图也不同。每个组都很难理解与其不
相关的数据元素。
 对于需要专用报表的用户而言,计算逻辑
非常具有挑战性。由于这类用户必须为每
个报表单独定义计算逻辑,因此,无法对
如何定义计算逻辑进行集中控制。例如,
有些用户知道他们应使用基本统计技术
(如移动平均值),但他们却不知道如何
构建此类计算,因而也就无从使用这些技
术。
 组合相关的信息集时存在难度。业务用户
很难构造一些专用查询,以组合两个相关
的信息集(如销售额和销售配额)。此类
查询会占用大量的数据库空间,因此,公
司要求用户向数据仓库团队请求跨主题区
域的数据集。因此,仅定义了少数预定义
报表,这些报表可以用于组合来自多个主
题区域的数据。此外,由于这些报表非常
复杂,因此用户不愿尝试修改这些报表。
 报表主要提供美国的业务信息。非美国分
公司的用户非常不满意只提供美国的业务
信息,他们希望能够查看不同货币和不同
语言的报表。
 信息难以审核。财务部门当前仅将
AdventureWorks DW 数据库用作从中进行
大容量查询的数据源。然后,再将数据下
载到单个电子表格中,并花费大量时间准
备数据和处理电子表格。因此,很难在整
个公司内准备、审核和管理公司财务报表。
解决方案
 数据仓库团队最近对当前分析系统执行了设计
评审。评审包括当前问题和未来需求之间的差
距分析。数据仓库团队确定 AdventureWorks
DW 数据库是一个设计良好的维度数据库,具
有相符的维度和代理键。相符的维度可使某个
维度用于多个数据集市中,例如时间维度或产
品维度。代理键是链接维度表和事实数据表的
假键,用于确保唯一性并提高性能。此外,数
据仓库团队确定当前在加载和管理
AdventureWorks DW 数据库中的基表方面没有
重大问题。因此,该团队已决定使用 Microsoft
SQL Server 2005 Analysis Services (SSAS) 来完
成下列各项:
 通过一个通用的元数据层提供统一的数据访问以进行
分析和报告。
 简化用户的数据视图,从而加速交互式查询、预定义
查询以及预定义报表的开发。
 正确构造可组合来自多个主题区域的数据的查询。
 管理聚合。
 存储和重用复杂的计算。
 为美国以外的业务用户提供本地化体验。
数据仓库
 Adventure Works DW 除了包括从单独数据
源得到的财务信息外,还包括 OLTP 数据库
中的一些表。该数据与 OLTP 数据库保持同
步,以支持典型的 SQL Server 2005
Integration Services (SSIS) 方案(例如,加
载和更新数据仓库)。
 Adventure Works DW 包含两个主题区域:
财务和销售。
财务
 数据仓库的财务主题区域分为具有以下特征的
两个架构:
 1.财务:
包含 Adventure Works 公司及其分公司的财务
数据。
包含使用相关组织的本地货币表示的数据。
支持 Analysis Services 财务度量值组。
 2.货币汇率:
包含货币转换数据,其中包括以美元 (USD)
为基准的每日平均汇率和收盘汇率。 .
支持 Analysis Services 货币汇率度量值组。
销售
销售主题区域分为具有以下特征的四个架构:
 1、分销商销售
仅包含对分销商的销售。
仅包含交付订单。
包含以 USD 为单位的数据,并跟踪原币。
支持 Analysis Services 分销商销售度量值组。
 2、销售汇总
包含分销商和 Internet 销售数据的摘要视图。
与分销商以及 Internet 销售架构相比已经减
少了维数。
 3、Internet 销售
包含个人客户 Internet 销售订单和详细信息数
据。
仅包含交付订单。
包含以 USD 为单位的数据,并跟踪原币。
支持 Analysis Services Internet 销售度量值组。
 4、销售配额
包含销售代表的销售配额数据。
支持 Analysis Services 销售配额度量值组。
注:Internet 销售表可以支持数据挖掘方案,
而其他表可以支持 OLAP 方案。
作业:
 使用Adventure Works DW构建OLAP方案,查
询主题为:2004年4月讲英语的国家里分经销
商对各个产品的销售量情况(数据)。
 要求 1、完成详细设计步骤:数据源选择,数
据源视图的建立,构建多维数据集,部署数据
仓库,选择合适字段,完成报表显示。
 2、一周时间完成在Word文档中,每步骤需有
适量贴图进行阐述说明。
 3、发送至邮箱:[email protected] 截止日期:下
周二晚8点。