1. 创建数据源(必须的) 把项目中可能用到的数据仓库的连接设置好 通常是数据仓库 注意:身份模拟的设置 如果仓库和SSAS是一个服务器,可以直接使用服务帐号 否则,可以指定特定的用户名和密码 2. 创建数据源视图(必须的) 把项目中可能用到的一些维度表和
1. 创建数据源(必须的)
把项目中可能用到的数据仓库的连接设置好
通常是数据仓库
注意:身份模拟的设置
如果仓库和SSAS是一个服务器,可以直接使用服务帐号
否则,可以指定特定的用户名和密码
2. 创建数据源视图(必须的)
把项目中可能用到的一些维度表和事实表映射成一个视图
经验做法:先选择事实表,然后“添加相关表”
还可以做一些附加的操作
修改友好名称
添加命名计算(在原先的数据库字段基础上,再派生一些字段)
修改关系(如果仓库中没有关系,可以通过在这里建立关系来实现)
如果表仍然比较多,可以通过创建不同的视图来简化
3. 创建多维数据集
两种主要的模型:
根据仓库自动生成(最方便)
选择数据源视图
选择事实表和维度表
重点要修改的地方
多维数据集结构
修改度量值的聚合方式
修改度量值的格式
维度用法(维度和度量的关系)
常规:维度和事实是标准的一对多关系
事实关系:退化维度(某些要分析的方面,它的数据增长与度量值基本接近,此时不适合做维度表)与度量值的关系。
多对多关系:针对仓库中的多对多关系的一个实现。需要中间事实表
被引用关系:雪花架构的产物。需要中间维度
部署:将定义发送给服务器,创建多维数据库
处理:把数据从仓库中读取出来,并且根据多维数据集的定义和维度定义进行预先计算
先建模,然后反向工程生成仓库
4. 理解维度的设计
维度的属性(Attribute)来自于维度表中的字段
Attribute的值应该要能唯一标识自己,否则就可能出现聚合错误
通过添加KeyColumn,让它变成复合键。
层次结构
方便用户分析
提供更好的效率
将一些低级别的Attribute隐藏起来
Attribute的关系问题
默认情况下,所有的Attribute都与维度的键列发生直接关系
如果有创建层次结构的话,建议在层次结构属性之间创建关系,这样就会有一些属性与键列发生间接关系
5. 多维数据库设计的进阶知识
5.1 计算
可以做三个事情
计算成员:是在聚合值的基础上再做计算。此处一定要注意与命名计算的区别。根本区别在于命名计算是针对行集的(语法上T-SQL),每一行都要计算。计算成员是针对聚合之后的结果计算。(语法是MDX). 相当于是一个标量函数,永远返回一个值。
计算成员通常是针对度量值的计算,最后还是归类在度量值中。
命名集:也用MDX脚本,定义一个表达式,返回值可能是多个的。例如,我们可以将经常需要分析的产品(例如有10个)定义为一个所谓的“核心产品”
命令集通常是针对维度的筛选。
脚本命令:可以改变MDX计算的结果,甚至可以产生虚构的数据。
5.3 KPI
关键性能指标
提供了4个表达式(MDX),来定义四个信息
目标:MDX查询得到目标指标值
当前:MDX查询得到实际完成值
状态:一般都是比较目标和当前值,得到的结果一般是三个值:1,0,-1
走向:通常也是比较当前值与历史一段时间的值,得到结果也是1,0,-1
5.4 操作(action)
希望在分析界面中,提供其他的一些链接,报表,钻取
但是,Action需要怎么在客户程序展现,依赖我们的代码去实现(Excel中已经实现了)
5.5 分区(partition)
规划数据存储设计。针对大型的分析数据库,必须规划多分区,以提高处理速度和查询效率。
分区之后,首先可以简化处理。可以针对单个分区进行处理,这样大大地提高处理速度。
如果有多分区,查询的时候,可以并行操作。
先把默认分区的绑定方式,从表绑定改成查询绑定。通常查询条件中,我们都是用时间列作为条件区分。
再去创建新的分区。
5.6 透视
针对一个cube,可以做多个透视。每个透视其实很类似于视图
5.7 翻译
针对一个cube,可以支持多个语言版本