还剩4页未读,继续阅读
文本内容:
数据仓库的用途数据仓库与事务性数据库的区别
1.事务性数据库帮助人们执行活动,数据仓库帮助人们制定计划
2.事务性数据库侧重于细节,数据仓库侧重于高层次的聚合
3.事务性数据库通常为特定的应用程序而设计,而数据仓库集成了不同源头的数据
4.事务性数据库关心的是现在,数据仓库关心的是随时间变化的活动
5.事务性数据库是易变的,数据仓库是稳定的
6.事务性数据库必须能够对详细信息快速获取或更新,数据仓库必须能够对高度汇总的信息快速获取事实表在__数据仓库中,保存度量值的详细值或事实的表度量值在数据仓库中,用来监视业务的可以汇总的数值成员维度中的项目称为维度的成员主键列数据库维度表中的一个列,它包含的值唯一地表示每行数据主键列在维度表外键列数据库表中的一个列,某个其他数据库表的主键列的每个值都可能在其中出现多次雪花型设计一种数据库布局,其中维度的属性被保存在单独的(规范化的)表中星型设计一种数据库布局,其中维度的多个属性被冗余地保存在单个(反规范化的)维度表中第2章计算成员一种使用比存储在__数据集中更复杂的公式来聚合度量值的机制__数据集一个或多个度量值组以及它们相关的维度的__度量值组单个事实表中明细数值的概念容器,附带一个或多个维度层次结构的所有可能聚合第3章由顶至底__方法即是首先要创建一个没有数据源的__数据集,然后再生成关系架构并加载数据源商业智能__平台VisualStudio中的商业智能设计器称为商业智能__工作台在BIDS环境中,可以创建为高性能分析组织数据的分析服务项目,可以创建为分析服务项目准备和加载数据的集成服务包,还可以创建把分析结果呈现给业务用户社区的报表服务报表SQLServer管理工作台对生产数据库进行常规维护工作——例如处理数据库项目分析服务项目(主要构成)主要构成“数据源”、“数据源视图”、“__数据集”、“维度”、“挖掘结构”、“角色”、“程序集”和“其他”第4章由底至顶__方法即是首先添加数据源,接着创建数据源视图,然后使用维度向导创建维度的初始结构,最后创建__数据集角色共享维度同一维度可以在事实表中担任不同的角色,当事实表中多个外键连接到同一个维度表时,可以认为该维度是一个角色共享维度(向__数据集中添加角色共享维度确保在事实表和维度表之间定义了多个关系通过维度向导创建维度,打开__数据集设计器,右击“__数据集结构”选项卡上“维度”窗格的背景,单击“添加__数据集维度”,单击列表中的维度,然后单击“确定”按钮)父子维度父子维度是指构建一个包含一个内置的递归层次结构的表,可以使用这个层次结构中的每个分支的所有级别来聚合数值(手工创建父子维度遵循创建标准维度的过程,在维度向导“定义父子关系”页面选中“这个维度的属性中含有父子关系”复选框,最后指定父属性键)第5章度量值组(重命名度量值组在__数据集设计器的“__数据集结构”选项卡中,右击度量值组,然后选择“重命名”,或在属性窗口中更改Name属性;向已有的__数据集添加度量值组在__数据集设计器的“__数据集结构”选项卡中,右击“度量值”窗格的任何区域,选择“新建度量值”,然后选择相应的事实表)粒度属性当关系类型为常规时,必须指定一个粒度属性,它是表示事实表中对应最低粒度明细信息的维度属性半累加性度量值半累加性度量值只能按照__数据集中部分维度进行累加,而不是全部通常用于固定时间点数值(也称为快照)(把半累加性度量值添加到__数据集时,不管是通过__数据集向导还是通过__数据集设计器手工添加的,都要更改它的默认聚合行为)无重复计数度量值无重复计数度量值返回事实表中唯一成员的计数必须包含在单独的度量值组中(添加无重复计数器度量值在__数据集设计器的“__数据集结构”选项卡中,右击“度量值”窗格的任何区域,单击“新建度量值”,从“用法”下拉列表中选择“无重复计数”,然后从“源表”下拉列表中选择事实表,然后单击源列)第6章一元操作符加法为+,减法为—,乘法为*,除法为/,~表示不对成员进行聚合这些代码称为一元操作符第7章聚合设计
1.因为要避免数据__,方法就是避免把聚合数据都存储起来,在需要的时候再计算它们
2.而且,对于大型的__数据集,聚合会对查询速度产生巨大的影响,帮助分析服务快速地响应查询
3.不需要存储__数据集所有可能的聚合值分析服务可以使用已有的聚合尽快地计算出需要的数值聚合值聚合值是从__数据集中获取的单个总计值聚合聚合包含了__数据集中一个属性层次结构与所有其他层次结构所有可能的组合是累加性度量值预先计算好的总计值层次结构第8章MDX查询式的写法(
8.2)SelectCrossJoin[Time].[CalendarYear].[All].Children{[Measures].[ResellerSalesAmount][Measures].[ResellerOrderQuantity]}onColumns{[Product].[ProductCategory].[Category].
[1][Product].[ProductCategory].[Category].
[1].CHILDREN}onRowsFrom[SSAS]计算的次序关键性能指标关键性能指标KPI度量的是业务为满足其目标所进行的过程对于每个KPI,需要为KPI的数值、目标、当前状态和走向创建表达式目标表达式定义业务目标状态表达式定义怎样比较值与目标走向表达式用来比较当前状态数值与前一个时间点状态的数值第9章引用关系(创建引用维度使用维度向导创建一个新维度这个维度必须关联到另一个维度表,而后者必须关联到一个事实表在__数据集设计器的“__数据集结构”窗格添加这个新维度在__数据集设计器的“维度用法”窗格,单击新维度与某个度量值组的交叉点,在“选择关系类型”下拉列表中选择“被引用”,在“维度”列表框中选择关联维度,最后在“维度属性”和“中间维度属性”下拉列表中选择相应的键列)多对多关系维度表中的多个成员与事实表中的多条记录相对应,这种类型的关系称为多对多关系(定义多对多关系使用维度向导创建两个维度,每个都与一个事实表相关,这些事实表必须是存储第一个维度中多个成员与第二个维度中多个成员映射关系的中间事实表其中一个维度要关联到一个主事实表在“__数据集结构”选项卡为每个事实表逐一创建度量值组,并添加这两个新维度在__数据集设计器的“维度用法”选项卡,单击关联到主事实表的维度与此事实表对应度量值组的交叉点,在“选择关系类型”下拉列表中选择“常规”,然后在“度量值组列”列表框选择相应的列值在“维度用法”选项卡中单击另一个维度与中间度量值组的交叉点第10章标准操作、钻取操作、数据集写回数据仓库是一个用以支持企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据__数据仓库有四个基本特征数据仓库的数据是面向主题的;数据仓库的数据是集成的;数据仓库的数据是不可更新的;数据仓库的数据是随时间不断变变化的数据仓库的__模式… 自顶向下的模式自底向上的模式…“”的方法数据集市和数据仓库的关系是单方向的,即数据从数据仓库流向数据集市建立全局数据仓库,建设规模往往较大,建设周期长,投资大在全局数据仓库建立好后,随着使用数据仓库的部门增多,对数据仓库资源的竞争将成为企业所面临的一个难题“自底向上”模式“自底向上”模式是从建立各个部门或特定的商业问题的数据集市开始,全局性数据仓库建立在这些数据集市的基础上“自底向上”模式的特点是初期投资少,见效快,因为它在建立部门数据集市时只需要较少的人做决策,解决的是较小的商业问题“自底向上”的__模式可以使一个单位在数据仓库发展初期尽可能少地花费资金,也可以在做出有效的投入之前评估技术的收益情况“平行__”模式“平行__”模式是指在一个全局性数据仓库的数据模型的指导下,数据集市的建立和全局性数据仓库的建立同时进行在“平行__”模式中由于数据集市的建立是在一个统一的全局数据模型的指导下进行的,可避免各部门在__各自的数据集市时的盲目性,减少各数据集市之间的数据冗余和不一致在“平行__”模式中数据集市的这种相对__性有利于全局性数据库的建设一旦全局性数据仓库建立好后,各部门的数据集市将成为全局数据仓库的一个子集#全局数据仓库将负责为各部门已建成和即将要建的数据集市提供数据数据仓库与事务性数据库的区别
1.事务性数据库帮助人们执行活动,数据仓库则帮助人们制定计划
2.事务性数据库侧重于细节,然而数据仓库侧重于高层次的聚合
3.事务性数据库通常是为特定应用程序设计的,然而数据仓库集成了不同源头的数据
4.事务性数据库关心的是现在,数据仓库关心的是随着时间变化的活动
5.事务性数据库是易变的,它的信息随着新订单的确认或者取消而更改,随着新产品的生产或者装配而更改,或者新的预定而更改
6.事务数据库必须能够提供对详细信息的快速获取或者更新,数据仓库必须能能够提供对高度汇总的信息进行快速获取___企业需要数据仓库 在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息在以往的操作型数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决策要使用的信息这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策和目标制定的作用甚微但是信息技术资源和操作型数据库系统不能把这些数据转换为企业真正需要的决策信息___呢?首先,企业数据分散在多种互不兼容的的结构和系统中,导致数据很难被整合成需要的决策信息;其次,战略决策所需的数据格式必须适合趋势分析,但操作型数据是由__驱动的,不能直接反映趋势的变化;再次,对于战略决策来说,决策者必须从不同的商业角度观察数据,比如说产品、地区、客户群等不同方面观察数据,操作型数据不适合从不同的角度进行分析 提供战略决策信息需要大量的企业数据,能够以合适的格式存放并能快速检索随着计算机技术的快速发展,存储成本迅速降低和计算能力大大提高,使建立数据仓库成为可能数据仓库的五大好处一个数据仓库是一个成功的商业智能(BI)的基础数据仓库的概念是很容易理解的—为支持企业的分析、报表和其它商业智能(BI)功能所需要的各种数据源创建一个__的位置和永久储存的空间而且它对你的业务真的很重要
1.一个数据仓库提供利用从各种数据源提供的数据,加强的商业智能(BI)
2.一个数据仓库足以让业务用户可以在一个地方快速访问许多数据源可节省时间
3.一个数据仓库能提高数据的质量和一致性
4.一个数据仓库能提供___智慧
5.一个数据仓库能创建高的投资回报率数据仓库学习体会说实话,才选这门课的时候就是想着它和数据库是没有什么大的区别的,只是数据量上大小上的区别,对它的概念很模糊认真学习了这门课,参阅了一些资料才算对它的概念有了真正的认识数据库是面向事务的设计,数据仓库是面向主题设计的数据库一般存储在线交易数据,数据仓库存储的一般是历史数据数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境中承担的是日常操作性的任务数据仓库是数据库技术的一种新的应用,而且到目前为止,数据仓库还是用关系数据库管理系统来管理其中的数据这些概念上的区别,理解起来很晦涩,可以这样记住,但是具体操作起来还是有困难的我想还是要多做数据库的设计,从中才能真正体会他们之间的去区别事实上,我觉得上这门课最大的感触在于老师讲的一句话数据仓库30%靠的是技术,70%靠的是各种关系的处理在具体的操作过程中,技术一般不存在大的问题,对于不同主题的数据仓库,一般都有很成熟的模型,根据实际做相应的修改最大的问题在于数据的提取,准确性,统一性等等上边不由自主想起本科时__员的一句话做计算机的,要时刻考虑转行或者转型,你永远干不过那些年轻人我想仅仅通过这门课的学习,也不可能说以后就成为数据仓库这一方面的专家或者说有多么豁然开朗的收获,重要的是,对于计算机这个行业,对于技术层面在一个项目中所占的比重,对于自己以后的出路,对于自己今后的定位,有了新的思考有了这些思考,我想,这也就够了还有,谢谢老师__SQL遇到的问题以及处理的方法在WindowsServer
2003、WindowsXP或者Windows2000中__SQLServer2008__版和企业版还有专业版,我们要将我们电脑的WIN7最好升级为旗舰版,你到网上搜下SQLServer2008专业版,下载__就可以了,在__前最好使用软件自带的检查工具检查你的系统是否满足__条件,以便想办法解决兼容问题,或者说选择合适电脑以及上课需要的SQLServer版本同时,__程序在卸载的时候的错误,会造成了注册表中键值不一致的现象正是由于这个差异,造成了SQLServer2008__过程中遇到“性能计数器注册表配置单元一致性”检查失败的故障我们需要修改一些参数,把注册表的键值调整好此外,我们最好将系统打好补丁,例如win2008必须要用360打上所有最新补丁,这样__SQL才不会出现问题由此可见,在遇到问题时,如果不加思考,完全生搬硬套帮助文档,可能事倍功半,还会引起很多不必要的麻烦,因为帮助文档只是给我们指明了大致的方向,编写帮助文档的人也不可能知道我们遇到问题的实际环境,因此帮助文档作为参考是非常有用的,但是遇到问题的时候,我们的实际经验和动手测试的能力也是非常重要的,这样才能少走弯路。