数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统(大数据应用与技术丛书)
编辑推荐
在《数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统》中,我们以连贯的方式组织了所有这些文章。不过本书并不仅仅是过去的杂志文章和DesignTip一字不变的集合。我们已经精简了多余的内容,确保所有文章都以一致词汇来编写,并且更新了许多图片。本书中的文章都进行了重新编辑和改进。一些术语自其被引入以来已经发生了变化,我们已经以追溯的方式使用被广泛采用的当前术语替换了老的术语。 ●人造键现在被称为代理键。 ●数据集市已经被替 ●数据暂存现在被称为提取、转换和加载。 ●终端用户应用程序已经被商业智能应用程序所替代。 ●帮助表现在被称为桥接表。 由于大多数人都不会从头到尾一页不漏地阅读本书,因此我们需要事先介绍一些常用的缩写词: ●DW/BI是端到端数据仓库/商业智能系统的英文缩写。这个缩写对于简约性来说很有用,不过它也明确地将数据仓库和商业智能链接为一个共存体。最后,它反映出从数据仓库本身作为终点到商业智能(BI)的重心转换推动我们所做的一切事情。毕竟,数据仓库是所有形式BI的平台。 ●本书中的许多图片都包含DD(degeneratedimension)、FK(foreignkey)和PK(primarykey)缩写,它们分别代表退化维度、外键和主键。 ●ETL的意思是提取、转换和加载,这是获取数据并且让数据准备好暴露给BI工具的标准范式。 ●ER(entity-relationship)指的是实体关系。我们会在探讨第三范式(3NF)或者与维度数据模型相反的标准化数据模型时频繁使用ER。 ●OLAP代表在线分析处理,通常用于将在多维数据库或多维数据集中捕获的维度模型与被称为星型模式的关系型DBMS中的维度模型区分开来。这些关系型星型模式有时也被称为ROLAP。 ●SCD(slowlychangingdimension)是渐变维度的缩写,指的是所确立的用于处理维度属性变更的技术。
内容简介
作为数据仓库和商业智能(DW/BI)行业中有影响力的领军人物,RalphKimball、MargyRoss得到了世界范围内的认可和尊重,他们在《数据仓库与商业智能宝典(第1版)》中确立了行业标准。现在,在《数据仓库与商业智能宝典(第2版)成功设计、部署和维护DW/BI系统》中已经更新了65篇DesignTip和白皮书,从而汇集了DW/BI技术创新前沿的著作。 从项目规划和需求收集,到维度建模、ETL和BI应用,本书涵盖了你在数据仓库和商业智能中将会遇到的所有内容。这些无与伦比的文章提供了成功地设计、部署和维护DW/BI系统的重要建议。 主要内容: ◆启动DW/BI项目和收集需求的注意事项 ◆集成式企业数据仓库的必备要素,其中包括总线架构和矩阵 ◆事实表的粒度性和三种基本类型 ◆渐变维度技术 ◆星型模式、外支架和桥接表 ◆维度建模高级模式 ◆提取、转换和加载(ETL)子系统与数据质量 ◆BI应用佳实践 ◆大数据注意事项 无论你正以种身份参与数据仓库或商业智能项目,这本可轻易参考和更新的宝典可谓无价之宝。
作者简介
RalphKimball创立了KimballGroup。自20世纪80年代中期开始,他就一直是DW/BI行业关于维度化方法的思想领袖,并且已经培训了超过20000名IT专家。在任职于Metaphor和创立RedBrickSystems之前,Ralph在施乐帕克研究中心(XeroxPARC)参与创建了Star工作站。Ralph拥有斯坦福大学电子工程专业的博士学位。 MargyRoss是KimballGroup和DecisionWorksConsulting的董事长。她从1982年开始就专注于数据仓库和商业智能。截止现在,Margy已经为数百个客户提供过咨询服务,并且向数万人讲解过DW/BI的实践。在任职于Metaphor和联合创办DecisionWorksConsulting之前,她毕业于美国西北大学,并且获得了工业工程专业的学士学位。