数据仓库维度建模笔记2009-03-2420:01《数据仓库工具箱—维度建模的完全指南》是数据仓库建模方面的经典著作,1996 年第一版出版被认为是数据仓库方面具有里程碑意义的事件。作者 kimballl是数据仓库方面的权威,他将多年的数据仓库建模实战经验、技巧融入本书。他提出的许多维度建模概念被广泛应用于数据仓库的设计和开发中。2002 年本书出版了第二版。这是一部非常好的数据仓库建模的书,前后完整的读了三遍,受益匪浅。以下笔记将本按四个部分组织:一、数据仓库体系结构和建模过程、技巧。二、维度表建模技术。三、事实表建模技术。四、行业建模经验。一、数据仓库体系结构和建模过程、技巧关键点:数据仓库体系结构、维度建模的四个步骤、数据仓库总线结构、一致性维度。1、对于数据仓库来说,业务需求是第一位的。2、数据仓库的目标:(1)、随心所欲的访问数据。直观、明显、简单、易用、切割、合并、下钻、上卷。(2)、一致的展现数据(相对于原来从多个系统中出来的报表不一致)。(3)、适应性、扩展性、可维护性。(4)、为领导决策提供支持。3、数据仓库的组成。源数据-->数据准备区-->数据仓库(维度建模)-->数据聚集区(OLAP)—>展现。其中原系统到数据准备区属于 ETL 过程。数据仓库和数据聚集区本书称为数据展示。展现本书称为数据存取工具。4、数据仓库应特别注意的几点特点:(1)、数据应该以维度的形式进行展示、存储和访问。(2)、数据仓库中必须包含详细的原子数据。(3)、必须采用共同的维度和事实表来建模。5、数据仓库采用使用维度建模的好处:易理解、查询的高性能、修改的灵活性和可扩充性。6、维度建模的扩展性。表现在三个方面:(1)、在现有的事实表中增加维度。(2)、在事实表中增加事实。(3)、在维度表中增加属性。(第一章)7、维度模型设计的四个步骤。(1)、选取业务(主题)。(2)、定于业务处理的粒度。(3)、选择维度。(4)、选择事实。8、应优先为模型选择有原子性的信息,因为原子性的数据提供了最大限度的灵活性,可以接受任何可能形式的约束。(第二章)9、数据仓库总线结构。实际上是一种增量建模方式,通过一致性维度来集成数据中心。数据总线矩阵:业务处理、公共维度。一级数据中心:衍生于单个基本源系统的数据中心,建议从一级数据中心开始建模,因为导致失败的主要风险是 ETL。合并数据中心:合并多个位于不同源系统的一级数据中心。(第三章)10、维度建模复查。考虑的...