03 维度建模的原则
数据库设计中的维度建模与事实建模
数据库设计中的维度建模与事实建模在数据库设计中,维度建模和事实建模是两种重要的建模方法。
维度建模和事实建模针对不同的数据类型和数据关系进行建模,在构建数据仓库或者业务智能系统时起到关键的作用。
本文将介绍维度建模和事实建模的概念、原则以及应用场景。
一、维度建模维度建模是指以维度为中心进行数据建模的方法。
维度是一种反映业务面向用户部门的数据元素,是衡量和分析业务过程的关键属性,如时间、地点、产品、客户等。
维度建模的核心概念是"星型模型",其中一个中心表(事实表)与多个维度表相连。
1. 基本原则(1)维度应该具有唯一性和确定性。
(2)维度应该是可测量的属性,并且应该为业务过程的关键属性。
(3)维度之间应该具有层次关系。
2. 维度建模的步骤(1)识别关键业务过程和需求。
(2)识别和定义需要使用的维度。
(3)确定维度之间的层次关系。
(4)设计事实表,并且确定与维度表之间的关系。
(5)设计维度表。
(6)定义维度表之间的关系。
3. 应用场景维度建模适用于需要对业务过程进行度量和分析的场景,如经营决策、市场分析、销售分析等。
维度建模能够提供简洁、易于理解的数据模型,使得用户能够直观地分析和进行决策。
二、事实建模事实建模是指以事实为中心进行数据建模的方法。
事实是与业务过程中的事件和活动相关的数据集合,如销售金额、订单数量等。
事实建模的核心概念是"雪花模型",其中一个中心表(事实表)与多个维度表相连,并且维度表之间可以进一步展开。
1. 基本原则(1)事实应该与业务过程息息相关。
(2)事实应该是可计量和可观察的。
(3)事实应该能够满足系统设计的需求。
2. 事实建模的步骤(1)识别需要度量和分析的业务过程。
(2)确定需要度量的事实,并进行定义和测量。
(3)确定需要使用的维度,并与事实表建立关系。
(4)确定维度之间的关系,并进行细化。
3. 应用场景事实建模适用于需要对业务过程中的事件和活动进行度量和分析的场景,如销售分析、客户行为分析、物流分析等。
维度建模案例的详细说明和讲解
维度建模案例的详细说明和讲解维度建模是一种常用的数据建模方法,它在构建数据仓库和商业智能系统中具有重要的作用。
本文将详细说明和讲解维度建模案例,包括其基本概念、设计原则以及实际应用。
一、维度建模基本概念维度建模是一种从用户的观点出发来组织和表示数据的方法。
它通过将数据划分为事实表和维度表,将业务过程中的指标与其背后的业务上下文关联起来,以便于理解和分析。
具体而言,维度表存储与业务过程相关的维度属性,例如日期、产品、地点等;而事实表则存储与指标相关的数据,例如销售额、利润等。
维度建模的设计原则主要包括:简单性、可理解性、一致性和可扩展性。
简单性指设计应该尽量保持简单,避免过度复杂和冗余;可理解性指设计应该易于理解和解释,符合用户的需求和认知;一致性指设计应该在整个数据仓库中保持一致,避免冲突和不一致;可扩展性指设计应该具备扩展和适应变化的能力。
二、维度建模的实际应用案例1. 零售业销售分析:假设我们拥有一个零售业数据仓库,其中包含了各种维度和事实数据。
我们可以使用维度建模来进行销售数据的分析和报表生成。
例如,我们可以将日期、产品、地点等维度与销售额、销售数量等事实数据关联起来,以便分析销售趋势、产品销售排行等信息。
2. 客户关系管理分析:在客户关系管理系统中,我们可以使用维度建模来分析客户的购买行为、消费偏好等信息。
例如,我们可以将客户、产品、时间等维度与购买金额、购买次数等事实数据关联起来,以便分析每个客户的购买习惯、忠诚度等指标。
3. 健康保险索赔分析:在健康保险业务中,我们可以使用维度建模来分析索赔数据。
例如,我们可以将保险公司、被保险人、医院等维度与索赔金额、索赔原因等事实数据关联起来,以便分析索赔金额的分布、索赔原因的排名等信息。
三、维度建模的观点和理解维度建模作为一种常用的数据建模方法,具有许多优点。
首先,它能够将复杂的业务过程和指标进行简化和抽象,使得数据更易于理解和分析。
其次,维度建模能够提供多维度的视角,使得用户能够从不同角度进行数据分析。
45商务智能原理与应用第三章——维度建模
事实表 地域键 时间键 部门键 产品键 销售数量 销售金额
图1 星型模型
地域维 地域键
国家 省份 城市
时间维 时间键
年 季度
月 日
国家 A A
省份 城市 BC BD
• 星型模式之所以广泛被使用,在于针对各个维作 了大量的预处理,如按照维进行预先的统计、分 类、排序等。通过这些预处理,能够极大的提升 数据仓库的处理能力。
表1
产品名称 产品类型 产品1 自行车
微型维度表
h_ID 产品类型
1
汽车
2
自行车
3
摩托车
起始时间 2018.7.1 2018.8.1 2018.9.1
截止时间 2018.8.1 2018.9.1 9999.12.31
表2
类型5:添加微型维度和类型1支架
类型5技术用于精确地保存历史属性值,并根据当前属性值报告历史事实。
而代理键通常是数据库系统赋予的一个数值,是自增 型的,按顺序分配,没有内置含义但也可以唯一地标 识一条维度信息。
代理建实现方法
1
使用数据库 赋值
• 大多数主要的数据库供应商实现了被称为递增键的代理 键策略。即,数据库中的表主键设为自增键。
• 一个常用的策略是使用整数列,第一条记录从1开始,
2
MAX() + 1
星型模型
当星型模型的维度表进一步层次化,就形成了雪花模型。
部门维 部门键
总公司 分公司 代理处
产品维 时间键 产品名称 产品描述 产品售价 产品质量
事实表 地域键 时间键 部门键 产品键 销售数量 销售金额
图2 雪花模型
地域维 地域键
国家 省份 城市
时间维 时间键
数据仓库技术中的维度建模方法与技巧(六)
数据仓库技术中的维度建模方法与技巧随着信息化的深入发展,数据的规模和复杂性不断增加,对数据仓库技术的需求也越来越高。
数据仓库作为一种重要的数据管理和分析工具,维度建模方法和技巧成为数据仓库建设的核心内容。
本文将从维度建模的概念、设计原则、模式选择以及应用实践等方面进行探讨。
一、维度建模的概念和设计原则概念维度建模是数据仓库中的一种数据建模方法,强调以业务过程为中心,将业务过程与事实表和维度表相结合,构建一个可靠、灵活和易于维护的数据模型。
维度是指业务过程的方面或特征,比如时间、地点、产品等。
设计原则(1)简洁性:维度建模应尽量避免冗余数据,只保留最重要和必要的维度和指标。
(2)一致性:数据模型应与业务过程相匹配,避免出现不符合业务逻辑的数据结构。
(3)灵活性:数据模型应具备较高的灵活性,能够适应业务需求的变化和演进。
(4)易于理解和维护:数据模型应具备良好的可读性和可维护性,方便数据仓库管理人员进行数据维护和查询等操作。
二、维度建模的模式选择星型模型星型模型是维度建模中最常用的一种模式。
它以一个具有业务实体属性的事实表为中心,围绕着该事实表构建一系列与之关联的维度表。
维度表和事实表通过共享的主键进行连接,形成一个星状的拓扑结构。
雪花模型雪花模型是星型模型的一种扩展,它在星型模型的基础上进一步细化和拆分维度表。
通过在维度表上拆分出一层或多层的子维度表,雪花模型可以更好地处理维度表的复杂性,提高数据模型的灵活性和性能。
星座模型星座模型是维度建模中的一种高级模式,它将多个星型或雪花模型进行整合,形成一个更大的数据模型。
星座模型适用于数据仓库规模较大、数据量较多的情况,能够更好地支持复杂的分析需求。
三、维度建模的应用实践设计维度表在设计维度表时,应根据业务需求和数据特点进行合理的抽象和归纳。
一方面,应考虑维度的可度量性和可分析性,确保维度表中的属性能够有效支持分析需求;另一方面,还应考虑维度的可扩展性和可维护性,尽量避免冗余和复杂的属性。
数据仓库维度建模设计原则及应用
数据仓库维度建模设计原则及应用廖 飒,黄光明(柳州职业技术学院信息工程系,广西 柳州 545006) 摘 要:维度建模技术作为数据仓库的主导技术,在数据仓库的应用中起着关键作用.本文重点探讨了维度建模技术的设计原则,并将其应用于学生成绩分析系统的数据仓库建模过程.关键词:数据仓库;维度建模;设计原则中图分类号:TP311113文献标识码:A文章编号:1671-380X(2007)04-0089-03Research and Appli ca ti on of D esi gn Pr i n c i ples of Da t a W arehouse D i m en si ona lM odeli n g TechnologyL I A O Sa,HUANG Guang-m ing(Infor m ation Engineering D ep1,L iuzhou V ocational&Technical College,L iuzhou545006China)Abstract:D i m ensi onal modeling is the data organizing f or m in data warehouse and it is als o a key fact or in the data warehouse app lica2 ti on1This paper discusses the design p rinci p les of di m ensi onal modeling technol ogy and app lies the m in data warehouse modeling p r ocess of student grade analysis syste m1Key words:data warehouse,di m ensi onal modeling,design p rinci p les 自从20世纪90年代提出数据仓库的概念以来,数据仓库技术得到了很大的发展.数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程.在数据分析和决策支持领域,数据仓库被认为是集成和存储各种分析数据的最佳手段,它通过对大量分散的数据进行抽取,经过加工转换,实现对数据的集成和综合管理,为决策分析提供统一的、高质量的数据平台.与传统的数据库系统一样,建立数据模型是构造数据仓库重要步骤之一,正确地运用数据建模技术是成功实施数据仓库的前提.目前,维度建模技术是数据仓库最为流行的数据建模技术.1 维度建模技术及其设计原则信息世界中的大多数数据本质上是多维的,例如,假设用户是一个在南部地区从事饮料产品贸易的销售经理,他希望了解与这一地区有关的重要数据,例如他要了解2006年12月份啤酒在广东地区的销售量.显然这个销售数据与产品(啤酒)、地区(广东)、时间(2006年12月份)3个维度相联系.有的数据可以涉及更多的商务维度,如时间、地区、产品、销售人员、客户等.大多数的商务数据是多维的.维度建模技术就是为了多角度、多层次地反映数据之间的这个联系,通过对数据进行重组与综合,组织和建立起数据的多维结构,为决策分析提供数据的多维视图.维度模型一般有两种不同性质的表:事实表和维度表.通常采用星型模型把事实表和维度表融合在一起(如图1所示),中间是事实表,周围是维度表.事实表中通常有2个或2个以上的外关键字(FK),外关键字是连接事实表和维度表的桥梁,它连接到相关维度表的主关键字上. 事实表是维度模型的基本表,其中存放的是大量业务性能的度量值.术语“事实”代表一个业务度量值.如上例中产品的销售量即为业务的度量值.事实表的结构为: (外关键字FK:事实列……).维度表是进入事实表的入口,它提供观察度量值的角度,如上例中的产品、地区和时间.维度表的属性列是用户使用数据的约束条件,同时也是数据分析时的切割工具,因此维度表的质量与深度直接影响整个数据仓库的性能.维度表的结构为(主关键字PK:属性列……).图1 星型模型111 事实表的设计原则由于事实表存放着业务处理过程中得到的度量值数据,度量值数据压倒性地成为数据中心的最大部分.设计事实表,应采取以下原则:1)事实表倾向于更少的列和更多的行.将事实表中与决策分析无关的列除去,根据分析需要合并某些列,如进行产品销售分析时,可以将单价、数量和折扣合并为一项:销售额=单价×数量×(1-折扣).2)尽量选择格式短的数据类型,以降低列的大小.数・98・第29卷 第4期2007年8月 宜春学院学报(自然科学)Journal of Yichun University(natural science)Vol129,No14Aug12007①收稿日期:2007-05-16基金项目:柳州职业技术学院研究项目(2005B06)作者简介:廖飒(1969-),女,广西平乐人,汉族,工程硕士,柳州职业技术学院讲师,主要研究方向:数据库1据仓库中的事实表数据可以达到千万行、上亿行,不良的数据类型会消耗宝贵的存储空间,减少磁盘的输入输出.在可能的情况下,使用int 代替varchar,s mallint 代替int,bit 代替s mallint .3)事实表的主键通常由外关键字组合而成.由外关键字组合而成的主键称为复合关键字,它可以唯一地标识事实表中的一行.不需要在事实表中引入一个唯一的关键字作为主键.4)事实列的值应尽可能是数字可加的.文本事实的内容具有不可预见性,几乎不可能进行分析,因此应尽可能将文本事实转换成维度属性或数值事实.百分比和比率这类数据值具有非加性的,应该将分子与分母都存放在事实表中,可以用数据存取工具求出事实表任何数据形式的比率,即合计值的比率.112 维度表的设计原则维度表行数往往比事实表少得多,但却包含对多维空间中维的详尽描述,而且这种描述往往是分层的.如对销售分析的地区维来说,可能有国家、省、市等层次.设计维度表,应采取以下原则:1)维度表倾向于更多的列和更少的行.在一个设计合理的维度模型中,维度表有许多列或属性,这些属性给出对维度表的行所进行的描述,因此应尽可能多地包含一些有意义的文字性描述.对于维度表来说,包含50到100个属性的情形并不少见.2)设计一个占空间尽可能小的主键,以参照到事实表.通常使用代理关键字代替业务系统的自然关键字作为维度表的主键.代理关键字是在填充维度时按需顺序分配的整数值,它没有明确的含义,仅仅用于维度表到事实表的连接.代理关键字通常采用4字节的整数表示,参照到事实表中可以减小了事实表的大小,可以带来更小更有效的索引,同时提高多表连接的速度.3)维度表不建议进行规范化,甚至鼓励一定程度的冗余.由于维度表的层次结构,使得维度表存在很大的数据冗余,但不建议进行规范化处理.规范化处理将冗余属性从维度表中去掉,放到另一个规范化的维度表中,从而形成雪花模型.由于维度表与事实表相比占用的空间非常小,规范化后节省下来的空间显得微不足道,却使数据展示变得复杂,制约了跨属性的浏览操作.因此,应该有意识地牺牲空间来换取数据仓库高性能与易使用方面的优点.4)维度表中的属性应尽可是文本的或离散的.维度属性是查询约束条件、成组与报表标签生成的基本来源,力求最大限度地减少编码在维度表的使用,应该通过更为详细的文本属性取代编号,以便使数据仓库的查询与报表方面的标签属性达到一致.业务操作编码通常包含一些信息在里面,应该将其中含义取出,以容易进行过滤、成组或者形成报表的分开的维度属性形式提供给用户.2 实例:学生成绩分析系统的设计与实现本实例主题为学生成绩分析,系统采用数据仓库+OLAP 技术组成,数据仓库实现主题数据的集成、存储和管理,OLAP 实现主题数据的多维度多层次分析.数据仓库建立在学校原有教务管理系统之上,源系统数据存放于S QL Server 数据库,为解决数据传送的兼容性问题,学生成绩分析系统数据仓库采用S QL Server 解决方案.针对系统的特点,并通过对数据源的分析,学生成绩分析系统数据仓库采用星型模型维度建模,成绩表作为事实表,学生信息、教师信息、课程信息、学年学期信息作为维度表.211 事实表的处理考试成绩是事实表中最基本的事实.数据源中部分考试成绩则以百分制分数进行登记,部分考试成绩以等级制进行登记,为了便以分析处理,将等级制成绩统一转换为百分制成绩.除了对考试成绩进行统计分析外,用户还需要对考试等级进行人数统计及分析,因此由考试成绩衍生出事实数据:优的人数、良的人数、中的人数、及的人数、不及的人数,当考试成绩大于或等于90分,将优的人数设置为1,其余的各项人数设置为0,其余同理进行设置.所有事实列的字段类型设计为tinyint 类型.212 维度表的处理1)维度表主键的处理.维度表采用代理关键字学生I D 、教师I D 、课程I D 、学年学期I D 做为主键,取代源系统的自然关键字学号、教师号、课程号、学年学期编号.根据对维度表的数据量进行估计,将学生I D 的数据类型设为int 类型,教师I D 、课程I D 数据类型设为s mallint 类型,而由于一个学年只有上下两个学期,即使10个学年也只有20行记录,使用tinyint 类型(所能表示的最大值为255)就足够了.2)维度表中源系统自然关键字的处理.虽然使用了代理关键字,但维度表中依然保留源系统自然关键字,目的是为了使数据仓库中的维度信息与源系统中的相关信息对应,同时将自然关键字中包含的有用信息抽取出来.例如学年学期编号中由五个字符组成,前四位表示年份,第五位表示学期,将这些信息从编码中抽取出来并加以转换,最终以学年、学期、学年学期三个维度属性形式提供给用户.3)维度表中层次结构的处理.由于数据来自学校原有教务管理系统,数据源进行了规范化处理,层次结构中相关的数据存放于多个表中.但维度表不建议进行规范化,因此将多个数据源表中相关信息合并到维度表中,如将学生基本信息、班级、专业、系部四个表中与学生相关的数据合并到学生维,使学生维中包含系、专业、班级三个层次.4)维度表中数值属性的处理.入学成绩、年龄、工龄、教龄等维度属性都是数值型属性,连续的属性取值不便于进行分析操作.通常采用“预设波段”的方法对属性数据进行转换,即将该属性值域映射为一组数目相对少的离散值,例如把学生维中入学成绩分为<380、381~400、401~420、421~440、441~460、461~480、481~500、>500八个波段,有利于基于该维度属性的分析操作,同时对于变化的属性如年龄等还可以降低属性的变化频度.5)维度表中编码式属性的处理.在源系统中,性别、婚姻状况、政治面貌等属性采用编码进行存储,如性别中“M ”表示“男”,“F ”表示“女”;婚姻状况用“Y ”表示“已婚”,“N ”表示“未婚”;政治面貌中用“1”表示“中共党员”,“2”表示“共青团员”,….在维度表中,・09・第4期 宜春学院学报(自然科学) 第29卷用原来的文本含义取代编号,比如用“男”取代性别中的“M ”,用“女”取代性别中的“F ”.213 学生成绩分析系统的维度模型根据以上的分析及处理,学生成绩分析系统数据仓库最终的维度模型如2所示.图2 学生成绩分析系统数据仓库星型模型3 结束语本文对数据仓库维度建模过程中的设计原则进行了研究,并将其应用于学生成绩分析系统的设计与实现.可以看出,数据仓库的维度模型中事实表与维度表的设计原则是不同的,前者要求多行少列,事实列尽可能是数字可加的,而维度表要求多列少行,属性列尽可是文本离散的.在数据仓库维度模型设计过程中遵循设计原则,可以高效、合理地完成设计工作.参考文献:[1]Ral ph Ki m ball ,Margy Ross 著,谭明金译1The DataW arehouse Toolkit:the Comp lete Guide t o D i m ensi onalModeling(数据仓库工具箱:维度建模的完全指南)[M ]1北京:电子工业出版社,20031[2]焦峰1MS S QL Server710的数据仓库设计原则[J ]1计算机与数字工程,2000,28(1):25-28[3]王孝成1数据仓库中的数据模型技术[J ]1湖南工程学院学报,2002,12(3):55-59[4]周志艳,罗锡文1农作物生产管理信息数据仓库维度建模初探[J ]1农业工程学报,2005,21(11):112-1151・19・第4期 廖飒,黄光明:数据仓库维度建模设计原则及应用 第29卷。
NX三维建模规范
目录1范围 (1)2规范性引用文件 (1)3术语 (1)4三维建模的原则 (3)5三维建模的精度要求 (3)5.1曲线的精度。
(4)5.2曲面的精度。
(4)6三维建模的通用要求 (4)6.1绘图单位 (4)6.2日期格式 (4)6.3图层设置 (4)6.4线型 (5)6.5颜色 (5)6.6文本字体和字符集 (6)6.7引用集 (6)6.8部件属性 (6)6.9材料与质量特性 (8)6.10原点和坐标系设置 (8)6.11视图 (8)6.12应按规定的方式组织和显示数据: (8)6.13其它 (8)7文件目录与命名原则 (9)7.1文件目录 (9)7.2命名规则 (9)8三维建模的特征应用要求 (10)8.1特征应用的基本要求 (10)8.2体素特征 (11)8.3参考特征 (11)8.4草图特征 (11)8.5 拉伸、旋转和扫描特征 (11)8.6成形特征 (12)8.1 引用特征 (12)8.2螺纹特征(Thread Feature) (12)8.3倒角特征(Chamfer Feature)和倒圆特征(Blend Feature) (12)8.4用户自定义特征(User Defined Feature) (13)8.5部件间相关建模 (13)9标准件、借用件、外购件的三维建模 (13)9.1概述 (13)9.2典型结构件 (13)9.3借用件 (13)9.4外购件 (13)9.5钣金零件的三维建模 (13)10模型的检查和提交 (13)附表一标准内置函数 (1)前言基于NX软件进行产品的三维设计与基于AutoCAD软件进行产品的二维设计,在产品的设计理念上具有根本性的不同,它需要以产品的三维模型为核心来开展工作,为此需要制定基于NX软件的相关应用规范。
本规范规定了采用NX软件进行产品设计时,在三维建模过程中所用的定义、三维建模的原则、三维建模的通用规定、文件管理、建模特征应用等要求。
本规范由XXXXXXXX提出。
维度建模和指标体系构建
维度建模和指标体系构建01数仓建模综述数据建模是数据开发工作中的核心与基石,好的模型体系好处很多:•降低成本:优秀的模型设计能够提升数据复用性,减少计算/存储资源浪费•提升开发效率:优秀的模型设计能够降低数据使用门槛,减少工作量•提升质量:优秀的模型设计能够保证数据口径一致,降低bug率数据建模的实现方式有很多,常用的比如ER模型,Data Vault模型等。
目前业界使用最多的模型是Ralph Kimball 在《数据仓库工具》中提出的维度建模模型,其中典型的代表如星型模型,雪花模型。
一个典型的维度建模一般需要经过如下几个步骤:1.业务调研:调研需要建模的业务形态,划分基本的业务线/数据域2.层次设计:定义数仓层级,保证各层级之间职责明确,划分清晰3.规范设计:定义数仓中表/字段的命名规范,建立统一的指标体系4.事实表设计:根据单一/复合业务过程确定事实表主题,确定最小粒度5.维度表设计:根据业务确定实体,补充实体属性字段优秀的层次设计可以保证数仓表数量在可控范围内增长,同时保证数据产出流逻辑清晰,便于后期维护和扩展。
良好的规范设计规定了统一的命名规则,保证各个业务过程的实体/指标的完备和唯一性。
02设计原则按照《大数据之路——阿里巴巴大数据实战》,维度建模应该符合以下几个规范1.高内聚,低耦合:从业务流程和数据访问特性两个角度考虑,针对业务粒度相近,业务流程相近的数据应该放在同一个表中(例如广告数仓中通常会把广告的点击/曝光/转化多个业务过程数据放在同一个宽表中),针对经常要在同一个场景下访问的数据,也应该放在同一个表内。
2.公共处理逻辑下沉和单一:公用的逻辑应该封装在底层表中,避免公用逻辑直接暴露给上层,同一个公共逻辑需要收敛,避免在多个地方同时存在3.适当冗余:考虑到mr/rdd计算框架下join运算的资源损耗,可以通过适当冗余字段处理减少join操作4.命名一致/可理解:同一个业务含义的字段命名必须相同,且直观可读。
数据仓库技术中的维度建模方法与技巧(八)
数据仓库技术中的维度建模方法与技巧随着信息技术的飞速发展,数据仓库已经成为企业管理和决策的重要工具。
而在数据仓库的建设过程中,维度建模是一种常用且有效的方法。
本文将介绍数据仓库技术中的维度建模方法与技巧,探讨如何利用维度建模提升数据仓库的效率和性能。
一、维度建模的基本概念与原则维度建模是一种以面向业务问题的方式组织数据的方法。
它将数据按照业务专业性进行划分,形成一种易于理解和使用的数据模型。
维度建模的核心思想是将事实表和维度表进行关联,通过事实表记录业务指标的数值,而维度表则描述了业务的上下文。
在进行维度建模时,有几个基本原则需要遵循。
首先是粒度一致性原则,即事实表和维度表之间的粒度要一致,以避免数据混乱和计算错误。
其次是维度可分解原则,即将复杂的维度进行分解,形成更加简洁易用的维度层次结构。
另外,还需要保持维度的稳定性,即维度的定义和结构在一定时间内不发生变化。
这些原则可以为维度建模提供一个稳定而一致的基础。
二、维度建模的方法与技巧1. 选择合适的维度在维度建模中,选择合适的维度是非常重要的。
维度应该是具有业务含义的属性,能够描述业务的特征和属性。
同时,维度应该具有层级结构,可以形成维度的树状关系。
例如,在销售数据中,产品维度可以包括产品类别、品牌、型号等层级。
选择合适的维度可以提高数据的可理解性和查询效率。
2. 设计合理的维度层次结构在维度建模中,设计合理的维度层次结构可以帮助用户更好地理解数据。
维度的层次结构应该是自然、有序且易于理解的。
根据数据的层级结构划分,可以将维度分为多个层次,从而形成维度的多层级关系。
例如,在时间维度中,可以分为年、季度、月、周等多个层级。
这样设计的层次结构可以满足用户对不同粒度数据的查询需求,提高数据灵活性。
3. 使用约束和引用键在维度建模中,引用键是一个重要的技巧,它用于在事实表和维度表之间建立关联。
通过引用键,可以实现多个维度表之间的关联和查询。
同时,还可以通过约束键来限制维度表中的数据。
三维模型分组的基本原则
三维模型分组的基本原则
三维模型分组的基本原则如下:
1. 逻辑关系原则:将具有相似性质或功能的部件或部分放在一组,以便更好地管理和组织模型。
2. 可视关系原则:将具有相似外观或形状的部件或部分放在一组,以便在可视化渲染或动画效果中统一处理和呈现。
3. 空间关系原则:将在空间中相互关联或相互依赖的部件或部分放在一组,以便更好地控制它们的位置、旋转和缩放等变换。
4. 材质关系原则:将使用相同或类似材质的部件或部分放在一组,以便更好地管理和调整材质属性。
5. 动态属性关系原则:将具有类似动态属性或动画效果的部件或部分放在一组,以便更好地控制和调整其运动或变化。
6. 层次关系原则:根据模型的层次结构将部件或部分分组,以便在制作复杂模型或动画时更好地控制和管理各个层级。
7. 用户需求原则:根据用户的需求和行为模式将部件或部分分组,以便更好地满足用户的设计和交互需求。
总之,三维模型分组的基本原则是根据逻辑关系、可视关系、空间关系、材质关系、动态属性关系、层次关系和用户需求等因素来确定部件或部分的分组方式,以便更好地管理、调整和呈现模型。
三维建模规范-基本知识
三维建模规范城市三维建模是为城市规划、建设、运营、管理和数字城市建设提供技术服务的基础,是城市经济建设和社会发展信息化的基础性工作。
城市三维模型数据是城市规划、建设与管理的重要基础资料。
为了建设市三维地理信息系统,规范市三维建筑模型的制作,统一三维模型制作的技术要求,及时、准确地为城市规划、建设、运营、管理和数字城市建设提供城市建筑三维模型数据,推进城市三维数据的共享,特制定本规范。
项目软件及数据格式1、项目中使用的软件统一标准如下:模型制作软件:3DMAX9贴图处理软件:Photoshop平台加载软件:TerraExplorer v6普通贴图格式:jpg透明贴图格式:tga模型格式:MAX、X、XPL2加载文件格式:shp平台文件格式:fly2、模型内容及分类城市建模主要包括建筑物模型和场景模型。
2.1、建筑物模型的内容及分类建筑物模型应包括下列建模内容:各类地上建筑物,包括:建筑主体及其附属设施。
含围墙、台阶、门房、牌坊、外墙广告、电梯井、水箱以及踢脚、散水等。
各类地下建筑物,包括:地下室、地下人防工程等。
其他建(构)筑物,包括:纪念碑、塔、亭、交通站厅、特殊公益建(构)筑物以及水利、电力设施等。
全市建筑物模型分为精细模型(精模),中等复杂模型(中模),体块模型(白模)。
市全市范围主要大街、名胜古迹、标志性建筑等用精模表示,一般建筑物用中模表示,城中村、棚户区等用白模表示。
2.1.1、精细复杂度模型(精模)2.1.1.1、定义:精细模型为,能准确表现建筑物的几何实体结构,能表现建筑物的诸多细节,对部分重要建筑景观进行重点准确制作表现的模型制作方式。
2.1.1.2、一般制作范围:城市中主干道两旁的主要建筑物、主干路十字路口的主要建筑,电信、移动、金融中心大楼,火车站,重点政治、经济、文化、体育中心区建筑,包括标志性建筑物,城市中知名度高的名胜古迹、地标性建筑(如大雁塔、钟楼等)。
2.1.1.3、制作方式:精细制作,不仅能反映实际建筑的大小,整体结构,而且能反映建筑物的细节结构。
三维模型制作规范及标准
真三维模型制作规范说明一、建模准备工作1.场景单位的统一1)在虚拟项目制作过中,因为通常较大的场景同时制作,所以都是以米做为单位会较为好操作些,所以,在建模之初就要把显示单位和系统单位都设置为M。
2.工作路径的统一:在项目操作时,往往一个项目会由许多人共同协作完成,这样,一个统计的工作路径就显得犹为重要,为便于我们项目管理及制作,我们在这里把项目的工作路径统一为:磁盘\城市项目名称\城市项目区块编号\MAX 存放项目相关场景文件;\MAPS 存放项目使用的贴图文件;二、建筑建模的要求及注意事项建筑建模工作包括模型细化处理、纹理处理和帖图,三者同时进行。
帖图可用软件工具辅助完成。
场景制作工具统一采用3dsmax9.0。
1.建筑精度的认定及标准1)一级精度建筑1.哪些建筑需要按1级精度建模——地标建筑、层数>=18层的建筑、建筑面积>=20000m2的建筑、大型雕塑、文物保护单位、大型文化卫生设施、医院、学校、商场、酒店、交通设施、政府机关、重要公共建筑等2.1级模型建模要求——需精细建模,外形、纹理与实际建筑相同,建筑细部(如:屋顶结构,建筑转折面,建筑与地面交界的铺地、台阶、柱子、出入口等),以及建筑的附属元素(门厅、大门、围墙、花坛等)需做出;3.1级模型应与照片保持一致,丰富其外观细节,应避免整个墙面一张贴图,损失了模型的立体效果;需注意接地处理,例如玻璃不可直接戳在地上;该有的台阶、围墙(含栅栏、大门)、花坛必须做出;建筑的体量应与照片一致;4.面数限制——1级模型控制在1000~2000个面。
5.一级精度建筑结构>=0.3米需要用模型表现出其结构,<0.3米可用贴图表现其结构。
(一级精度建筑楼梯或台阶<0.3米时都需要用模型表现其结构。
)2)二级精度建筑1.哪些建筑需要按2级精度建模——道路沿路建筑、历史文化保护区以及其它不属于1级精度的市(区)行政、金融、商贸、文化、科技、展览、娱乐中心等建筑,成串的骑楼建筑需以2级精度建模;2.2级模型建模要求——纹理与实际建筑相同,可删除模型和地面相交长宽小于3米的碎小模型,可减少模型附属元素(如:花坛、基座、柱子段数等);3.对于2级模型,整体、细节的颜色、形状都应与实际保持一致;4.面数限制——2级模型控制在300~800个面。
火星时代 三维建模标准
火星时代三维建模标准你们知道三维建模吗?就好像是在电脑里创造一个超级酷的小世界,里面有各种各样的东西,像房子呀、小动物呀,都可以用三维建模做出来。
在火星时代,三维建模有它自己的标准呢。
这标准就像是我们玩游戏的时候的规则一样重要。
比如说,我们要做一个小房子的三维模型。
这个小房子得看起来稳稳当当的,就像我们现实生活中的房子一样。
如果房子的墙壁歪歪扭扭的,那可不行,这就是三维建模标准里对形状准确性的要求。
就像我们搭积木,每一块积木都要放得整整齐齐的,不然搭出来的东西就不好看,还可能会倒呢。
再讲讲颜色方面的标准吧。
如果我们做的是一个春天的场景,那草地就应该是绿油油的,像我们在公园看到的那样新鲜。
花朵呢,要有各种鲜艳的颜色,红的像火,粉的像霞,白的像雪。
要是颜色涂得乱七八糟,本来该是蓝色的天空变成了紫色,那就不符合标准啦。
这就好比我们画画的时候,要是把太阳画成了黑色,那肯定很奇怪对吧?还有呀,在火星时代的三维建模标准里,模型的大小比例也很关键。
就像我们做一个小人和一个大树的模型。
小人不能比大树还高,得是大树高高大大的,小人小小的站在树下,这样才合理。
就像我们和爸爸妈妈站在一起,我们肯定是比较小的那个呀。
而且呀,模型的细节也很重要。
要是做一只小猫咪的模型,那小猫咪的毛得看起来毛茸茸的,眼睛要亮晶晶的,就像真的小猫咪一样可爱。
不能只是一个大概的形状,看起来光秃秃的,那就不好玩啦。
这就像我们捏橡皮泥,如果只捏出一个大概的形状,没有眼睛、鼻子这些细节,那这个橡皮泥作品就不够生动。
在火星时代的三维建模标准里,这些都是为了让我们做出的三维模型更加逼真、更加有趣。
这样我们看到这些模型的时候,就感觉像是走进了一个充满魔法的世界。
这个世界里的一切都很合理、很美好。
所以呀,这些标准就像是一把神奇的钥匙,能帮助我们做出超级棒的三维模型哦。
你们要是以后也想做三维建模,可一定要记住这些简单又重要的标准呀。
建筑效果图第13课
图13-4
图13-5
首页 末页 向上 向下 返回 结束 调音
《中文版3ds max 5建筑效果图培训教程 》
(3)在前视图里将“主体玻璃1”选中,单击 “旋转工具”按钮,接着用鼠标右键单击该按钮, 在打开的对话框中设臵参数如图13-6所示,在顶 视图中单击“镜像复制”工具按钮 ,在打开的 对话框中设臵参数如图13-7所示,单击 按 钮,效果如图13-8所示。
首页 末页 向上 向下 返回 结束 调音
《中文版3ds max 5建筑效果图培训教程 》
用3ds max的三维建模工具(如标准几何体、 扩展几何体等)都可创建如门窗、栅栏、柱 梁、墙壁等模型,这样建成的模型不但精确、 快捷,而且有相关的参数可调节。 用3ds max的“布尔运算”命令建模。它是 除二维、三维建模方法外的另一种组合运算 建模途径。“布尔运算”实际上就是通过对 两个以上对象进行“并集、差集、交集”运 算的建模方法,但布尔运算本身并不是万无 一失的,尽管3ds max 5的“布尔运算”与 3ds max 4版的“布尔运算”相比有一定程 度的改善,但有时也会在计算时出现错误。
首页 末页 向上 向下 返回 结束 调音
《中文版3ds max 5建筑效果图培训教程 》
由于3ds max的建模功能很强大,对于 同一个物体有多种创建方法,因此应在 创建时选择一种既准确又快捷的方法。 另外好的建模方法不但能准确、快速地 建模,而且能便于以后模型的修改。
首页 末页 向上 向下 返回 结束 调音
图13-15
首页 末页 向上 向下 返回 结束 调音
《中文版3ds max 5建筑效果图培训教程 》
(8)用同样的方法在顶视图上绘制出一个封 闭的曲线,如图13-16所示,并命名为“前厅”。 单击 下方的按钮 ,将绘制出的形状调节成如 图13-17所示的形状。
三维建模方案
三维建模方案在当今数字化时代,三维建模已经成为了很多领域不可或缺的工具,它可以帮助您更快速、更准确地进行设计和制造,节省时间和成本。
因此,选择一个合适的三维建模方案,对于企业和个人来说都是非常重要的。
下面,本文将为您介绍三维建模方案的选择准则和三大常见方案的优缺点,希望能对您有所帮助。
一、选择准则在选择三维建模方案时,需要考虑以下几点:1.功能需求:不同的行业和领域对三维建模的要求也不同,例如,制造业需要更加注重精度和真实感;建筑业则需要更加侧重对外传达效果;医学和科学研究需要更加注重数据分析等。
2.成本预算:三维建模软件价格差异巨大,有的高达数万元,而有的则只需要几百元。
因此,选择一个合适的三维建模软件需要考虑自身经济实力。
3.易用性:如果您没有三维建模的经验或者只是一个初学者,那么一个易于上手的三维建模软件显然更加适合您。
不同的软件对用户的门槛也不同,因此需要在易用性和功能方面做出平衡。
4.支持度和社区:虽然三维建模软件一般都会提供相应的帮助文档和技术支持,但是一个开放的社区可以为用户提供更加广泛的学习和使用资源,帮助用户更快速地解决问题。
二、三大常见方案1. BlenderBlender是一款完全免费的三维建模软件,界面友好,功能强大,涵盖了从建模到渲染的各个环节。
与其他付费软件相比,它的功能几乎一致,因此也可以满足绝大部分使用者的需求。
此外,它还有一个非常庞大的社区,可以为用户提供各种教程和插件。
2. 3ds Max3ds Max是一款功能非常强大的三维建模软件,被广泛应用于游戏、电影、建筑和工业设计等领域,尤其是游戏开发。
它提供了各种实用的建模工具和渲染器,可实现VR和AR的互动制作。
但它的价格相对较高,需要有一定的预算。
此外,它还需要一定的学习成本,对于初学者来说可能有些困难。
3. SketchUpSketchUp是一款轻量级的三维建模软件,它主要用于建筑设计、室内设计和景观设计等领域。
数据仓库维度建模
商场关键字(PK) 待定商场属性
POS零售营销事务事实
日期关键字(FK) 产品关键字(FK) 商场关键字(FK) 促销关键字(FK) POS事务编号 待定事实
产品维度
产品关键字(PK) 待定产品属性
促销维度
促销关键字(PK) 待定促销属性
实例-4.确定事实
确定事实:
是否还记得确定事实的基本原则? 按照基本原则你认为事实表中应该包含哪些事实? 是否应该在事实表中存放计算列? 实例中事实应包括销售量、销售额与成本价,当然也可以包括毛
数据仓库维度建模就是大厦的框架建设工作 数据仓库ETL过程,就是为大厦添砖加瓦的过程 优秀数据访问工具则是大厦整体装修的最佳工具
框架的重要性
地基打多深决定大厦能做多高。 钢筋混凝土结构还是刚结构决定了大厦的稳定性 维度建模是数据仓库框架建设的重要技术
维度建模四步曲
四步维度建模步骤:
维度表属性
添加维度表属性
这是维度建模的最后修补工作 增加的维度属性会为用户带来更多的查询条件 丰富的维度属性将使查询变得更加灵活
维度表属性-日期维度
日期维度属性
是否还可以列出其它属性
日期维度
日期关键字(PK) 日期 星期 日历周结束日期 日历月 日历年月 日历季度 日历年季度 日历半年度 节假日指示符 。。。及其它
实际数据
零售业案例背景
背景:
设想一下在一家大型杂货连锁店,其业务覆盖分布在 美国5个州范围内的100多家杂货店。
每个商店都有完整的配套部门,包括各类人员,并有 大致60000多个品种的产品放在货架上。
各杂货店的POS系统记录了每位顾客交易详的细信息 定价与促销是管理层重要决策之一 如何使各种形式的促销活动所产生的效能清晰可见?
维度建模的10大基本原则
遵循这些原则进行维度建模可以保证数据粒度合理,模型灵活,能够适应未来的信息资源,违反这些原则你将会把用户弄糊涂,并且会遇到数据仓库障碍。
原则1、载入详细的原子数据到维度结构中维度建模应该使用最基础的原子数据进行填充,以支持不可预知的来自用户查询的过滤和分组请求,用户通常不希望每次只看到一个单一的记录,但是你无法预测用户想要掩盖哪些数据,想要显示哪些数据,如果只有汇总数据,那么你已经设定了数据的使用模式,当用户想要深入挖掘数据时他们就会遇到障碍。
当然,原子数据也可以通过概要维度建模进行补充,但企业用户无法只在汇总数据上工作,他们需要原始数据回答不断变化的问题。
原则2、围绕业务流程构建维度模型业务流程是组织执行的活动,它们代表可测量的事件,如下一个订单或做一次结算,业务流程通常会捕获或生成唯一的与某个事件相关的性能指标,这些数据转换成事实后,每个业务流程都用一个原子事实表表示,除了单个流程事实表外,有时会从多个流程事实表合并成一个事实表,而且合并事实表是对单一流程事实表的一个很好的补充,并不能代替它们。
原则3、确保每个事实表都有一个与之关联的日期维度表原则2中描述的可测量事件总有一个日期戳信息,每个事实表至少都有一个外键,关联到一个日期维度表,它的粒度就是一天,使用日历属性和非标准的关于测量事件日期的特性,如财务月和公司假日指示符,有时一个事实表中有多个日期外键。
原则4、确保每个事实表中的事实具有相同的粒度或同级的详细程度在组织事实表时粒度上有三个基本原则:事务,周期快照或累加快照。
无论粒度类型如何,事实表中的度量单位都必须达到相同水平的详细程度,如果事实表中的事实表现的粒度不一样,企业用户会被搞晕,BI应用程序会很脆弱,或者返回的结果根本就不对。
原则5、解决事实表中的多对多关系由于事实表存储的是业务流程事件的结果,因此在它们的外键之间存在多对多(M:M)的关系,如多个仓库中的多个产品在多天销售,这些外键字段不能为空,有时一个维度可以为单个测量事件赋予多个值,如一个保健对应多个诊断,或多个客户有一个银行账号,在这些情况下,它的不合理直接解决了事实表中多值维度,这可能违反了测量事件的天然粒度,因此我们使用多对多,双键桥接表连接事实表。
3维做成照片一样真实的十大原则
3维做成照片一样真实的十大原则Bill Fleming是美国资深3D艺术家,Komodo Studio的领头人。
Komodo Studio是业界在创建照片真实的电影广播级3D生物和角色领域中的佼佼者。
Bill本人也是很多3D书籍的作者,其中包括由Charles River Media,Inc.出版的“The 3D Creature Workshop”。
同时他也是数本杂志的知名专栏作家,包括Animation World,Visual Magic和Keyframe。
同时他还是Serious 3D 的主编。
Serious 3D是一本致力于专业级3D制作教程的杂志,本文就是Bill Fleming为Serious 3D撰写的一篇文章。
云之君的话:之所以翻译这篇文章是因为作者精练地提出了3D制作中一些共通的原则。
我们国内的3D玩家并不缺乏教材,但是很多3D的基本概念却相当的缺乏,所以我认为本文确有其价值,故而译之与大家共享,希望3D同好们有所收获。
怎样使得一幅CG照片般真实?可能有上千个元素可以增加图象的真实性,但总结起来有10条,我把它们称之为“照片真实3D的十大原理则。
它们正是确保图象照片般真实的基本底线。
01. 混乱和无序02. 个性和期望03. 可信度04. 表面材质05. 镜面反射06. 污垢、灰尘和锈迹07. 裂痕和刮擦08. 斜角边缘09. 物体材质深度10. 散射率你所要做的全部事就是把你的图象同这十条原则比较,如果满足其中的八项以上的话就可以把你的作品称之为照片真实3D。
举个例子,一个刚出厂的崭新物品不需要第6和第7条原理,但仍旧要满足第8条原理。
在开始之前我们首先要了解图象背后的创作背景,这一点很重要,这有助于我们理解照片真实3D原理应用的理由和方式。
Dwellers是一部目前Komodo Studios,一个位于南加州的动画工作室,正在制作中的一部3D动画影片。
这是一部关于一名名叫Papagaio的老玩具工匠制造出具有感知思维能力的机器生物的故事。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
月份=6
Salesperson Name Territory Name Region Name 销售代表=Jenny
Chapter Ten 维度建模的原则
Contents
从需求到数据设计 星型模式 星型模式的键 星型模式的优势
维度表
维度是维度模型的基础,描述了参与业务的对象,每 个维度表联系着所有参与其中的业务过程。
Order Date
Date Month Quarter Year
Order Dollars Cost Margin Dollars Quantity Sold
Customer Name Customer Code Billing Address Shipping Address
Salesperson
星型模式的优势2
优化浏览
在数据库模式中,表与表连接的目的在于寻找 到需要的数据 如果连接的路径复杂,那么在数据库中浏览数 据将是缓慢而艰难的 如果连接路径简单、直接,则浏览数据会更快 星型模型的优势之一在于它优化对数据库的浏 览
时间
产品 缺陷
组件
供应商
问题
星型模式的优势3
最适于查询处理பைடு நூலகம்
事实表的主键
外键
每个维度表都与中央的事实表有着1:N的关系。 每个维度表的主键是事实表的外键。 一个单独的复合主键:其长度为4个维度表键长度的总和, 外键作为附件属性存在事实表中 一个生成的主键:与维度表的键无关的新生成的键,维度表 的主键作为附加属性存储在事实表中 连接的主键:最常用的方式!!!
实际销售价格 MSRP销售价格 零配件价格 全价 经销商附加部件 经销商信用 经销商发票 首付款数量 制造商收益 金额数量 模型名称 模型年份 部件风格 生产线 产品目录 外部颜色 内部颜色 第一个模型的年 份 时间维度表 付款方式维度表 客户人口统计维度表 经销商维度表
事实表 数据结构,From 信息包表
例:查询2000年版本的Cherokee、在2001年1 月份由“ABC”经销商卖出的、客户已婚、并通 过建行提供三年贷款;符合以上条件的交易有 多少销售收益?
需要通过多个维度表中的属性分析所有这些事实。
一个查询中会用到每个商业维度表的部分或者 全部属性。
从需求到数据设计
维度建模基础 这些表在维度模型中如何安排?前提:
Eg. 商店面积 、产品包装尺寸或重量
星型模式
事实表的内容与特点
事实表:键+指标+退化的维度
Order Measures
Product_key Order_date_key Salesperson_key Customer_key Order_Dollars Cost Margin_Dollars Quantity_Sold Order_number Order_Line
•细长:表很长,但不宽,大量的记录 •键:所有维度表主键连接起来的组合键。 •稀疏的数据:事实表中可能会存在数据隔 断 退化的维度:数据元素既不是事实,也不是 维度,但对于分析有用。保留在事实表中。
事实的“可加和性” ——Sumable?
可加性非常重要,因为DW很少检索单个事实表记录 完全加和
事实表主键的选择
Chapter Ten 维度建模的原则
Contents
从需求到数据设计 星型模式 星型模式的键 星型模式的优势
星型模式的表关系
从前面的讨论可以得出的结论
星型模式是一种关系模型,非规范化的 关系 维度表与事实表之间是1:N的关系
更复杂的模型: 维度表与维度表的多对多关系 维度表与事实表的多对多关系
星型模型是一种以查询为中心的结构 简单、清洗的连接路径以及星星模型本身的结构使得 查询在维度表和事实表之间顺利、流畅、高效
代理机构
婚否
家庭大小 已拥有车辆数 家庭财产 拥有/租用
单独品牌标记
第一次操作日期
事实:实际销售价格、MSRP销售价格、配件价格、全价、经销商附加部
件、经销商信用、经销商发票、预付定金、收益、贷款
从需求到数据设计
维度建模基础
Example:将所有的信息集成在一起,显示了如何由信息包表构 造不同的维度表(就是关系、表)
每个事实表都包含特定业务过程相关的度 量
Eg. 下单 、显示一网页 、处理一客户服务请求
事实表中的一条记录是一个度量事件 事件通常有数字值,用来量化大量的事件, 这些数字称为事实(Fact)
Eg. 定购数量、销量、呼叫持续时间
离散的描述信息的数字型数据不是事实, 它们用于约束查询而不是求和
使用最低粒度的好处
可以频繁容易地从操作型系统抽取数据 很多数据挖掘需要最低层次 便于向下钻取 存储和维护的代价 实际处理中,我们构建汇总事实表来支持汇总数据查 询
使用最低粒度的缺点
Chapter Ten 维度建模的原则
Contents
从需求到数据设计 星型模式 星型模式的键 星型模式的优势
代理键的优势
保证源系统中的键的意外管理变化不会影响DW 允许DW整合多个源系统中具有不同键的相同数据 (Eg. 顾客) 允许在维度表中添加源系统不存在的行(Eg. DimTime表中的“日期未知”) 提供跟踪属性随事件变化的方法 与大型字符或GUID键相比,整型的代理键可提高查询 与处理性能 代价:ETL中的查找——代理键管道
维度表的主键——代理键
代理键(替代键、无意义键、人工键)
选择维度表主键的原则
避免维度表中的主键有内在的含义。传统的OLTP系 统中的主键都有内在含义,例如产品编码 不要用OLTP系统中的键作为维度表的主键
替代键是系统生成的简单的序列号码(通常是 整数),没有任何内在含义。OLTP中表的键一 般作为一个附加属性存放在维度表当中。
模型应该为数据访问提供最好的方式 解决方法: 这个模型必须以查询为中心 •将事实表放在中央,维度表安排在事实 表的四周能够满足这些要求。 它必须为查询和分析而接收优化 模型必须显示出事实表和维度表之间的相互作 •事实表位于星型中央,维度表分布在星 用 型的各个角上——星型模式 这个结构必须使每个维度都能有相等的机会与 事实表交互 模型应该允许沿着维度的层次结构下钻或上钻
雇员、 顾客、 产品 、商店
OLTP中,底层数据结构在设计是采用规范化技术,这 些方法将重复属性移至自身所属的表中,从而删除冗 余数据。 将业务对象的所有属性(包含层次结构)重新合并到 单个维度表中的操作称为反规范化。
反规范化包含规范化模型同样的信息与关系,没有丢失任何 信息,而表的复杂性降低了。
DW关注的是经理如何管理业务问题 DW回答全局的问题 反映商业趋势 通过几个商业维度,衡量业务情况
星型模式
构建星型模式是数据仓库建模的基本数据 设计技术。
星型模式
一个简单的星型模式的回顾
Product Product Name SKU Brand Customer 产品名=TV Order Measures 州=Maine
从需求到数据设计
需求的定义完全驱动着数据仓库的数据设计。
需求定义文档 信息包表包括:
商业指标 商业维度 维度内的层次结构
信息包表是数据仓库逻辑数据设计的基础
数据设计就是集中所有的数据结构
一个数据结构是由一组数据元素结合而成的。 逻辑数据设计包括: 决定多种需要的数据元素以及将这些元素组合成数据结构 数据结构之间建立关系
维度表的内容:维度表的集合是星型模式中的关键 部分
维度表键:唯一地确定表的每行 文本属性(很少有计算的数值数据)描述性的 信息。用户使用此描 述构造他们的查询。 非规范化:规范化意味着更多的表,为了高效 查询,查询最好直接从维度表中获得一个属性, 然后直接查询事实表
Customer Customer_Key Name Customer_ID Billing Address Billing City Billing State Billing ZIP Shipping Address
从需求到数据设计
设计决策
选择处理过程:信息包表的主题 选择粒度:数据到底详细到什么程度? 识别维度: 信息包表 选择事实 选择数据库的持久度:保存多旧的历史数据?
从需求到数据设计
维度建模基础
维度建模:将所需的商业维度合并到逻辑数据 模型中去。 信息报表是维度建模的基础:三类数据实体
事实表是数据仓库数据库中最大的表
所占存储空间:大于等于95% 关系事实表对应AS中的”度量组”
不含事实的事实表
一些业务过程没有任何实际度量的事件,如发生 事件,系统就添一项,否则,系统没有任何记 录。——事实表表示事件的时候
Example:需要用“1”表示出勤了么?No
日期维 学生维 教师维 教室维
课程维
日期键 课程键 教师键 学生键 教室键
跟踪学生出勤情况的事实表
粒度
事实表中包含信息的详细程度称为粒度。每个 事实表必须只有一种粒度。
最低粒度 事实表的基本层次是所有相应维度自然的最低层 次。