数据仓库设计编码规范3.0

合集下载

数据库编码规范

数据库编码规范

数据库编码规范V1.02022-8-28目的范围术语设计概要命名规范(逻辑对象)数据库对象命名脚本注释数据库操作原则常用字段命名(参考)1)目的为了统一公司软件开辟的设计过程中关于数据库设计时的命名规范和具体工作时的编程规范,便于交流和维护,特制定此规范。

2)范围本规范合用于开辟组全体人员,作用于软件项目开辟的数据库设计、维护阶段<3)术语数据库对象:在数据库软件开辟中,数据库服务器端涉及的对象包括物理结构和逻辑结构的对象。

物理结构对象:是指设备管理元素,包括数据文件和事务日志文件的名称、大小、目录规划、所在的服务器计算极名称、镜像等,应该有具体的配置规划。

普通对数据库服务器物理设备的管理规程,在整个项目/产品的概要设计阶段予以规划。

逻辑结构对象:是指数据库对象的管理元素,包括数据库名称、表空间、表、字段/域、视图、索引、触发器、存储过程、函数、数据类型、数据库安全性相关的设计、数据库配置有关的设计以及数据库中其他特性处理相关的设计等。

4)设计概要设计环境<数据库:ORACLE9i、MSSQLSERVER2000 等,操作系统:LINUX7.1 以上版本,显示图形操作界面;RedHat9 以上版本WINDOWS2000SERVER 以上设计使用工具手使用PowerDesigner 做为数据库的设计工具,要求为主要字段做详尽说明。

对于SQLServer 尽量使用企业管理器对数据库进行设计,并且要求对表,字段编写详细的说明(这些将作为扩展属性存入SQLServer 中) 手通过PowerDesigner 定制word 格式报表,并导出word 文档,作为数据字典保存。

(PowerDesignerv10 才具有定制导出word 格式报表的功能)<对于SQLServer 一旦在企业管理器进行数据库设计时加入扩展属性,就可以通过编写简单的工具将数据字典导出。

4 编写数据库建数据库、建数据库对象、初始化数据脚本文件设计原则4 采用多数据文件手禁止使用过大的数据文件,unix 系统不大于2GB,window 系统不超过500MB$oracle 数据库中必须将索引建立在索引表空间里。

数据仓库规范

数据仓库规范

数据仓库规范一.数据仓库层次结构规范1.1 基本分层结构系统的信息模型从存储的内容方面可以分为,STAGE接口信息模型、ODS/DWD信息模型,MID信息模型、DM信息模型、元数据信息模型。

在各个信息模型中存储的内容如下描述:1) SRC接口层信息模型:提供业务系统数据文件的临时存储,数据稽核,数据质量保证,屏蔽对业务系统的干扰,对于主动数据采集方式,以文件的方式描述系统与各个专业子系统之间数据接口的内容、格式等信息。

与该模型对应的数据是各个专业系统按照该模型的定义传送来的数据文件。

STAGE是生产系统数据源的直接拷贝,由ETL过程对数据源进行直接抽取,在格式和数据定义上不作任何改变。

与生产系统数据的唯一不同是,STAGE层数据具有时间戳。

STAGE层存在的意义在于两点:(1)对数据源作统一的一次性获取,数据仓库中其他部分都依赖于STAGE层的数据,不再重复进行抽取,也不在生产系统上作运算,减小生产系统的压力;(2)在生产系统数据已经刷新的情况下,保存一定量的生产系统的历史数据,以便在二次抽取过程中运算出错的情况下可以进行回溯。

2) ODS/DWD层(对应原模型的ODS和DW层)信息模型:简称DWD层是数据仓库的细节数据层,是对STAGE层数据进行沉淀,减少了抽取的复杂性,同时ODS/DWD的信息模型组织主要遵循企业业务事务处理的形式,将各个专业数据进行集中。

为企业进行经营数据的分析,系统将数据按分析的主题的形式存放,跟STAGE层的粒度一致,属于分析的公共资源。

3) MID 信息模型:轻度综合层是新模型增加的数据仓库中DWD层和DM层之间的一个过渡层次,是对DWD层的生产数据进行轻度综合和汇总统计。

轻度综合层与DWD的主要区别在于二者的应用领域不同,DWD的数据来源于生产型系统,并为满足一些不可预见的需求而进行沉淀;轻度综合层则面向分析型应用进行细粒度的统计和沉淀。

4) DM信息模型:为专题经营分析服务,系统将数据按分析的专题组织成多维库表的形式存放,属于分析目标范畴的数据组织与汇总,属于分析的专有资源。

数据库设计说明书编写规范(国标)

数据库设计说明书编写规范(国标)

<项目名称>数据库设计说明书作者:完成日期:签收人:签收日期:修改情况记录:目录1 引言 (1)1.1 编写目的 (1)1.2 背景 (1)1.3 定义 (1)1.4 参考资料 (1)2 外部设计 (1)2.1 标识符和状态 (1)2.2 使用它的程序 (2)2.3 约定 (2)2.4 专门指导 (2)2.5 支持软件 (2)3 结构设计 (3)3.1 概念结构设计 (3)3.2 逻辑结构设计 (3)3.3 物理结构设计 (3)4 运用设计 (3)4.1 数据字典设计 (3)4.2 安全保密设计 (4)1 引言1.1 编写目的说明编写这份数据库设计说明书的目的,指出预期的读者范围。

1.2 背景说明:a.待开发的数据库的名称和使用此数据库的软件系统的名称;b.列出本项目的任务提出者、开发者、用户以及将安装该软件和这个数据库的单位。

1.3 定义列出本文件中用到的专门术语的定义和缩写词的原词组。

1.4 参考资料列出要用到的参考资料,如:a.本项目的经核准的计划任务书或合同、上级机关的批文;b.属于本项目的其他已发表的文件;c.本文件中各处引用的文件、资料,包括所要用到的软件开发标准。

列出这些文件的标题、文件编号、发表日期和出版单位,说明能够得到这些文件资料的来源。

2 外部设计2.1 标识符和状态联系用途,详细说明用于唯一地标识该数据库的代码、名称或标识符,附加的描述性信息亦要给出。

如果该数据库属于尚在实验中、尚大测试中或是暂时使用的,则要说明这一特点及其有效时间范围。

2.2 使用它的程序列出将要使用或访问此数据库的所有应用程序,对于这些应用程序的每一个,给出它的名称和版本号。

2.3 约定陈述一个程序员或一个系统分析员为了能使用此数据库而需要了解的建立标号、标识的约定,例如用于标识数据库的不同版本的约定和用于标识库内各个文卷、记录、数据项的命名约定等。

2.4 专门指导向准备从事此数据库的生成、从事此数据库的测试、维护人员提供专门的指导,例如将被送入数据库的数据的格式和标准、送入数据库的操作规程和步骤,用于产生、修改、更新或使用这些数据文卷的操作指导。

数据库设计规范_编码规范

数据库设计规范_编码规范

数据库设计规范_编码规范数据库设计规范包括数据库表结构的设计原则和数据库编码规范。

数据库表结构的设计原则包括表的命名规范、字段的命名规范、主键和外键的设计、索引的使用、约束的定义等。

数据库编码规范包括SQL语句的书写规范、存储过程和函数的命名规范、变量和参数的命名规范、注释的使用等。

1.表的命名规范-表名使用有意义的英文单词或短语,避免使用拼音或缩写。

- 使用下划线(_)作为单词之间的分隔符,如:user_info。

- 表名使用单数形式,如:user、order。

2.字段的命名规范-字段名使用有意义的英文单词或短语,避免使用拼音或缩写。

- 字段名使用小写字母,使用下划线(_)作为单词之间的分隔符,如:user_name。

- 字段名要具有描述性,可以清楚地表示其含义,如:user_name、user_age。

3.主键和外键的设计-每张表应该有一个主键,用于唯一标识表中的记录。

- 主键字段的命名为表名加上“_id”,如:user_id。

- 外键字段的命名为关联的表名加上“_id”,如:user_info_id,指向user_info表的主键。

4.索引的使用-对于经常用于查询条件或连接条件的字段,可以创建索引,提高查询性能。

-索引的选择要权衡查询性能和写入性能之间的平衡。

-不宜为每个字段都创建索引,避免索引过多导致性能下降。

5.约束的定义-定义必要的约束,保证数据的完整性和一致性。

-主键约束用于保证唯一性和数据完整性。

-外键约束用于保证数据的一致性和关联完整性。

6.SQL语句的书写规范-SQL关键字使用大写字母,表名和字段名使用小写字母。

-SQL语句按照功能和逻辑进行分行和缩进,提高可读性。

-使用注释清晰地描述SQL语句的功能和用途。

7.存储过程和函数的命名规范-存储过程和函数的命名要具有描述性,可以清楚地表示其功能和用途。

-使用有意义的英文单词或短语,避免使用拼音或缩写。

- 使用下划线(_)作为单词之间的分隔符,如:get_user_info。

数据仓库命名规范

数据仓库命名规范

数据仓库命名规范数据仓库命名规范是指在设计和创建数据仓库时,为各个数据仓库对象(例如表、列、视图等)和元数据(例如字段、参数等)指定的名称格式和规范。

命名规范的目的是为了提高数据仓库的可维护性、可理解性和可扩展性,使数据仓库的使用更加方便和高效。

下面是一些常用的数据仓库命名规范:1. 对象命名规范:- 使用有意义的名称:对象的名称应该能够反映该对象的用途和含义,方便用户理解和识别。

- 使用简洁明了的词汇:尽量使用简洁明了的英文单词或缩写,避免使用过长或混淆的命名。

- 避免使用特殊字符和空格:对象的名称应该只包含字母、数字和下划线,避免使用特殊字符和空格。

- 避免使用数据库关键字:不要使用数据库系统保留的关键字作为对象的名称,以免引起冲突和错误。

2. 字段命名规范:- 使用统一的命名风格:字段命名应该使用统一的命名风格,例如驼峰命名法或下划线命名法,便于阅读和编写SQL查询。

- 使用有意义的字段名:字段的名称应该能够反映该字段的含义和作用,方便用户理解和使用。

- 避免使用冗余和过长的字段名:字段的名称应该尽量简短,避免冗余和过长的命名,有助于提高数据仓库的性能和可维护性。

- 使用统一的字段前缀:可以使用统一的字段前缀,例如"dim_"表示维度表字段,"fact_"表示事实表字段等。

3. 表命名规范:- 使用有意义的表名:表名应该能够反映表的内容和含义,方便用户理解和识别。

- 使用统一的命名风格:表名可以使用统一的命名风格,例如首字母大写或下划线命名法。

- 使用复数形式的表名:表名应该使用复数形式,以区分表和字段的命名。

- 使用有意义的表前缀:可以使用有意义的表前缀,例如"dim_"表示维度表,"fact_"表示事实表等。

4. 视图命名规范:- 使用有意义的视图名:视图的名称应该能够反映视图的内容和用途,方便用户理解和使用。

数据库设计规范范文

数据库设计规范范文

数据库设计规范范文1.数据库命名规范:-数据库名称应简洁、具有描述性,并且易于理解和识别。

-避免使用特殊字符、空格和汉字。

-采用小写字母和下划线分隔单词,以提高可读性。

2.表设计规范:-表名应具有描述性,简洁明了并与其所代表的实体一致。

- 表名要求使用单数形式,例如"customer"而不是"customers"。

-避免使用数据库关键字作为表名。

-主键应该是唯一的且不可为空,使用自增长或GUID等机制来确保唯一性。

-尽量避免使用冗余字段,如果需要使用,则使用触发器或存储过程来维护数据一致性。

3.字段设计规范:-字段名应具有描述性,简洁明了并与其所代表的数据类型一致。

-字段名要求使用小写字母和下划线分隔单词,以提高可读性。

-避免使用数据库关键字作为字段名。

-字段类型应选取合适的数据类型,以节省存储空间和提高查询效率。

-字段的长度应根据实际需求来设定,避免使用过长或过短的字段长度。

4.索引设计规范:-索引应根据查询需求和数据分布情况来创建,以提高查询性能。

-对于频繁进行查询、排序和连接操作的字段,应考虑创建索引。

-避免创建过多的索引,因为索引会占用额外的存储空间,并影响写操作的性能。

-对于经常更新的表,尽量减少索引的数量和大小,以提高更新操作的性能。

-定期检查和优化索引,以确保索引的有效性和最佳性能。

5.视图和存储过程设计规范:-视图应尽量简洁明了、易于维护,只返回必要的字段和数据。

-存储过程应具有描述性、易于理解和使用。

-存储过程应尽量减少对数据库的直接操作,以提高性能和安全性。

-视图和存储过程的命名应具有描述性,并符合命名规范。

6.数据库安全性规范:-限制数据库登录账号的权限,并定期检查和更新密码。

-对敏感数据进行加密,以防止数据泄露。

-使用防火墙和安全策略来防止未授权的访问。

-定期备份和恢复数据库,以防止数据丢失和损坏。

-对数据库进行监控,及时发现和解决潜在的安全问题。

数据仓库国家标准规范最新

数据仓库国家标准规范最新

数据仓库国家标准规范最新随着信息技术的快速发展,数据仓库作为企业数据管理和分析的核心工具,其标准化建设对于确保数据的一致性、安全性和可扩展性至关重要。

以下是关于数据仓库国家标准规范的最新概述:# 数据仓库国家标准规范最新引言数据仓库国家标准规范旨在为企业提供一个统一的数据管理框架,以支持数据的集成、存储、管理和分析。

这些规范有助于提升数据处理的效率,降低运营成本,并确保数据的准确性和可靠性。

1. 数据定义和分类- 明确数据的定义,包括结构化数据和非结构化数据。

- 根据业务需求和数据特性,对数据进行合理分类。

2. 数据集成- 规定数据集成的方法和流程,确保数据源的多样性和数据的一致性。

- 采用ETL(Extract, Transform, Load)等技术实现数据的抽取、清洗和加载。

3. 数据存储- 规定数据存储的格式和结构,支持关系型数据库和非关系型数据库的存储需求。

- 确保数据存储的安全性,包括数据备份和灾难恢复机制。

4. 数据质量管理- 制定数据质量标准,包括数据的准确性、完整性、一致性和时效性。

- 实施数据质量监控和评估机制,及时发现并纠正数据问题。

5. 数据安全与隐私保护- 规定数据访问控制和权限管理,确保数据的安全性。

- 遵守相关的数据保护法规,保护个人隐私和敏感信息。

6. 数据分析与报告- 规定数据分析的方法和工具,支持高级分析和数据挖掘。

- 制定报告生成的标准格式,确保报告的一致性和可读性。

7. 数据治理- 明确数据治理的职责和流程,包括数据的所有权、使用权和责任。

- 建立数据治理委员会,负责监督和指导数据仓库的建设和维护。

8. 技术标准和接口规范- 规定数据仓库的技术架构和接口标准,确保系统的兼容性和扩展性。

- 支持开放标准和API,促进数据的共享和互操作。

结语数据仓库国家标准规范的最新发展,为企业提供了一个坚实的数据管理基础。

通过遵循这些规范,企业能够更有效地利用数据资源,提升决策质量和业务竞争力。

数据库设计规范_编码规范

数据库设计规范_编码规范

数据库设计规范_编码规范1.命名规范:表名、字段名和约束名应该具有描述性,遵循一致的命名规则。

避免使用保留字作为名称,使用下划线或驼峰命名法。

2.数据类型选择:选择合适的数据类型来存储数据,避免过大或过小的数据类型。

这有助于减小数据库的存储空间,提高查询性能。

3.主键和外键:每个表都应该有一个主键来唯一标识每条记录。

外键用于建立表之间的关系,确保数据的一致性和完整性。

4.表的范式:根据具体需求,遵循规范化设计原则。

将数据分解为多个表,减少数据冗余和更新异常。

5.索引设计:根据查询需求和数据量,设计适当的索引。

避免过多或不必要的索引,以减小索引维护的开销。

6.分区设计:对大型表进行分区,将数据分散存储在不同的物理磁盘上,提高查询性能。

7.安全性设计:为数据库设置适当的权限和访问控制,限制不必要的用户访问和操作。

数据库编码规范:1.编码一致性:统一使用同一种编码方式,如UTF-8,避免不同编码之间的转换问题。

2.参数化查询:使用参数化查询语句,预编译SQL语句。

这样可以防止SQL注入攻击,提高查询性能。

3.事务管理:使用事务控制语句(如BEGIN、COMMIT和ROLLBACK)来管理数据库事务,确保数据的一致性和完整性。

4.错误处理:在代码中捕获和处理数据库错误和异常,提高系统的容错性。

5.SQL语句编写:编写简洁且优化的SQL语句,避免使用多个嵌套的子查询,使用JOIN操作符进行表之间的关联。

6.数据库连接管理:优化数据库连接,避免频繁地打开和关闭数据库连接。

7.缓存机制:对于频繁查询的数据,使用缓存机制来减少数据库的压力。

8.日志记录:记录数据库操作日志,包括增删改查的操作,以便后续的问题跟踪和审计。

综上所述,数据库设计规范和编码规范对于确保数据库系统的性能、安全性和可维护性至关重要。

遵循这些规范能够提高数据库系统的效率和可靠性,减少潜在的问题和风险。

因此,在进行数据库设计和编码时,应该遵循这些规范。

wms编码规则

wms编码规则

WMS(仓库管理系统)的编码规则通常根据仓库的实际情况和需求进行定制。

以下是一些常见的编码规则:
1. 物料编码:每个物料都应有唯一的编码,通常由物料类型、物料编号、版本号等信息组成。

这样可以方便系统对物料进行识别和管理。

2. 仓库编码:每个仓库都应有唯一的编码,通常由仓库编号、区域编号等信息组成。

这样可以方便系统对仓库进行识别和管理。

3. 货位编码:每个货位都应有唯一的编码,通常由货位编号、货架编号、通道编号等信息组成。

这样可以方便系统对货位进行识别和管理。

4. 批次编码:每个批次都应有唯一的编码,通常由生产日期、生产批次号等信息组成。

这样可以方便系统对批次进行识别和管理。

5. 供应商编码:每个供应商都应有唯一的编码,通常由供应商编号、供应商名称等信息组成。

这样可以方便系统对供应商进行识别和管理。

在制定编码规则时,需要考虑以下几点:
1. 唯一性:确保每个编码都是唯一的,不会与其他编码重复。

2. 可读性:编码应具有一定的可读性,方便操作人员快速查找和识别。

3. 稳定性:编码应具有一定的稳定性,不会频繁更改。

4. 扩展性:编码应具有一定的扩展性,可以适应仓库未来的发展需求。

总之,WMS的编码规则需要根据实际情况和需求进行定制,以确保系统的稳定性和可扩展性。

数据仓库开发规范

数据仓库开发规范

数据仓库设计与开发规范1概述2数据仓库设计规范2.1命名规范数据仓库库表的命名规范命名规范➢RAW表:RAW+源表名称➢中间表:MID+源表名称➢如果表名字符长度超过32位,则在源表名称中英文字母缩写替换英文单词表字段命名规范命名规范数据库字段的命名必须遵循以下规范:➢采用有意义的字段名。

字段的名称必须是易于理解,能表达字段功能的英文单词或缩写英文单词,无论是完整英文单词还是缩写英文单词,单词首字母必须大写。

➢系统中属于是业务范围内的编号的字段,其代表一定的业务信息,这样的字段建议命名为:代表当前这字段含意的英文单词+ “ID”➢尽量遵守第三范式的标准(3NF)。

✧表内的每一个值只能被表达一次✧表内的每一行都应当被唯一的标示✧表内不应该存储依赖于其他键的非键信息存储过程命名规范命名规范➢存贮过程的命名请遵循以下命名规范:P_ MID_+ 业务逻辑(英文单词或缩写)如:P_MID_PUB_TRADE_BUY设计规范在存贮过程中必须说明以下内容:➢名称:存贮过程。

➢描述:描述存储过程的作用➢创建者:首次创建此存贮过程的人的姓名。

在此请使用中文全名,不允许使用英文简称。

➢修改者、修改日期、修改原因:如果有人对此存贮过程进行了修改,则必须在此存贮过程的前面加注修改者姓名、修改日期及修改原因。

➢对存贮过程各参数及变量的中文注解。

示例如下:-- =============================================-- procedurename: P_MID_PUB_TRADE_BUY-- description : 公募交易表-- author : 张三-- create date : 2015-07-17--source_table : raw_tp_dis_trade_app_rec--target_table : MID_PUB_TRADE_BUY--modified :修改日期:2015-07-20 修改原因及内容-- =============================================视图命名规范命名规范➢视图的命名请遵循以下命名规范:V_ +_操作的表名(不带前缀)或功能的英文单词或英文单词缩写。

常见的数仓命名规则

常见的数仓命名规则

常见的数仓命名规则数据仓库的命名规则在数据仓库领域,命名规则对于数据管理和数据分析非常重要。

一个合理的命名规则可以提高数据仓库的可维护性和可理解性。

下面是一些常见的数仓命名规则:1. 表名和字段名要有意义:表名和字段名应该准确地描述数据的含义。

避免使用模糊或不明确的名称,以免给数据分析带来困扰。

2. 使用下划线分隔单词:为了增加可读性,建议在表名和字段名中使用下划线来分隔单词。

例如,"user_id"比"userID"更易于理解。

3. 使用缩写词:在命名中使用常见的缩写词可以节省空间并提高可读性。

例如,使用"cust_id"代替"customer_id"。

4. 避免使用特殊字符:在命名中避免使用特殊字符,如空格、斜杠、反斜杠等。

这些字符在某些数据库中可能引起问题。

5. 使用一致的命名风格:在整个数据仓库中使用一致的命名风格可以提高可维护性。

例如,可以选择使用小写字母和下划线的组合来命名所有的表和字段。

6. 避免使用过长的命名:命名应该简洁明了,不要过于冗长。

过长的命名可能会导致命名混乱和错误。

7. 命名应具有层次结构:表名和字段名应该具有层次结构,以反映数据的关系。

例如,可以使用"dim_"前缀表示维度表,"fact_"前缀表示事实表。

8. 避免使用保留字:在命名中避免使用数据库中的保留字,以免引起冲突。

9. 使用可排序的命名:为了方便排序和查找,建议在命名中使用有意义的排序规则,如按照字母顺序或按照日期顺序。

10. 命名要具有可扩展性:命名应该具有可扩展性,以便将来可以方便地添加新的表和字段。

一个好的数据仓库命名规则可以提高数据管理和数据分析的效率,减少错误和混乱。

在命名时要注意清晰、简洁、有意义,并保持一致性和可扩展性。

这样可以使数据仓库更易于理解和维护,提高数据分析的准确性和可靠性。

数仓字段类型设计要求

数仓字段类型设计要求

数仓字段类型设计要求一、整数型字段类型设计要求整数型字段用于存储整数值,其设计要求如下:1. 字段长度:根据实际数值范围确定字段长度,避免出现溢出问题。

2. 是否可为空:根据业务需求确定字段是否可为空。

3. 默认值:根据业务规则设置默认值,避免数据缺失。

二、浮点型字段类型设计要求浮点型字段用于存储带小数点的数值,其设计要求如下:1. 字段长度:根据实际数值范围确定字段长度,避免出现精度丢失问题。

2. 小数位数:根据业务需求确定小数位数,避免过多或过少的精度。

3. 是否可为空:根据业务需求确定字段是否可为空。

4. 默认值:根据业务规则设置默认值,避免数据缺失。

三、字符串型字段类型设计要求字符串型字段用于存储文本信息,其设计要求如下:1. 字段长度:根据业务需求确定字段长度,避免文本截断问题。

2. 是否可为空:根据业务需求确定字段是否可为空。

3. 默认值:根据业务规则设置默认值,避免数据缺失。

4. 字符集:根据业务需求确定字符集,避免乱码问题。

四、日期型字段类型设计要求日期型字段用于存储日期和时间信息,其设计要求如下:1. 数据格式:根据业务需求确定日期和时间的格式,避免数据解析错误。

2. 是否可为空:根据业务需求确定字段是否可为空。

3. 默认值:根据业务规则设置默认值,避免数据缺失。

五、布尔型字段类型设计要求布尔型字段用于存储逻辑真假值,其设计要求如下:1. 是否可为空:根据业务需求确定字段是否可为空。

2. 默认值:根据业务规则设置默认值,避免数据缺失。

六、枚举型字段类型设计要求枚举型字段用于存储预定义的离散值,其设计要求如下:1. 枚举值列表:根据业务需求确定可选的枚举值列表,避免数据不一致问题。

2. 是否可为空:根据业务需求确定字段是否可为空。

3. 默认值:根据业务规则设置默认值,避免数据缺失。

七、数组型字段类型设计要求数组型字段用于存储多个数值或文本值,其设计要求如下:1. 数据类型:确定数组元素的数据类型,避免数据类型不匹配问题。

数据库命名设计规范

数据库命名设计规范

一、数据库表及字段1.数据库表的命名规范:表的前缀应该用系统或者模块的英文名的缩写(全部大写)。

如果系统功能简单,没有划分为模块,则可以以系统英文名称的缩写作为前缀,否则以各模块的英文名称缩写作为前缀。

例如:如果有一个模块叫做 BBS(缩写为 BBS),那末你的数据库中的所有对象的名称都要加之这个前缀: BBS_ + 数据库对象名称, BBS_CustomerInfo 标示论坛模块中的客户信息表。

表的名称必须是易于理解,能表达表的功能的英文单词或者缩写英文单词,无论是完整英文单词还是缩写英文单词,单词首字母必须大写。

如果当前表可用一个英文单词表示的,请用完整的英文单词来表示;例如:系统资料中的客户表的表名可命名为:SYS_Customer。

如果当前表需用两个或者两个以上的单词来表示时,尽量以完整形式书写,如太长可采用两个英文单词的缩写形式;例如:系统资料中的客户物料表可命名为:SYS_CustItem。

表名称不应该取得太长(普通不超过三个英文单词)。

表名长度不能超过 30 个字符,表名中含有单词全部采用单数形式,单词首字母必须大写。

在命名表时,用单数形式表示名称。

例如,使用 Employee,而不是 Employees。

对于有主明细的表来说。

明细表的名称为:主表的名称 + 字符 Dts。

例如:采购定单的名称为: PO_Order,则采购定单的明细表为:PO_OrderDts;对于有主明细的表来说,明细表必须包含两个字段:主表关键字、 SN,SN 字段的类型为 int 型,目的为与主表关键字联合组成明细表的关键字,以及标示明细记录的先后顺序,如1,2,3……。

表必须填写描述信息,后台表名尽量与前台表名相同,后台独有的表应以_b 作为后缀。

如 r_gggd_b。

数据库表的命名采用如下规则:1)表名用模块名_开头,表名长度不能超过 30 个字符,表名中含有单词全部采用单数形式,单词首字母必须大写。

2)多个单词间用下划线(_)进行连接。

规划数据库类型代码

规划数据库类型代码

规划数据库类型代码数据库类型代码是用于标识数据库类型的一种标准化编码系统。

它对于数据库管理和数据交换非常重要,能够提供统一的标识和分类方式,方便数据库管理员和开发人员进行数据库规划、设计和维护工作。

一、引言数据库类型代码的规划是为了满足不同数据库系统之间的互操作性需求,使得不同的数据库系统能够进行数据交换和共享。

本文将详细介绍数据库类型代码的规划过程和标准格式。

二、数据库类型代码规划过程1. 确定数据库类型分类根据数据库系统的特点和用途,将数据库类型进行分类,例如关系型数据库、面向对象数据库、文档数据库等。

每个分类下可以进一步细分为具体的数据库产品。

2. 分配分类代码为每个数据库类型分类分配唯一的代码,通常采用数字或字母进行表示。

代码应具有一定的规律性,方便数据库管理员和开发人员进行识别和查询。

3. 编写数据库类型代码标准格式数据库类型代码应具备一定的标准格式,包括代码名称、代码描述和代码示例。

代码名称应简洁明了,能够准确描述该数据库类型的特点和用途。

代码描述应详细介绍该数据库类型的结构、功能和应用场景。

代码示例应提供一个具体的数据库产品作为示例,以便更好地理解该数据库类型。

4. 审核和发布数据库类型代码标准编写完数据库类型代码标准格式后,需要进行审核和发布。

审核过程中应确保代码的准确性、完整性和一致性。

发布后,应将标准格式文档进行存档和备份,以备后续使用和参考。

三、数据库类型代码标准格式示例代码名称:关系型数据库代码描述:关系型数据库是一种基于关系模型的数据库,采用表格的形式来组织和存储数据。

它具有结构化、可扩展和数据一致性的特点,适用于需要高度数据一致性和事务支持的应用场景。

关系型数据库常见的产品有Oracle、MySQL、SQL Server等。

代码示例:名称:Oracle描述:Oracle是一种功能强大的关系型数据库管理系统,具有高性能、高可用性和高安全性的特点。

它支持复杂的查询操作、事务处理和数据完整性约束,适用于大型企业级应用和数据仓库系统。

数据仓库建设规范(文档版)

数据仓库建设规范(文档版)

数据仓库建设规范(⽂档版)1 概述本⽂档制定了XX数据仓库中数据库对象的命名规范(⽤户、表、视图、存储过程、函数、表分区、主键、索引、序列等)、数据库编程规范,JAVA编程规范为系统设计和开发⼯作提供统⼀的命名标准,提⾼系统的规整性和代码的可读性,减轻维护⼯作量,提⾼⼯作效率。

2 数据库对象命名规范2.1 层次划分序号模型层次⽤途1ODS存放来⾃各个系统的原始数据;2DW根据业务分析需求,对主题域内的数据进⾏轻度汇总;3DM建⽴跨域的业务主题模型;4DIM统⼀服务于数据中⼼的参数表;5APP应⽤层,⽤于⽣成报表6XX XX数据层级按照⾃⼰数据仓库规划的命名即可~2.2 表、视图、存储过程、函数命名规范<对象类型><_模型层次><_主题><_对象描述>[_汇总类型][_存储类型]说明:<> 尖括号中的内容为必须项,适⽤于所有⽤户层对象,[] ⽅括号中的内容为可选项,会因⽤户层及对象的不同⽽不同命名约束:数据库对象命名可能受最⼤长度限制,因此在实际命名中如果按照规范约定的命名⽅式存在超长的现象,需要开发⼈员灵活控制。

2.2.1 对象类型<对象类型><_模型层次><_主题域><_对象描述>[_汇总类型][_存储类型]。

适⽤范围:所有⽤户层对象。

对象类型对象说明TB TABLE表VW VIEW视图………………2.2.2 模型层次<对象类型><_模型层次><_主题域><_对象描述>[_汇总类型][_存储类型]说明:对象属性⼀般为对象归属⽤户的简写。

适⽤范围:所有⽤户层对象。

可以参照⾃⼰的对象属性命名规范,对此不要求统⼀。

模型层次说明ODS获取层,存放从各个源系统接收的原始数据;DW 根据业务分析需求,对数据进⾏汇总,应⽤分析原则优先访问DW层,其次DWD层,不允许访问ODS层;DM建⽴跨域的业务主题模型;DIM维表APP报表层,根据DM模型数据⽣成报表。

数据库设计编码规范

数据库设计编码规范

SQL Serve数据库设计规范一、数据库命名规范:对象前缀命名:前缀命名一般用小写表的前缀:业务模块组名前缀数据列的前缀:一般采用列的数据类型做前缀存储过程前缀:udp ,系统存储过程(sp)自定义函数前缀:udf(User define function)视图前缀:udv(User Define View)表示用户自定义视图自定义规则前缀:udr(User Define rule)用户自定义规则自定义约束前缀:uck(User Checker)用户自定义约束索引前缀:idx(Index)表示索引主键前缀:pk(primary keys)表示主键数据列的前缀示例:编号 1 2 3 4 5 6 7数据类型char varchar int smallint datetime money numeric 前缀 c vc i si dt m n 编号8 9 10 11 12 13数据类型decimal float bit binary image text前缀 d f b b img tx二、数据库设计规范:1、每个表中都可以考虑添加的的几个有用的字段RecoredID,记录唯一编号,不建议采用业务数据作为记录的唯一编号CreationDate,在SQL Server 下默认为GETDATE()RecordCreator,在SQL Server下默认为NOT NULL DEFAULT USERRecordVersion,记录的版本标记;有助于准确说明记录中出现null 数据或者丢失数据的原因2、数据类型:字符类型一般不建议采用char而采用varchar数据类型,除非当这列数据的长度特别固定时可以考虑用char。

数值类型如果表示金额货币建议用money型数据,如果表示科学记数建议用numeric数据类型记录标识一般采用int类型标识唯一一行记录。

自增or 非自增3、索引:所有的表都应该有一个主键索引,这对提高数据库的性能很有帮助根据使用频率决定哪些字段需要建立索引,选择经常作为连接条件、筛选条件、聚合查询、排序的字段作为索引的候选字段。

数据库设计规范范文

数据库设计规范范文

数据库设计规范范文1.命名规范:-表名、列名、视图名和索引名应具有描述性。

-避免使用保留字作为对象的名称。

-使用统一的命名约定,如下划线分隔或驼峰命名法。

2.完整性约束:-使用主键和唯一约束来确保数据的唯一性。

-使用外键约束来维护关系的完整性。

-使用检查约束来对列的取值进行限制。

3.规范化:-采用规范化技术来设计数据库模式,确保数据的一致性和有效性。

-将数据拆分成适当的表,避免数据冗余。

-设计合适的关系模式,避免数据的不一致性。

4.数据类型和大小:-选择合适的数据类型和大小,以节省存储空间并提高查询性能。

-避免使用过大或过小的数据类型,以免浪费存储空间或引发数据溢出。

5.索引和查询优化:-为经常使用的列创建索引,以提高查询性能。

-避免创建过多的索引,以减少写操作的开销。

-使用合适的查询语句,避免全表扫描和笛卡尔积。

-使用表分区技术来提高查询和维护的效率。

6.安全性:-对敏感数据采取额外的安全措施,如加密。

-限制对数据库的访问权限,只给予必要的用户访问权限。

-定期备份数据库,以保证数据的安全性和可恢复性。

7.文档化:-对数据库的结构和设计进行文档化,以便于团队成员的理解和维护。

-记录数据库的版本变更和修改历史。

8.性能优化:-定期进行数据库性能评估,对性能瓶颈进行调优。

-优化查询语句,重写复杂的查询,以提高查询性能。

-根据数据特点进行分区设计和冗余数据的优化。

9.数据访问和事务管理:-使用合适的访问控制机制,对数据库进行细粒度的权限控制。

-合理使用事务管理,确保数据的一致性和完整性。

10.数据库监控和日志记录:-监控数据库的运行状态,包括CPU利用率、磁盘空间和内存使用情况等。

-启用数据库的日志功能,记录数据库的操作和错误信息,以便进行故障排查。

综上所述,数据库设计规范是保证数据库系统高效稳定运行的基础,良好的数据库设计规范不仅可以提高数据的安全性和可靠性,还可以提升系统的性能和可维护性。

三区三线数据库字段代码

三区三线数据库字段代码

三区三线数据库字段代码一、引言在数据库设计与管理中,字段代码是非常重要的组成部分。

它们用于定义数据库表中的各个字段的属性和特征,如数据类型、长度、约束等。

本文将介绍三区三线数据库字段代码的相关内容,包括字段命名规范、数据类型选择和约束设置等。

二、字段命名规范字段命名规范是保证数据库字段代码可读性和一致性的基础。

在三区三线数据库中,字段命名应遵循以下几点原则:1. 语义化命名:字段名称应能够准确表达字段所存储的数据含义,避免使用简单的字母或数字组合。

2. 避免冗余:字段名称应尽量避免与表名或其他字段名重复,避免造成混淆和歧义。

3. 使用下划线分隔:多个单词组成的字段名称应使用下划线进行分隔,以提高可读性。

例如,"customer_id"代表客户ID字段。

4. 规范缩写:如果字段名称需要缩写,应遵循常用的缩写规范,并在文档中进行说明。

三、数据类型选择在三区三线数据库中,数据类型的选择应根据实际需求和数据特性来确定。

以下是常用的数据类型及其适用场景:1. 整数型(INT):用于存储整数数据,如用户年龄、商品数量等。

2. 字符串型(VARCHAR):用于存储可变长度的字符串数据,如用户姓名、产品名称等。

3. 小数型(DECIMAL):用于存储精确的小数数据,如商品价格、订单金额等。

4. 布尔型(BOOLEAN):用于存储布尔值,如用户状态(启用/禁用)等。

5. 日期型(DATE):用于存储日期数据,如订单日期、生日等。

四、约束设置约束是用来保证数据库数据完整性和一致性的重要手段。

在三区三线数据库中,可以设置以下几种约束:1. 主键约束(PRIMARY KEY):用于唯一标识表中的每一行数据,保证数据的唯一性和索引效率。

2. 外键约束(FOREIGN KEY):用于建立表与表之间的关系,保证数据的完整性和一致性。

3. 唯一约束(UNIQUE):用于保证字段中的数据唯一,但可以为空。

4. 非空约束(NOT NULL):用于保证字段中的数据不为空。

数据中心数据仓库建设规范模板

数据中心数据仓库建设规范模板

数据中心数据仓库建设规范模板一、项目背景与目标(一)业务背景阐述企业的业务现状和发展趋势,分析当前数据管理和利用中存在的问题和挑战,说明建设数据仓库的必要性。

(二)项目目标明确数据仓库建设的总体目标,例如提高数据质量、实现数据整合与共享、支持数据分析和决策等。

同时,将总体目标分解为具体的、可衡量的阶段性目标。

二、需求分析(一)业务需求与各业务部门进行深入沟通,了解其对数据的需求,包括数据的内容、格式、频率、用途等。

(二)数据需求对业务需求进行转化,确定所需的数据来源、数据类型、数据量、数据粒度等。

(三)性能需求根据业务场景和用户规模,预估数据仓库的查询和处理性能要求,如响应时间、吞吐量等。

三、数据仓库架构设计(一)分层架构通常包括源数据层、数据清洗转换层、数据存储层和数据应用层。

每层的功能和职责要清晰明确。

(二)技术选型根据企业的技术实力、预算和业务需求,选择合适的数据仓库技术平台,如传统的关系型数据库(如 Oracle、SQL Server)、大数据平台(如 Hadoop、Spark)等。

(三)存储设计合理规划数据的存储方式,包括表结构设计、分区策略、索引设计等,以提高数据存储和查询的效率。

四、数据治理与质量管理(一)数据治理框架建立数据治理组织架构,明确各角色的职责和权限,制定数据治理流程和制度。

(二)数据质量评估制定数据质量评估指标和方法,定期对数据进行质量检查和评估。

(三)数据清洗与转换对源数据进行清洗、转换和整合,确保数据的准确性、完整性和一致性。

五、数据安全与隐私保护(一)访问控制建立严格的用户访问权限管理机制,根据用户角色和职责分配不同的数据访问权限。

(二)数据加密对敏感数据进行加密存储和传输,确保数据的安全性。

(三)隐私保护遵循相关法律法规和企业规定,对涉及个人隐私的数据进行妥善处理和保护。

六、数据仓库开发与测试(一)开发流程制定数据仓库的开发流程,包括需求分析、设计、编码、测试、部署等阶段的工作流程和规范。

数据仓库命名规范

数据仓库命名规范

数据仓库命名规范数据仓库命名规范是为了标准化数据仓库中对象的命名,以确保数据仓库中的各个对象能够清晰、规范地表达其含义和用途。

下面是一个简单的数据仓库命名规范,以便于管理和维护数据仓库。

1. 表和视图命名规范:- 对于事实表,使用名词的复数形式。

例如,sales、orders等。

- 对于维度表,使用名词的单数形式,表示维度的含义。

例如,product、customer等。

- 对于视图,使用名词的单数形式,表示视图的含义。

例如,monthly_sales、top_customers等。

2. 列命名规范:- 使用有意义的名称,以描述列中存储的数据。

例如,product_id、order_date等。

- 避免使用缩写,以确保名称的清晰度和一致性。

3. 主键命名规范:- 以表名加上“_id”后缀作为主键的命名。

例如,product_id、customer_id等。

4. 外键命名规范:- 以引用的表名加上“_id”后缀作为外键的命名。

例如,product_id、customer_id等。

5. 索引命名规范:- 以表名加上索引的列名作为索引的命名。

例如,product_category_index、customer_name_index等。

6. 约束命名规范:- 以表名加上约束的类型作为约束的命名。

例如,product_id_pk(主键约束)。

- 对于复合约束,可以在命名中加上多个列的名称。

例如,order_product_unique(唯一约束)等。

7. 存储过程和函数命名规范:- 使用有意义的名称,以描述存储过程或函数的功能。

例如,calculate_total_sales、get_customer_info等。

8. 文件和文件夹命名规范:- 使用有意义的名称,以描述文件或文件夹中的内容。

例如,sales_report_2020.xlsx、customer_data_backup等。

总结起来,数据仓库命名规范的目标是为了让命名清晰、一致、易于理解和维护。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
23
数据库对象命名规范(表)
表命名规范: 表命名规范:
(一)、不使用TAB,TBL,T作为前缀,本来就是一个表,为什么还要说明 (二)、表名以代表表内内容的一个或多个名词组成,以下划线分隔 (三)、表命名包括三部分:XXX_YYY_ZZZ,总长度不超过26个字符。 XXX代表层次域,YYY代表内容域,ZZZ代表功能模块域 (四)、使用表的层次分类作为表名的前缀:如,与事实表相关的表使用 前缀FCT_,与短信搜索相关的使用_SMS后缀,后缀表示按功能划分。相 同功能模块使用相同的后缀。 (五)、一些表作为多对多连接的表,可以使用两个表的内容做为表名, 后缀以_REL结尾,主要应用于OLTP数据库。 (六)、当系统中有一些少量的,重复出现的值时,使用字典表来节约存 储空间和优化查询。如地区,系统中的用户类型等。在OLTP中,以DIC_ 开头,在数据仓库中以DMS_开头。
17
分级存储(二)
在线存储
(核心存储)
近线存储
(二级存储)
离线存储
(三级存储)
在分级存储体系架构中,一般分为 在分级存储体系架构中,一般分为: 在线 (On-line)存储 近线(Near-line)存储 存储 近线 离线(Off-line)存储 存储 离线 三级存储方式。 三级存储方式。 按照数据的不同生命周期制定相应存储机制, 按照数据的不同生命周期制定相应存储机制,降低成本
20
分级存储(五)
离线存储 离线存储则指将数据备份到磁带或磁带库 上。大多数情况下主要用于对在线存储或近线存储 的数据进行备份,以防范可能发生的数据灾难,因 此又称备份级存储。 离线存储通常采用磁带作为存储介质,其访问 速度低,但价格低廉的海量存储。
21
培训大纲
一、目的和范围 二、数据仓库体系架构 三、分级存储(数据生命周期) 四、数据库对象命名规范 数据库对象命名规范 五、SQL编码规范 六、PL/SQL编码规范 七、代码优化规则 八、日志
目的: 好的命名规范,可以明显的增强程序的可读性和可维护性: (1). 保障程序一致性 (2). 增强程序的可读性 (3). 增强程序可维护性 (4). 降低程序的BUG概率 (5). 提升程序可扩展性和性能 范围: 本规范主要适用于所有基于Oracle数据仓库设计开发的项目。
3
培训大纲
一、目的和范围 二、数据仓库体系架构 数据仓库体系架构 三、分级存储(数据生命周期) 四、数据库对象命名规范 五、SQL编码规范 六、PL/SQL编码规范 七、代码优化规则 八、日志
数据仓库设计编码规范(3.0)
上海XX通信有限公司 金刚(seniordba@) 2011-02
培训大纲
一、目的和范围 二、数据仓库体系架构 三、分级存储(数据生命周期) 四、数据库对象命名规范 五、SQL编码规范 六、PL/SQL编码规范 七、代码优化规则 八、日志
2
目的和范围
22
数据库对象命名规范(总纲)
命名规范总纲: 命名规范总纲
(一)、所有名称的字符范围为:A-Z,a-z,0-9和_(下划线),不允许使用其 它字符作为名称。 (二)、采用英文单词或英文短语(包括缩写)作为名称,不能使用无意义 的字符或汉语拼音。 (三)、名称应该清晰明了,能够准确表达事务的含义,最好可读,遵循” 顾名思义”的原则。 (四)、所有标识符(包括表名,字段名,存储过程名,参数名,变量名 等)要求简洁,不要用特殊字符,更不要使用保留字。 (五)、所有标识符必须以字母开头,而不要以数字开头。 (六)、所有数据库对象标识符不要用双引号扩起来。
18
分级存储(三)
在线存储: 在线存储是指将数据存放在高速的磁盘系统( 如闪存存储介质、FC磁盘或SCSI磁盘阵列)等存储设 备上,适合存储那些需要经常和快速访问的程序和 文件,其存取速度快,性能好,存储价格相对昂贵 。 在线存储是工作级存储,其最大特征是存储设 备和所存储的数据时刻保持“在线”状态,可以随 时读取和修改,以满足前端应用服务器和数据库对 数据访问的速度要求。
5
数据仓库基本概念(二)
数据仓库的三种模型: 数据仓库的三种模型: (一)、企业数据仓库(EDW): 数据仓库收集了整个组织关于主题的所有信息,它提供企业范围内的数据 集成,通常来自一个或多个操作数据库系统或外部信息提供者,并且是跨功能的。 通常,它包含细节数据和汇总数据,它需要广泛的商业建模,可能需要多年设计 和建设。 (二)、数据集市 数据集市包含企业范围的一个子集,针对特定的用户群和特定的主题。例 如,销售数据集市可能限定其主题为顾客、商品和销售。包括在数据集市中的数 据通常是汇总的。 (三)、虚拟仓库 虚拟仓库是操作数据库视图的集合。虚拟仓库易于建立,但需要操作数据库 服务器具有剩余能力。
15
培训大纲
一、目的和范围 二、数据仓库体系架构 三、分级存储(数据生命周期) 分级存储( 分级存储 数据生命周期) 四、数据库对象命名规范 五、SQL编码规范 六、PL/SQL编码规范 七、代码优化规则 八、日志
16
分级存储(一)
概念: 分级存储是根据数据的重要性、访问频率、保留时间、容 量、性能等指标,将数据采取不同的存储方式存储在不同性能 的存储设备上,通过分级存储管理实现数据客体在存储设备之 间的自动迁移。 数据分级存储的工作原理是基于数据访问的局部性。 通过将不经常访问的数据自动移到存储层次中较低的层次,释 放出较高成本的存储空间给更频繁访问的数据,可以获得更好 的性价比。这样,一方面可大大减少非重要性数据在一级本地 磁盘所占用的空间,还可加快整个系统的存储性能。
11
数据仓库基本层次结构(四)
2) ODS/DWD层信息模型,简称DWD层 层信息模型,简称 层信息模型 层 是数据仓库的细节数据层,是对STAGE层数据进行沉淀,减少 了抽取的复杂性,同时ODS/DWD的信息模型组织主要遵循企业业务 事务处理的形式,将各个专业数据进行集中。 为企业进行经营数据的分析,系统将数据按分析的主题的形式存 放,跟STAGE层的粒度一致,属于分析的公共资源。
14
数据仓库基本层次结构(七)
5) MDW元数据信息模型 元数据信息模型 描述数据及其环境的数据,即是对数据资源的描述,是信息共享 和交换的基础和前提,用于描述数据集的内容、质量、表示方式、空 间参考、管理方式以及数据集的其它特征。一般来说,它有两方面的 用途。 首先,元数据能提供基于用户的信息,如记录数据项的业务描述 信息的元数据能帮助用户使用数据。 其次,元数据能支持系统对数据的管理和维护,元数据机制主要 支持以下五类系统管理功能: (1). 描述哪些数据在数据仓库中 (2). 定义要进入数据仓库中的数据和从数据仓库中产生的数据 (3). 记录根据业务事件发生而随之进行的数据抽取工作时间安排 (4). 记录并检测系统数据一致性的要求和执行情况 (5). 衡量要求 日分区:PART_YYYYMMDD,分区字段名称为DAY_ID 月分区:PART_YYYYMM , 分区字段名称为MON_ID
13
数据仓库基本层次结构(六)
4) DM信息模型 信息模型 为专题经营分析服务,系统将数据按分析的专题组织成多维库表的 形式存放,属于分析目标范畴的数据组织和汇总,属于分析的专有资 源。 其信息主要来源于DWD和MID层汇总,反映实时的经营状况,时间 维度为天。而历史经营状况的分析,时间维度一般为周,月,同时也 具有季度,年这样的维度。
10
数据仓库基本层次结构(三)
STAGE层存在的意义在于两点: (1).对数据源做统一的一次获取,数据仓库中其它部分都依赖 STAGE层的数据,不再重复进行抽取,也不在生产系统上做运 算,减少生产系统的压力。 (2).在生产系统数据已经刷新的情况下,保存一定量的生产系统 的历史数据,以便在运算出错的情况下可以进行回溯。
7
数据仓库体系架构图
8
数据仓库基本层次结构(一)
系统的信息模型从存储的内容方面可以分为: (一)、STAGE接口信息模型 (二)、ODS/DWD信息模型 (三)、MID信息模型 (四)、DM(DataMart)信息模型 (五)、元数据信息模型
9
数据仓库基本层次结构(二)
在各个信息模型中存储的内容如下描述: 层信息模型: 1) STAGE层信息模型 层信息模型 提供业务系统数据文件的临时存储,数据稽核, 数据质量保证,屏蔽对业务系统的干扰,对于主动数 据采集方式,以文件的方式描述系统与各个专业子系 统之间数据接口的内容、格式等信息。 与该模型对应的数据是各个专业系统按照该模 型的定义传送来的数据文件。 STAGE是生产系统数据源的直接拷贝,由ETL 过程对数据源进行直接抽取,在格式和数据定义上不 作任何改变。
24
数据库表分区设计规范:
表分区设计规范: 表分区设计规范: (一)、分区只应用于大表。(原则上规定记录数>1,000,000) (二)、关于时间范围的分区一律使用NUMBER数据类型,不要使用VARCHAR2或DATE数据类型, 分区类型选择范围分区。 之所有不选择VARCHAR2或DATE,一方面是基于存储和运算效率考虑, 另一方面是是在分区列同时存储日和月维度数据时,难以分离。
4
数据仓库基本概念(一)
数据仓库: 数据仓库: 数据仓库是一个面向主题的,集成的,时变的和非易失的数据集合,支持管 理部门的决策过程。 面向主题的:数据仓库围绕一些主题如顾客、供应商、产品和销售来组织。 数据仓库关注决策者的数据建模与分析,而不是组织机构的日常操作和事务处理。 因此,数据仓库排除对于决策支持过程无用的数据,提供特定主题的简明视图。 集成的:通常,构造数据仓库是将多个异构数据源,如关系数据库,平面文 件和联机事务记录集成在一起。使用数据清理和数据集成技术确保命名约定、编 码结构、属性度量等的一致性。 时变的:数据存储从历史的角度(例如过去3~5年)提供信息。数据仓库中的 关键结构都隐式或显式的包含时间元素。 非易失的:数据仓库总是物理的分别存放数据;这些数据源于操作环境下的 应用数据。由于这种分离,数据仓库不需要事务处理、恢复和并发控制机制。通 常,它只需两种数据访问操作:数据的初始化装入和数据访问。
相关文档
最新文档