保险仓库数据模型设计

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

业务经理
2006-10-8
2008-5-9
李四
业务经理
2008-5-9
9999-12-31
2008-5-9
以上start_date为红色的是该数据实例被创建时的版本,该值从逻辑上看应该
为数据的业务创建日期,比如入职日期,但为了避免受到数据质量的影响,
我们通常把每个数据实例的第一个版本的start_date置为1900-01-01
分析集市模型概念

事实表(一)

每一个事实表通常包含了业务需求所关心的一系列的指标值

每一个事实表的行包括

具有可加性的数值型的指标值

文本事实通常具有不可预见的内容,很难进行分析

与维表相连接的外键

通常具有两个和两个以上的外键

外键之间表示维表之间多对多的关系
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
上都能检索到正确的数据。

数据是否需要版本化,首先依赖于实体是否有时变特性,比如“
报案信息”通常是在某个时间点上发生,它就没有时变特性,因
此就不需要版本化。

在实体中加入时间戳属性可以实现数据版本化,这个时间戳可以
基于业务涵义,如对保单的某次批改的生效日期;也可以仅仅是
技术上的,比如员工某项登记信息被修改,则生成新的员工记录
分析集市模型概念

维度建模

一种非规范化的关系模型


由一组属性构成的表所组成

表跟表之间的关系通过关键字和外键来定义
以良好的可理解性和方便的产生报表来进行数据组织,很少考虑
修改的性能

通过SQL或者相关的工具实现数据的查询和维护
© 2006 FEnet Software Co., Ltd. All Rights Reserved.



维度建模的基本概念

模型概述

模型介绍

模型运用方法与技巧

相关技术问题
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
分析层模型结构
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
分析集市模型概念

维表(一)

每一张维表对应现实世界中的一个对象或者概念


例如:客户、产品、保单、标的、案件
维表的特征

包含了众多描述性的属性列
如保单维表里的销售渠道、保费区间、风险等级等

通常情况下,跟事实表相比,行数相对较小
通常< 10万条

内容相对固定
几乎就是一类查找表
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
分析集市模型概念

事实表(二)

事实表的特征

非常的大



内容相对的窄
列数较少


包含几万、几十万甚至几百几千条的记录
经常发生变化
现实世界中新事件的发生→事实表中增加一条记录
典型情况下,仅仅是数据的追加

事实表的使用
各类指标值的聚集计算
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
承保中间表场景示例
保单号
批单号
保险起期
保险金额
保费
核保日期
批改原因
start date
end date
0001
---
2006-3-7
12000
80
2006-3-4
N/A
1900-1-1
2006-5-18
在事务型事实表上计算时点值,建议在维度较细的Cube上使用事务型事实。
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
中间层历史数据的版本化

数据仓库中的历史数据决不会被删除或覆盖,因此需要加入数据
版本特性来区分随时间变化的业务信息,使得在任一给定时间点

模型介绍

模型运用方法与技巧

相关技术问题
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
模型在整个系统架构中的定位
元 需求模型


•最终用户
•数据集市
•Cube
分析层/数据
集市模型
数据仓库
•面向分析主题
•轻度汇总数据
•Star Schema 建模
业务分析需求举例
2006和2007年度各险种份额对比
✓ 与上一年相比,各险种所占
的份额有何差异?
2006
2007
✓ 每个机构在各险种所占份额
是多少?
车险
财产险
货运险
其它险
车险
财产险
货运险
其它险
2006年度各机构在各险种上的份额
车险
财产险
货运险
其它险
时间
机构
险种
机构3
机构2
机构1
0%
20%
40%
60%
分析层模型主题域
分析层模型每个主题域为同类的业务处理,共享相同的维度

承保理赔分析
记录安邦保险所关注的主要承保理赔业务指标。

收付费分析
记录财务收付中应收保费、实收保费、应收率、应付赔款、实
付赔款等收付类信息。

核赔效率分析
记录理赔环节中查勘、定损、核损、缮制过程的相关指标。
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
•中间表
分析层
活动


理赔

产品

财务账户


ETL过程
源系统模型
车险
理赔
实物

资金供应


事件
协议

ODS模型
核心
•基本上与业务数据同构
•保留详细交易数据
角色

地理位置

收付费处

AT&T

收付
财务
•面向业务应用
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
1011
2008-9-12
1000
2010102
1011
2008-9-13
-300
2010102
1011
wk.baidu.com
2008-9-12
2200
2010201
2031
2008-9-12
100
2010202
2001
2008-9-12
1000
2010202
2001
2008-9-13
1200
2010202
2001
2008-9-14
,并指定该记录的有效(Valid)期间,ETL处理需要实现数据相邻
版本时间戳的链接。

需要为版本化的实体找出一个锚ID来唯一标识每个数据实例,比
如保单实体的锚ID可以是保单号,表明该实体中最原子的粒度是
保单。
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
收付费分析的星型结构
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
分析层模型介绍

“承保理赔分析事实表”、“收付费分析事实表”、“核赔效率分
析事实表”都是经轻度汇总生成的表,它们全部都是事务型事实表

中间事实表都是经过版本化的历史表,保存最细粒度的数据
100
2010202
2001
2008-9-12
1000
2010202
2001
2008-9-13
2200
2010202
2001
2008-9-14
0
快照型事实表的指标通常包含时点值,随着时间积累,维度组合会越来越细,
此类型的事实表通常用于粒度较粗的数据集市或Cube;而事务型事实表的度量
都是可累加的,其对于维度较多的轻度汇总表是有利。如果OLAP server支持
-2200
机构
险种
日期
期末未决
2010102
1011
2008-9-12
1000
2010102
1011
2008-9-13
700
2010102
1011
2008-9-14
2900
2010201
2031
2008-9-12
100
2010201
2031
2008-9-13
100
2010201
2031
2008-9-14
Dimensions

属性个数少(窄)

属性个数多(宽)

记录行数多(大)

记录行数少(小)

数值型指标

描述性属性

随着时间的推移,数据

静态的,很少发生变化
增长
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
分析主题域数据 (Analytical Subject Areas)
分析集市模型设计步骤
需求
整理指标维度矩阵
设计集市层模型
设计分析层模型
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
维度指标矩阵
维度指标矩阵是把
需求转化为多维模
型的重要工具
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
如何建立分析集市模型

业务驱动

根据固定报表和KPI、持续率、承保理赔、执行力、再保五个
数据集市的业务需求,结合BI.Insurance DWM的建模方法,
建立Taiping EDW 分析集市模型
行业经验
业务需求
工作组和建模
持续发展
安邦分析
BI.Insurance DWM
集市模型
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
80%
100%
Thousands
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
维度建模举例
客户
险种
时间
机构
© 2006 FEnet Software Co., Ltd. All Rights Reserved.



维度建模的基本概念

模型概述
据通过核心原子数据相关主题域数据经过汇总计算得到。核心原子数据和分析数据分别映射到不同的数
据集市中。

其中,典型的分析主题域如通用承保分析(Universal
underwriting analysis)如下图:
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
时间戳与数据版本
业务信息的不同版本的时间链
时间戳(start_date/end_date)
员工姓名
职位
离职时间
start_date
end_date
张三
初级核保人
2006-5-21
2007-12-3
张三
中级核保人
2007-12-3
9999-12-31
李四
业务员
2004-3-12
2006-10-8
李四

通过事实(Facts)和维度(Dimensions)模型方式表达,为典型保险分析应用提供分析型数据架构,
为数据集市提供统一的指标和维度,为数据应用提供统一的数据信息。

分析主题域数据,将业务需求阶段定义的分析主题域,按照维度建模方法,格式化成符合维度-事实表
的星型模型或雪花模型。其中维度信息由核心原子数据按照定义的层次形成相关的维度视图,事实表数

中间事实表主要用于生成轻度汇总表的过渡,除此之外,通过冗余
相关属性,中间事实表的设计也考虑了其它无法从直接从分析层计
算的指标的计算
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
事务型事实和快照型事实
事务型
机构
险种
日期
快照型
未决变化
2010102
安邦BI系统数据模型介绍
© 2006 FEnet Software Co., Ltd. All Rights Reserved.



维度建模的基本概念

模型概述

模型介绍

模型运用方法与技巧

相关技术问题
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
0001
0001
2006-3-7
0
0
2006-5-18
注销
2006-5-18
9999-12-31
0002
---
2006-4-19
22300
120
2006-4-7
N/A
1900-1-1
2006-5-10
0002
0002
2006-4-19
22300
120
2006-5-10
修改
2006-5-10
2006-5-21
9999-12-31
0005
---
2008-3-14
400000
3600
2008-3-8
N/A
1900-1-1
2008-4-6
0005
0004
2008-3-14
310000
3000
2008-4-6
退保
2008-4-6
0002
0003
2006-4-19
22300
138
2006-5-21
加保
2006-5-21
9999-12-31
0003
---
2007-1-12
120000
890
2007-1-8
N/A
1900-1-1
9999-12-31
0004
---
2007-5-2
57000
500
2007-4-22
N/A
1900-1-1
分析集市模型概念

维表(二)

维表的应用

基于维属性的过滤(切片、切块等)

基于维属性的各种聚集操作

报表中各类标签的主要来源

事实表通过维表进行引用
© 2006 FEnet Software Co., Ltd. All Rights Reserved.
分析集市模型概念

事实表与维表的比较
Facts
相关文档
最新文档