联通BI基础培训
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
广东联通BI基础培训
谢礼明
目录
广东联通经分系统介绍1
数据仓库基础知识2
广东联通业务介绍3
developer快速上手4
BI系统
BI系统的是为业务部门提供数据分析,支撑数据应用。Business intelligence,简称BI,商业智能。
KPI考核指标首页是图
形界面
个人认为一个优秀的BI 系统应包含以下功能:基本功能
1,报表2,即席查询3,ETL
4,指标监控及预警漂亮的界面
1,图表结合
2,UI 设计专业、简单、美观3,操作简单方便4,移动版1,基本功能
优秀的数据分析
1,单维/多维分析2,深入分析,数据可以层层深入3,数据内容充实,切合使用需要4,自动生成数据分析报告。
1,基本功能数据挖掘
1,预测2,分类
请在系统找出我们已经具备的功能?
目录
广东联通经分系统介绍1
数据仓库基础知识2
广东联通业务介绍3
developer快速上手4
数据仓库与数据库的区别
数据库数据仓库
1,用途不同OLTP系统,面向应用OLAP系统,面向主题分析2,使用的用户面向事物操作人员面向分析和决策人员
3,库容量差异数据量小,十T级数据量大,百T级甚至P级
4,数据量操作级别差距短的,简单性事务,只
影响几条或几十条数据
复杂的select和大数据的
insert,动不动就百万级以
上的数据。
5,数据结构数据分散,不同数据标
准集成的(数据汇总、数据聚合)。数据标准统一
6,数据时间性要求当前的、最新的的数
据反应历史变化的。数据特点:历史数据,按周期存放的,冗余的数据。
7,DB设计基于E-R,遵循第三范式星形/雪花,可以不遵循第
三范式
8,优先考虑高性能,高可用性,高
并发
海量数据操作,响应时间
分层设计
应用层 数据集市 地市数据集市、数据挖掘
应用层 KPI报表、cagnos、主题分析、指标库
中间层 DWA
CBD:用户统一视图、3G用户统一视图、固话用户统一视图
汇总数据:用户行为、增值业务、集团业务、国际业务 DWD 清单汇总、用户属性聚合、费用汇总、集团客户汇总等
接口层 存储层 接口备份、增量转全量、减少I/O(分常用数据和历史数据) 接口层 日接口、月接口、增量接口、全量接口
中间层是数据仓库最重要的一层。直接决定了数据仓库的性能。
一般的做法是:
1)数据汇总。将底层数据按维度进行小颗粒度汇总
2)信息聚合。将多张表的信息聚合在一个表中。这样的好处,是避免使用表关联,提高查询性能。
星型模型
星型模型
维度表直接连接到事实表上,像星星一样,故称星型模型。
雪花模型
雪花模型
一个或多个维度表不是直接连接到事实表,而是通过维度表中转的,其图形像雪花。
维度建模
或者说,为了分析方便(商业应用要求),将同一维度的不同层次的维度(如地市ID,区县ID )都融合到事实表中(如用户宽表)。
将商业维度融合到数据模型中,由此得名维度建模。
维度模型也称星型模型
它强调的是先对维度进行预处理,将多个维度集合到一个事实表,形成一个宽表,如上面的用户统一视图。包含了20多个维度。这样可以组合各维度,形成灵活的报表查询。
目录
广东联通经分系统介绍1
数据仓库基础知识2
广东联通业务介绍3
developer快速上手4
Bss功能架构
具体见《广东联通BSS项目外围接口规范-经营分析系统接口v 1.18.doc》
客户
社会中的自然人
用户
产品的实体用户。就是说,一个客户如果办了多张卡,那么他就具有多个用户
账户
存放资金的实体。账户的归属人可以是个体也可以是实体。一个客户可以拥有多个账户。
账户上的资金可以为本人付费,也可以为他人付费。
一个账户对应多个账本。(TF_F_ACCOUNTDEPOSIT账本余额)
账单
分客户账单和用户账单
客户账单,根据规则,对用户的账单进行简单的算术求和。
用户账单,可以细分为账目项(消费明细),账目项细分为账目。
销帐流程
按照用户的账单来销帐,而不是按照客户账单。
如果帐户上的资金余额不能够冲销一个用户的账单,那么称之为部分冲销,
如一个账单的所有账目都被销帐后,才能算该用户的帐单完全销账。
关系
1个集团客户<----> N个客户
1个客户<----> N个用户
1个客户<----> N个账户
1个集团用户<----> N个用户
N个账户<----> N个用户
(账户和用户的映射关系是通过销帐关系来确定的。1个账户可以为多个用户销帐,但必须指定优先级。1个用户也可以对应多个账户)
指标库
用户资料信息
T_index_userinfo_m 指标用户统一视图(完全版)
T_index_user_m2
用户费用-日T_index_acct_d 指标用户日统一视图(完全版)
T_index_user_d2
用户通信行为T_index_call_m
用户资料信息-日T_index_userinfo_d
用户标签-日T_index_tag_d
用户标签T_index_tag_m
用户通信行为-日T_index_call_d 数据指标库
用户出账T_index_acct_m 指标用户统一视图)
指标用户统一视图(简单版)T_index_user_m1指标用户日统一视图)
指标用户日统一视图(简单版)T_index_user_d1