联通BI基础培训

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

广东联通BI基础培训

谢礼明

目录

广东联通经分系统介绍1

数据仓库基础知识2

广东联通业务介绍3

developer快速上手4

BI系统

BI系统的是为业务部门提供数据分析,支撑数据应用。Business intelligence,简称BI,商业智能。

KPI考核指标首页是图

形界面

个人认为一个优秀的BI 系统应包含以下功能:基本功能

1,报表2,即席查询3,ETL

4,指标监控及预警漂亮的界面

1,图表结合

2,UI 设计专业、简单、美观3,操作简单方便4,移动版1,基本功能

优秀的数据分析

1,单维/多维分析2,深入分析,数据可以层层深入3,数据内容充实,切合使用需要4,自动生成数据分析报告。

1,基本功能数据挖掘

1,预测2,分类

请在系统找出我们已经具备的功能?

目录

广东联通经分系统介绍1

数据仓库基础知识2

广东联通业务介绍3

developer快速上手4

数据仓库与数据库的区别

数据库数据仓库

1,用途不同OLTP系统,面向应用OLAP系统,面向主题分析2,使用的用户面向事物操作人员面向分析和决策人员

3,库容量差异数据量小,十T级数据量大,百T级甚至P级

4,数据量操作级别差距短的,简单性事务,只

影响几条或几十条数据

复杂的select和大数据的

insert,动不动就百万级以

上的数据。

5,数据结构数据分散,不同数据标

准集成的(数据汇总、数据聚合)。数据标准统一

6,数据时间性要求当前的、最新的的数

据反应历史变化的。数据特点:历史数据,按周期存放的,冗余的数据。

7,DB设计基于E-R,遵循第三范式星形/雪花,可以不遵循第

三范式

8,优先考虑高性能,高可用性,高

并发

海量数据操作,响应时间

分层设计

应用层 数据集市 地市数据集市、数据挖掘

应用层 KPI报表、cagnos、主题分析、指标库

中间层 DWA

CBD:用户统一视图、3G用户统一视图、固话用户统一视图

汇总数据:用户行为、增值业务、集团业务、国际业务 DWD 清单汇总、用户属性聚合、费用汇总、集团客户汇总等

接口层 存储层 接口备份、增量转全量、减少I/O(分常用数据和历史数据) 接口层 日接口、月接口、增量接口、全量接口

中间层是数据仓库最重要的一层。直接决定了数据仓库的性能。

一般的做法是:

1)数据汇总。将底层数据按维度进行小颗粒度汇总

2)信息聚合。将多张表的信息聚合在一个表中。这样的好处,是避免使用表关联,提高查询性能。

星型模型

星型模型

维度表直接连接到事实表上,像星星一样,故称星型模型。

雪花模型

雪花模型

一个或多个维度表不是直接连接到事实表,而是通过维度表中转的,其图形像雪花。

维度建模

或者说,为了分析方便(商业应用要求),将同一维度的不同层次的维度(如地市ID,区县ID )都融合到事实表中(如用户宽表)。

将商业维度融合到数据模型中,由此得名维度建模。

维度模型也称星型模型

它强调的是先对维度进行预处理,将多个维度集合到一个事实表,形成一个宽表,如上面的用户统一视图。包含了20多个维度。这样可以组合各维度,形成灵活的报表查询。

目录

广东联通经分系统介绍1

数据仓库基础知识2

广东联通业务介绍3

developer快速上手4

Bss功能架构

具体见《广东联通BSS项目外围接口规范-经营分析系统接口v 1.18.doc》

客户

社会中的自然人

用户

产品的实体用户。就是说,一个客户如果办了多张卡,那么他就具有多个用户

账户

存放资金的实体。账户的归属人可以是个体也可以是实体。一个客户可以拥有多个账户。

账户上的资金可以为本人付费,也可以为他人付费。

一个账户对应多个账本。(TF_F_ACCOUNTDEPOSIT账本余额)

账单

分客户账单和用户账单

客户账单,根据规则,对用户的账单进行简单的算术求和。

用户账单,可以细分为账目项(消费明细),账目项细分为账目。

销帐流程

按照用户的账单来销帐,而不是按照客户账单。

如果帐户上的资金余额不能够冲销一个用户的账单,那么称之为部分冲销,

如一个账单的所有账目都被销帐后,才能算该用户的帐单完全销账。

关系

1个集团客户<----> N个客户

1个客户<----> N个用户

1个客户<----> N个账户

1个集团用户<----> N个用户

N个账户<----> N个用户

(账户和用户的映射关系是通过销帐关系来确定的。1个账户可以为多个用户销帐,但必须指定优先级。1个用户也可以对应多个账户)

指标库

用户资料信息

T_index_userinfo_m 指标用户统一视图(完全版)

T_index_user_m2

用户费用-日T_index_acct_d 指标用户日统一视图(完全版)

T_index_user_d2

用户通信行为T_index_call_m

用户资料信息-日T_index_userinfo_d

用户标签-日T_index_tag_d

用户标签T_index_tag_m

用户通信行为-日T_index_call_d 数据指标库

用户出账T_index_acct_m 指标用户统一视图)

指标用户统一视图(简单版)T_index_user_m1指标用户日统一视图)

指标用户日统一视图(简单版)T_index_user_d1

相关文档
最新文档