数据挖掘内容简介
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据挖掘内容简介
一、数据挖掘内容的选择
单一维度报表统计,是统计中的最小单位。
一般根据时间对数据内容进行数学运算,获得的一组相对连贯的数字。
使用数字可以
生成分析图表(线图、柱图等)。
说明在时间段内的数据变化。
还可以进行数学运算,用以计算平均值或者变化角度、速度和频率等内容。
1统计内容(单一维度的报表统计)
1
2
3
4
5
6
2、外部采集内容(单一维度的报表统计)
二、挖掘分析内容
7
二维度报表统计建立在一维统计报表的基础上。
对一维报表进行组合。
从而使报表获得除时间以外,其他两项或多项数据内容。
在二维度报表中,存在单项组合,以及多项组合。
单项组合指单纯的将两个一维报表组合起来,进行对比和分析。
多项组合是指将几个单项组合,和另外一些单项组合进行统计和比对。
以了解不同变化发生过程中的区别以及特点。
1、组合关系(二维度报表统计)
下表中白色为可填内容,黄色为重复内容不需要填。
例如1为交款总金额统计2为贷款平均金额统计。
1-2为交
款总额与贷款总额同一时间下的趋势变化,以及比例关系。
所以2-1具有统计分析价值。
将行列对应表格更改为绿色。
说明其有意义,并将数据内容统计方法写入:a)单项组合(二维度报表统计)表中。
如果3为单位类型统计。
1和3为交换总金额统计和交款单位类型统计。
数据内容不在同一层面上。
且从目前来看暂时没有什么可比性。
暂时不用统计。
则将3-1格子标为红色以供探讨或进行深层次的挖掘分析。
8
2、组合用途
9
三、结构组合和组织
数据挖掘分析分为两部分内容。
一部分为已知的能够获得数据,并了解到有潜在的关联关系,或对比关系的。
这部分内容大部
10
分根据统计管理系统获得。
在数据挖掘分析系统中对其单粒度、多粒度统计模型进行组合封装。
变为新的报表分析内容。
一部分为未知的,以前没有或是无从知道是否有关联的数据。
通过挖掘分析系统,建立分析模型。
并在实践中调整优化,以达到与实际情况相符合的最佳状态。
单一纬度的报表统计。
单一维度的报表统计对固定时间、固定地域、规定单一数据内容进行统计。
说明在这一时间内的,数值变化,以及变化规律趋势。
根据统计内容可以加入公示运算,以对变化趋势变化速度内进行预测。
单一维度的统计是最小细度的数据准备。
双维度的报表统计。
双维度报表在单一维度的基础上,进行初步的组合。
将两个相关联的统计内容组合在一起说明在同一时间、同一地域内。
两个不同数据内容的变化趋势。
例如同一时间的存款、贷款趋势或是存款、贷款、余额的变化关系。
说明在一定范围内,相关数据的走势以及对应关系。
根据关系可以得到不同数据之间的数学关系,反应速度以及比例。
从而对趋势变化预测。
三维度的组合报表统计分析。
三维度建立在单一维度、双维度报表统计分析基础上。
在根据时间段、地域等内
容,对细粒度以及组合力度内容进行拼装和组合,生成新的分析内容
例如日期和缴存人年龄的曲线,为单一维度报表统计。
说明随时间推移缴存人的年龄变化,以及平均值、日期和缴存金额
11
变化曲线,为单一维度报表统计。
说明历史过程中缴存金额随时间变化增大或者减少。
历史阶段缴存金额的平均值。
而日期、缴存人年龄、缴存金额的报表为一个二维组合报表。
说明在一段时间内,缴存人年龄和缴存金额之间的对应关系。
再增加第三维度的内容。
如在不同时间、同一地区情况下,则说明,这个地区两个时间阶段内,或者更多时间周期内,不同的年龄金额趋势展情况,从而推断出,变化趋势以及变化速度。
而相同周期,不同地域情况下。
则说明在同一周期内,地域之间的事物发展状况和区别。
从而找到地区之间的差异和变化。
1、示意图
12
13
不同岗期、不同地域
相同用酿平同地域
/同周期、朗同地域
和同円期•相同地域
挖拥彷析内容
挖掘井析内#
14
四、数据挖掘展示 1、展示方式
展示方式根据展示内容以及数据特点,选择饼图、线图、柱图等。
组合试图可根据用户喜好制定进行展示
2、示例
龄数数 年钱次
■
■
■2500 2000 1500
1000 500 0
--- 年龄 —钱数 ——次数
60=「
60
匚B
「
2000 --- ------------
龄
O O
年龄
—钱数
8060
龄
692
60
-匚
巾
「
M
9
廿
O 龄
数数 年
钱次 ■ ■ ■
龄
数
年钱
■ ■
龄 年 ■。