数据挖掘数据集

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性、多项式、泊松、岭脊等回归类 ARIMA、X-11、WOLD分解等时间序列模式 嵌入式网状结构、过拟合网状神经等学习模式
ARIMA平稳时间序列预测-举例
某地年最低气温时序数据
绘制时序图
定阶
参数估计
平稳性和纯随机性检验
模式化及预测
来自百度文库
ARIMA时间序列预测-举例
预测效果图
多维属性数据集
目标
属性/值
数据变换
数据挖掘
解释评价
数据抽取
数据 仓库
数据预处理
待分析 数据
处理后 数据
变换后 数据
模式
知识
建模数据集
监督性分类性-举例
界面化流程图
2020/4/23
监督性分类性-举例
结果输出—模型比较
预测的0/实际所有的0
2020/4/23
监督性分类性-举例
结果输出—最优模型—树
2020/4/23
监督性分类性-举例
数据挖掘的三种基本数据集
数 事物数据集 据 时序/序列数据集 集
多维属性数据集
事物数据集
ID —— WORK ID —— TIME —— WORK
5
描述性结果模式
以描述性语言及规则等展现形式
关联规则 序列规则 If-then 规则集
……
时序数据集



序列数据集
值 值
预测性结果模式
以各种回归式、方程式、检验结果等无偏预测值展现
数据挖掘建模数据集
——不同数据挖掘模式下的各种数据集
引例
统计学奥卡姆剃刀 以尽量少的因子去解释现象,减少中间过程。
• 误差会以乘积的方式扩大 • 引入因子会使主题偏移
辛普森悖论 分组中具有优势,总评中却是劣势。
爱荷华州的一位居民移居到阿拉巴马州,结果提 高了这两个州的平均智商。
• 分组兼顾权重 • 定量因子细化分析
结果输出—分类
将打分文件输入待预测数据集,对新数 据产生分类。
2020/4/23
文本数据集
文本
只有单列文本

DB
企业决策支持信息系统
File
Edit
Location 1992
PowerPlay
Data
Values
All Products Age groups
Display Text Revenue($000)
Legend 1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
产品
查询报表
OLAP
ODS
统计分析
数据仓库 数据挖掘
决策支持
服务
谢谢
有目标值则是有监督性
分类性结果模式
各种机器学习
K中心、两阶段、邻近、系统等无监督聚类 分类树、逻辑回归、神经网等监督性分类模式
监督性分类性-举例
信贷风险预测
数据来源于银行信贷部门对用户贷款信息的记录,包括客户基本信息、信用信 息、是否拖欠等。希望通过对以往客户数据的分析来对新客户评价信用,降低风险。
相关文档
最新文档