数据挖掘课程设计答辩ppt
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
# 可视化模型 plot(concrete_model2)
# 评估模型的性能 model_results2 <- compute(concrete_model2, concrete_test[1:8]) predicted_strength2 <- model_results2$net.result cor(predicted_strength2, concrete_test$strength)
数据预处理
02
(2)可以看到数据由0-1000不等,数据是均匀 分布或者严重非正太时,可以将其标准化到0-1 范围内,对数据规范化处理得
# 数据标准化 normalize <- function(x) { return((x - min(x)) / (max(x) - min(x))) } # apply normalization to entire data frame concrete_norm <- as.data.frame(lapply(concrete, normalize))
估计混泥土的强度是一个特别有趣的挑战。 尽管混泥土几乎要用于每一个建设项目,但 由于它各种成分的使用以复杂的方式相互作 用,所以它的性能变化很大。因此,很难精 确地预测它最终产品的强度。
02
数据分析与预测目标
数据分析与预测目标
给定一份材料成分清单, 要求: (1)挑选合适的模型预测混 泥土强度
(2)考虑预测值与真 实值的相关性,评估模 型性能并进行优化
模型构架与评价
模型构架与评价
为了对混凝土中使用的原料和最终产品的强度 之间的关系建立模型,我们将使用一个多层前 馈神经网络。首先构造两个隐藏结点的多层前 馈网络,然后对模型拓扑可视化得
## Step 3: 基于数据训练模型 # 神经网络模型 library(neuralnet) concrete_model <- neuralnet(formula = strength ~ cement + slag + ash + water + superplastic +
数据分析与预测目标
混凝土数据集包含了 1030 个混凝土案例9 个描述混合物成分的 特征。
。
01
02
这些特征被认为与最终的 抗压强度相关,并且它们 包含了产品中
数据分析与预测目
标
水泥Cement (kg/m3 )
老化时间 (aging time)
混凝土抗压强度 (兆帕,兆帕)
Water(kg/m3 )
模型 评价
模型评价
从优化后的模型5个隐藏结点相关性达到0.93, 提高后的模型误差从2.69下降到1.62
模型评价
线性回归得到模型为比较 lm.fit <- glm(strength ~ cement + slag +
ash + water + superplastic + coarseagg + fineagg + age, data = concrete_train) summary(lm.fit) pr.lm<-predict(lm.fit,concrete_test) MSE.LM<-sum((pr.lmconcrete_test$strength)^2)/nrow(concrete_test) print(MSE.LM)
模型构建与评价
模型评估 对于数值预测问题需要度量混凝土强度和真实值之间的相 关性,可以用cor()函数
# 生成关于数据集的预测值 model_results <- compute(concrete_model, concrete_test[1:8])
predicted_strength <- model_results$net.result # 获取两个之间的相关性 cor(predicted_strength, concrete_test$strength)
# confirm that the range is now between zero and one summary(concrete_norm$strength)
数据预处理
02
(2)对比原始最大值最小值82.60 2.33发 现规范化后数据在0~1之间 说明规范化顺 利进行
数据预处理
03
设置随机数划分训练集和测试集
模型评价
模型对比
模型对比
BP方法预测的精度比 非线性回归模型预测的要 高得多
神经网络方法对非线 性问题的分析与预测比回 归分析方法有更大的优势
若有更多的数据用于 训练网络,则网络的预测 能力会更强.并且采用人工 神经网络方法预测混凝土 强度,可减少混凝土适配 次数,减少人力物力
梦想,要比昨 天走的更远
四、模型构建与评价
模型构架与评价
神经网络是一种运算模型,由大量的节点(或称神经 元)之间相互联接构成。每个节点代表一种特定的输出函 数,称为激励函数。每两个节点间的连接都代表一个对于 通过该连接信号的加权值,称之为权重,这相当于人工神 经网络的记忆。网络的输出则依网络的连接方式,权重值 和激励函数的不同而不同。
set.seed(1265) train_sample=sample(1000,800) # 划分训练集和测试集 concrete_train <concrete_norm[train_sample, ] concrete_test <- concrete_norm[train_sample, ]
04
可以看出两个变量具有很强的相关性
05
提高模型性能
提高模型性能
## Step 5:提高模型的性能 # 隐藏层有5个单元 concrete_model2 <- neuralnet(strength ~ cement + slag +
ash + water + superplastic + coarseagg + fineagg + age, data = concrete_train, hidden = 5)
coarseagg + fineagg + age,data = concrete_train,hidden=2)
# visualize the network topology plot(concrete_model)
模型构 建与评 价
在这个简单的模型中, 对于8个特征中的每一 个特征都有一个输人节 点,后面跟着-个单一的 隐藏节点和一个单一的 预测混凝土强度的输出 节点。每一个连接的权 重也都被描绘出来,偏 差项也被描绘出来(通过 带有1的节点表示)。 我们可以看出训练的步 数为21996和一个称为 误差平方和2.69953
感谢各位聆听
Add up everything what you like and everything what you want 梦想,要比昨天走的更远
BP网络是一种有监督的前馈运行的神经网络,它由输 入层i、隐含层h、输出层k以及各层之间的节点的连接权 所组成。它又分为正向和反向传播两种
模型构架与评价
模型构架与评价
多层前馈神经网络 多层前馈神经网络有一个输入层,中间有一个或多个隐含层,有一个输出层。多 层感知器网络中的输入与输出变换关系为
这时每一层相当于一个单层前馈神经网络,如对第 q层,它形成一个nq-1维的超 平面。它对于该层的输入模式进行线性分类,但是由于多层的组合,最终可以实 现对输入模式的较复杂的分类
Flyபைடு நூலகம்Ash (kg/m3 )
Superplas ticizer kg/m3
粗集料(coarse aggregate) 细集料( fine aggregate)
高炉矿渣 Blast Furnace Slag
(kg/m3)
03
数据预处理及分析
数据预处理
01
可以看到图中变量名比较复杂,给变量重命名如 下,便于下文使用
数据分析与预测课 程设计
混凝土的强度预测 XXX
混凝土的强度预测
一、任务背景 二、数据分析与预测目标 三、数据预处理及分析 四、模型构建与评价 五、总结
01
任务背景
在工程领域中,对建筑材料的性能有精确的 估计至关重要。这些估计是必需的,以便制 定安全准则来管理用于楼宇、桥梁和道路建 设中的材料。
# 评估模型的性能 model_results2 <- compute(concrete_model2, concrete_test[1:8]) predicted_strength2 <- model_results2$net.result cor(predicted_strength2, concrete_test$strength)
数据预处理
02
(2)可以看到数据由0-1000不等,数据是均匀 分布或者严重非正太时,可以将其标准化到0-1 范围内,对数据规范化处理得
# 数据标准化 normalize <- function(x) { return((x - min(x)) / (max(x) - min(x))) } # apply normalization to entire data frame concrete_norm <- as.data.frame(lapply(concrete, normalize))
估计混泥土的强度是一个特别有趣的挑战。 尽管混泥土几乎要用于每一个建设项目,但 由于它各种成分的使用以复杂的方式相互作 用,所以它的性能变化很大。因此,很难精 确地预测它最终产品的强度。
02
数据分析与预测目标
数据分析与预测目标
给定一份材料成分清单, 要求: (1)挑选合适的模型预测混 泥土强度
(2)考虑预测值与真 实值的相关性,评估模 型性能并进行优化
模型构架与评价
模型构架与评价
为了对混凝土中使用的原料和最终产品的强度 之间的关系建立模型,我们将使用一个多层前 馈神经网络。首先构造两个隐藏结点的多层前 馈网络,然后对模型拓扑可视化得
## Step 3: 基于数据训练模型 # 神经网络模型 library(neuralnet) concrete_model <- neuralnet(formula = strength ~ cement + slag + ash + water + superplastic +
数据分析与预测目标
混凝土数据集包含了 1030 个混凝土案例9 个描述混合物成分的 特征。
。
01
02
这些特征被认为与最终的 抗压强度相关,并且它们 包含了产品中
数据分析与预测目
标
水泥Cement (kg/m3 )
老化时间 (aging time)
混凝土抗压强度 (兆帕,兆帕)
Water(kg/m3 )
模型 评价
模型评价
从优化后的模型5个隐藏结点相关性达到0.93, 提高后的模型误差从2.69下降到1.62
模型评价
线性回归得到模型为比较 lm.fit <- glm(strength ~ cement + slag +
ash + water + superplastic + coarseagg + fineagg + age, data = concrete_train) summary(lm.fit) pr.lm<-predict(lm.fit,concrete_test) MSE.LM<-sum((pr.lmconcrete_test$strength)^2)/nrow(concrete_test) print(MSE.LM)
模型构建与评价
模型评估 对于数值预测问题需要度量混凝土强度和真实值之间的相 关性,可以用cor()函数
# 生成关于数据集的预测值 model_results <- compute(concrete_model, concrete_test[1:8])
predicted_strength <- model_results$net.result # 获取两个之间的相关性 cor(predicted_strength, concrete_test$strength)
# confirm that the range is now between zero and one summary(concrete_norm$strength)
数据预处理
02
(2)对比原始最大值最小值82.60 2.33发 现规范化后数据在0~1之间 说明规范化顺 利进行
数据预处理
03
设置随机数划分训练集和测试集
模型评价
模型对比
模型对比
BP方法预测的精度比 非线性回归模型预测的要 高得多
神经网络方法对非线 性问题的分析与预测比回 归分析方法有更大的优势
若有更多的数据用于 训练网络,则网络的预测 能力会更强.并且采用人工 神经网络方法预测混凝土 强度,可减少混凝土适配 次数,减少人力物力
梦想,要比昨 天走的更远
四、模型构建与评价
模型构架与评价
神经网络是一种运算模型,由大量的节点(或称神经 元)之间相互联接构成。每个节点代表一种特定的输出函 数,称为激励函数。每两个节点间的连接都代表一个对于 通过该连接信号的加权值,称之为权重,这相当于人工神 经网络的记忆。网络的输出则依网络的连接方式,权重值 和激励函数的不同而不同。
set.seed(1265) train_sample=sample(1000,800) # 划分训练集和测试集 concrete_train <concrete_norm[train_sample, ] concrete_test <- concrete_norm[train_sample, ]
04
可以看出两个变量具有很强的相关性
05
提高模型性能
提高模型性能
## Step 5:提高模型的性能 # 隐藏层有5个单元 concrete_model2 <- neuralnet(strength ~ cement + slag +
ash + water + superplastic + coarseagg + fineagg + age, data = concrete_train, hidden = 5)
coarseagg + fineagg + age,data = concrete_train,hidden=2)
# visualize the network topology plot(concrete_model)
模型构 建与评 价
在这个简单的模型中, 对于8个特征中的每一 个特征都有一个输人节 点,后面跟着-个单一的 隐藏节点和一个单一的 预测混凝土强度的输出 节点。每一个连接的权 重也都被描绘出来,偏 差项也被描绘出来(通过 带有1的节点表示)。 我们可以看出训练的步 数为21996和一个称为 误差平方和2.69953
感谢各位聆听
Add up everything what you like and everything what you want 梦想,要比昨天走的更远
BP网络是一种有监督的前馈运行的神经网络,它由输 入层i、隐含层h、输出层k以及各层之间的节点的连接权 所组成。它又分为正向和反向传播两种
模型构架与评价
模型构架与评价
多层前馈神经网络 多层前馈神经网络有一个输入层,中间有一个或多个隐含层,有一个输出层。多 层感知器网络中的输入与输出变换关系为
这时每一层相当于一个单层前馈神经网络,如对第 q层,它形成一个nq-1维的超 平面。它对于该层的输入模式进行线性分类,但是由于多层的组合,最终可以实 现对输入模式的较复杂的分类
Flyபைடு நூலகம்Ash (kg/m3 )
Superplas ticizer kg/m3
粗集料(coarse aggregate) 细集料( fine aggregate)
高炉矿渣 Blast Furnace Slag
(kg/m3)
03
数据预处理及分析
数据预处理
01
可以看到图中变量名比较复杂,给变量重命名如 下,便于下文使用
数据分析与预测课 程设计
混凝土的强度预测 XXX
混凝土的强度预测
一、任务背景 二、数据分析与预测目标 三、数据预处理及分析 四、模型构建与评价 五、总结
01
任务背景
在工程领域中,对建筑材料的性能有精确的 估计至关重要。这些估计是必需的,以便制 定安全准则来管理用于楼宇、桥梁和道路建 设中的材料。