过程分析技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
26
探索性分析
模型参数( 模型参数(Model parameter) )
模型参数能用来估算模型中不同样品之间的关系 计算过程中变量的正交性使得变量得到循环,可以 计算过程中变量的正交性使得变量得到循环, 解释没有被解释的原始变量
27
探索性分析
34个不同比率的高密度聚乙烯 低密度聚乙烯聚合膜的近红外光谱图 个不同比率的高密度聚乙烯/低密度聚乙烯聚合膜的近红外光谱图 个不同比率的高密度聚乙烯
22
分类方法
主要靠周围有限的邻近的样本, 1 主要靠周围有限的邻近的样本,而不是靠判别 类域的方法来确定所属类别的
2 在高度非线性的分离结构中是很有效的
当样本不平衡时, 当样本不平衡时,有可能导致当输入一个新样本 3 该样本的K个邻居中大容量类的样本占多数 时,该样本的 个邻居中大容量类的样本占多数
20
空间中距离的测量
两维空间中两个未知样品与平均值的欧氏距离
21
分类方法
K最临近(K-nearest neighbor) 最临近( 最临近 )
如果一个样本在特 征空间中的k个最相 征空间中的 个最相 似(即特征空间中最 即特征空间中最 邻近)的样本中的大 邻近 的样本中的大 多数属于某一个类 别,则该样本也属 于这个类别。 于这个类别。
主成分分析 模型参数 未知样品 给定的方程 定义的Z类别 定义的 类别 F测试 测试 计算剩余值 和LEVP值
25
分类方法
F测试: 测试: 测试 两个标准偏差的比率: 两个标准偏差的比率:
σ F= σ
2 1 2 2
可以处理高度非线性的情况 可以处理类别之间结构不同的情况 可以处理未知样品不属于任何类别或者属于 两个以上的类别的情况
31
探索性分析
有正值点 和负值点
32
探索性分析
聚乙烯样品中分 子取向的变化对 于近红外光谱数 据中的变化性有 很大影响
33
34
28
探索性分析
对于主成分回归, 对于主成分回归,三个主成分是最优的
29
探索性分析
Loadings 用来估算模型中不同变量之间的关系, 用来估算模型中不同变量之间的关系,也能够帮 助解释主成分解释的现象
30
探索性分析
以聚乙烯为例
(1)和虚线很近的 ) 变量之间是高 度相关的 (2) 原点距离的远 ) 近表示了变化 性的大小
2
引言
化学计量学( 化学计量学(chemometrics): ):
统计学 化学体系的 测量值 体系的状态 数学方法
3
基石
1 一些符号 纯量, 纯量,a=[0.5] 向量, 向量,a=[5 4 1 2] 矩阵, 矩阵, 1 2 3 A= 4 5 6
7 8 9
2 统计学:正态分布 统计学:
逆多重线 性回归
主成分分析
人工神经 探索性分析 网络
6
逆多重线性回归
逆多重线性回归( 逆多重线性回归(Inverse multiple linear regression) )
输入多个分析仪 的信号 (如:波长) 波长)
多重线性回归
输出一个性质 (one property of interest) ) (如:组成浓度) 组成浓度)
8 过程分析化学中的化学计量学
学生: 学生:李润妍 2009.11.12
1
目录
• • • • • • • • • • • 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 8.10 8.11 引言 化学计量学的基石 定量模型的建立 异常值 定性模型的建立 探索性分析 过程分析化学的校正样品悖论 化学计量学中样品和变量的选择 校正转换 非技术问题 总结
10
主成分分析
主成分分析( 主成分分析(Principal component regression) ) 线性 多个变量 变换
较少个数重 要变量Hale Waihona Puke Baidu
11
主成分分析
表8.6 对苯乙烯—丁二烯 对苯乙烯 丁二烯 聚合物中的 顺丁二烯成分 建立主成分分 析模型的结果
在主成分分析中主成分的数目 1 2 3 4 5 6 7 8 9 10 RMSEE (顺丁二烯 %) 顺丁二烯 17.00 5.80 3.18 1.26 1.25 1.25 1.23 1.23 1.15 1.15
19
空间中距离的测量
马氏距离( 马氏距离(Mahalanobis distance): ): 它是有效地计算两个样本集之间相似度 相似度方 它是有效地计算两个样本集之间相似度方 不受量纲的影响, 法。它不受量纲的影响,两点之间的马氏 距离与原始数据的测量单位无关 。 但是夸大了变化微小的变量的作用 。
4
基石
3 线性回归:自变量 和变量 之间的线性关系 线性回归:自变量X和变量 和变量Y之间的线性关系 4 多重线性回归:多个自变量 和一个变量 之间的线 多重线性回归:多个自变量X和一个变量 和一个变量Y之间的线 性关系 5 数据预处理:平均值中心化、数据压缩 数据预处理:平均值中心化、
5
定量模型的建立
网络结构由三部分构成: 网络结构由三部分构成: 输入层、 输入层、输出层和隐藏层
14
人工神经网络
15
人工神经网络
苯乙烯—丁二烯聚合物顺丁二烯建立神经网络 表8.7 苯乙烯 丁二烯聚合物顺丁二烯建立神经网络 模型中获得的结果
隐藏层中的数量点 1 2 3 4 5 6
RMSEE(顺丁二烯 %) 顺丁二烯 2.70 1.52 1.13 1.05 0.96 1.07
7
逆多重线性回归
70个不同的苯乙烯 丁二烯聚合物的近红外光谱图 个不同的苯乙烯—丁二烯聚合物的近红外光谱图 个不同的苯乙烯
8
逆多重线性回归
RMSEE: : 估算均方根误差
(Yi − Y i ) 2 ∑
i =1 n ^
RMSEE =
N −1
9
逆多重线性回归
在苯乙烯—丁二烯聚合物中为顺丁二烯成分使用逆多重线性回 表8.5 在苯乙烯 丁二烯聚合物中为顺丁二烯成分使用逆多重线性回 归所得的结果 逆多重线性回归模型选择的波 长(nm) 1706 1706,1824 1706,1824,1670 1706,1824,1670,1570 4.69 2.19 1.90 1.39 RMSEE(顺丁二烯%)
12
主成分分析
使 用 不 同 个 数 的 主 成 分 可 以 解 释 数 据 中 变 量 的 百 分 数
13
人工神经网络
人工神经网络( 人工神经网络(Artificial neural networks) ) 一种模仿动物神经网络行为特征进行分布,并进行 一种模仿动物神经网络行为特征进行分布 并进行 信息处理的算法数学模型。 信息处理的算法数学模型。
4
每一个待分类的文本都要计算它到全体已知样本 的距离
23
分类方法
从近红外光谱中获得的聚乙烯发泡体的两个未知样品
样品A属于类别 ,样品B在类别 在类别3和 之间 样品 属于类别2,样品 在类别 和4之间 属于类别 如果K=22或者更多? 或者更多? 如果 或者更多
24
分类方法
类模拟软独立建模( 类模拟软独立建模(Soft independent modeling of class analogies) )
16
定性模型的建立
第一 参比浓度的低准确性会在定量模 型中引起不可预料的错误 第二 X变量和 变量之间的定量关系 变量和Y变量之间的定量关系 变量和 是非线性或者是很复杂的 第三 想要测定定量模型不能得到的推论
17
定性模型的建立
空间中距 离的测量
分类方法
探索性分析
18
空间中距离的测量
欧氏距离( 欧氏距离(Euclidean distance) 欧氏距离是m维空间中两个点的真实距离 维空间中两个点的真实距离, 欧氏距离是 维空间中两个点的真实距离, 可看做是信号的相似程度 相似程度。 可看做是信号的相似程度。距离越 近越 相似,相互之间越容易干扰。 相似,相互之间越容易干扰。 但是,它将样品的不同属性( 但是,它将样品的不同属性(即各指标或各 变量) 变量)之间的差别等同看待 。
探索性分析
模型参数( 模型参数(Model parameter) )
模型参数能用来估算模型中不同样品之间的关系 计算过程中变量的正交性使得变量得到循环,可以 计算过程中变量的正交性使得变量得到循环, 解释没有被解释的原始变量
27
探索性分析
34个不同比率的高密度聚乙烯 低密度聚乙烯聚合膜的近红外光谱图 个不同比率的高密度聚乙烯/低密度聚乙烯聚合膜的近红外光谱图 个不同比率的高密度聚乙烯
22
分类方法
主要靠周围有限的邻近的样本, 1 主要靠周围有限的邻近的样本,而不是靠判别 类域的方法来确定所属类别的
2 在高度非线性的分离结构中是很有效的
当样本不平衡时, 当样本不平衡时,有可能导致当输入一个新样本 3 该样本的K个邻居中大容量类的样本占多数 时,该样本的 个邻居中大容量类的样本占多数
20
空间中距离的测量
两维空间中两个未知样品与平均值的欧氏距离
21
分类方法
K最临近(K-nearest neighbor) 最临近( 最临近 )
如果一个样本在特 征空间中的k个最相 征空间中的 个最相 似(即特征空间中最 即特征空间中最 邻近)的样本中的大 邻近 的样本中的大 多数属于某一个类 别,则该样本也属 于这个类别。 于这个类别。
主成分分析 模型参数 未知样品 给定的方程 定义的Z类别 定义的 类别 F测试 测试 计算剩余值 和LEVP值
25
分类方法
F测试: 测试: 测试 两个标准偏差的比率: 两个标准偏差的比率:
σ F= σ
2 1 2 2
可以处理高度非线性的情况 可以处理类别之间结构不同的情况 可以处理未知样品不属于任何类别或者属于 两个以上的类别的情况
31
探索性分析
有正值点 和负值点
32
探索性分析
聚乙烯样品中分 子取向的变化对 于近红外光谱数 据中的变化性有 很大影响
33
34
28
探索性分析
对于主成分回归, 对于主成分回归,三个主成分是最优的
29
探索性分析
Loadings 用来估算模型中不同变量之间的关系, 用来估算模型中不同变量之间的关系,也能够帮 助解释主成分解释的现象
30
探索性分析
以聚乙烯为例
(1)和虚线很近的 ) 变量之间是高 度相关的 (2) 原点距离的远 ) 近表示了变化 性的大小
2
引言
化学计量学( 化学计量学(chemometrics): ):
统计学 化学体系的 测量值 体系的状态 数学方法
3
基石
1 一些符号 纯量, 纯量,a=[0.5] 向量, 向量,a=[5 4 1 2] 矩阵, 矩阵, 1 2 3 A= 4 5 6
7 8 9
2 统计学:正态分布 统计学:
逆多重线 性回归
主成分分析
人工神经 探索性分析 网络
6
逆多重线性回归
逆多重线性回归( 逆多重线性回归(Inverse multiple linear regression) )
输入多个分析仪 的信号 (如:波长) 波长)
多重线性回归
输出一个性质 (one property of interest) ) (如:组成浓度) 组成浓度)
8 过程分析化学中的化学计量学
学生: 学生:李润妍 2009.11.12
1
目录
• • • • • • • • • • • 8.1 8.2 8.3 8.4 8.5 8.6 8.7 8.8 8.9 8.10 8.11 引言 化学计量学的基石 定量模型的建立 异常值 定性模型的建立 探索性分析 过程分析化学的校正样品悖论 化学计量学中样品和变量的选择 校正转换 非技术问题 总结
10
主成分分析
主成分分析( 主成分分析(Principal component regression) ) 线性 多个变量 变换
较少个数重 要变量Hale Waihona Puke Baidu
11
主成分分析
表8.6 对苯乙烯—丁二烯 对苯乙烯 丁二烯 聚合物中的 顺丁二烯成分 建立主成分分 析模型的结果
在主成分分析中主成分的数目 1 2 3 4 5 6 7 8 9 10 RMSEE (顺丁二烯 %) 顺丁二烯 17.00 5.80 3.18 1.26 1.25 1.25 1.23 1.23 1.15 1.15
19
空间中距离的测量
马氏距离( 马氏距离(Mahalanobis distance): ): 它是有效地计算两个样本集之间相似度 相似度方 它是有效地计算两个样本集之间相似度方 不受量纲的影响, 法。它不受量纲的影响,两点之间的马氏 距离与原始数据的测量单位无关 。 但是夸大了变化微小的变量的作用 。
4
基石
3 线性回归:自变量 和变量 之间的线性关系 线性回归:自变量X和变量 和变量Y之间的线性关系 4 多重线性回归:多个自变量 和一个变量 之间的线 多重线性回归:多个自变量X和一个变量 和一个变量Y之间的线 性关系 5 数据预处理:平均值中心化、数据压缩 数据预处理:平均值中心化、
5
定量模型的建立
网络结构由三部分构成: 网络结构由三部分构成: 输入层、 输入层、输出层和隐藏层
14
人工神经网络
15
人工神经网络
苯乙烯—丁二烯聚合物顺丁二烯建立神经网络 表8.7 苯乙烯 丁二烯聚合物顺丁二烯建立神经网络 模型中获得的结果
隐藏层中的数量点 1 2 3 4 5 6
RMSEE(顺丁二烯 %) 顺丁二烯 2.70 1.52 1.13 1.05 0.96 1.07
7
逆多重线性回归
70个不同的苯乙烯 丁二烯聚合物的近红外光谱图 个不同的苯乙烯—丁二烯聚合物的近红外光谱图 个不同的苯乙烯
8
逆多重线性回归
RMSEE: : 估算均方根误差
(Yi − Y i ) 2 ∑
i =1 n ^
RMSEE =
N −1
9
逆多重线性回归
在苯乙烯—丁二烯聚合物中为顺丁二烯成分使用逆多重线性回 表8.5 在苯乙烯 丁二烯聚合物中为顺丁二烯成分使用逆多重线性回 归所得的结果 逆多重线性回归模型选择的波 长(nm) 1706 1706,1824 1706,1824,1670 1706,1824,1670,1570 4.69 2.19 1.90 1.39 RMSEE(顺丁二烯%)
12
主成分分析
使 用 不 同 个 数 的 主 成 分 可 以 解 释 数 据 中 变 量 的 百 分 数
13
人工神经网络
人工神经网络( 人工神经网络(Artificial neural networks) ) 一种模仿动物神经网络行为特征进行分布,并进行 一种模仿动物神经网络行为特征进行分布 并进行 信息处理的算法数学模型。 信息处理的算法数学模型。
4
每一个待分类的文本都要计算它到全体已知样本 的距离
23
分类方法
从近红外光谱中获得的聚乙烯发泡体的两个未知样品
样品A属于类别 ,样品B在类别 在类别3和 之间 样品 属于类别2,样品 在类别 和4之间 属于类别 如果K=22或者更多? 或者更多? 如果 或者更多
24
分类方法
类模拟软独立建模( 类模拟软独立建模(Soft independent modeling of class analogies) )
16
定性模型的建立
第一 参比浓度的低准确性会在定量模 型中引起不可预料的错误 第二 X变量和 变量之间的定量关系 变量和Y变量之间的定量关系 变量和 是非线性或者是很复杂的 第三 想要测定定量模型不能得到的推论
17
定性模型的建立
空间中距 离的测量
分类方法
探索性分析
18
空间中距离的测量
欧氏距离( 欧氏距离(Euclidean distance) 欧氏距离是m维空间中两个点的真实距离 维空间中两个点的真实距离, 欧氏距离是 维空间中两个点的真实距离, 可看做是信号的相似程度 相似程度。 可看做是信号的相似程度。距离越 近越 相似,相互之间越容易干扰。 相似,相互之间越容易干扰。 但是,它将样品的不同属性( 但是,它将样品的不同属性(即各指标或各 变量) 变量)之间的差别等同看待 。