多变量统计过程控制
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用主元分析清除数据中测量噪声
X t1 p1T t2 p2T tk pkT E
式中E为误差矩阵。因而数据X可以近似地表示为:
X t1 p1T t2 p2T tk pkT
通过对数据矩阵进行主元分析可以计算出矩阵的各 个主元,用前k个主元来表示数据X不仅可以起到压缩数 据维数的作用,还可以很好起到清除噪声的作用。
即X的各个主元。
方法二:非线性迭代部分最小二乘算法(NIPALS)
利用NIPALS算法分别计算矩阵的各个主元。 NIPALS算法步骤为: ①从X中任选一列Xj,并记为t1,即t1= Xj; ②计算p1:p1T t1T X t1T t;1
③将p1的长度归一化:p1T P1T ‖p1‖; ④计算t1:t1 Xp1 p1T p;1
J Y TY 2Y T X T X T X
J 2 X TY 2 X T X
X T X X TY
( X T X )1 X TY
用主元回归计算模型参数
X t1 p1T t2 p2T tk pkT E Tk PkT E
用X的前k个主元来代替那些原始输入变量进行回归分
析,这样便得到下面的主元回归模型PCR。
过程变化的简单模型
对于简单的正态随机变化,可以用下面的模型来描 述:
xij w ij i 1,2, k; j 1,2, n
过程参数变化还会引起额外的变化,较复杂的过程 模型为:
统计过程控制类型
筛选性:通过抽样检查检测过程输 出,筛选出不合格产品 。
预防性:通过过程控制防止不合格 产品产生的方法。
统计过程实施步骤:⑴构画流程图。画过程流程图, 并标注组成过程的各个阶段。其次研究过程中的数据流向 与数据储存。⑵确定问题。确定过程变量,收集变量数据 并加以分析。⑶过程探索。收集过程信息,建立经验或者 理论模型,选定统计过程控制图并决定采用哪些变量,最 后实施统计过程控制。
用多元回归算法求模型最佳参数
将实测输出值表达为模型预测值加上误差值
y a0 a1x1 a2 x2 an xn
Y X E
所要求的最佳模型参数就是要求误差值最小,即E最
小。也可表示为 ET E最小。 记 J ET E,求J最小值如下:
J ET E (Y X )T (Y X ) Y TY Y T X ( X )T Y T X T X
应用主元分析压缩数据维数实例
用MatIab指令按下列表达式产生一组四维数据:
x1 randn(50.1) x2 randn(50.1) x3 2 x1 x2 x4 x1 1.5 x2
从上述数学描述式可以看出,这四个变量之间是线性相关的。对 这些数据进行主几分析,得到数据的协方差短阵的特征值为:
Y b1t1 b2t2 bk tk Tk B
式中 B [b1b2 bk ]为主元回归模型参数。
利用最小二乘法计算得到
B
(TkT Tk
)
T 1 T k
Y
由于X Tk PkT ,所以 Y Tk B XPk B ,从上式中可以看出
Pk B Pk (TkT Tk )1TkT Y
此式即为通过主元回归得到模型参数的计算式。
单变量统计过程控制
过程变化的类型 工业过程中所存在的各种各样的变化根据其产生原因大概分
为四类。 噪声变化。随机变化。 过程本身原因引起的变化。如催化剂老化等。
过程变化原因分类 ` 外界因素引起的变化。如环境温度、湿度等。 可在生产中找到原因的变化。如原材料变化等。
统计过程控制的重要作用之一是监测、区分过程变化,帮助人 们寻找过程变化的原因。这通常是利用各种控制图来实现的。
上。
数据矩阵X的主元计算方法
方法一:利用X的协方差矩阵计算主元
第一步:数据矩阵X的负荷向量实际上是其协方差矩阵 X T X 的
特征向量。故需先求出协方差矩阵特征值 1 2 m 的特向 量 p1, p2 , pm 。
第二步:由于X的负荷向量相互正交且长度为1.故需要对所得 上面特征向量进行正交化,单位化。
模型的建立
通过过程所积累的数据和实验所得到的数据,一般的 线性模型可以表达为:
y a0 a1x1 a2 x2 an xn
由在生产过程中得到的一组输入输出观测值,来寻求 最佳模型参数,使得模型预测的输出值与实际测量的输出 值之间的误差达到最小。这个寻找最佳模型参数的过程称 为线性回归。当模型具有多个输出变量时,这个过程被称 为多元线性回归。
⑤将步骤②中的t1与步骤④中的t1作比较,如果它们一样,则算 法已收敛,计算停止,如果它们不一样,回到步骤②,以④中的t1 代替②中的t1继续计算,知道算法收敛为止。
上述算法只是针对第一个主元而言的,对于计算其他主元,算 法是一样的,只要将算法中的X矩阵变为相应的误差矩阵即可。
E1 X t1 p1T , E2 E1 t2 p2T Em Em1 tm pmT
539.46, 73.32 , 0, 0 这说明数据维数可以压缩为两维。与前两个特征值对应的特征向员为: [0.3078 —0.1537 0.7693 0.53831] [一0.4754 —0.6551 —0.2957 0.5073 ]
因此,主元分析足对数据进行维数压缩的有效工具,它对分析和 研究过程以及对过程进行监控是非常实用的.
b1 p1
b2
p2
[b1, [b1,
p2 ] b1]
b1
bm
pm
[b1, pm ] [b1 , b1 ]
b1
[b2 , [b2 ,
pm ] b2 ]
b2
[bm1, p2 ] [bm1, bm1]
bm1
p1 ‖b b1 1‖ p1 ‖b b2 2‖ p1 ‖b bm m‖
第三步:根据 ti Xpi 可求得数据矩阵的各个得分向量,
主元分析
主元分析可以用来实现下列目标:数据简化、数据
压缩、建模奇异值检测、变量选择、分类和预报。
X t1 p1T t2 p2T tm pmT
X TPT
其中得分向量之间是相互正交的,负荷向量之间相互正交
且长度为1,由此可得
ti Xpi
‖t1‖‖t2‖ ‖tm‖
数据矩阵X的变化体现在主元所对应的负荷向量方向来自百度文库