(完整word版)Unscrambler9.7PCA、PLS建模分析流程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

by liao
2013.1.23
红外光谱分析
化学计量学软件Unscrambler9.7 PLS1红外光谱分析建模(帮助里自带例题消费者对果酱质量的偏爱性分析-tutor_b每一步超详细步骤,自己总结加翻译)PCA\PLS2\PLS1
问题1:找到覆盆子果酱主要的感官质量特征
问题2:找出主要感官质量特征和化学测量值的关系
问题3:通过主要感官质量特征预测未知样的参数
看重
PCA 解释方差图(the Explained Variance:残余方差曲线),得分和权重
PLS2 解释方差图(the Explained Variance:残余方差曲线):残余方差曲线,得分,权重,模型预测能力-Predicted vs Measured
PLS1 解释方差图(the Explained Variance:残余方差曲线),
模型预测能力-Predicted vs Measured,
模型系数RW-Regression Coefficients,
预测时:
模型预测错误率RMSEP
基本设置:
1 打开自带例子tutorial B
L A B 为化学变量;Absorban吸收性Soluble可溶解性Acidity酸性为设备变量(比色法测得),6个变量放在设备变量里
preference变量是消费者偏爱性
20个样品:12个用来建模,叫做校正集;其他8个为预测集。

2 插入类别变量Cultivar、Harvest Time
Edit - Insert - Category Variable
同理,收获时间分类变量Harvest Time ,变量名为蓝色。

数据表中双击选择对应值如下图
3 样品、变量设置
Modify - Edit Set
样品:
变量:
问题1:找到覆盆子果酱主要的感官质量特征解决方法1 PCA建模
因为只考虑X变量
分析:
1 解释残余方差图
选中右下方,Plot - Variancesand RMSEP
得到解释方差图,3个主成分描述了92%的验证变量信息、97%的校正变量信息。

2 解释得分图:
选中得分图,Edit - Options-SampleGrouping -Enable Sample Grouping,再按下图设置:得到:
按照收获时间分类,分成了三类,以不同颜色标示。

3 解释权重矩阵
选中权重矩阵,View - Correlation Loadings
显示REDNESS and COLOUR在主成分1的最右边,离得很近,远离中心,非常接近100%解释方差椭圆(内椭圆为50%解释方差),得出颜色和发红性很相关,也意味着得分图右边的样品这两个变量的含量值很高。

主成分2轴上,R.SMELL and R.FLAV在正上方,两者很相关,且与在正下方的FLAV呈负相关。

在得分图上,越往上,有很高R.SMELL and R.FLAV。

得分图和相关权重图显示C2H3 and C1H3有很高的REDNESS and COLOUR特性值;C1H2有很大的off-flavour特性。

在得分图上的样品点的位置对应权重图上相对应位置上的特性变量值。

主成分3描述的变量是sweetness, bitterness and chewing resistance
Plot - Loadings,选择PC 1 vs. PC 3
4 解释影响图
左下角是,位于图右上方的样品是outliers,应该被去除。

本图中没有outliers.
保存PCA模型为“Tutorial B PCA”。

问题2:找出主要感官质量特征和化学测量值的关系解决方法
1 建立PLS2模型
因为考虑X和Y变量
Task - Regression
点击
setup
在PC5处预测误差达到最小值。

但是第一个最小预测误差是在前两个主成分后的0.84,这是必须选择的主成分来避免过拟合。

2 找出outliers
下方的warning:找出outliers。

点击Window - Warning List
点击outliers得出:
1 解释方差图
选中左下方图,Plot - Variancesand RMSEP--看模型如何描述6个Y变量_查看解释方差explained variance.
the Explained Variance:残余方差曲线显示,两个主成分是最佳的。

变量很好地被这两个主成分描述。

85%the color variation (variables 1 and 2),80%的sweetness (6) 可以被化学和测量变量解释。

注意:只有23%的总Y变量被模型解释(用两个主成分)。

total为蓝色。

2 解释得分图
得分图
Edit - Options
PC1描述收获时间。

收获时间1在最左边,收获时间在最右边,分的很开。

得分图不显示培养变量Cultivar 的信息。

结合loading权重图可以得到更多的信息。

3 解释权重图
选中权重图,Plot - Loading Weights
显示spectrophotometric color measurements (L, A, and B)与color intensity and redness是负相关的。

Sweetness就像期望的一样与酸度Acidity负相关。

但是R. Flavor与the PLS-factors弱相关(靠近原点、弱的PLS权重)
问题1PCA模型分析结果是jam quality varied both with respect to color, flavor, and sweetness(果酱质量主要以color, flavor, and sweetness)区分。

现在的模型中显示,chemical and instrumental 变量主要预测color and sweetness,但是不能预测Y-variableFlavor 。

采用其他设备变量X,例如气相色谱数据,可以提高Y-variableFlavor 的预测能力。

1 解释模型预测能力图
模型预测能力
选中右下角图,Plot - Predicted vs Measured :variable Redness, model with two PCs
最终四幅图:
保存PLS2模型为“Tutorial B Inst-Sens”
问题3:通过主要感官质量特征预测未知样的参数解决方法1 建立PLS1预测模型
Task - Regression
2 解释模型预测能力--残余方差图
选中左下角图,点击Window - Copy To - 1
预测方差在0.143时停止降低,因此选择两个主成分PC1、PC2.
3 解释预测和测量图Predicted vs Measured
选中右下角图,点击Plot - Predicted vs Measured
预测能力很好,虽然一些样品不是很好地被预测,但是总的相关系数很好0.9213,
4 解释模型系数Bw and B
模型系数告诉我们每一个感官变量对消费者的累计重要性,这些变量可以很好地预测Y变量Preference。

Plot - Regression Coefficients,选择Weighted coefficients (BW) ,两个主成分
双击图中显示屏位置,可以使画出的图是全屏
Edit - Options -bars
Edit - Mark - SignificantX-Variables Only
统计分析上,Redness, Color and Sweetness对于预测Preference很重要。

Raspberry Smell也很重要,但是是副作用对应偏爱。

Thickness看起来很重要,因为有很大的副作用,但是该模型不能显示其重要性。

保存模型为“Tutorial B Sens-Pref”
5 打开结果矩阵
File - Import - Unscrambler Results -Import data into New data table
6 输出模型Results - Regression
点击Export
Full ASCII-MOD export包含了outliers探测等的所有结果,且可以被其他软件识别。

7 预测新变量
Task - Predict
预测存在一些不确定性的限制,模型不是太好,但是这个模型可以被用来预测新果酱样品的偏爱性,预测哪一个样品将会被消费者接受。

保存预测结果为“Tutorial B Predict 1”。

7 RMSEP(预测均方根误差值)
查找原始单元中的错误-RMSEP(预测均方根误差值)
Results - Regression--Tutorial B Sens-Pref
Plot - and RMSEP
图中显示了所有主成分的偏爱性的预测均方根误差。

(完整word版)Unscrambler9.7PCA、PLS建模分析流程
前两个主成分的RMSEP是0.83,这意味着预测新样品误差在0.8左右,在可以接受的感官质量特征分析水平内,在所有测量中都有一定的不确定性。

相关文档
最新文档