分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
j 1
(17)
(2) j
式中 ki(1) 表示葡萄及葡萄酒理化指标的综合主成分 yi(1) 在回归方程中的系数,
(2) k (2) j 表示葡萄及葡萄酒芳香物质的综合主成分 y j 在回归方程中的系数, SI1 为理
化指标对葡萄酒质量影响比重, SI 2 为芳香物质对葡萄酒质量影响比重。
由式(15)的系数及式(15) 、式(16) ,可以计算得理化指标对红葡萄酒质量影响 比重 SI1 65.5% ,芳香物质对红葡萄酒质量影响比重 SI 2 35.5% ;同样可以计算得理化 指 标 对 白 葡 萄 酒 质 量 影 响 比 重 SI1 53.1% , 芳 香 物 质 对 白 葡 萄 酒 质 量 影 响 比 重
全模型的复判定系数为 R 2 ,减模型的复判定系数记为 R 2 j 。定义
2 2 R 2 j R Rj
由于在全模型中多一个自变量 x j ,所以,若 R 2 j 几乎为零,说明增加 x j , 对 y 的解释能力没有显著提高;否则,若 R 2 j 显著不为零,则 x j 就可以为回归模 型提供显著的解释信息。
yi 表示酿酒红葡萄、红葡萄酒理化指标的第 i 个主成分。
通过逐步回归分析后, 影响红葡萄酒质量的红葡萄和红葡萄酒理化指标的主成分只剩下
yi (i 1, 2, , 6), y12 , y13 。结合红葡萄及红葡萄酒理化指标的主成分,糖转化为酒精,酸影
响葡萄酒中的 PH 值,单宁、色素等酚类物质溶解在葡萄酒中,红葡萄酒的颜色、气味、口 感等与酚类、 糖类和酸类等物质密切相关, 而葡萄酒的质量目前主要依据评酒员的感官评价, 葡萄酒的好坏与其外观、 香气和口感密切联系, 葡萄与葡萄酒的理化指标就在一定程度上影 响了葡萄酒的质量,具体定量关系如上式回归方程。 1.4 关于葡萄和葡萄酒的理化指标对葡萄酒质量影响的论证
y b0 b1 x1 b2 x2 bn xn
从这 n 个变量中删除自变量 x j ,这时用 n 1 个自变量拟合模型称为减模型, 即
y b0 b1 x1 b j 1 x j 1 b j 1 x j 1 bn xn
Matlab 程序
clc,clear gj=xlsread('…\葡萄酒评价\葡萄酒和葡萄.xlsx'); gj=zscore(gj); %数据标准化 r=corrcoef(gj); %计算相关系数矩阵 %下面利用相关系数矩阵进行主成分分析,x 的列为 r 的特征向量,即主成分的 系数 [x,y,z]=pcacov(r) %y 为 r 的特征值,z 为各个主成分的贡献率 contr=cumsum(z)/sum(z) t=x(:,1:19) t1=z(1:19) y1=zeros(27,19); y1=gj*t Y=[68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5]; Y=zscore(Y); %数据标准化
F进 >F出
式中, F进 为选入变量时的临界值; F出 为删除变量时的临界值。 (3)理化指标对葡萄酒质量的影响 将酿酒葡萄和葡萄酒的理化指标合并为一个数据表(见附件) ,将得到的数 据进行标准化处理,处理方法如式(5) ,基于模型三的酿酒葡萄理化指标的主成 分分析法对合并的数据进行主成分分析, 得到酿酒葡萄和葡萄酒的理化指标的 p 个主成分,对其两者的理化指标降维,且增强指标的独立性,把各酿酒葡萄与葡 萄酒合并的样本的原始三十九个理化指标的标准化数据代入 p 个主成分的表达 式,就可以得到各葡萄样本的 p 个主成分值。将评酒员的评分作为葡萄酒质量的 定量刻画,利用合成样本的主成分对葡萄酒质量进行逐步回归分析,得到酿酒葡 改变其中的 萄和葡萄酒理化指标对葡萄质量的综合定量描述 y f ( x1 , x2 , , x p ) , 某一项或几项解释变量 xi ,可以观察到该项或几项解释变量对葡萄质量的பைடு நூலகம்响
y f ( x1 , x2 , , xi , , x p ) 。
1.3 逐步回归分析模型的求解
对酿酒葡萄与葡萄酒合并的样本进行主成分分析,以酿酒红葡萄、红葡萄酒 为例主成分分析的结果如下: 表 1:酿酒红葡萄、红葡萄酒理化指标的主成分分析结果
序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 特征根 11.6142 5.1747 4.3136 3.4271 2.3188 2.1235 1.5764 1.5033 1.1455 1.0063 0.8612 0.7795 0.6168 0.446 0.4158 0.3469 0.3135 0.2537 0.2282 0.1594 贡献率 29.7799 13.2685 11.0605 8.7873 5.9456 5.445 4.0421 3.8546 2.9372 2.5804 2.2082 1.9988 1.5815 1.1436 1.0661 0.8896 0.8038 0.6505 0.585 0.4087 累计贡献率 0.2978 0.4305 0.5411 0.629 0.6884 0.7429 0.7833 0.8218 0.8512 0.877 0.8991 0.9191 0.9349 0.9463 0.957 0.9659 0.9739 0.9804 0.9863 0.9904
(15)
(4)理化指标与芳香物质对葡萄酒质量的影响比重 理化指标对葡萄酒质量影响比重计算为
SI1
k
i 1
11
(1) i 13
k
i 1
11
(1) i
k
j 1
(16)
(2) j
芳香物质对葡萄酒质量影响比重计算为
SI 2
k
j 1
13
(2) j 13
k
i 1
11
(1) i
k
现将前 19 个主成分代替原来的理化指标,然后对葡萄酒的质量进行逐步回归。 运用 MATLAB 中的 Stepwise Regression 窗口(matlab 程序见附录)进行交互 式逐步回归,如图 1。
图 1 逐步回归交互式界面 复判定系数为 R 2 0.8711 ,检验值 F 15.2108 ,得到最终模型为 y 0.1423 y1 0.1782 y2 0.1027 y6 0.1936 y12 0.3670 y13 此回归方程即为酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响方程,
(3)两种综合主成分的逐步回归 将葡萄和葡萄酒的理化指标及芳香物质的综合主成分看作同等地位的变量 对葡萄酒的质量会产生一定的影响,现对其三者之间进行逐步回归分析(用 matlab 的 Stepwise Regression 窗口实现) ,得到理化指标与芳香物质的回归方程:
(2) (1) (1) y 0.4504 y9 0.1637 y1(1) 0.1806 y2 0.1194 y5
x1 , , x j 1 , x j 1 , , xn 变量已进入模型后,引入 x j 会显著提高对 y 的解释能力;
(i) 当 F j F 时, 接受 H 0 ,说明 R 2 这说明在全模型中删除 x j , j 显著为零, 对 y 的解释能力无显著的减弱变化。 (2)逐步回归分析 模型的起始首先要求 y 与每一个 xi 的一元线性回归方程, 选择 F 值最大的变 量进入模型。然后,对剩下的 n 1 个模型外的变量进行偏 F 检验(设定 xi1 已在 模型中) ,在若干通过偏F检验的变量中,选择 F j 值最大者进入模型。再对模型 外的 n 2 个自变量做偏 F 检验。在通过偏 F 检验的变量中选择 F j 值最大者进入 模型。接着对模型中的三个自变量分别进行偏 F 检验,如果三个自变量都通过 了偏 F 检验,则接着选择第四个变量。但如果有某一个变量没有通过偏 F 检验, 则将其从模型中删除。 重复上述步骤, 直到所有模型外的变量都不能通过偏 F 检 验,则算法终止。为了避免变量的进出循环,一般取偏 F 检验拒绝域的临界值 为
可以看出, 前 8 个特征根的累计贡献率就达到了 80%以上, 主成分分析效果很好。 下面选取前 19 个主成分(累计贡献率就达到了 98.63%) ,由此可得 19 个主成分 分别为
y1 0.1053 x1 0.1615 x2 0.0097 x39 y 0.2391x 0.1840 x 0.1225 x 2 1 2 39 y19 0.2364 x1 0.1969 x2 0.1539 x39
由于评酒员的感官评价中考虑了外观、香气和口感等综合因素,因此葡萄酒 的感官质量是由葡萄酒的外观、香气、口感和整体因素等决定的,受评酒员个人 的偏好的影响。若反映到葡萄及葡萄酒的化学组成,外观是受葡萄及葡萄酒的色 泽等影响的,香气是由葡萄及葡萄酒的芳香物质影响的,而口感是由葡萄及葡萄 酒的某些理化指标影响的。因此,理化指标在一定程度上反应了葡萄酒的质量, 由于香气对葡萄酒质量的影响,可能芳香物质在一定程度上影响了葡萄酒的质 量。 现在我们就采用主成分分析与逐步回归的方法对葡萄及葡萄酒的理化指标 与芳香物质进行定量研究,考察理化指标与芳香物质对葡萄酒质量的影响程度。 分析步骤如下: (1)葡萄和葡萄酒理化指标的综合主成分分析 基于模型四中酿酒葡萄和葡萄酒的理化指标的主成分分析法,得到了葡萄和
2 给出统计假设 H 0 : R 2 j 0, H 1 : R j 0
统计检验量为
Fj
Q j Q Q ( n m 1)
式中, Q j 是减模型的残差平方和, Q 为全模型的残差平方和。
根据检验水平 查 F 分布表,得到拒绝域的临界值 F ,则决策准则如下: ( i ) 当 F j F 时 , 拒 绝 H 0 , 说 明 R 2 j 显 著 不 为 零 , 这 说 明 在
SI 2 46.9% ,说明红、白葡萄和红、白葡萄酒的芳香物质对葡萄酒的质量有 30%以上的
影响比重,白葡萄的芳香物质对白葡萄酒的质量影响相对更大。根据实际情况,红葡萄酒的 颜色、气味、口感等与酚类等理化指标密切相关,而白葡萄酒的质量,主要由源于葡萄品种 的一类香气和源于酒精发酵的二类香气以及酚类物质的含量所决定。 故而它们的理化指标对 葡萄酒的质量有较大程度的影响, 但并不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒 的质量。
分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和 葡萄酒的理化指标来评价葡萄酒的质量 1.1 问题 4 的分析 问题四要求研究酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响, 以及是 否能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。 我们将提取葡萄及 葡萄酒的理化指标与芳香物质中的主成分, 利用逐步回归的方法考察理化指标与 芳香物质对葡萄酒质量的影响程度, 通过对芳香物质对葡萄酒质量影响比重得到 芳香物质对葡萄酒的质量有 30%以上的影响比重(白葡萄的芳香物质对白葡萄酒 的质量影响相对更大) ,故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄 酒的质量。 1.2 逐步回归分析模型的建立 逐步回归法是一种变量筛选方法。逐步回归法采取边进边退的方法,对于模 型外部的变量,只要它还可提供显著的解释信息,就可以再次进入模型;而对于 已在内部的变量,只要它的偏 F 检验【6】不能通过,则还可能从模型中被删除。 (1)偏 F 检验 在决定一个新的变量是否有必要进入模型, 或者判断某个变量是否可以从模 型中删除时,考虑这个变量能否对 y 提供显著的附加解释信息?现采用偏 F 检 验。 设有 n 个自变量 x1 , x2 , , xn ,采用这 n 个自变量拟合的模型称为全模型,即
(1) (1) 葡萄酒的两种理化指标合并在一起的综合主成分,记为 y1(1) , y2 。 , , y11
(2)葡萄和葡萄酒芳香物质的综合主成分分析 同对理化指标的处理方法,先将酿酒葡萄和葡萄酒的芳香物质合并成一个数 据矩阵,先对其中的每一个元素进行标准化处理,然后进行主成分分析,得到芳
(2) (2) 香物质的主成分 y1(2) , y2 。 , , y13
相关文档
最新文档