葡萄酒的质量预测模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

葡萄酒的质量预测模型
陈欣
【摘要】运用SPSS软件对葡萄酒的理化指标进行主成分分析,把葡萄酒的各项理化指标降维成了9个主成分,以9个主成分为自变量,葡萄酒的实际评分为因变量,建立多元线性回归模型,得到回归方程.通过葡萄酒质量的预测得分与实际评分的误差分析,得出预测准确率达到了81.5%.
【期刊名称】《西安文理学院学报(自然科学版)》
【年(卷),期】2013(016)002
【总页数】3页(P45-47)
【关键词】葡萄酒;理化指标;回归方程;质量预测
【作者】陈欣
【作者单位】西安文理学院数学与计算机工程学院,西安710065
【正文语种】中文
【中图分类】O213.9
随着国民经济的发展,人民生活水平的提高,我国葡萄酒开始走进千家万户,因此如何评定葡萄酒的优劣成为当下的一个热点话题.葡萄酒的质量一般是通过聘请一批有资质的评酒员进行品评,每个评酒员在对葡萄酒进行品尝后对葡萄酒的外观,香气,口感等指标打分,然后求和得到其总分,从而确定葡萄酒的质量[1-2].由于品评往往受到评酒员的嗜好、习惯、年龄、经验等因素的影响,使得品
尝有一定程度的主观性和不确定性,这使得评分的可靠性受到影响.由于葡萄酒的理化指标在一定程度上能反映葡萄酒的质量,为了对葡萄酒的评价更客观可信,减少主观因素对葡萄酒评定的影响,本文建立多元线性回归模型,通过检测葡萄酒中各种理化指标来预测葡萄酒的质量.
1 数据来源
数据来源于西安市科技计划项目组,抽取了市场上27种葡萄酒样品,聘请一批有资质的评酒员进行品评,得出每种葡萄酒样品质量的实际评分.另外,通过测量得到葡萄酒样品的各项理化指标,其中包括总酚、单宁、花色苷、DPPH半抑制体积、酒总黄酮、顺式反式白藜芦醇、色泽等,以及芳香物质:包括乙醛、丙酮、乙酸甲酯、乙酸乙酯等58个指标.
2 数据处理
由于理化指标数据庞大且繁杂,彼此之间有一定的相关性和信息的重复,为此采用主成分分析,对数据进行简化.主成分分析是数学上对数据降维的一种方法,其基本思想是设法将原来众多的具有一定相关性的指标,重新组合成一组较少个数的互不相关的综合指标来代替原来指标,即提取葡萄酒理化指标中的主成分.用较少的变量去解释原来资料中的大部分变异,将现有许多相关性很高的变量转化成彼此相互独立或不相关的变量.主成分分析[3]的具体步骤如下:
(1)对原始数据进行标准化处理
其中和s分别是第j个指标的均值和标准差.
(2)求相关系数矩阵
经标准化处理后的数据相关系数矩阵为R=(rij)p×p,其中
(3)计算相关系数矩阵R的特征根及向量
求特征方程|r-λI|=0 的 p个非负特征根λi(i=1,2,…,p)且
λ1≥λ2≥λ3≥…≥λp≥0.
(4)计算各主成分的方差贡献率φk和累计方差贡献率φk
φk为第k个主成分Fk提取原始p个指标的信息量.(5)求主成分
各主成分与标准化变量的关系为:,其中F1,F2,…,Fm 这些线性组合互不相关,且它们的方差成递减,m的数值一般根据累计方差贡献率φm≥80%来确定.
利用SPSS软件对葡萄酒的50多个理化指标进行主成分分析,得到葡萄酒样品理
化指标的9个主成分F1,F2,…,F9,累计方差贡献率达到了83.04%,主成分分析的效果良好.
3 多元线性回归分析
客观世界中很多变量之间存在着线性关系.假设有p个自变量x1,x2,…,xp,而y是表示实验指标的因变量.因变量y与p个自变量x1,x2,…,xp间存在线性关系,并可用下述多元线性回归模型[4]表达:y=β0+β1 x1+… +βp xp+ε,
其中β0,β1,…,βp为回归系数,ε 为随机误差.
上述模型为多元线性回归模型,据此模型以葡萄酒理化指标的9个主成分F1,
F2,…,F9为自变量,以葡萄酒样品的实际评分为因变量y,作多元线性回归,
得到回归方程如下:
y=70.515+1.935F1 -1.524F2+1.504F3+1.726F4-
0.406F5+0.898F6 -0.043F7+0.434F8-0.148F9求得检验统计量
F=38.447 8 >F0.05=2.432,回归方程的拟合系数为R2=0.789,所以线
性回归方程显著,模型有效.
4 预测结果分析
用葡萄酒的理化指标对葡萄酒的质量进行预测,得到葡萄质量的预测得分,见表1.
表1 葡萄酒的实际评分与预测得分对比表葡萄酒号1 2 3 4 5 6 7 8 9实际评分68.1 74 74.6 71.2 72.1 66.3 65.3 67.6 78.2预测得分
67.72 73.61 72.99 69.15 72.99 68.83 67.05 67.34 78.03
葡萄酒号 10 11 12 13 14 15 16 17 18实际评分 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4预测得分 68.35 62.41 67.62 72.53 71.3 67.82 68.27 71.84 67.14葡萄酒号 19 20 21 22 23 24 25 26 27实际评分 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5预测得分 68.35 72.41 67.62 72.53 73.3 67.82 68.27 71.84 75.14
利用回归方程进行回归预测,平均相对误差为2.56%.若允许预测误差在5%以内,葡萄酒质量预测的准确率81.5%.
按照比较流行的帕克评分系统:96~100分为顶级佳酿,90~95分为优秀,80~
89分为优良,70~79分为普通,60~69分为次品,50~59分为劣品来划分,
将此27种葡萄酒样品进行等级划分.以实际评分和预测得分分别进行等级划分,结果见表2.
表2 实际评分与预测得分等级划分表葡萄酒等级评分区间样品名(实际评分划分) 样品名(预测得分划分)普通[70,79) 2,3,4,5,9,14,17,19,20,21,22,23,24,26,27 2,3,5,9,13,14,17,20,22,23,26,27
次品[60,69) 1,6,7,8,10,11,12,13,15,16,18,25 1,4,6,7,8,10,11,12,15,16,18,19,21,24,25
由此表可看出,预测等级与实际等级不一的有:样品4,13,19,21,24,预测准确率为81.5%.
实际预测中可以增减一些理化指标,重新进行主成分分析和回归分析,进行多次预测,利用求平均值的方法可以减小误差,提高预测的准确率.
[参考文献]
[1]韦旭阳,陶永胜.通过气味活性成分评价干红葡萄酒的香气质量[J].中国食品学报,2012,12(10):189-193.
[2]李记明,李华.葡萄酒成分分析与质量研究[J].食品与发酵工业,2009,2(1):23-30.
[3]李小胜,陈珍珍.如何正确应用SPSS软件做主成分分析[J].统计研究,2010,27(8):105-109.
[4]王振友,陈莉娥.多元线性回归统计预测模型[J].应用统计与决策,2008,5:46-52.。

相关文档
最新文档