葡萄酒质量评价模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1
x2
x3
x4
褐变度
DPPH自由基1/IC50(g/L)
总酚(mmol/kg)
单宁(mmol/kg)
x9
x10
x11
x12
酒石酸(g/L\)
苹果酸(g/L)
柠檬酸(g/L)
多酚氧化酶活力
x5
x6
x7
x8
葡萄总黄酮(mmol/kg)
白藜芦醇(mg/kg)
黄酮醇(mg/kg)
总糖g/L
x13
x14
x15
表1.2两组白葡萄酒的均衡评价均值
1b
1b
1b
1b
1b
1b
1b
1b
1b
9.7
9.1
9.6
9.4
8.9
8.6
9.4
8.8
8.7
1b
1b
1b
1b
1b
1b
1b
1b
1b
9.2
8.7
8.2
8.5
8.8
8.7
9.3
9.4
8.9Hale Waihona Puke 1b1b1b
1b
1b
1b
1b
1b
1b
1b
8.6
9
9.2
8.3
9.2
8.9
8.8
9.4
8.3
离差平方和
均方
F值
P值
SS组间
(处理因素)
1
0.02240741
0.02240741
0.10
0.7559
SS组内
(抽样误差)
52
11.93259259
0.22947293
总和
53
11.95000000
表1.4一、二两组白葡萄酒平衡评价均值的方差检验结果
自由度
离差平方和
均方
F值
P值
SS组间
(处理因素)
表1.1两组红葡萄酒的均衡评价均值
1h
1h
1h
1h
1h
1h
1h
1h
1h
7.7
9.6
9.4
8.4
8.6
8.6
8.9
8.4
9.7
1h
1h
1h
1h
1h
1h
1h
1h
1h
8.8
8.4
7.9
8.9
8.7
7.6
9.1
9.2
7.9
1h
1h
1h
1h
1h
1h
1h
1h
1h
9.2
9.2
9.2
9
10
9.1
8.3
8.9
9
2h
2h
4.不考虑葡萄酒酿造工艺对葡萄酒质量的影响。
5.所有已知数据均是真实可靠。
6.评酒员对葡萄酒样品的评分是客观的,不含任何个人的主观意见。
四、符号的约定:
1h:第一组的红葡萄酒的均衡评分均值
2h:第二组的红葡萄酒的均衡评分均值
1b:第一组的白葡萄酒的均衡评分均值
2b:第二组的白葡萄酒的均衡评分均值
表1.7
表2.1
然后,进一步画出聚类谱系图,其中图2.1是对酿酒红葡萄的聚类谱系图,图2.2是酿酒白葡萄的聚类谱系图。
接着,根据每类葡萄的质量均值分别对两组酿酒红白葡萄的四类进行分级。
在酿酒红葡萄中,第一类的均值为9.3,第二类均值为8.05,第三类均值为8.8,第四类均值为8.86,所以第一类酿酒葡萄为第一等级,第四类酿酒葡萄为第二等级,第三类酿酒葡萄为第三等级,第二类酿酒葡萄为第四等级。
问题一中需要检验附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信。本文认为可以取每个样品的“均衡评价”结果的均值作为每个样品的质量度量,然后利用SAS软件分红白葡萄酒对两组葡萄酒的质量评价结果进行方差分析确定是否存在显著性差异。本文认为不同样品的葡萄酒有不同的理化指标,因此不同样品的葡萄酒的质量应该有一定的差异。所以可以通过利用SAS软件对数据进行统计分析,判断数据的分散程度,分散度较大的反映了质量的差异性,从而可信度较高。
观察表2.2其SPRSQ项,看到由26-5时该值两两之间变化不大,而从5到4增加了约0.05,变化较大,则分类有明显差异,由此可见,酿酒白葡萄分成四类的结果比较有意义,这四类为第一类为{3},第二类为{1 8 13 16 17 18 19 22},第三类为{2 4 6 7 9 10 11 12 14 20 21 23 26 },第四类为{5 15 25 24 27}。
1
1.11446429
1.11446429
8.96
0.0041
SS组内
(抽样误差)
52
6.71992857
0.1243301
总和
53
7.82839286
最后,利用SAS调用means对表1.1和表1.2做一些简单的统计分析,选出可信度较高的一组评价。表1.1数据统计分析的结果如表1.5所示,表1.2数据统计分析的结果如表1.6所示。
2h
2h
2h
2h
2h
2h
2h
8.4
9.1
8.9
8.8
8.9
8.6
8.4
8.4
9.4
2h
2h
2h
2h
2h
2h
2h
2h
2h
8.4
8.1
8.7
8.6
9.3
8.2
8.8
9
8.8
2h
2h
2h
2h
2h
2h
2h
2h
2h
8.7
9.3
9
8.9
8.9
8.8
8.6
8.8
8.8
其中,对表1.1数据一二两组红葡萄酒平衡评价均值的方差检验结果如表1.3所示,对表1.2数据一二两组白葡萄酒平衡评价均值的方差检验结果如表1.4所示。
第一问是要比较两组葡萄酒质量评价是否存在显著性差异,并选出可信度较高的一组。
首先,本模型通过SAS软件分别对两组葡萄酒的各个品种的10个平衡(整体)评价求均值,并将均值作为对应品种的质量指标,如表1.1,表1.2。
其次,分别对表1.1与表1.2的数据利用SAS软件对其做方差分析,进行样本均数差别的显著性检验,并分别假定原假设为一二组对红葡萄酒的质量评价没有显著性差异和一二组对白葡萄酒的质量评价没有显著性差异。由于葡萄酒主要分为两类:红葡萄酒和白葡萄酒,即中国的所谓“干红”和“干白”。所以本模型决定对红葡萄酒和白葡萄酒进行分开检验。
关键字:葡萄酒方差分析聚类分析相关分析主成份分析回归分析
一、问题重述:
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。需要解决的问题如下:
同时,本文通过SAS软件的聚类分析根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。并用SAS软件的相关分析找出了酿酒葡萄与葡萄酒的理化指标之间的联系。最后,本文利用SAS进行主成份分析和回归分析,确定了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响的模型。该模型的现实意义是帮助品酒爱好者可以直接通过酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量进行初步的判定和估计。
0.28993249
因为葡萄酒的质量可从3个主要方面进行判别,即理化指标、卫生指标和感官指标。其中的理化指标是对葡萄酒最基本的特征予以规定,即它应达到的最起码的成分含量,例如酒精、糖度、酸度、二氧化硫等;卫生指标是衡量葡萄酒受微生物或重金属污染的程度;感官指标是判断葡萄酒质量好坏的一个重要方法,是对葡萄酒质量的综合评价。所以本模型认为不同样品的葡萄酒的质量应该存在较大差异,样本点的分布应该较为分散。
9.4
2b
2b
2b
2b
2b
2b
2b
2b
2b
9.4
9.2
9.3
9.3
9.6
9.2
8.6
9.1
9.4
2b
2b
2b
2b
2b
2b
2b
2b
2b
9.5
9.3
8.6
8.8
9.4
9.3
8.7
9.7
9.2
2b
2b
2b
2b
2b
2b
2b
2b
2b
2b
9.1
9.1
9.5
9.2
9.6
9.2
9.6
9.2
9.3
9.5
从表1.3中可知SS组间均方0.02240741比SS组内均方0.22947293小得多,且F值为0.10小于1,P值为0.7559。若给定显著性水平为0.05,显然,P值大于显著性水平,所以接受原假设即一二两组对红葡萄酒的质量评价不存在显著性差异。
葡萄酒质量评价模型
摘要
虽然葡萄酒并非源自于中国,但是葡萄酒却在今天的中国流行起来了。其中高品质的葡萄酒成为了许多名门望族的身份象征,葡萄酒的品评也日益受到重视。本文利用MATLAB软件对初始数据进行处理,并用SAS软件对经MATLAB软件处理的附录一中的数据进行方差分析,确定两组评价存在显著性差异,并确定第一组评价的可信度较高。
观察表2.1其SPRSQ项,看到由26-5时该值两两之间变化不大,而从5到4增加了约0.013,变化较大,则分类有明显差异,由此可见,酿酒红葡萄分成四类的结果比较有意义,第一类为{3 21},第二类为{1 8},第三类为{2 4 6 7 9 11 12 15 18 19 20 22 23 },第四类为{5 10 13 14 16 17 24 25 26 27}。
从表1.5可知第二组红葡萄酒的均衡评价均值的标准差0.32003383小于第一组的红葡萄酒的均衡评价均值的标准差0.59709649,因此第二组的红葡萄酒的均衡评价均值更平稳,样本数据比较集中。而表1.6中同样可得第二组白葡萄酒的均衡评价均值的标准差0.28993249小于第一组的白葡萄酒的均衡评价均值的标准差0.40571317,也反映出第二组的白葡萄酒的均衡评价均值更平稳,样本数据比较集中。所以本模型认为第一组的评价数据较为分散,可信度比较高。
x16
还原糖g/L
可溶性固形物g/l
PH值
可滴定酸(g/l)
x17
x18
x19
x20
果梗比(%)
出汁率(%)
a果皮质量(g)
L
x25
x26
x27
x28
固酸比
干物质含量g/100g
果穗质量/g
百粒质量/g
x21
x22
x23
x24
a
b
H
C
x29
x30
x31
x32
五、模型建立与求解:
1.第一个问题的解答:
图2.2
3.第三个问题的解答:
第三个问题主要解决的问题是分析酿酒葡萄与葡萄酒的理化指标之间的联系。本模型将红葡萄酒与白葡萄酒进行分开讨论,然后通过SAS软件对酿酒葡萄与葡萄酒的理化指标进行初步的数据处理,将氨基酸总量作为氨基酸的度量,并将其他详细的氨基酸分类指标舍去。同样用白藜芦醇的含量指标作为白藜芦醇的度量,并将其他详细的白藜芦醇的分类指标去掉。而对于那些含有多次测验结果的指标,我们将取其均值为指标的度量,对于色泽则按三原色分类,然后进行相关性分析。
花色苷(mg/L)
单宁(mmol/L)
总酚(mmol/L)
酒总黄酮(mmol/L)
白藜芦醇(mg/L)
y1
y2
y3
y4
y5
DPPH半抑制体积(IV50) 1/IV50(uL)
L*(D65)
a*(D65)
b*(D65)
y6
y7
y8
y9
表1.8
氨基酸总量
蛋白质mg/100g
VC含量(mg/L)
花色苷mg/100g鲜重
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、问题分析:
问题二中需要根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。本文认为可以选择第一问中求出的可信度高的第一组的“均衡评价”结果作为第二问中葡萄酒的质量,结合酿酒葡萄的指标,然后利用SAS软件对这些数据指标进行聚类分析,从而对酿酒葡萄进行分级。
问题三中需要分析酿酒葡萄与葡萄酒的理化指标之间的联系。本文认为要确定酿酒葡萄与葡萄酒的理化指标之间的联系,首先必须利用SAS软件先确定这两组指标是否存在相关关系,并筛选出相关性较高的指标,从而确定两组指标之间存在的联系。
2.第二个问题的解答:
第二问是要根据酿酒葡萄的理化指标和葡萄酒的质量对27个酿酒葡萄样品进行分类,并进行等级排序。由第一问的解答得知第一组的红葡萄酒和白葡萄酒的评价数据更可信,所以本文选定第一组的葡萄酒评价均值作为葡萄酒的质量的数值。
首先,通过SAS软件分别导入两组酿酒葡萄的理化指标和葡萄酒的质量合并的数据,然后进行聚类分析,用类平均法聚类的结过程如表2.1和表2.2,其中表2.1是对酿酒红葡萄的分类过程,表2.2是对酿酒白葡萄的分类过程。
从表1.4中可知SS组间均方1.11446429比SS组内均方0.1243301大得多,且F值为8.96大于1,P值为0.0041。若给定显著性水平为0.05,显然,P值小于显著性水平,所以拒绝原假设即一二两组对白葡萄酒的质量评价存在显著性差异。
表1.3一、二两组红葡萄酒平衡评价均值的方差检验结果
自由度
表1.5一二两组红葡萄酒的均衡评价均值的统计分析
组别
样本数
平均值
标准差
1h
27
8.80370370
0.59709649
2h
27
8.76296296
0.32003383
表1.6一二两组白葡萄酒的均衡评价均值的统计分析
组别
样本数
平均值
标准差
1b
28
8.96428571
0.40571317
2b
28
9.24642857
问题四中需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
三、模型的假设:
1.评酒员对葡萄酒样品的评分是客观的,不含任何个人的主观意见。
2.假设二级指标对葡萄酒影响都反映在一级指标中。
3.假设酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,而且成正比。
表2.2
在酿酒白葡萄中,第一类的均值为9.6,第二类均值为8.94,第三类均值为8.99,第四类均值为8.95,所以第一类酿酒葡萄为第一等级,第三类酿酒葡萄为第二等级,第四类酿酒葡萄为第三等级,第二类酿酒葡萄为第四等级。
最后,结论是将酿酒红葡萄分成四类四个等级,将酿酒白葡萄分成四类四个等级。
图2.1
x2
x3
x4
褐变度
DPPH自由基1/IC50(g/L)
总酚(mmol/kg)
单宁(mmol/kg)
x9
x10
x11
x12
酒石酸(g/L\)
苹果酸(g/L)
柠檬酸(g/L)
多酚氧化酶活力
x5
x6
x7
x8
葡萄总黄酮(mmol/kg)
白藜芦醇(mg/kg)
黄酮醇(mg/kg)
总糖g/L
x13
x14
x15
表1.2两组白葡萄酒的均衡评价均值
1b
1b
1b
1b
1b
1b
1b
1b
1b
9.7
9.1
9.6
9.4
8.9
8.6
9.4
8.8
8.7
1b
1b
1b
1b
1b
1b
1b
1b
1b
9.2
8.7
8.2
8.5
8.8
8.7
9.3
9.4
8.9Hale Waihona Puke 1b1b1b
1b
1b
1b
1b
1b
1b
1b
8.6
9
9.2
8.3
9.2
8.9
8.8
9.4
8.3
离差平方和
均方
F值
P值
SS组间
(处理因素)
1
0.02240741
0.02240741
0.10
0.7559
SS组内
(抽样误差)
52
11.93259259
0.22947293
总和
53
11.95000000
表1.4一、二两组白葡萄酒平衡评价均值的方差检验结果
自由度
离差平方和
均方
F值
P值
SS组间
(处理因素)
表1.1两组红葡萄酒的均衡评价均值
1h
1h
1h
1h
1h
1h
1h
1h
1h
7.7
9.6
9.4
8.4
8.6
8.6
8.9
8.4
9.7
1h
1h
1h
1h
1h
1h
1h
1h
1h
8.8
8.4
7.9
8.9
8.7
7.6
9.1
9.2
7.9
1h
1h
1h
1h
1h
1h
1h
1h
1h
9.2
9.2
9.2
9
10
9.1
8.3
8.9
9
2h
2h
4.不考虑葡萄酒酿造工艺对葡萄酒质量的影响。
5.所有已知数据均是真实可靠。
6.评酒员对葡萄酒样品的评分是客观的,不含任何个人的主观意见。
四、符号的约定:
1h:第一组的红葡萄酒的均衡评分均值
2h:第二组的红葡萄酒的均衡评分均值
1b:第一组的白葡萄酒的均衡评分均值
2b:第二组的白葡萄酒的均衡评分均值
表1.7
表2.1
然后,进一步画出聚类谱系图,其中图2.1是对酿酒红葡萄的聚类谱系图,图2.2是酿酒白葡萄的聚类谱系图。
接着,根据每类葡萄的质量均值分别对两组酿酒红白葡萄的四类进行分级。
在酿酒红葡萄中,第一类的均值为9.3,第二类均值为8.05,第三类均值为8.8,第四类均值为8.86,所以第一类酿酒葡萄为第一等级,第四类酿酒葡萄为第二等级,第三类酿酒葡萄为第三等级,第二类酿酒葡萄为第四等级。
问题一中需要检验附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信。本文认为可以取每个样品的“均衡评价”结果的均值作为每个样品的质量度量,然后利用SAS软件分红白葡萄酒对两组葡萄酒的质量评价结果进行方差分析确定是否存在显著性差异。本文认为不同样品的葡萄酒有不同的理化指标,因此不同样品的葡萄酒的质量应该有一定的差异。所以可以通过利用SAS软件对数据进行统计分析,判断数据的分散程度,分散度较大的反映了质量的差异性,从而可信度较高。
观察表2.2其SPRSQ项,看到由26-5时该值两两之间变化不大,而从5到4增加了约0.05,变化较大,则分类有明显差异,由此可见,酿酒白葡萄分成四类的结果比较有意义,这四类为第一类为{3},第二类为{1 8 13 16 17 18 19 22},第三类为{2 4 6 7 9 10 11 12 14 20 21 23 26 },第四类为{5 15 25 24 27}。
1
1.11446429
1.11446429
8.96
0.0041
SS组内
(抽样误差)
52
6.71992857
0.1243301
总和
53
7.82839286
最后,利用SAS调用means对表1.1和表1.2做一些简单的统计分析,选出可信度较高的一组评价。表1.1数据统计分析的结果如表1.5所示,表1.2数据统计分析的结果如表1.6所示。
2h
2h
2h
2h
2h
2h
2h
8.4
9.1
8.9
8.8
8.9
8.6
8.4
8.4
9.4
2h
2h
2h
2h
2h
2h
2h
2h
2h
8.4
8.1
8.7
8.6
9.3
8.2
8.8
9
8.8
2h
2h
2h
2h
2h
2h
2h
2h
2h
8.7
9.3
9
8.9
8.9
8.8
8.6
8.8
8.8
其中,对表1.1数据一二两组红葡萄酒平衡评价均值的方差检验结果如表1.3所示,对表1.2数据一二两组白葡萄酒平衡评价均值的方差检验结果如表1.4所示。
第一问是要比较两组葡萄酒质量评价是否存在显著性差异,并选出可信度较高的一组。
首先,本模型通过SAS软件分别对两组葡萄酒的各个品种的10个平衡(整体)评价求均值,并将均值作为对应品种的质量指标,如表1.1,表1.2。
其次,分别对表1.1与表1.2的数据利用SAS软件对其做方差分析,进行样本均数差别的显著性检验,并分别假定原假设为一二组对红葡萄酒的质量评价没有显著性差异和一二组对白葡萄酒的质量评价没有显著性差异。由于葡萄酒主要分为两类:红葡萄酒和白葡萄酒,即中国的所谓“干红”和“干白”。所以本模型决定对红葡萄酒和白葡萄酒进行分开检验。
关键字:葡萄酒方差分析聚类分析相关分析主成份分析回归分析
一、问题重述:
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。需要解决的问题如下:
同时,本文通过SAS软件的聚类分析根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。并用SAS软件的相关分析找出了酿酒葡萄与葡萄酒的理化指标之间的联系。最后,本文利用SAS进行主成份分析和回归分析,确定了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响的模型。该模型的现实意义是帮助品酒爱好者可以直接通过酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量进行初步的判定和估计。
0.28993249
因为葡萄酒的质量可从3个主要方面进行判别,即理化指标、卫生指标和感官指标。其中的理化指标是对葡萄酒最基本的特征予以规定,即它应达到的最起码的成分含量,例如酒精、糖度、酸度、二氧化硫等;卫生指标是衡量葡萄酒受微生物或重金属污染的程度;感官指标是判断葡萄酒质量好坏的一个重要方法,是对葡萄酒质量的综合评价。所以本模型认为不同样品的葡萄酒的质量应该存在较大差异,样本点的分布应该较为分散。
9.4
2b
2b
2b
2b
2b
2b
2b
2b
2b
9.4
9.2
9.3
9.3
9.6
9.2
8.6
9.1
9.4
2b
2b
2b
2b
2b
2b
2b
2b
2b
9.5
9.3
8.6
8.8
9.4
9.3
8.7
9.7
9.2
2b
2b
2b
2b
2b
2b
2b
2b
2b
2b
9.1
9.1
9.5
9.2
9.6
9.2
9.6
9.2
9.3
9.5
从表1.3中可知SS组间均方0.02240741比SS组内均方0.22947293小得多,且F值为0.10小于1,P值为0.7559。若给定显著性水平为0.05,显然,P值大于显著性水平,所以接受原假设即一二两组对红葡萄酒的质量评价不存在显著性差异。
葡萄酒质量评价模型
摘要
虽然葡萄酒并非源自于中国,但是葡萄酒却在今天的中国流行起来了。其中高品质的葡萄酒成为了许多名门望族的身份象征,葡萄酒的品评也日益受到重视。本文利用MATLAB软件对初始数据进行处理,并用SAS软件对经MATLAB软件处理的附录一中的数据进行方差分析,确定两组评价存在显著性差异,并确定第一组评价的可信度较高。
观察表2.1其SPRSQ项,看到由26-5时该值两两之间变化不大,而从5到4增加了约0.013,变化较大,则分类有明显差异,由此可见,酿酒红葡萄分成四类的结果比较有意义,第一类为{3 21},第二类为{1 8},第三类为{2 4 6 7 9 11 12 15 18 19 20 22 23 },第四类为{5 10 13 14 16 17 24 25 26 27}。
从表1.5可知第二组红葡萄酒的均衡评价均值的标准差0.32003383小于第一组的红葡萄酒的均衡评价均值的标准差0.59709649,因此第二组的红葡萄酒的均衡评价均值更平稳,样本数据比较集中。而表1.6中同样可得第二组白葡萄酒的均衡评价均值的标准差0.28993249小于第一组的白葡萄酒的均衡评价均值的标准差0.40571317,也反映出第二组的白葡萄酒的均衡评价均值更平稳,样本数据比较集中。所以本模型认为第一组的评价数据较为分散,可信度比较高。
x16
还原糖g/L
可溶性固形物g/l
PH值
可滴定酸(g/l)
x17
x18
x19
x20
果梗比(%)
出汁率(%)
a果皮质量(g)
L
x25
x26
x27
x28
固酸比
干物质含量g/100g
果穗质量/g
百粒质量/g
x21
x22
x23
x24
a
b
H
C
x29
x30
x31
x32
五、模型建立与求解:
1.第一个问题的解答:
图2.2
3.第三个问题的解答:
第三个问题主要解决的问题是分析酿酒葡萄与葡萄酒的理化指标之间的联系。本模型将红葡萄酒与白葡萄酒进行分开讨论,然后通过SAS软件对酿酒葡萄与葡萄酒的理化指标进行初步的数据处理,将氨基酸总量作为氨基酸的度量,并将其他详细的氨基酸分类指标舍去。同样用白藜芦醇的含量指标作为白藜芦醇的度量,并将其他详细的白藜芦醇的分类指标去掉。而对于那些含有多次测验结果的指标,我们将取其均值为指标的度量,对于色泽则按三原色分类,然后进行相关性分析。
花色苷(mg/L)
单宁(mmol/L)
总酚(mmol/L)
酒总黄酮(mmol/L)
白藜芦醇(mg/L)
y1
y2
y3
y4
y5
DPPH半抑制体积(IV50) 1/IV50(uL)
L*(D65)
a*(D65)
b*(D65)
y6
y7
y8
y9
表1.8
氨基酸总量
蛋白质mg/100g
VC含量(mg/L)
花色苷mg/100g鲜重
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、问题分析:
问题二中需要根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。本文认为可以选择第一问中求出的可信度高的第一组的“均衡评价”结果作为第二问中葡萄酒的质量,结合酿酒葡萄的指标,然后利用SAS软件对这些数据指标进行聚类分析,从而对酿酒葡萄进行分级。
问题三中需要分析酿酒葡萄与葡萄酒的理化指标之间的联系。本文认为要确定酿酒葡萄与葡萄酒的理化指标之间的联系,首先必须利用SAS软件先确定这两组指标是否存在相关关系,并筛选出相关性较高的指标,从而确定两组指标之间存在的联系。
2.第二个问题的解答:
第二问是要根据酿酒葡萄的理化指标和葡萄酒的质量对27个酿酒葡萄样品进行分类,并进行等级排序。由第一问的解答得知第一组的红葡萄酒和白葡萄酒的评价数据更可信,所以本文选定第一组的葡萄酒评价均值作为葡萄酒的质量的数值。
首先,通过SAS软件分别导入两组酿酒葡萄的理化指标和葡萄酒的质量合并的数据,然后进行聚类分析,用类平均法聚类的结过程如表2.1和表2.2,其中表2.1是对酿酒红葡萄的分类过程,表2.2是对酿酒白葡萄的分类过程。
从表1.4中可知SS组间均方1.11446429比SS组内均方0.1243301大得多,且F值为8.96大于1,P值为0.0041。若给定显著性水平为0.05,显然,P值小于显著性水平,所以拒绝原假设即一二两组对白葡萄酒的质量评价存在显著性差异。
表1.3一、二两组红葡萄酒平衡评价均值的方差检验结果
自由度
表1.5一二两组红葡萄酒的均衡评价均值的统计分析
组别
样本数
平均值
标准差
1h
27
8.80370370
0.59709649
2h
27
8.76296296
0.32003383
表1.6一二两组白葡萄酒的均衡评价均值的统计分析
组别
样本数
平均值
标准差
1b
28
8.96428571
0.40571317
2b
28
9.24642857
问题四中需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
三、模型的假设:
1.评酒员对葡萄酒样品的评分是客观的,不含任何个人的主观意见。
2.假设二级指标对葡萄酒影响都反映在一级指标中。
3.假设酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,而且成正比。
表2.2
在酿酒白葡萄中,第一类的均值为9.6,第二类均值为8.94,第三类均值为8.99,第四类均值为8.95,所以第一类酿酒葡萄为第一等级,第三类酿酒葡萄为第二等级,第四类酿酒葡萄为第三等级,第二类酿酒葡萄为第四等级。
最后,结论是将酿酒红葡萄分成四类四个等级,将酿酒白葡萄分成四类四个等级。
图2.1