葡萄酒的评价
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ap
Z
d ij
3
五.模型建立与求解
5.1 问题一模型的建立与求解 配对样本 t 检验是针对配对数据的 t 检验。其检验方法是首先求出没对样本的差 值,然后比较样本差值的均值和总体均值 0 之间的关系。如果两组数据没有差别,那 么其样本差值均值应该在 0 附近波动。否则认为两组数是有差别的。这种方法本质就 是在对配对样本的差值同总体均值 0 做单样本 t 检验,通过对题目的分析和数据的整 理,恰好符合此检验,因此我们应用了配对样本 t 检验。 配对样本 t 检验模型建立的步骤: 两组人员对每种红葡萄酒评价的平均分数 X1 , X 2 服从正态分布 N (1 , 12 ) ,
2
用第二问中所得到的数据进行分析,利用曲线拟合的方法,得到相应的图表,通过这
些图表分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,讨论其中的重要关 系。
三.模型假设
1. 问题中所给的数据具有一定的事实依据,能够反映客观的事实,值得相信。 2. 假设葡萄周围的环境因素不影响其本身的性质。 3. 假设所有的理化指标在任何情况下不会改变。 4. 忽略其他的不必要因素,减少数据的误差,增加数据的可靠性。
2012 高教社杯全国大学生数学建模竞赛
承
诺
书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。
四.符号说明
符号 X1 , X 2
Y c d aij
aij
R
~
说明 对酒评价的平均数 随机变量 样品(酒、葡萄)序号 指标种类序号 指标值 标准化指标 相关系数矩阵 特征值 特征向量 第 i 个主成分 为 y j 的信息贡wk.baidu.com率 为 y p 的贡献率 综合得分 聚类数目 到聚类中心距离
yi bj
对 一组白酒 平均打分 1 - 二组白 酒平均打 分
均 值 -2 .5 21 43
df
Sig .( 双 侧) 27 .01 4
表其所是配对样品 t 检验结果。其显著性水平 sig.(双侧)取值明显小于 0.05, 所以认为两组评酒员对于白葡萄酒的评价结果有着显著性差异。 对于两组人员可信度的判断, 我们将表中每组评酒员对于每一种酒的评价分别求 出其方差和标准差, 以此来进行进一步的判断。 方差和标准差的求解得到如下表和图:
4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡
萄酒的理化指标来评价葡萄酒的质量?
二.问题分析
2.1 问题一的分析 对于问题一,数据量大,因此需要将两组评酒员的评分进行整理,一种酒样需 要两组人员评判,因为样本并非独立,且需要评定结果是否有显著性差异,所以使用 配对样本 t 检验。 为了判断可信度的情况, 需要判断两组评分值的波动性大小再通过, 所以利用各组评分的方差、标准差判断来哪一组的评价更可信。 2.2 问题二的分析 在问题二中需要对酿酒葡萄进行分级,因此需要将数据进行归类分析。附录二 中所给的影响变量的因素数据过多,需要建立主成分分析法模型对数据降维,把多个 变量化为少数几个主成分,这样可以简化问题,再应用聚类分析的方法将问题划分为 几个等级,得到所求的结果。 2.3 问题三的分析 针对问题三,可以利用在问题二中所得的数据,利用 matlab 与 SPSS 软件进行处 理,可以得到相应的图表,利用图表对结果进行分析,继而对酿酒葡萄与葡萄酒的理 化指标之间的联系进行分析。 2.4 问题四的分析 为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量是否有影响, 本问题需要利
关键词:配对样本 t 检验;主成分分析法;聚类分析;matlab、SPSS
1
一.问题重述与提出
1.1 问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒员在 对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质 量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理 化指标会在一定程度上反映葡萄酒和葡萄的质量。讨论之间的联系,来更好探究以下 问题: 1.2 问题的提出 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3
81.5 74.2 70.1 53.9 74.6 73
78.2 68.8 61.6 68.3 68.8 72.6
85.6 78 69.2 73.8 73
77.1 71.5 68.2 72 71.5
72.9 74.3 72.3 63.3 65.9 72
6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
表八 两组人员对于两组就评价的方差、标准差 一组红 二组红 一组白 二组白 方差 标准差 方差 标准差 方差 标准差 方差 标准差 83.61 9.14 73.69 8.58 83 9.11 23.29 4.83 35.81 5.98 14.6 3.82 180.96 13.45 44.16 6.65 41.24 6.42 27.64 5.26 59.81 7.73 128.24 11.32 97.24 9.86 37.16 6.1 40.24 6.34 37.89 6.16 55.81 7.47 12.29 3.51 113.8 10.67 23.65 4.86 53.76 7.33 19.01 4.36 146.44 12.1 20.45 4.52 93.25 9.66 56.41 7.51 35.25 5.94 37.96 6.16 39.61 6.29 58.6 7.66 165.24 12.85 28.01 5.29 29.65 5.45 23.16 4.81 83.49 9.14 95.64 9.78 27.36 5.23 32.56 5.71 191.41 13.84 63.36 7.96 63.69 7.98 34.24 5.85 159.41 12.63 79.04 8.89 71.69 8.47 22.61 4.75 104.21 10.21 126.04 11.23 40.44 6.36 13.76 3.71 153.69 12.4 42.09 6.49 32.4 5.69 20.84 4.57 102.8 10.14 14.29 3.78 77.01 8.78 37.21 6.1 118.44 10.88 48.64 6.97 16.29 4.04 18.09 4.25 160.2 12.66 74.01 8.6 79.21 8.9 8.25 2.87 129.76 11.39 34.61 5.88 42.49 6.52 45.24 6.73 140.89 11.87 27.21 5.22 42.64 6.53 49.64 7.05 41.76 6.46 23.44 4.84 23.44 4.84 35.16 5.93 57.96 7.61 45.04 6.71 104.49 10.22 31.96 5.65 155.44 12.47 57.96 7.61 45.56 6.75 21.84 4.67 124.8 11.17 48.24 6.95 29.24 5.41 22.29 4.72 39.29 6.27 10.44 3.23 67.4 8.21 9.65 3.11 100.01 10 34.69 5.89 58.16 7.63 39.36 6.27 30.49 5.52 95.85 9.79 28.16 5.31 37.4 6.12 65.61 8.1 92.61 9.62 44.8 6.69 18.45 4.3 129.96 11.4 32 5.66 72.41 8.51 22.84 4.78
赛区评阅编号(由赛区组委会评阅前进行编号):
2012 高教社杯全国大学生数学建模竞赛
编 号 专 用 页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
y sy n 1 ~ t (n 1)
④ ⑤
利用 SPSS 软件可以快速求出对应的 t 值和 sig(双侧)值。 对数据进行判断: 若 sig. 值<显著水平 0.05,则拒接零假设, 即认为两总体均值存在显著差异; 若 sig. 值>显著水平 0.05,则不能拒接零假设, 即认为两总体均值不存在显著差异;
我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话) : 所属学校(请填写完整的全名) : 参赛队员 (打印并签名) :1. 李航 2. 3. 指导教师或指导教师组负责人 陈雪松 宋鹏 (打印并签名): 吴玉斌 沈阳航空航天大学
A
日期: 2012 年 9 月 10 日
两组评酒人员对每种白葡萄酒评价的显著性差异的判断同上。 表一 葡萄酒品尝的平均值 一组红 二组红 一组白 二组白
58.7 74.9 79.3 59.9 78.6 78.6 77.1 77.2 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6
4
:
一组红
62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3
二组红
68.1 74 74.6 71.2 72.1 66.3 65.3 66
一组白
72.4 74 78.8 73.1 72.2 77.8 76.4 71
二组白
78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4
82 74.2 78.3 79.4 71 68.4 77.5 71.4
2 N ( 2 , 2 ) ,分别从这两总体中抽取样本相互配对如表一,检验 1 和 2 是否有显
著差异。 ① 引进一个新的随机变量 Y X1 X 2 对赢得样本值为 ( y1 , y2 ,
, n) yn ) ,其中, yi x1i x2i (i 1, 2,
检验的问题就转化为单样本 t 检验问题,即转化为检验 Y 的均值是否与样 本 0 有显著差异。 ② ③ 建立 0 假设 H 0 : Y 0 t 统计量 t
对 1
1组红酒平均 打分 2组红酒平均 打分
对 1
表三 红酒配对样品相关系数 配对样本相关系数 N 相关系数 1组红酒平均打分 & 27 2组红酒平均打分
.700
Sig. .000
表三是配对样品的相关性分析结果。其相关系数为 0.700,对应的显著水平 sig. 近似于 0,小于 0.05,即认为两组评酒人员对红酒的评价相关性显著。 表四 红酒配对样本检验 配对样本检验 配对差分 差分的 95% 置信区间 均值 标准 的标 下 差 准误 限 上限 5.37 1.03 .41 4.6658 19 38 57 Sig .( 双 侧) .02 1
80.4 79.8 71.4 72.4 73.9 77.1
75.9 73.3 77.1 81.3 64.8 81.3
77.4 76.1 79.5 74.3 77 79.6
利用 SPSS 软件对数据处理之后得出如下结果: 通过对红酒的计算和统计得到如下三个表格: 表二 红酒配对样品统计量 配对样本统计量 均值 73.056 70.515 N 27 27 标准差 7.3426 3.9780 均值的标 准误 1.4131 .7656
对 1
一组白酒平 均打分 二组白酒平 均打分
对 1
表六 白酒配对本品相关系数 配对样本相关系数 N 相关系数 28 一组白酒平均打分 & 二组白酒平均打分
.240
Sig. .220
对表六配对样品相关性分析结果。相关系数为 0.240,对应的显著性水平 sig. 为 0.220,大于 0.05,所以两组评酒人的相关性不显著。 表七 白酒配对样品检验 配对样本检验 配对差分 差分的 95% 标 均值 置信区间 准 的标 差 准误 下限 上限 t 5.0 .9605 -4.49 -.55 -2.625 828 6 234 052 2
对 1组红酒平 均打分 - 2 1 组红酒平 均打分
均 值 2. 54 07
t 2.458
df 26
表四显示的是配对样本 t 检验结果。其显著水平 sig.(双侧)的值小于 0.05,
5
即认为两组评酒员对于红葡萄酒的评价的得分值有着显著的差别。 通过对白酒的计算和统计得到如下三个表格: 表五 白酒配对样品统计量 配对样本统计量 均值 74.010 7 76.532 1 N 28 28 标准差 4.80404 3.17094 均值的标 准误 .90788 .59925
葡萄酒的评价
摘
要
在葡萄成熟的季节,面对着丰收的景象我们对葡萄酒的评价产生了浓厚的兴趣, 对于提出的问题,我们应用了:t 检验、主成分分析法、聚类分析、曲线拟合与线性 回归。 针对问题一, 我们应用了数理统计的假设检验——t 检验, 将数据进行配对处理, 利用 SPSS 软件可以快速求出相应的 t 值和 sig.值,判断是否存在显著性差异。我们 利用了方差、标准差来判定两组评酒员的可信度,有清晰的表图为依据。最后得出两 组评酒员的评价结果存在显著性差异,并且第二组可信度更高。 针对问题二, 由于影响酿酒葡萄质量的变量因素过多, 我们应用了主成分分析法 通过降维技术把多个变量化为少数几个主成分, 这些主成分能够放映原始变量大部分 信息,这样更容易抓住事情的主要矛盾,使问题简化,得到相应因素的评分。对这些 评分通过聚类分析按照相似程度分为三个等级。 针对问题三, 我们利用了问题二中的总分数据, 通过 matlab 和 SPSS 软件的计算, 我们得到了大量可利用的数据与图表, 通过对这些图表的分析可以得到酿酒葡萄与葡 萄酒之间的关系,再利用回归曲线分析得到 R 方值,进一步完善酿酒葡萄与葡萄酒理 化指标之间的联系。 针对问题四,利用问题二中的数据,采用曲线拟合的方法,将葡萄的质量和葡萄 酒的理化指标分别与葡萄酒的质量(葡萄酒理化指标得分+葡萄酒感官指标得分)利 用 matlab 进行拟合,将得到的拟合图和公式进行分析,得到相应的结论。 最后,我们结合模型分析的结果,对现有的葡萄酒评价方法提出了建议,并对我 们的模型进行客观地分析,并进行了推广。
Z
d ij
3
五.模型建立与求解
5.1 问题一模型的建立与求解 配对样本 t 检验是针对配对数据的 t 检验。其检验方法是首先求出没对样本的差 值,然后比较样本差值的均值和总体均值 0 之间的关系。如果两组数据没有差别,那 么其样本差值均值应该在 0 附近波动。否则认为两组数是有差别的。这种方法本质就 是在对配对样本的差值同总体均值 0 做单样本 t 检验,通过对题目的分析和数据的整 理,恰好符合此检验,因此我们应用了配对样本 t 检验。 配对样本 t 检验模型建立的步骤: 两组人员对每种红葡萄酒评价的平均分数 X1 , X 2 服从正态分布 N (1 , 12 ) ,
2
用第二问中所得到的数据进行分析,利用曲线拟合的方法,得到相应的图表,通过这
些图表分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,讨论其中的重要关 系。
三.模型假设
1. 问题中所给的数据具有一定的事实依据,能够反映客观的事实,值得相信。 2. 假设葡萄周围的环境因素不影响其本身的性质。 3. 假设所有的理化指标在任何情况下不会改变。 4. 忽略其他的不必要因素,减少数据的误差,增加数据的可靠性。
2012 高教社杯全国大学生数学建模竞赛
承
诺
书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、 网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开 的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处 和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛 规则的行为,我们将受到严肃处理。
四.符号说明
符号 X1 , X 2
Y c d aij
aij
R
~
说明 对酒评价的平均数 随机变量 样品(酒、葡萄)序号 指标种类序号 指标值 标准化指标 相关系数矩阵 特征值 特征向量 第 i 个主成分 为 y j 的信息贡wk.baidu.com率 为 y p 的贡献率 综合得分 聚类数目 到聚类中心距离
yi bj
对 一组白酒 平均打分 1 - 二组白 酒平均打 分
均 值 -2 .5 21 43
df
Sig .( 双 侧) 27 .01 4
表其所是配对样品 t 检验结果。其显著性水平 sig.(双侧)取值明显小于 0.05, 所以认为两组评酒员对于白葡萄酒的评价结果有着显著性差异。 对于两组人员可信度的判断, 我们将表中每组评酒员对于每一种酒的评价分别求 出其方差和标准差, 以此来进行进一步的判断。 方差和标准差的求解得到如下表和图:
4. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡
萄酒的理化指标来评价葡萄酒的质量?
二.问题分析
2.1 问题一的分析 对于问题一,数据量大,因此需要将两组评酒员的评分进行整理,一种酒样需 要两组人员评判,因为样本并非独立,且需要评定结果是否有显著性差异,所以使用 配对样本 t 检验。 为了判断可信度的情况, 需要判断两组评分值的波动性大小再通过, 所以利用各组评分的方差、标准差判断来哪一组的评价更可信。 2.2 问题二的分析 在问题二中需要对酿酒葡萄进行分级,因此需要将数据进行归类分析。附录二 中所给的影响变量的因素数据过多,需要建立主成分分析法模型对数据降维,把多个 变量化为少数几个主成分,这样可以简化问题,再应用聚类分析的方法将问题划分为 几个等级,得到所求的结果。 2.3 问题三的分析 针对问题三,可以利用在问题二中所得的数据,利用 matlab 与 SPSS 软件进行处 理,可以得到相应的图表,利用图表对结果进行分析,继而对酿酒葡萄与葡萄酒的理 化指标之间的联系进行分析。 2.4 问题四的分析 为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量是否有影响, 本问题需要利
关键词:配对样本 t 检验;主成分分析法;聚类分析;matlab、SPSS
1
一.问题重述与提出
1.1 问题的重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒员在 对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质 量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理 化指标会在一定程度上反映葡萄酒和葡萄的质量。讨论之间的联系,来更好探究以下 问题: 1.2 问题的提出 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3
81.5 74.2 70.1 53.9 74.6 73
78.2 68.8 61.6 68.3 68.8 72.6
85.6 78 69.2 73.8 73
77.1 71.5 68.2 72 71.5
72.9 74.3 72.3 63.3 65.9 72
6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
表八 两组人员对于两组就评价的方差、标准差 一组红 二组红 一组白 二组白 方差 标准差 方差 标准差 方差 标准差 方差 标准差 83.61 9.14 73.69 8.58 83 9.11 23.29 4.83 35.81 5.98 14.6 3.82 180.96 13.45 44.16 6.65 41.24 6.42 27.64 5.26 59.81 7.73 128.24 11.32 97.24 9.86 37.16 6.1 40.24 6.34 37.89 6.16 55.81 7.47 12.29 3.51 113.8 10.67 23.65 4.86 53.76 7.33 19.01 4.36 146.44 12.1 20.45 4.52 93.25 9.66 56.41 7.51 35.25 5.94 37.96 6.16 39.61 6.29 58.6 7.66 165.24 12.85 28.01 5.29 29.65 5.45 23.16 4.81 83.49 9.14 95.64 9.78 27.36 5.23 32.56 5.71 191.41 13.84 63.36 7.96 63.69 7.98 34.24 5.85 159.41 12.63 79.04 8.89 71.69 8.47 22.61 4.75 104.21 10.21 126.04 11.23 40.44 6.36 13.76 3.71 153.69 12.4 42.09 6.49 32.4 5.69 20.84 4.57 102.8 10.14 14.29 3.78 77.01 8.78 37.21 6.1 118.44 10.88 48.64 6.97 16.29 4.04 18.09 4.25 160.2 12.66 74.01 8.6 79.21 8.9 8.25 2.87 129.76 11.39 34.61 5.88 42.49 6.52 45.24 6.73 140.89 11.87 27.21 5.22 42.64 6.53 49.64 7.05 41.76 6.46 23.44 4.84 23.44 4.84 35.16 5.93 57.96 7.61 45.04 6.71 104.49 10.22 31.96 5.65 155.44 12.47 57.96 7.61 45.56 6.75 21.84 4.67 124.8 11.17 48.24 6.95 29.24 5.41 22.29 4.72 39.29 6.27 10.44 3.23 67.4 8.21 9.65 3.11 100.01 10 34.69 5.89 58.16 7.63 39.36 6.27 30.49 5.52 95.85 9.79 28.16 5.31 37.4 6.12 65.61 8.1 92.61 9.62 44.8 6.69 18.45 4.3 129.96 11.4 32 5.66 72.41 8.51 22.84 4.78
赛区评阅编号(由赛区组委会评阅前进行编号):
2012 高教社杯全国大学生数学建模竞赛
编 号 专 用 页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
y sy n 1 ~ t (n 1)
④ ⑤
利用 SPSS 软件可以快速求出对应的 t 值和 sig(双侧)值。 对数据进行判断: 若 sig. 值<显著水平 0.05,则拒接零假设, 即认为两总体均值存在显著差异; 若 sig. 值>显著水平 0.05,则不能拒接零假设, 即认为两总体均值不存在显著差异;
我们参赛选择的题号是(从 A/B/C/D 中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话) : 所属学校(请填写完整的全名) : 参赛队员 (打印并签名) :1. 李航 2. 3. 指导教师或指导教师组负责人 陈雪松 宋鹏 (打印并签名): 吴玉斌 沈阳航空航天大学
A
日期: 2012 年 9 月 10 日
两组评酒人员对每种白葡萄酒评价的显著性差异的判断同上。 表一 葡萄酒品尝的平均值 一组红 二组红 一组白 二组白
58.7 74.9 79.3 59.9 78.6 78.6 77.1 77.2 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6
4
:
一组红
62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3
二组红
68.1 74 74.6 71.2 72.1 66.3 65.3 66
一组白
72.4 74 78.8 73.1 72.2 77.8 76.4 71
二组白
78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4
82 74.2 78.3 79.4 71 68.4 77.5 71.4
2 N ( 2 , 2 ) ,分别从这两总体中抽取样本相互配对如表一,检验 1 和 2 是否有显
著差异。 ① 引进一个新的随机变量 Y X1 X 2 对赢得样本值为 ( y1 , y2 ,
, n) yn ) ,其中, yi x1i x2i (i 1, 2,
检验的问题就转化为单样本 t 检验问题,即转化为检验 Y 的均值是否与样 本 0 有显著差异。 ② ③ 建立 0 假设 H 0 : Y 0 t 统计量 t
对 1
1组红酒平均 打分 2组红酒平均 打分
对 1
表三 红酒配对样品相关系数 配对样本相关系数 N 相关系数 1组红酒平均打分 & 27 2组红酒平均打分
.700
Sig. .000
表三是配对样品的相关性分析结果。其相关系数为 0.700,对应的显著水平 sig. 近似于 0,小于 0.05,即认为两组评酒人员对红酒的评价相关性显著。 表四 红酒配对样本检验 配对样本检验 配对差分 差分的 95% 置信区间 均值 标准 的标 下 差 准误 限 上限 5.37 1.03 .41 4.6658 19 38 57 Sig .( 双 侧) .02 1
80.4 79.8 71.4 72.4 73.9 77.1
75.9 73.3 77.1 81.3 64.8 81.3
77.4 76.1 79.5 74.3 77 79.6
利用 SPSS 软件对数据处理之后得出如下结果: 通过对红酒的计算和统计得到如下三个表格: 表二 红酒配对样品统计量 配对样本统计量 均值 73.056 70.515 N 27 27 标准差 7.3426 3.9780 均值的标 准误 1.4131 .7656
对 1
一组白酒平 均打分 二组白酒平 均打分
对 1
表六 白酒配对本品相关系数 配对样本相关系数 N 相关系数 28 一组白酒平均打分 & 二组白酒平均打分
.240
Sig. .220
对表六配对样品相关性分析结果。相关系数为 0.240,对应的显著性水平 sig. 为 0.220,大于 0.05,所以两组评酒人的相关性不显著。 表七 白酒配对样品检验 配对样本检验 配对差分 差分的 95% 标 均值 置信区间 准 的标 差 准误 下限 上限 t 5.0 .9605 -4.49 -.55 -2.625 828 6 234 052 2
对 1组红酒平 均打分 - 2 1 组红酒平 均打分
均 值 2. 54 07
t 2.458
df 26
表四显示的是配对样本 t 检验结果。其显著水平 sig.(双侧)的值小于 0.05,
5
即认为两组评酒员对于红葡萄酒的评价的得分值有着显著的差别。 通过对白酒的计算和统计得到如下三个表格: 表五 白酒配对样品统计量 配对样本统计量 均值 74.010 7 76.532 1 N 28 28 标准差 4.80404 3.17094 均值的标 准误 .90788 .59925
葡萄酒的评价
摘
要
在葡萄成熟的季节,面对着丰收的景象我们对葡萄酒的评价产生了浓厚的兴趣, 对于提出的问题,我们应用了:t 检验、主成分分析法、聚类分析、曲线拟合与线性 回归。 针对问题一, 我们应用了数理统计的假设检验——t 检验, 将数据进行配对处理, 利用 SPSS 软件可以快速求出相应的 t 值和 sig.值,判断是否存在显著性差异。我们 利用了方差、标准差来判定两组评酒员的可信度,有清晰的表图为依据。最后得出两 组评酒员的评价结果存在显著性差异,并且第二组可信度更高。 针对问题二, 由于影响酿酒葡萄质量的变量因素过多, 我们应用了主成分分析法 通过降维技术把多个变量化为少数几个主成分, 这些主成分能够放映原始变量大部分 信息,这样更容易抓住事情的主要矛盾,使问题简化,得到相应因素的评分。对这些 评分通过聚类分析按照相似程度分为三个等级。 针对问题三, 我们利用了问题二中的总分数据, 通过 matlab 和 SPSS 软件的计算, 我们得到了大量可利用的数据与图表, 通过对这些图表的分析可以得到酿酒葡萄与葡 萄酒之间的关系,再利用回归曲线分析得到 R 方值,进一步完善酿酒葡萄与葡萄酒理 化指标之间的联系。 针对问题四,利用问题二中的数据,采用曲线拟合的方法,将葡萄的质量和葡萄 酒的理化指标分别与葡萄酒的质量(葡萄酒理化指标得分+葡萄酒感官指标得分)利 用 matlab 进行拟合,将得到的拟合图和公式进行分析,得到相应的结论。 最后,我们结合模型分析的结果,对现有的葡萄酒评价方法提出了建议,并对我 们的模型进行客观地分析,并进行了推广。