2012全国数学建模论文a题(葡萄酒)省一等奖
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名) :1.
2.
3.
指导教师或指导教师组负责人(打印并签名):指导组
日期:2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价
摘要
本文主要根据评酒员对葡萄酒的一系列指标的打分,从而对葡萄酒的质量作出判别。考虑到酿酒葡萄的好坏、所酿葡萄酒的质量和酿酒工艺、陈酿技术等约束条件,为此我们建立模型来确定影响葡萄酒评价的各种因素。在这模型中利用excel,spss,matlab等一系列的数学工具对模型进行求解,综合统计分析的应用对所给的结果进行比较,从而得出最终的结果。
首先,对于问题1,分析两组评酒员的评价结果,每个评酒员对外观、口感、香气、平衡/整体四个方面指标得分进行求和,得到其总分,确定葡萄酒的质量。由于葡萄酒的质量满足正态分布,为了能分辨出两组的差异,所以利用spss进行配对T检验,从而得出两组评酒员有显著的差异。其次,用excel对两组进行方差分析,根据所得到的P值大小,得出第一组的评价结果更为可信。
对于问题2,在问题1的基础下,根据所给的理化指标和葡萄酒的质量利用spss统计分析软件进行分析,相关性分析对数据进行预备分析,剔除与葡萄酒质量无显著性相关的指标,再利用系统聚类的方法对酿酒葡萄进行分级。
对于问题3,利用主成分分析法,对问题二得出的相关显著性整合后的酿酒葡萄理化指标与葡萄酒的理化指标进行分析,确定两者的相关系数以及多元回归方程,从而得出两者之间存在的联系。
对于问题4,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,且在确定葡萄酒的质量时,感官指标也会对其产生影响。所以,由影响所酿葡萄酒质量有关的因素建立一个多元线性回归方程,并由此求出其相关系数,验证结果对错。
关键:T检验,方差分析,相关性分析,聚类分析,多元线性回归
一、问题的提出
通常确定葡萄酒质量时一般是通过一批有资质的评酒员对葡萄酒进行品评,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。但是每个评酒员的品味、风格等各有千秋,故导致最后葡萄酒的质量变化,同时葡萄酒的好坏和所用酿葡萄酒质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。通过对影响葡萄酒因素的综合计算,以得到葡萄酒质量与各影响因素之间的关系。
二、问题的假设
1.假设当时每个评酒员的精神处于最佳状态,即其感官分析很好。
2.假设所给的数据真实可靠。。
3.假设两组品酒员都是随机分配。
4.假设在判断哪组更可信时候,忽略系统误差。
5.假设评酒员对待每一份酒样品都保持公平、公正的工作原则。
6.假设在简化问题的过程中,酿酒工艺等环节对葡萄酒的质量无影响。
三、符号说明
四、问题分析与模型求解
4.1.1、问题一:针对两组评酒员的评价结果,可分别对评酒员最终评出的葡萄酒的总分(即葡萄酒的质量)进行讨论,进而可以得出两组评酒员之间的差异,确定哪组可信度更高。
首先,查看附件1中的葡萄酒品尝评分表可以看出有两个可疑的数据,一个为第一组的白葡萄酒第3个样本的数据过大,而另一个为第一组红葡萄酒第20个样本则无数据。针对数据过大的样本,该评酒员对样本的持久性评分为77分,而持久性的满分值为8分,显然不可能,由此可知数据77可能是由于某种原因而不小心多出一个7,即原先样本的数据应为7。而对于无数据的样本,由数据表格可以看出,无数据的样本是由评酒员4评出,而观察评酒员4对其他样品的评价,始终比较保守,分数变化不大,故可用均值填补法,无数据的样本数据进行弥补,计算可得样本数据为5。
针对两组评酒员的评价结果,利用公式
90
c i j Ai ij ==∑,9
i Bij dij ==∑(j=1、2)
得出各组红,白葡萄酒的总分, 利用spss17.0软件分析工具中的Descriptive statistic 中的explore 对第一组白葡萄酒进行正态检验可得如下
表 1
图 1
正态性检验
Kolmogorov-Smirnov a Shapiro-Wilk
统计量 Df Sig. 统计量 df Sig. 得分
.123
28
.200*
.964
28
.425
图2
图3
综上可知,评酒员对第一组白葡萄酒的评价结果满足正态分布。所以同理可得第二组白葡萄酒,第一组红葡萄酒和第二组红葡萄酒的评价结果都满足正态分布(详图见附录)
而对于该问题来说,目的是为了判断两组评酒员的评价结果是否有显著性差异。又因为两组的评价结果都满足正态分布,故可用Compare means 中的paired-samples T test 来分析两组。假设这两组评价结果无显著性差异,利用公式(查阅网上)
,1d
d
t df n S =
=- 其中d s 为差异标准误,计算公式为
:
d S =
=
=
式中:d 为两样本各对数据之差,即:
B j d Aij ij =- i=0、1…9 j=1、2
j d d n =∑;
借助软件spss17.0的Compare means 中的paired-samples T test 对第一,第
二组白葡萄酒进行配对T 检验,可得如下
表 2
、
表 3
成对样本相关系数
N 相关系数 Sig.
对1 G1 & G2 28 .241 .217