获一等奖论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网
上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的
资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参
考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规
则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展
示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):北京大学
参赛队员 (打印并签名) : 1. 李涛
2.
3.
指导教师或指导教师组负责人 (打印并签名):
日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前
进行编号):
葡萄酒的评价
摘要
本文首先通过每一组十个评酒员的打分求出每个葡萄酒样品总分的均值与方差,然后对这两组数据进行正态性的检验,得出这两组数据基本符合正态分布,根据两个正态总体的双侧检验,对这两组数据的均值进行t检验,结果发现两组数据均值基本无差异,再对方差进行F检验,方差有显著性差异,说明这两组的评价结果有显著性差异,由于方差表示的是与均值差别的波动情况,因此方差越小,结果就越可靠,据此我们判断出方差小的一组评价结果更可信。在对酿酒葡萄进行分级的过程中,首先对酿酒葡萄的理化指标进行聚类分析,根据国际准则得出葡萄酒的质量与葡萄级别之间的关系,结合酿酒葡萄的分类情况,我们把酿酒葡萄进行了分级。在分析酿酒葡萄与葡萄酒的理化指标中,我们通过主成分分析对其中取决定因素的成分进行拟合,得到相互联系的关系式,从而得出彼此理化指标的联系。通过对各种理化指标和与质量相互之间的关系综合分析,我们得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响并不是绝对的,葡萄酒的质量还与感官分析、芳香物质等有关,因此葡萄酒的质量是多种因素共同决定的。
关键词 t检验 F检验聚类分析主成分分析拟合
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、模型假设
1. 假设这55种酒样品来自同一总体。
2.假设同一酒样品的质量一致。
3.假设两组品酒员的评酒时间、环境相同。
三、模型的建立与求解
问题(一)
通过对附件1给出的某一年份一些葡萄酒的评价结果进行深入的分析,对这两组品酒员的评分进行基于Excel的概率统计假设检验,判断两组评酒员评分结果的差异性. 首先,我们对每位品酒员对每一酒样品所打分数进行求和,然后分别求出同一组别同一酒样品的所有评酒员的总分的均值及方差。
其次,对第一组品酒员评分结果进行分析:将第一组红葡萄酒和白葡萄酒各样品酒总分均值进行汇总,得到一组均值数据,再用同种方法得到第二组红、白葡萄酒均值数据,将这两组数据导入SPSS软件系统里分别进行正态分布规律的检验,如图1.2:
图1.2
由图1.2知,这两组数据都满足正态分布规律。
T-检验
由此,我们可以对这两组数据进行t-检验,以判断两组品酒员的评价结果是否有显著性差异。检验结果如图1.3所示:
图1.3 t-检验双样本等方差假设
从Excel计算知,t Stat=0.1589,t 单尾临界=1.659085144,t Stat小于t 单尾临界,无法判断两组数据是否存在显著性差异。
F-检验
依据t-检验结果,无法判断两组评酒员评分结果是否存在显著性差异,故采用F检验法。将第一组评酒员对红葡萄酒与白葡萄酒各酒样品评分结果的方差值(55个数据)作为第一组数据,第二组的作为第二组数据,对这两组方差值数据进行F-检验,得到如图1.4所示结果:
图1.4 F-检验双样方差分析
从Excel计算结果得知,F值为4.400393975,F 单尾临界为1.570883782,F值大于F 单尾临界值,否定原假设,接受备择假设,得结论:第一组品酒员的评分结果与第二组品酒员的评价结果存在显著性差异。
根据方差值比较,第一组方差值4082.71027大于第二组方差值927.8056,可判断第二组评分员评分结果更可信。
综上,两组品酒员的评价结果存在显著性差异,且第二组的结果更可信。
问题(二)
葡萄酒的质量一般是通过一批有资质的品酒员分别对同一样品葡萄酒进行品尝后并对其分类指标打分,然后求和得到该葡萄酒的总分而确定的。因为酿酒葡萄的好坏,与所酿葡萄酒的质量有直接的关系,所以我们尝试着对附件2的数据进行分析,并根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级。
由问题(一)分析结果可知,第二组品酒员的评价结果更可信,故采集第二组评分员评分结果,导入SPSS软件,利用聚类分析法进行数据分析。
对第二组评价的白葡萄酒分析,对其酿酒葡萄的理化指标进行聚类法分析。结果如图2.1: