葡萄酒的评价数学建模论文A

合集下载

2012年全国数学建模A题参考答案

2012年全国数学建模A题参考答案

2012高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范”)A题葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格)答案仅供参考:1. 分析附件1中两组评酒员的评价结果有无显著性差异根据表1计算的各取样点葡萄质量综合评分结果, 结合当地气象资料,进行相关普查和回归分析, 挑选出相关性显著, 并通过0. 01显著性检验的11个因子, 果实着色期平均最低气温(Tn45 )、果实着色期平均日较差(D45 )、果实着色期平均相对湿度(U45 )、果实着色期降水量(R 45 )、果实着色期水热系数(K 45 )、全生育期平均相对湿度(Ug )、全生育期降水量(Rg )、全生育期水热系数(Kg )、7~ 8月份降水量(R 7- 8 )、日照时数( S7- 8 )、水热系数(K 7- 8 )。

利用DPS3. 01 数据处理系统对这些影响因素进行因子分析, 并进行倾斜旋转( promaxrotation)得到11种影响酿酒葡萄品质气象因子结构如表5。

数学建模 葡萄酒评价模型

数学建模  葡萄酒评价模型

A题葡萄酒的评价摘要随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。

针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。

针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。

针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。

但主成分法去掉了一部分数据,我们有用最小二乘法进行。

针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

2012年大学生数学建模竞赛A题(优秀论文A题葡萄酒)

2012年大学生数学建模竞赛A题(优秀论文A题葡萄酒)

葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。

通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。

为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。

综合来看,主观因素对葡萄酒质量的评价具有不确定性。

结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。

将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。

为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。

由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对葡萄酒的质量的作用。

葡萄酒的评价

葡萄酒的评价

葡萄酒的评价摘要在解决品酒员评价结果有无显著性差异中,首先我们对评价数据进行了第一次整理,得到酒样品分类指标的平均得分,然后对两组各项指标的评价结果进行了Wilcoxon秩和检验和t检验,得出两组红葡萄酒品酒员在外观分析中的色调,香气分析中的纯正度、质量,上存在显著性差异。

两组白葡萄酒品酒员在口感分析中的纯正度、持久性、质量和平衡/整体评价上存在显著性差异。

对于哪一组结果更可信的问题,我们引入了可信度,并对评价数据进行了第二次处理,得到酒样品的得分,根据第二次处理结果计算可信度的大小来评价品酒员的评分是否可信,最终得到第二组的结果更加可信。

针对酿酒葡萄的分级问题,需要考虑理化指标和感官指标。

首先我们对酿酒葡萄的理化指标进行归一化处理,然后将归一化的数据进行主成分分析,得到红葡萄有7个主要成分,白葡萄有8个主要成分,再根据成分矩阵,来判断每个主成分所包含的主要理化指标。

感官指标则由葡萄酒的质量来体现,因为总分确定质量,所以我们取第一问较可信的结果,进行归一化处理,同葡萄的理化指标一起进行聚类分析,得到的聚类分析图谱,最后使用聚类拆解法分级模型,得到分级结果以表格的形式给出。

分析酿酒葡萄与葡萄酒的理化指标之间的联系时,我们采用逐步多元线性回归分析。

根据第二问中的主成分分析结果和葡萄酒的主要指标,我们剔除了酒石酸、苹果酸、柠檬酸这三个指标。

在进行逐步回归分析之前,我们对酿酒葡萄与葡萄酒指标两两之间进行了相关性分析,得到其相关系数显著性,依次将对因变量作用显著的自变量引入回归方程,且每引入一个自变量后,对在此之前已引入的自变数重新测验,有不显著者立即舍弃,直到没有显著的自变数可以引入为止,最后即可得到一个最优的回归方程。

这一过程我们利用SPSS来进行计算,得到的结果以表格的形式给出。

针对第四问,我们仍采用第三问的方法,分析了各个理化指标对葡萄酒质量的影响。

通过逐步分析的方法运用SPSS计算得到红葡萄、红葡萄酒理化指标与红葡萄酒质量间的线性关系。

2012全国数学建模论文a题(葡萄酒)省一等奖范文

2012全国数学建模论文a题(葡萄酒)省一等奖范文

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):指导组日期:2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):2葡萄酒的评价摘要本文主要根据评酒员对葡萄酒的一系列指标的打分,从而对葡萄酒的质量作出判别。

考虑到酿酒葡萄的好坏、所酿葡萄酒的质量和酿酒工艺、陈酿技术等约束条件,为此我们建立模型来确定影响葡萄酒评价的各种因素。

在这模型中利用excel,spss,matlab等一系列的数学工具对模型进行求解,综合统计分析的应用对所给的结果进行比较,从而得出最终的结果。

首先,对于问题1,分析两组评酒员的评价结果,每个评酒员对外观、口感、香气、平衡/整体四个方面指标得分进行求和,得到其总分,确定葡萄酒的质量。

由于葡萄酒的质量满足正态分布,为了能分辨出两组的差异,所以利用spss进行配对T检验,从而得出两组评酒员有显著的差异。

其次,用excel对两组进行方差分析,根据所得到的P值大小,得出第一组的评价结果更为可信。

对于问题2,在问题1的基础下,根据所给的理化指标和葡萄酒的质量利用spss统计分析软件进行分析,相关性分析对数据进行预备分析,剔除与葡萄酒质量无显著性相关的指标,再利用系统聚类的方法对酿酒葡萄进行分级。

国赛数学建模竞赛优秀论文

国赛数学建模竞赛优秀论文

I 、问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?酒的理化指标来评价葡萄酒的质量?II 、问题分析问题思路问题一: 本问题中,两组各10名评酒员分别对27种红葡萄酒和28种白葡萄酒进行评分。

其中,评分标准一样,评酒员都能理性的按照标准给酒一个合理的评分。

由于,每个人的口感、视觉效果和嗅觉不一样,品酒员给每种酒打的分数不一样而产生误差。

品酒员给每种酒打的分数不一样而产生误差。

根据表格,根据表格,分别计算出两组10名评酒员的评价总分、标准方差、平均值。

运用SAS 对两组进行配对样本T 检验,并用Excle 进行图标分析。

对比两种结果并得出统一结论。

给及两组评酒员的评价结果的差异性和可信度进行评估。

组评酒员的评价结果的差异性和可信度进行评估。

问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,这里的分级问题需要考虑两方面的问题处理:1、对葡萄理化指标和影响葡萄酒质量评定的标准进行整合分析,2、现实中还没有统一的酿酒葡萄分级标准,现实中还没有统一的酿酒葡萄分级标准,对本题中葡萄进行分级需要有一对本题中葡萄进行分级需要有一套标准。

2012年全国数学建模大赛 A题葡萄酒的评价

2012年全国数学建模大赛 A题葡萄酒的评价

葡萄酒的评价摘要本文就影响葡萄酒的质量的因素进行了探究。

在问题一中,评酒员间存在评价尺度、评价位置以及评价方向等方面的差异,导致不同评酒员对同一酒样的评价差异很大,于是我们需要探讨两组评酒员的可信度。

对此,我们建立了单元素方差模型对其进行了显著性差异的判断,最后我们得出结论:两组评酒员的评价结果有显著性差异,并且第二组评酒员评价的结果更加可信。

在问题二中,我们首先将大量的数据进行了样本住分析塞选,大大减少了计算量,就红、白葡萄酒前17组样本葡萄酒的分数进行训练,由后十组的理性指标进行检验,也可检验俩个的准确性。

最后我们认为可以给酿酒葡萄分为一、二、三、四四个等级。

在问题三中,因为要讨论酿酒葡萄与葡萄酒的理化指标之间的联系,我们就其两者的重要理化指标进行了探讨,应用了回归模型将其各项重要指标进行了多元拟合处理,最后得出了葡萄酒和酿酒葡萄中的重要指标的等式关系。

在问题四中,我们首先利用了回归原理求得葡萄酒质量与葡萄酒和酿酒葡萄的理化指标之间的等式关系,由等式和图像细致的分析了葡萄酒和酿酒葡萄理化指标对葡萄酒质量的影响。

在一定范围内,理化指标的与葡萄酒的质量呈正相关,达到一定的量后呈现负相关趋势。

关键词:显著性差异判别主成分分析 BP神经网络回归模型1.问题的重述现今社会,随着人们生活水平的提高,人们对葡萄酒的质量要求也越来越高。

在确定葡萄酒质量的时候,一般聘请一批资深的评酒员进行评比,根据不同的指标所得的分数从而求得总分,以此确定葡萄酒的质量。

其中酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

本题给出了3份材料,材料1是某一年份一些葡萄酒的评价结果,材料2和材料3分别给出了该年份这些葡萄酒和酿酒葡萄的成分数据。

我们必须解决以下问题:问题一:分析材料1中两组评酒员的评价结果是否有明显的差异,并且求出哪组评酒员的评价结果更可信。

问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄的品质进行分级。

2012年数学建模A题一等奖获奖论文

2012年数学建模A题一等奖获奖论文
6
秩和得到一个新的排序。由于此排序综合了 20 个评酒员的结果,因此,更能反 应酒样的排序真实性,即认为该综合排序为理想排序。记样品 j 在第一组、第二 组排序内的秩次为 X j (1) , X j (2) ,综合之后排序秩次为 X j 。红葡萄酒三种排序的 比较图如下:
关键词:葡萄酒评价
排序检验法
符号秩检验
TOPSIS 法
多重比较
1
一、问题重述
对于葡萄酒质量的确定,现如今通常采用感官评价的方法,即聘请一批有资 质的品酒员对葡萄酒进行品评,然后对其外观、口感等分类指标进行打分。最后 通过求和得到每种葡萄酒的总分,从而确定葡萄酒的质量。附件 1 中给出了某一 年份一些葡萄酒的打分结果。 同时,酿酒葡萄的好坏又直接影响着所酿葡萄酒的质量。除了感官评价的方 法之外,在某种程度上,葡萄酒和酿酒葡萄检测的理化指标也能反映葡萄酒和葡 萄的质量。附件 2 和附件 3 即给出了同一年份中,这些葡萄酒的和酿酒葡萄的成 分数据。 请分析题目,试建立合适的数学模型解决以下问题: 1. 对于附件 1 中的红葡萄酒与白葡萄酒, 每种葡萄酒均由两组评酒员对其进 行打分。试分析这两组品酒员的评价结果有无显著性差异,并判断哪一组的结果 更为可信。 2. 综合感官评价所得到的葡萄酒质量与酿酒葡萄的理化指标,对酿酒葡萄 进行分级。 3. 试分析酿酒葡萄、葡萄酒的两组理化指标之间有何关系。 4. 分析酿酒葡萄的理化指标、葡萄酒的理化指标对葡萄酒质量的影响,论 证能否只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
3
分的差异是否在一定的置信区间内,若不在,则认为评分差异性显著。 考虑到本题的背景,两组评分的差异可体现在对样本酒的排名差异上。由于 该问属于食品评价中的感官评价问题,因此,可结合感官评价中的排序检验与非 参数检验中的符号秩检验,对两组评分的显著性进行评价。 1.1.1 样品秩次和秩和的求解 评酒员对每一个酒样均从四大方面进行了评分。根据题意,葡萄酒的质量由 总分所确定。 因此, 我们将每一个方面的评分加和, 得到 i 品酒员对葡萄酒样品 j 的总评分。 以红葡萄酒的评价为例,对于品酒员 i ,将其对 27 种样品的评分进行排序, 评分最高的酒样秩次为 1,当多个样品有相同秩次时,则取平均秩次。记在 i 品 酒员的评价排序中, j 酒样的秩次为 xij ,可得到秩次矩阵为:

2012高教社杯全国大学生数学建模竞赛A题葡萄酒的评价

2012高教社杯全国大学生数学建模竞赛A题葡萄酒的评价

2012高教社杯全国大学生数学建模竞赛葡萄酒的评价摘要本文以概率论与数理统计的相关知识为理论基础,综合运用正态分布和分级的原理,利用统计分析数据,研究了葡萄酒的评价指标体系,针对 葡萄酒的质量评价问题,建立合理的数学模型用以评价。

问题一:(1) 本问题的葡萄酒质量评价指标(即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析),先对指标归类按顺序,统计并整理出相关的数据,再利用正态分布的思想,假设并验证质量评价指标为正态分布并进行差异性分析,对比找出附件1中两组评酒员的显著差异为:两组评酒员对红葡萄酒的评价结果有显著性差异的是外观分析中的色调、香气分析中的浓度,其他的无显著性差异;两组评酒员对白葡萄酒的评价结果有显著性差异的是口感分析中的纯正度、浓度,持久性、质量和平衡/整体评价,其他的无显著性差异。

(2)本问题要求分析附件1中哪组指标更可信,这就要在问题(1)基础上分析两组指标的可信性,建立可信性分析模型,利用matlab 软件编程计算得(程序见附件4): 1var =0.0735 ,2var =0.0398。

可见21var var ,因此第二组可信性高。

问题二:此问题我们的总体思路是这样的:先根据样品葡萄酒的得分高低对葡萄酒进行分级,并且假设葡萄酒得分越高,那么酿酒葡萄就越好,等级就越高,于是我们利用一些分类模型就可以得到相应酿酒葡萄的级别差。

根据这条思路,我们建立如下一些模型来讨论(见表6、7、8)。

为了充分利用文中的数据,我们把第一组第二组葡萄酒品尝得分合并,这样就得到了一个更大的样本,对结论会更有说服力。

为了能比较客观的对葡萄酒分划分合理的等级,我们需要一种能从总体上正确的反应葡萄酒的评分,这里我们利用已经单位化的综合了所有指标的葡萄酒品尝评分的所得分评价,它们的得分范围理论上包含在[0,1]区间上,实际计算红葡萄的单位化归一化后的评分。

国赛A题优秀论文

国赛A题优秀论文

葡萄酒的评价模型摘要本文主要解决葡萄酒的评价问题,运用多种数理统计方法通过MATLAB和SPSS软件对可能影响葡萄酒质量的因素进行统计分析,初步得出对葡萄酒的理化指标评价和主观评价具有差异性。

对于问题一中的显着性差异分析,针对两组评酒员对于每一种酒的评分,本文用α=),结果显示两组评酒员对红葡萄酒和白葡萄酒的评分MATLAB进行t检验(0.05都具有显着性差异。

对于可信度的问题,我们用EXCEL进行方差与置信区间的综合分析,得出对红、白葡萄酒的评价结果第二组可信度均较高。

问题二,首先用相关性分析计算出各个理化指标之间以及各理化指标与葡萄酒质量间的Pearson相关系数r,然后选取和葡萄酒质量相关程度较大(0.2r>)的理化指标进行聚类分析,依照指标的不同情况可将其分别分为3、4、5类,得出在每种分类情况下的分类方案。

最后,我们计算每种分类方案下各类酿酒葡萄质量得分的平均值,分值越高则级别越高,确定了最终的分级方案。

问题三,我们先对酿酒葡萄的理化指标进行主成分分析,利用降维技术找出能代表酿酒葡萄的主要理化指标,然后再将得出的主要理化指标与葡萄酒的理化指标进行相关性分析,根据相关系数确定二者理化指标间的关系。

结果表明,葡萄酒的理化指标除了由相对应的酿酒葡萄的理化指标决定外,还可由其它相关性大的理化指标决定。

最后,对问题四建立多元线性回归分析模型,对第一问中计算出了红、白葡萄酒和葡萄的样本相关系数进行比较,发现用葡萄的理化指标衡量葡萄酒的质量是不全面的,芳香物质可能会影响酒的香气从而影响酒的整体质量。

因此在第二小问中,先根据葡萄酒中芳香物质的化学成分将其分类(醛、烃、醇、酯、酸、酮以及其他含氧有机物),再利用多元线性回归模型计算出其样本相关系数,说明芳香物质通过酒的香气来影响酒的品质,从而说明了理化指标分析和主观评分在葡萄酒质量分析中的差异性。

关键词:t检验相关性分析聚类分析主成分分析多元线性回归问题重述葡萄酒是世界公认的对人体有益的健康酒精饮品,其生产方式方便,经济,且风味极佳.因而越来越受到广大市民的青睐,同时葡萄酒的质量以及等级划分也越来越受到人们的关注。

数学建模葡萄酒论文

数学建模葡萄酒论文

题目:葡萄酒的评价摘要关键词:可信度分析,K-S正态性检验,配对样本t检验,kruskal-wallis检验,主成分分析一、问题重述1.1背景为确定一批红葡萄酒的质量,现聘请两组评酒师对其进行品评及按分类指标打分。

求和得到的总分便是红葡萄酒的质量。

红葡萄酒是由葡萄皮和果肉综合酿造得到的,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

1.2需要解决的问题我们尝试通过三个附件所给出的数据,建立数学模型讨论以下问题:问题(1):分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?问题(4):分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型分析2.1问题(1)的分析题目要求我们根据两组评酒员对27种红葡萄酒的10个指标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著性差异,然后判断哪组评酒员的评价结果更可信。

初步分析可知:由于评酒员对颜色、气味等感官指标的衡量尺度不同,因此两组评酒员评价结果是否具有显著性差异应该与评价指标的类型有关,不同的评价指标的显著性差异可能会不同。

基于以上分析,我们可以分别两组品尝同一种类酒样品的评酒员的评价结果进行两两配对,分析配对的数据是否満足配对样品t检验的前提条件,而且根据常识可知评酒员对同一种酒的同一指标的评价在实际中是符合t检验的条件的。

接着我们就可以对数据进行多组配对样品的t检验,从而对西组评酒员评价结果的显著性差异进行检验。

由于对同一酒样品的评价数据只有两组,我们只能通过评价结果的稳定性来判定结果的可靠性。

而每组结果的可靠性又最终决定于每个评酒员的稳定性,因此将问题转化为对评酒员稳定性的评价。

2.2问题(4)的分析本题要求我们分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,同时论证能否能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

初步分析可知酿酒葡萄质量的好坏以及葡萄酒理化指标的合理会使醒出的葡萄酒的质量较好。

国赛数学建模A题葡萄酒论文

国赛数学建模A题葡萄酒论文

葡萄酒的评价一、摘要对于问题一,考虑到分数间不存在相关性,样本量偏小,需要对两组数据进行比较分析,我们采用了非参数检验中的Wilcoxon符号秩检验,评判结果均有显著性差异。

在此情况下,比较同组内十名品酒员对同一样品酒给出的总分的方差,再令得到的多组方差取平均,无论红葡萄酒和白葡萄酒,都是第一组方差较大,故第二组的评分较为可信。

另外由于所给数据大量且复杂,需预先对数据进行预处理,排除明显错误数据,用组内均值替代缺失数据。

对于问题二,先用SPSS对芳香物质和香气指标总分进行简单相关分析,筛选芳香物质中与香气评分相关性较大的成分。

将保留的芳香物质和葡萄的理化指标与葡萄的质量进行逐步回归分析,得到回归方程。

在得到结果后,我们也检验了数据满足逐步回归分析的条件。

最后将不同组葡萄的指标系数代入,根据分数值对葡萄分级,最终红、白葡萄酒都被分为六级。

对于问题三,我组首先对葡萄酒与酿酒葡萄当中相同的指标进行了简单相关性检验,得出其中大部分指标是强相关的,但是有一些指标(例如白酒的色素)是不相关的。

为了对这些指标进行进一步的分析,我组对含有二级指标的指标组进行了典型相关性分析,分析多个指标与多个指标间的关系。

而像酒总黄酮这类的单独指标,则进行了逐步线性回归,探究与所有可能有联系的指标间的联系。

对于问题四,我组以品酒员测定的指标等级为依据,希望通过逐步线性回归与Topsis排序的方法归纳出葡萄酒和葡萄理化指标间的数量关系,进而还原出品酒员所评定的等级。

但是在具体实践过后,两种方法的分级都与品酒员的分级有较大的误差,故认定不能直接通过理化指标去确定葡萄酒的等级。

关键词:葡萄酒质量符号秩检验主成分分析逐步回归主成分分析二、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

2012年全国大学生数学建模竞赛A题葡萄酒评价分析

2012年全国大学生数学建模竞赛A题葡萄酒评价分析

对葡萄酒的评价分析摘要本文主要应用数理统计中的t检验法,回归分析法等方法对葡萄酒的评价的相关问题进行了分析,建立相应的模型。

针对问题一,首先,对样本进行K-S检验得出数据取自的总体服从正态分布,进而运用成对数据t检验法进行检验,得出两组评酒员对每种葡萄酒的总评分有显著差异;在此基础上,采用两种方法分别判断哪组评酒员的可信度更高。

方法一是计算出每组评酒员对每种葡萄酒的总评分的置信区间,评分处于置信区间内的人次百分比较高的一组可信度较高;方法二是比较两组评酒员对每种葡萄酒的总评分的方差的大小,总体方差分布较小的一组,可信度较高。

两种方法均得出了同一结论,即第二组评酒员的结果更可信。

针对问题二,基于问题一得到的结论,建立了酿酒葡萄品质的综合评价模型。

首先,对数据指标进行归一化处理,并计算出酿酒葡萄与各指标因素间的相关系数。

然后,分别用层次分析法和因子分析法确定了各指标因素的权重。

最后,利用确定的权重,建立了酿酒葡萄品质的综合评价模型,对葡萄进行分级。

如,优质的红葡萄样品是8、23、3、1。

针对问题三,从两个层次建立相关性系数模型。

首先,运用Excel软件分析葡萄酒各理化指标与酿酒葡萄成分的相关性;然后,进一步分析酿酒葡萄的综合评价指标与葡萄酒的理化指标之间的联系。

得出结论:酿酒葡萄的花色苷成分与葡萄酒的花色苷呈显著正相关。

针对问题四,分别建立回归分析模型和综合评价模型,其中综合评价模型建立方法同问题二,回归分析模型则先将葡萄和葡萄酒的各理化指标进行因子分析法降维后得数量较少的因子变量,对简化后的新指标进行回归分析,此处尝试用SPSS软件的回归分析中5种回归拟合方法,继而选取拟合度最佳的模型,得回归系数,建立多元线性回归方程分析各理化指标对葡萄酒质量的影响;将新指标得分带入方程,可求得线性拟合后的葡萄酒质量评分。

进一步引入芳香物质作为评判指标,同样建立线性回归模型求得葡萄酒质量评分,将有无引入芳香物质作为指标的质量评价结果分别与可信度较高的评酒员对葡萄酒的评价结果进行回归模型检验比较和差值平方和比较,得到结论用葡萄和葡萄酒的理化指标来评价葡萄酒的质量是完全可行的,但加入芳香物质作为评价指标更能准确合理地评价葡萄酒的质量。

数学建模论文葡萄酒的评价

数学建模论文葡萄酒的评价

数学建模论文---葡萄酒的评价承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):4198所属学校(请填写完整的全名):广东医学院(东莞校区)参赛队员(打印并签名) :1. 黄洁2. 顾家荣3. 陈婉君指导教师或指导教师组负责人(打印并签名):唐国平日期:2013年9月 9日编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒质量的评价模型摘要本文主要讨论了关于葡萄酒与葡萄之间关系的研究,主要分析了附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信;还根据酿酒葡萄的理化指标和葡萄酒的质量把这些酿酒葡萄分为3个等级;分析了酿酒葡萄与葡萄酒的理化指标之间的联系和酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

通过这些分析有益于对葡萄酒行业的发展有一定的贡献。

对于问题一,用10个品酒员对每种酒样品的总评分的来代表这种酒样品的质量,建立单因子数学模型,分别对两个水平进方差分析,由U检验,取置信区间为95%,最终得出两组品酒员对红葡萄酒的评分有显著性差异,对白葡萄酒的评分没有显著性差异。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

葡萄酒的评价摘要我们对两种葡萄和葡萄酒都单独进行分析。

问题一:经过处理附表1的数据,分别得到两组酒评酒员对每一个红葡萄酒样品评分的平均值,将这两组数据看成两个相互独立的样本,用SPSS软件分别对两组数据进行参数和非参数假设检验,进而判断两组评酒员对红葡萄酒的评价结果是否有显著性差异。

根据两组评酒员的评分,分别求出每一个红葡萄样品10位评酒员评分的标准差,然后求和,通过比较两组标准差和的大小,结果比较小的,评分更稳定,更可信。

最后得到的结论是: 1、两组评酒员的评价结果有显著性差异。

2、第二组评酒员的结果更可信。

以下用到葡萄酒质量的评分都是以第二组评酒员的分数为标准。

问题二:我们采用相关分析和聚类方法对酿酒葡萄进行分级。

首先,对酿酒葡萄的多项理化指标与葡萄酒质量评分进行相关分析,得出一些与葡萄酒质量评分相关系数比较高的葡萄理化指标。

接着,这些指标和评酒员对葡萄酒的质量评分一起作为标准,对葡萄样品聚类分析,从而得出葡萄的分级。

得出,对红葡萄分成五级,对白葡萄分成四级,为了对分级的合理进行检验,我们定义一种对葡萄划分的检验方法,以评酒员对葡萄酒的评分作为标准,通过检验得出,红葡萄划分有误率为25.9%,白葡萄划分有误率为14.3%,可以认为结论合理。

问题三:根据附表2和附表3所给的数据,分别对酿酒葡萄和葡萄酒的理化指标进行相关性分析,得出相关矩阵,对于多个相关性比较明显的理化指标选出一个代表性理化指标,先对红葡萄和红葡萄酒指标进行分析,选出红葡萄中的7个代表性理化指标,红葡萄酒的8个代表性理化指标,然后用选取的这15个理化指标进行典型相关分析,得出酿酒葡萄和葡萄酒的理化指标之间的联系。

分析的结果要考虑相关分析后被掩盖的理化指标。

对于白葡萄和白葡萄的理化指标同样分析,选出白葡萄的6个代表性理化指标,白葡萄酒的7个代表性理化指标,然后用选取的这13个理化指标进行典型相关分析,得出酿酒葡萄和葡萄酒的理化指标之间的联系。

问题四:我们采用逐步回归的方法,以评酒员对葡萄酒质量评分作为因变量,以酿酒葡萄和葡萄酒的理化指标作为自变量,进行逐步回归分析,得出葡萄酒质量评分与酿酒葡萄和葡萄酒的理化指标的函数关系。

在进行数据回归的时候,我们留取一些样本不进行逐步回归,用这些样本对得出的回归方程进行检验,经过检验,得出平均标准差为3.1%,可以知道建立逐步回归模型比较合理。

关键词:葡萄酒非参数和参数假设检验系统聚类典型相关性分析逐步回归一、问题重述在对葡萄酒质量进行评价时,通常是由一批有资质的评酒员进行感官品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析对问题一的分析:题目要求得到两组评酒员的评价结果有无显著性差异,分析附表1的数据,两组红葡萄酒的评分和两组白葡萄酒的评分都是配对设计的,所以对两组酒评酒员对葡萄酒的评价结果进行两配对样本t检验法进行分析,由于t检验的样本必须服从正态分布,故在t检验之前,要利用非参数假设检验来推断两组红葡萄酒评价结果是否服从正态分布,再应用SPSS软件实现t检验。

当评酒员之间的分数相差不大时,评酒员的评分就更加可信,所以要比较两组评酒员对葡萄酒评分的稳定性差异,针对附表1所给的27个红葡萄酒样品,通过求第一组评酒员,求出每一个红葡萄样品的标准差的和以及第二组评酒员对每一个红葡萄样品的标准差的和,进行比较两个数的大小,结果比较小的那组评酒员评分更稳定,更可信。

对问题二的分析:酿酒葡萄的等级主要由其理化指标来反应,但是我们不可能直接通过理化指标的数据就知道葡萄的等级,只能通过其酿成的葡萄酒的质量评分来判断,因为葡萄酒质量的好坏在一定程度上取决于酿酒葡萄的等级,酿酒葡萄的等级越好,相对来说,其酿成的葡萄酒会更好。

因此,我们以葡萄酒的质量评分与酿酒葡萄的多项理化指标进行相关分析,从而获取了与酿酒葡萄的等级相关度较高的理化指标。

接着,为了对酿酒葡萄进行等级的划分,我们采取上面获取的多项理化指标和葡萄酒的质量评分作为聚类的依据,得出酿酒葡萄的等级。

对问题三的分析:要分析酿酒葡萄与葡萄酒的理化指标之间的联系,由于题目给的指标很多,不能直接进行典型相关分析,对酿酒葡萄的各指标进行相关性分析,相关性大的指标只取一个指标进行分析,最后可以选出酿酒葡萄与葡萄酒有代表性的理化指标。

而酿酒葡萄的理化指标与葡萄酒的理化指标之间的相关系数只能反映这两组变量中各对之间的相关性,但不能反映这两组变量整体之间的相关性,我们可以将两组变量间的相关性凝结为少数几个典型变量之间的相关性,通过对相关性较大的几对典型变量的研究来了解原来两组变量之间的相关性。

所以选用典型相关性分析方法进行分析,用SPSS软件进行处理对问题四的分析:葡萄酒的质量可以由酿酒葡萄和葡萄酒的理化指标反映,但是他们可能存在某种关系。

因此,我们引入逐步回归的方法对这些指标进行回归分析,从而得出它们之间的关系。

在选取回归方程的时候,我们考虑到葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标有一定的关系,为了对该函数能否真实反映葡萄酒的质量和酿酒葡萄的理化指标、葡萄酒的理化指标,我们预留一定的样本不进行逐步回归,用这些样本对建立的逐步回归模型进行检验,得出模型的误差率,从而得出是否能用酿酒葡萄的理化指标、葡萄酒的理化指标反应葡萄酒的质量。

三、模型假设1、假设题目中所给的数据正确,可以用来进行数据分析。

2、假设葡萄及葡萄酒中的芳香物质中表格空格为0,即不含有这种物质。

3、假设两组评酒员的评价结果均值相互独立。

4、假设问题3选取出的酿酒葡萄和葡萄酒的理化指标进行典型相关分析时,这两组变量都是连续变量,且都服从多元正态分布。

四、符号说明i w 1:第一组评酒员对第i 个红葡萄酒样品评分平均值;i w 2:第二组评酒员对第i 个红葡萄酒样品评分平均值;i c : 红葡萄有代表性理化指标分别为天门冬氨酸、苏氨酸、脯氨酸、蛋白质、VC 含量、顺式白藜芦醇苷、H(i=1…7);i d :红葡萄酒有代表性理化指标分别为花色苷、反式白藜芦醇苷、反式白藜芦醇、a*、b*、乙醛、丙酸乙酯、乙酸-2-甲基丙基酯(i=1…8);i e : 白葡萄有代表性理化指标分别为谷氨酸、柠檬酸、多酚氧化酶活力、反式白藜芦醇、VC 、芳香物质(i=1…6);i f :白葡萄酒有代表性理化指标分别为单宁、总酚、DPPH 半抑制体积、L*、、b*、H 、C (i=1…7);1U ;为i c 的第一典型变量;1V :为i d 的第一典型变量;1M ;为i e 的第一典型变量;1N :为i f 的第一典型变量;i i i w w z 211-= (i=1,2……n);五、模型建立与求解问题一先对数据进行处理,第一组红葡萄酒品尝评分4号品酒员对第20个样品色调的评分为空,用4号评酒员对其他指标评分的平均值代替,第一白葡萄酒品尝评分7号品酒员对酒样品3持久性的评分为77,明显出错,改为7。

求出两组酒评酒员对葡萄酒样品品尝评分的均值。

柯尔莫戈洛夫-斯米尔诺夫单样本检测[]是检测独立样本分布是否服从正态分布的一种方法,这里通过应用这种方法,再用SPSS软件对每组葡萄酒的评价均值数据进行处理。

两组红葡萄酒评价检测结果第一组红葡萄酒评价结果P值0.531第二组红葡萄酒评价结果P值0.801上图给出了统计量的p值,p1=0.531>0.05,p2=0.801>0.05,无法拒绝原假设,及样本来至的总体分布与理论分布相吻合,两组红葡萄酒评价结果均值是服从正态分布。

两组白葡萄酒评价检测结果0.781第一组白葡萄酒评价结果P值第二组白葡萄酒评价结0.796果P值图中给出了统计量的p值,p3=0.781>0.05,p2=0.801>0.05,所以也无法拒绝原假设,及样本来至的总体分布与理论分布相吻合,也就是说两组白葡萄酒评价结果是服从正态分布。

分析数据,先分析所给的两组红葡萄酒的评分采,用两配对样本t 检验法对评价结果进行分析。

记i i i w w z 211-= (i=1,2……n),i z 1 (i=1,2……n)来自正态总体,用假设检验的方法,假设0H :1u =0成立,∑==n i i z n z 1111,()∑=--=n i i z z n s 12112111 n s z t 11= ,()}1{21-≥=-n t t w αi w 1:第一组评酒员对第i 个红葡萄酒样品评分平均值;i w 2:第二组评酒员对第i 个红葡萄酒样品评分平均值;i z 1 :第一组评酒员与第二组评酒员对第i 个红葡萄酒样品评分平均值的差值;1z :正态总体i z 1 的平均值;1s :正态总体i z 1的标准差;t :为构造的统计量;W :t 检验的拒绝域对于统计量t ,在给定显著性水平α下,该检验问题的拒绝域是W ,若()121-≥-n t t α,则拒绝0H ;若()121-<-n t t α,则接受0H ,我们取显著性水平α=0.05,用SPSS 软件实现数据处理,得到下表红葡萄酒评分结果 组数 样本数 平均值 标准差t1值 p和一27 73.0926 200.0798 2.491 0.019二 27 70.5148 138.666 上表给出了两组红葡萄酒评分均值的t 检验结果,通过查表当α=0.05,n=27时,()0555.2121=--n t α<2.491=t1,且方差齐性检验的p值为0.019<0.05,所以拒绝原假设,对于红葡萄酒的评价,两组评酒员的评价结果有显著性差异。

因为第一组评酒员对红葡萄酒样品评分的标准差和大于第二组的和,第二组各评酒员得评分差异小,稳定性高,比较可信。

同样的方法对两组白葡萄酒的评分进行处理,得到下表白葡萄酒评分结果 组数 样本数 平均值标准差和 t2 p 一 28 73.99929264.1155-2.638 0.014二 28 76.5321175.9042两组白葡萄酒评分结果两独立样本的t 检验结果,通过查表当∂=0.05,n=28时,()121--n t α=2.0518<2.491=t,且方差齐性检验的p 值为0.014<0.05,所以拒绝原假设,对于白葡萄酒的评价,所以得出两组评酒员的评价结果有显著性差异。

相关文档
最新文档