数学建模--葡萄酒的分级(正式版)
2012数学建模A题论文:葡萄酒的评价
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012年 9月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。
对于本题,我们主要采用SPSS软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
数学建模之葡萄酒的评价
葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对于本题,我们主要采用SPSS和MATLAB软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
最后,我们通过T检验,在SPSS中可其相应的标准差,通过比较标准差来确定哪个组更可靠。
针对问题二,首先利用主成分分析法对酿酒葡萄的指标进行简化,将问题转化成一个多元函数的求解问题,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后利用最小二乘法建立了酿酒葡萄与葡萄酒理化指标间的关系式。
一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
二、问题分析2.1针对问题一,我们将它分成两个问题去解决1、针对问题一中的两组评酒员的评价结果有无显著性差异,我们在SPSS 中利用T检验去判断。
在这之前,我们对附录1中数据进行处理,利用excel 分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。
数学建模葡萄酒评价优秀论文
葡萄酒的评价模型摘要近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增。
特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平。
如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。
本文通过对感官评价分析,结合葡萄酒和酿酒葡萄的理化指标和芳香物质的大量数据,建立了客观可靠的葡萄酒质量综合评价模型。
针对问题一:本题需要检验两组品酒员的评价结果是否存在显著差异,并选出更可靠的一组。
我们将各种葡萄酒的10个二级指标得分,相加得到每种酒的总分。
在判断知每组品酒员的评价总分均服从正态分布后,用t检验分析两组品酒员对各葡萄酒评价的差异性,由此计算得到两组评价的显著性差异率为13.36%,即总体上两组品酒员的评价不存在显著差异。
但由于两组品酒员的评价仍存在部分差异,我们比较两组品酒员对55种葡萄酒评价的方差,发现第二组评分的方差普遍小于第一组,所以第二组的评价结果更可信。
针对问题二:为了对酿酒葡萄进行分级,我们将葡萄的理化指标作为媒介。
先根据国际指标制定适用于本题评分的分级标准,将葡萄酒进行分级,再根据理化指标经标准化之后的数值,利用欧氏距离对酿酒的55种酿酒葡萄进行Q型聚类分析。
聚类得到红白葡萄各六个分类后,再把各类酿酒葡萄对应至相应葡萄酒的等级,将酿酒红葡萄和酿酒白葡萄各分为五级。
针对问题三:由于各种酿酒葡萄的理化指标种类复杂,我们用主成分分析的方法,从酿酒红葡萄和酿酒白葡萄的27个有效指标中各提取出了8个和9个主要成分。
考虑到酿酒葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,我们建立多元线性回归模型,得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。
关键词:显著性检验;聚类分析;主成分分析;多元回归。
一、问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
数学建模毕业论文--葡萄酒的评价
数学建模毕业论文--葡萄酒的评价
葡萄酒的评价是一项复杂的任务,涉及多个因素,包括葡萄品种、酿造过程、年份、产地和存储条件等。
在数学建模中,我们可以利用统计分析和机器学习算法来对葡萄酒进行评价,以预测其质量和特征。
首先,我们可以采集一定数量的葡萄酒样本,并测量其相关属性,如酒精含量、酸度、pH值、残留糖分、挥发性酸、柠檬
酸等。
利用统计分析方法,我们可以探索这些属性与葡萄酒质量之间的关系,建立相应的数学模型。
例如,可以使用线性回归分析来确定具体属性与葡萄酒得分之间的相关性。
另一方面,机器学习算法可以帮助我们构建更复杂的评价模型。
可以使用聚类算法将葡萄酒样本分成不同的类别,以发现具有相似特征的葡萄酒群体。
此外,可以使用分类算法或回归算法来预测葡萄酒的质量评分。
这些算法可以利用已知的葡萄酒样本数据进行训练,并在新样本上进行预测。
除了属性数据,我们还可以考虑其他因素对葡萄酒评价的影响。
例如,可以考虑葡萄酒的价格、评分和消费者评价等因素,以构建更综合的评价模型。
可以使用模糊数学方法来处理这些不确定性和主观性因素,以得出更准确的评价结果。
最后,为了验证模型的准确性和稳定性,可以使用交叉验证或留一验证的方法进行模型评估。
这些方法可以帮助我们评估模型的泛化能力,并进行必要的调整和改进。
数学建模可以帮助我们对葡萄酒进行评价,为葡萄酒生产商、消费者和酒评人提供有关葡萄酒质量和特征的有价值信息。
葡萄酒评价数学建模matlab
葡萄酒评价数学建模matlab【原创实用版】目录一、引言二、葡萄酒评价的数学模型介绍三、数学建模在葡萄酒评价中的应用案例四、MATLAB 在葡萄酒评价数学模型中的应用五、结论正文一、引言随着人们生活水平的提高,对葡萄酒的需求也日益增加。
葡萄酒的品质不仅取决于酿酒葡萄的品种、产地、气候等条件,还与酿酒工艺紧密相关。
为了对葡萄酒的质量进行客观评价,数学建模方法被广泛应用于葡萄酒评价领域。
本文将介绍葡萄酒评价的数学模型,并探讨如何利用 MATLAB 进行葡萄酒评价数学模型的实现。
二、葡萄酒评价的数学模型介绍葡萄酒评价的数学模型主要基于葡萄酒的理化指标,如花色苷、总酚、单宁等,以及葡萄酒的外观、香气和口感等感官评价指标。
通过建立数学模型,可以客观地评价葡萄酒的质量,并为酿酒师提供参考意见。
常用的数学模型包括多元线性回归模型、逐步回归模型、主成分分析模型等。
三、数学建模在葡萄酒评价中的应用案例数学建模在葡萄酒评价中的应用案例有很多,其中之一是利用逐步回归分析找出对葡萄酒理化指标影响显著的因素,得出酿酒葡萄与葡萄酒理化指标之间的函数关系。
另一个案例是基于多目标优化模型研究酿酒葡萄的分级方法,同时考虑酿酒葡萄和葡萄酒的理化指标,建立以误差平方和最小为目标的多目标优化模型。
四、MATLAB 在葡萄酒评价数学模型中的应用MATLAB 是一种强大的数学计算软件,可以方便地实现葡萄酒评价数学模型。
例如,通过 MATLAB 可以轻松地完成多元线性回归模型的参数估计、逐步回归模型的变量筛选等任务。
此外,MATLAB 还可以绘制葡萄酒理化指标与感官评价指标的关系图,便于酿酒师直观地了解葡萄酒的质量状况。
五、结论数学建模方法在葡萄酒评价领域具有广泛的应用前景,可以提高葡萄酒评价的客观性和准确性。
MATLAB 作为一种有效的数学计算工具,在葡萄酒评价数学模型的实现中发挥着重要作用。
建模论文-葡萄酒的评价
葡萄酒的评价摘要葡萄酒的质量评价是研究葡萄酒的一个重要领域,目前一般是通过聘请一些有资历的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其进行打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本文分析了如何对酿酒葡萄进行分类,寻找了酿酒葡萄与葡萄酒的理化指标之间的联系,以及解决了酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响等问题,建立了相应的数学模型,并且充分运用了Excel和SPSS等数学工具。
对于问题一,我们首先使用Excel对附件一中的数据进行了加权平均,求得两组品酒员对红白葡萄酒的评分;再通过方差分析法比较两组品酒员对红白葡萄酒评分的波动性大小。
在判断显著性差异的时候,我们使用了成对样本的t检验,通过比较p值和0.05,得到红葡萄酒和白葡萄酒都存在显著性差异;通过对方差大小的观察,可以得到第二组评分结果更加可信。
对于问题二,我们先运用主成分分析法找出红白酿酒葡萄的主成分,再运用SPSS软件通过聚类分析法对酿酒葡萄进行分类。
对于问题三,首先我们运用主成分分析法对葡萄酒的理化指标进行了降维,再利用SPSS对酿酒葡萄和葡萄的理化指标进行了相关性分析,发现酿酒葡萄和葡萄的理化指标之间的相关性不强。
对于问题四,我们把酿酒葡萄和葡萄酒的理化指标作为自变量,对第二组评酒员的评分作为因变量,建立多元回归线性模型,最终发现葡萄酒的质量仅用酿酒葡萄和葡萄酒的理化指标来评价是不客观的,还与葡萄品种和环境等很多因素有关。
关键字:SPSS软件聚类分析主成分分析多元线性回归模型 t检验一、问题的提出确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)
葡萄酒理化指标与质量的评鉴分析摘要用好的葡萄也许酿不出好酒,但没人能用劣质葡萄酿出好酒。
巧妇难为无米之炊,再优秀的酿酒师,如果没有优质的葡萄,也很难酿出好酒。
不同葡萄品种酿制出的葡萄酒是不同的,但是,除了品种间的差异,葡萄自身的质量是酿制高品质葡萄酒的关键。
本文通过建立meansK-聚类模型、典型相关分析等模型,逐步探求用葡萄和葡萄酒的理化指标来评鉴葡萄酒质量的方法。
问题一要求我们分析附件1中两组评酒员的评价结果是否存在显著性差异,为此我们依据小概率原理建立模型Ⅰ-显著性检验模型。
首先我们利用F检验求解两组评酒员之间是否存在显著性差异,再利用配对t检验对检验样本做再次检验,以提高研究效率,确保评价结果的准确性。
利用Excel软件处理数据后,进行t、F的联合检验,当联合检验均被接受,得到两组评酒员的评价结果有显著性差异的结论。
同时通过对两组品酒员对55种葡萄酒样品评分的稳定性、统一性分析,确定第二组品酒员的评价结果更可信。
针对问题二本文根据附件2提供的数据,利用模糊数学原理[3],建立模型ⅢK-聚类模型,对酿酒葡萄进行分类,再以葡萄酒品尝评分作为质量评价依据,means对酿酒葡萄进行分级。
首先,考虑到酿酒葡萄的理化指标过多,不便分类,我们利用多元统计分析原理对红、白酿酒葡萄进行主成分分析,得出红、白酿酒葡萄分别有8个和11个主成分,从而大大减少了分类指标。
再利用meansK-算法求出最佳聚类数k,建立meansK-聚类模型对各种葡萄样品在各个主成分上的得分进行聚类,将红、白葡萄样品分别划分为3类和4类。
最后,根据每个类别中葡萄样品对应的葡萄酒的品尝评分,对各类酿酒葡萄进行分级。
针对问题三建立模型Ⅳ-典型相关分析模型,定量分析酿酒葡萄与葡萄酒的理化指标之间的联系。
我们首先选取酿酒葡萄与葡萄酒皆含有的花色苷、单宁等成分作为理化指标,然后构建典型相关分析模型,研究酿酒葡萄与葡萄酒两组样品的理化指标之间的相关性。
关于葡萄酒问题的数学建模.
葡萄酒评价模型摘要本文讨论了葡萄酒的评价问题。
对问题一,分别求出两组评酒员对各葡萄酒样品的平均评分,通过SPSS软件对同一类酒的两组得分进行T检验,检验结果表明两组评酒员的评价结果有显著性差异。
再建立评酒员和样品葡萄酒得分的典型相关分析模型,运用MATLAB 求解,以样品葡萄的得分与评酒员的相关系数越大评分越不可信为依据,得出第二组的评分更可信的结论。
对问题二,以第二组的评分为准,对葡萄酒的质量进行排序,得出排序向量,对酿酒葡萄中各个理化指标进行排序,得出排序矩阵,排序向量与排序矩阵的各列进行点乘,得到葡萄酒质量与酿酒葡萄中各个理化指标的内积,以此内积作为葡萄酒的质量与酿酒葡萄中各个理化指标的相似度指标,选出相似度较高的五项指标作为酿酒葡萄分级的参考指标。
根据参考指标对酿酒葡萄进行分级,分别得出了依香气、口感、外观进行分级的酿酒葡萄分级结果(见表五,表六)。
对问题三,建立非线性回归模型,讨论酿酒葡萄与葡萄酒理化指标的联系。
将葡萄和葡萄酒的理化指标进行无量纲化处理,利用最短距离法,选出葡萄理化指标中对葡萄酒理化指标影响最大的五项作为回归自变量,以葡萄酒的理化指标为回归因变量,运用MATLAB求解得到酿酒葡萄与葡萄酒的理化指标之间的4次函数关系式(见表七,表八)。
对问题四,建立酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量的多重T检验模型。
应用SPSS软件进行T检验,通过检验结果所体现出的向量整体差异程度表明,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响较大,故可以用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量。
关键词理化指标;T检验;典型相关系数;回归模型;葡萄酒评价一、问题重述由于葡萄酒不仅饮用口感佳,而且还具有延缓衰老、滋补养颜、预防心脑血管病、预防癌症等功效,因而受到越来越多人的亲睐。
葡萄酒厂在对葡萄酒质量进行鉴定时,一般是通过聘请一批有专业知识和资质的评酒员对葡萄酒进行品评。
每名评酒员品评后会根据评判标准对所品葡萄酒进行打分,然后求其所有评酒员的打分之和,从而确定葡萄酒的质量。
全国大学生数学建模竞赛A题葡萄酒评价分析
全国大学生数学建模竞赛A题葡萄酒评价分析葡萄酒是一种古老而美妙的饮品,其种类繁多,风味各异。
如何对葡萄酒进行准确的评价和分析成为了葡萄酒爱好者和生产商们共同关注的问题。
在此次全国大学生数学建模竞赛A题中,我们将围绕葡萄酒的评价和分析展开讨论。
1. 引言葡萄酒是一种由葡萄经过发酵而成的酒类饮品。
葡萄酒的风味和品质受到许多因素的影响,如产地、葡萄品种、酿造工艺等。
为了准确评价葡萄酒的质量和特点,我们需要建立相应的评价指标和模型。
2. 数据分析为了进行葡萄酒评价,我们首先需要收集相关的数据。
通过对不同品牌、不同种类的葡萄酒进行采样和测试,我们可以获得葡萄酒的关键指标,如酒精含量、酸度、甜度、单宁含量等。
在数据分析中,我们可以运用统计学方法和数学建模技术,对数据进行整理和处理。
通过计算均值、方差、相关系数等指标,我们可以得到葡萄酒的基本特征和相互之间的关系。
3. 葡萄酒评价指标体系建立基于数据分析的结果,我们可以建立葡萄酒评价指标体系。
这一体系应该包含对葡萄酒各项指标的评价方法和权重。
常见的评价指标包括酒精含量、色泽、香气、口感等。
在指标体系中,我们可以采用层次分析法,通过对各个指标的重要性进行排序和评估。
同时,还可以利用数学模型,将各项指标综合起来,得到最终的评价结果。
4. 葡萄酒评价模型构建在对葡萄酒进行评价时,我们可以利用数学建模方法构建评价模型。
常用的模型包括多元回归模型、灰色关联度模型等。
多元回归模型可以用来分析葡萄酒各项指标之间的关系,进而预测葡萄酒的品质。
灰色关联度模型则可以用来度量葡萄酒各个指标对品质的影响程度。
通过不断地调整模型和参数,我们可以得到更准确的葡萄酒评价结果,并为葡萄酒生产商提供有针对性的改进建议。
5. 葡萄酒评价系统设计为了方便葡萄酒评价和分析的实施,我们可以设计一个葡萄酒评价系统。
该系统可以包括数据输入、数据处理、指标评价、模型计算等功能模块。
数据输入模块用于将葡萄酒相关数据录入系统。
数学建模 葡萄酒评价
A题:葡萄酒的评价摘要本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理化指标之间的联系、评价结果统计分析等方面的研究。
通过方差分析、层次分析等方法建立模型,解决了葡萄酒的评价问题。
问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel画出图表(见正文),直观地观察出两组评价数据范围接近,第二组评价数据波动不大,评价数据更可信。
问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。
采用系统工程学的层次分析法(AHP)来确定影响葡萄品质的各因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。
各等级下葡萄样品数如下表:问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用神经网络进行比较验证。
问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量间的联系。
通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。
本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。
关键词:方差分析Excel逐步回归分析Bp神经网络聚类分析MatlabDPS数据处理系统一、问题重述通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。
根据上述条件建立数学模型解决以下问题:1.分析两组评酒员的评价结果有无显着性差异,哪一组结果更可信。
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
数学建模葡萄酒分级(正式版)
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西安理工大学参赛队员 (打印并签名) :1. 郑晓东2. 罗璐3. 宫维静指导教师或指导教师组负责人 (打印并签名):日期: 2013 年 05月10 日葡萄酒质量的综合评价分析摘要近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。
对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。
对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。
对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。
对问题四,采用灰色关联度分析的方法进行求解,分别求出酿酒葡萄的理化指标与葡萄酒质量的关联度、葡萄酒理化指标与其质量的关联度,通过关联度值的大小,即可看出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响大小,并以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。
2012数学建模A题---葡萄酒评价---国家奖
葡萄酒的评价摘要本文主要运用统计分析方法,解决与所酿葡萄酒有关的问题。
对于问题一,,分别对白酒和红酒的两组数据进行差异性检验。
构建一个能反应葡萄酒本身质量的量,对两组数据分别进行相关性分析,得到第二组评酒员的结果更可信。
对于问题二,先做聚类分析,再做线性回归分析,得到白、红葡萄分为4级和3级。
对于问题三,利用问题二中聚类得到的7个主成分,把每种葡萄酒的理化指标与酿酒葡萄之间的7个主成分进行相关性分析,得到7个回归方程,即为酿酒葡萄与葡萄酒的理化指标之间的联系。
对于问题四,首先建立模型:12W=a *Y +b *Y 。
其中a,b 分别为酿酒葡萄和葡萄酒对葡萄酒质量的贡献率,1Y ,2Y 分别为两种因素的贡献值。
然后,通过确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。
问题一中,本文运用excel 做两组数据的显著性差异检验,得到两组评酒员在评论白酒和红酒都存在显著性差异,且通过了F 检验。
接着本文通过确定各指标的权重,构建一个能反应各葡萄酒实际平分的量,把两组数据与之做相关性分析,发现第二组与之相关性更大,故第二组评酒员的结果更可信。
问题二中,本文通过SPSS 做理化指标的聚类分析,得到7个主成分;再做指标与评分的线性回归分析,得到白葡萄的分级结果为4级:一级:白酿酒葡萄14,22;二级:白酿酒葡萄4,5,9,19,23,25,26,28;三级:白酿酒葡萄24,27;四级:白酿酒葡萄1,2,3,6,7,8,10,11,12,13,15,16,17,18,20。
红葡萄酒为3级:一级:红酿酒葡萄2,9;二级:红酿酒葡萄3,4,10,22,24;三级:红酿酒葡萄1,5,6,7,8,11,12,13,14,15,16,17,18,19,20,21,23,25,26,27。
问题三中,本文运用excel 将葡萄酒的一级指标分别与7个主成分进行相关性分析然后对每种主要成分利用SPSS 进行线性回归分析得到以下7个回归方程:()()()()()r1134r21367r3137r4136r6137r71Y =-39.542+1.727+21.850+3.9463Y =4.044+0.026-0.156-0.005-0.1954Y =2.807+0.021-0.030-0.1895Y =2.700+0.024-0.169-0.0056Y =0.069+0.001-0.006-0.0077Y =70.028-0.188+x x x x x x x x x x x x x x x x x ()()2347r8123560.841+0.280-0.187+1.7048Y =58.545-0.021-1.028+1.666+27.045-0.0049x x x x x x x x x 即为每种酿酒葡萄与葡萄酒理化指标之间的联系。
数学建模葡萄酒的评价
葡萄酒的评价摘要葡萄失去很高的养分价值,本文经由过程对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行评论辩论剖析,对不合的酿酒葡萄进行了分类,并更深刻评论辩论两者的理化指标是否影响葡萄酒质量.针对问题一,我们起首分离盘算每类葡萄酒样品在两组组评酒师评价下的分解得分,以此作为每组评酒师的最终评价成果.再应用统计学中的T 磨练进行假设与磨练,得出两组评价成果具有明显性差别.最后经由过程盘算各组评价员的评价成果的尺度差,以此推算稳固性指标值P,P 值较大的可托度较高,得出2p p <红1红与2P P <白1白,进而得出第二组的评价成果加倍可托.针对问题二,我们分离对两组葡萄进行分类.在这里我们采取聚类剖析法和主成分剖析法,在matlab 中实现对酿酒葡萄的分类.针对问题三,根据σμ-=x Z 对附件2中的数据进行尺度化处理,消除单位不合的影响.以酿酒葡萄的30个一级理化指标作为自变量X,葡萄酒9个一级的理化指标作为因变量y,树立多元线性回归模子εβ+=X y ,得出酿酒葡萄的理化指标与葡萄酒的理化指标之间的接洽即回归系数矩阵β.针对问题四,用灰色接洽关系度剖析对两者的关系进行器量,求得理化指标对样品酒的的接洽关系系数.然后根据葡萄酒分解得分及指标的相干系数得出样品酒的分解指标,经由过程MATLAB 软件对分解指标与第二问中葡萄酒的分数进行指数拟合,拟合后果不佳,是以不克不及定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测分解指标与葡萄酒的质量负相干.症结词:T磨练聚类剖析法主成分剖析法 Z分数多元线性回归一.问题重述肯定葡萄酒质量时一般是经由过程聘任一批有天资的评酒员进行批评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后乞降得到其总分,从而肯定葡萄酒的质量.酿酒葡萄的利害与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在必定程度上反应葡萄酒和葡萄的质量.附件1给出了某一年份一些葡萄酒的评价成果,附件2和附件3分离给出了该年份这些葡萄酒的和酿酒葡萄的成分数据.请测验测验树立数学模子评论辩论下列问题:1.剖析附件1中两组评酒员的评价成果有无明显性差别,哪一构成果更可托?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级.3.剖析酿酒葡萄与葡萄酒的理化指标之间的接洽.4.剖析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证可否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二.问题剖析葡萄酒的评价是一个庞杂的进程,须要分解斟酌不合评价员的评分,并且葡萄酒和葡萄的构成成分平常庞杂,它们也要影响葡萄酒的质量,对如斯繁多的数据,我们就必须依附盘算机对象,应用数学统计学常识对它们进行处理,并找出各个含量之间的关系,接洽生涯现实,对葡萄酒作出有理有据的评价.对于问题一:要想得到两组评价员的评价成果有无明显差别,并对它们的靠得住性作出断定,我们起首就应当将两组评价员的对27组红葡萄酒和28组白葡萄酒的评价成果整顿出来,求得葡萄酒的分解得分,再应用统计学中的T磨练进行假设与磨练,断定两组是否消失明显性差别,再经由过程盘算各组评价员的评价成果的尺度差和稳固性指标,进而断定谁的成果加倍可托.对于问题二:须要对葡萄进行分级,因为葡萄酒的质量与酿酒葡萄的利害有直接关系,所以我们可以根据葡萄酒的质量对酿酒葡萄做一个简略的分级,之后,我们用主成分剖析法算出每一组样本葡萄的哪些指标该葡萄的主成分,然后经由过程数据剖析断定出这些成分哪些对葡萄酒的质量作出了进献,筛选出重要成分后,对不合葡萄的成分做加权乞降,以此作为葡萄分级的另一个根据.对于问题三:要想得到葡萄与葡萄酒的指标间的接洽,即得到它们之间的函数关系表达式,必须求出两者指标之间的相干系数.但是,因为它们各自的指标太多,此处仅以一级指标作为相干身分进行剖析.令酿酒葡萄的30个一级指标作为自变量,葡萄酒的9个一级指标作为因变量,树立线性回归模子,经由过程最小二乘法盘算出回归系数,即酿酒葡萄的指标与葡萄酒的指标间的相干性.对于问题四:题中想请求出理化指标对证量的影响,即各理化指标与质量的线性或非线性关系,但是,因为理化指标太多,并且并不是没个理化指标都邑对葡萄酒的质量造成影响,所以起首必须进行数据的筛选,这里我们应用spss软件进行典范相干性剖析,找出哪些指标与质量有较大的关系,然后将这些指标设为自变量,将质量设为因变量,对它们进行多元线性拟合,最后得到一个多元表达式今后,我们就可以经由过程这个方程来对葡萄酒的质量进行验证,假如验证的成果与评价员打分的成果根本吻合的话,就解释可以用葡萄与葡萄酒的理化指标来对葡萄酒的质量进行评价.三.根本假设1、假设评酒员对每种葡萄酒的评价成果是大致相符正态散布的;2、假设酿酒葡萄与葡萄酒中的芬芳物资重要成分是:低醇.酯类.苯等,其余成份疏忽;3、假设酿酒葡萄与葡萄酒的理化指标中一级指标为重要影响.4、假设酿酒葡萄中消失的而葡萄酒中不消失的理化指标也会影响葡萄酒的理化指标及质量;5、假设不斟酌多种葡萄可制成一种酒,只斟酌一种葡萄制成一种酒;6、假设只斟酌红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,疏忽去皮红葡萄可酿制白葡萄酒;7、假设质量高的葡萄酒必定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄不必定能酿制成质量高的葡萄酒;8、ijA暗示第i瓶酒的第j个指标无量纲化后的值9、ijB暗示第i种酿酒葡萄的第j个指标无量纲化后的值10.iM暗示第i瓶酒的分解指标四符号解释:T统计量T:khija第k组序号为h的样品第i个指标第j个品酒师的给分:khia序号为h的样品中第i个指标第k组10位品酒师给分的平均值:khiS第k组序号为h的样品第i个指标10位品酒师评分的尺度差kib:第k组第i个指标所占权重:khx第k组序号为h的样品的稳固性指标k :p红第k组红葡萄酒的评分总平均稳固性指标k :P白第k组白葡萄酒的评分总平均稳固性指标ijX : 为第i个样品的第j个指标is : 第i个葡萄样品的总得分i: 第i个样品葡萄理化指标得分为个中:第一个指标指澄清度,第二个指标指色调,第三个指标指喷鼻气纯正度,第四个指标指喷鼻气浓度,第五个指标指喷鼻气质量,第六个指标指口感纯正度,第七个指标指口感浓度,第八个指标指持久性,第九个指标指口感质量,第十个指标指均衡/整体评价.五模子树立与求解5. 1 问题一:葡萄酒评价成果的明显性差别及可托度剖析5. 1. 1 葡萄酒评价成果数据预处理对附件1中数据经由过程Excel筛选不雅察时可发明某些数据错误,如:第一组红葡萄酒品尝评分中酒样品20号下4号品酒员对于外不雅剖析的色调评价数据缺掉;第一组白葡萄酒品尝评分中酒样品3号下7号品酒员对于口感剖析的持久性评价数据为77,明显超出该项上限8;第一组白葡萄酒品尝评分中酒样品8号下9号品酒员对于口感剖析的持久性评价数据为16,明显超出该项上限8等.对这些平常数据为削减其对于总体评价成果的影响,采纳预处理:取该酒样对应误差项目其余品酒员评价成果平均值替代该平常数据.经由数据预处理可得出每一种类葡萄酒的分解得分,树立表1与表2.表1 红葡萄酒总得分平均值根据表1,用excel 作出两组评酒师对每一类葡萄酒的评分折线图.图1表2 红葡萄酒总得分平均值根据表2,用excel 作出两组评酒师对每一类葡萄酒的评分折线图. 图2根据图1. 图2可初步简略看出两组评酒师的评价成果消失有明显性差别.5.1.2 葡萄酒评价成果差别性剖析与可托度剖析模子树立与求解(1) t 磨练模子树立起首假定两个总体平均数间没有明显差别,即 210:μμ=H查T 值表,比较盘算得到的T 值与理论T 值,揣摸产生概率(一般为95%).两个正态总体的均值磨练模子假设n X X X ,...,,21 是来自总体() 211,σμN 的样本n Y Y Y ,...,,21是来自总体() 222,σμN 的样本,且两样本自力.设1μ ,2μ和2221,σσ均未知,其磨练问题为 210:μμ=H . 且()2t ~11)(2121321-++---n n n n S Y X μμ.当0H 为真时,统计量T 的盘算公式()2~1121213-++-=n n t n n S YX T .式中,()()211212222113-+-+-=n n S n S n S .查T 值表,比较盘算得到的T 值与理论T 值,揣摸产生概率(一般为95%),个中α 为明显性程度,05.010095-1==α是以当05.0< T 则以为0H 不成立,两组评酒员对红葡萄酒的评价成果有明显性差别.(2)两组评酒员对红葡萄酒的评价成果比较: 分离盘算出 7.3426 S ,73.0556 ,2711 ===X n05.00210.0<=T ,解释该两组评酒员对红葡萄酒的评价成果有明显性差别.(3)两组评酒员对白葡萄酒的评价成果比较: 分离盘算出 4.8266 S ,73.9786 ,2811 ===X n05.00129.0<=T ,解释该两组评酒员对白葡萄酒的评价成果有明显性差别.5. 1. 3可托度剖析模子树立与求解:第k 组序号为h 的样品 第i 个指标10位品酒师给分的平均值 第k 组序号为h 的样品第i 个指标10位品酒师的尺度差 算出第k 组序号为h 的样品的稳固性指标 第k 组红,白葡萄酒的评分总平均稳固性指标盘算求得:比较红葡萄酒的两组总平均稳固性指标,因为2p p <红1红,所以第二组品酒师的评价成果更可托.同样,比较白葡萄酒的总平均稳固性指标,因为2P P <白1白,所以第二组品酒师的评价成果可托度更高. 5.2问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级.问题二求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,葡萄酒由酿酒葡萄酿制而成,则酿酒葡萄的质量与葡萄酒的质量有着直接的关系,则可以根据葡萄酒的质量对酿酒葡萄做一个简略的分级,在根据主成分剖析从葡萄的理化指标中筛选出对葡萄质量产生影响的重要身分,根据所得各重要身分的进献率给个身分加权作为系数,求出葡萄中主成分的含量,并进行排名,之后将此排名与之前根据葡萄酒质量所得出的排名分解,进而得出较精确的对酿酒葡萄的分级.5.2.1 K 均值法聚类剖析模子 k 均值法的根本步调:(1)选择k 个葡萄酒样品作为初始凝集点,或者将所有葡萄酒样品分成k 个初始类,然后将这k 个类的重心(均值)作为初始凝集点.(2)对除凝集点之外的所有葡萄酒样品逐个归类,将每个葡萄酒样品归入凝集点离它比来的谁人类(平日采取欧氏距离),该类的凝集点更新为这一类今朝的均值,直至所有葡萄酒样品都归了类.(3)反复步调(2),直至所有的葡萄酒样品都不克不及再分派为止.最终的聚类成果在必定程度上依附于初始凝集点或初始分类的选择.经验标明,聚类进程中的绝大多半重要变更均产生在第一次再分派中.也就是:先算各类的均值再算各类中样本到本类及其他类的均值的绝对值距离(欧氏距离)将葡萄酒样本从新归类到欧氏距离较小的类中(从新归类就得算均值)起首,根据第一问得出的成果,我们采取第二组评酒员的成果作为断定葡萄酒质量的根据,根据各葡萄酒的分数,我们得出了红葡萄酒和白葡萄酒的排名 ,虽然是葡萄酒质量的排名,但因为葡萄酒的质量由酿酒葡萄的质量决议,所以上表可以看作是葡萄质量的排名,以上表中葡萄酒的分数作为酿酒葡萄质量的分数,可以对酿酒葡萄作出初步的分级,针对葡萄酒的成绩,我们用聚类剖析的办法,得出了葡萄的初步分级,运行的得到的图样如下:图 3图 4根据上述成果,得出红.白葡萄酒的等级分类,树立表3,表4. 表 3 红葡萄酒等级分类A 1,10,12,13,16,25B 4,5,14,19,21,22,24,26,27C 6,7,8,11,15,18 D2,3,9,17,20,23表 4 白葡萄酒等级分类5.2.2 主成分—权值分级模子固然酿酒葡萄所对应葡萄酒的质量能在必定程度上反应酿酒葡萄的质量,但葡萄的质量还应以葡萄本身的成分来区分其级别,为了得到更精确的分级,我们又对附件中所给酿酒葡萄中的理化指标做了一些剖析.为了分解斟酌酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,将附件3中芬芳物资含量总和作为一个一级理化指标,设第i 个样品葡萄理化指标得分为i σ,葡萄酒的质量总分为i ω,则第i 个葡萄样品的总得分i s 可以暗示为10,)1(<<-+=θωθθσi i i s (5.2.2.1)拔取一个使得样品趋于较稳固值的θ,此时的θ可作为酿酒葡萄的分级权值.(1)起首对各理化指标进行归一化处理,酿酒葡萄一级理化指标中样本有n 个,指标有m 个,分离设为m X X X ,...,21,令ij X 为第i 个样品的第j 个指标.做变换jiij ij s X X N -=(5.2.2.2)得到尺度化的数据矩阵m n ij N N ⨯=)(,个中∑∑==--==n i j ij j n i ij j X X n s X n X 121)(11,1(5.2.2.3) (2)在尺度化数据矩阵N 的基本上盘算ϕ个原始指标相干性系数矩阵个中∑∑∑===----=nk j kjnk i kink j kj i kiij X XX XX X X Xr 1211)()())(((5.2.2.4)(3)求相干性系数矩阵R 的特点值并排序mλλλ≥≥≥...21,再求出R 的特点值的响应的正交单位化特点向量T m i i i i l l l l ),...,(21=,则第i 个主成分可暗示为各指标k X 的线性组合∑==mi k ki i X l Z 1.盘算分解得分.起首盘算得到第i 个样本中第k 个主成分的得分为∑==mj j ki ik X l F 1,再以ϕ个主成分的方差进献率为权重,求得第i 个样品的分解得分),...2,1(1n i F f mi k ik i ==∑=λ.模子求解:表5 红葡萄样品主成份及其排序表 6红葡萄样品分解得分对分解得分相邻样品分差值进行剖析,当其值达到及以上,以为两酿酒葡萄的品德差别较大,不克不及分在统一级,按照此办法,红葡萄可分成六级,一级到六级暗示葡萄品德逐渐下降,具体情形如下表:表 7红葡萄分级成果本模子中重要以红葡萄样品的相干数据进行分级,按照同样的办法将白葡萄的相干数据代入,求得白葡萄分级如下:表 8 白葡萄分级成果5. 3 问题三:剖析酿酒葡萄与葡萄酒的理化指标之间的接洽 5.3.1 数据预处理尺度化及分解理化指标在处理附件2中数据时可以发明某些消失平常的数据值,如:葡萄理化指标中白葡萄百粒质量的第三次检测值为2226.1 g,明显超出其它两次的检测值.为防止平常数据值对分级成果的影响,取其它两次值的平均值替代该平常值.同时对数据进行尺度化处理,取其z 分数:σμ-=x Z :个中,x 为变量值, μ为平均数, σ为尺度差.Z 分数暗示的是此变量大于或小于平均数几个尺度差.因为z 分数分母的单位与分子的单位雷同,故z 分数没有单位,因而可以用Z 分数来比较两个从不合单位总体中抽出的变量值.同时将原始数据直接转化为z 分数时,常会消失负数和带小数点的值. 5. 3. 2多元线性回归模子(1)模子树立不雅察所给附件中的数据易知,影响酿酒葡萄与葡萄酒理化指标的身分往往不止一个,所以树立多元线性回归模子求解酿酒葡萄与葡萄酒两者理化指标之间的接洽. 设变量Y 与变量 P X X X ,...,,21间有线性关系εββββ++++=P P X X X Y ,...,22110 .式中,()P N βββσε,...,,,,0~102和2σ是未知参数,2≥P . 设n i y x x x i ip i i ,...,2,1,),,...,,(21= 是()Y X X X P ,,...,,21 的n 次自力不雅测值,则多元线性模子可暗示为n i x x x y i iP P i i i ,...,2,1,...,22110=++++=εββββ. 式中,()2i ,0σεN ∈,且自力同散布.可用矩阵情势暗示,令 则多元线性模子可暗示为 εβ+=X y . 式中()()n I Var E 2,0σεε== .(2)模子求解相似于一元线性回归,求参数的估量值,就是求最小二乘函数()()()βββX X Q T--=y y .达到最小的β值,可以证实的最小二乘估量()y 1T T X X X -∧=β.从而可得经验回归方程为P P X X X Y ∧∧∧∧∧+++=ββββ,...,22110 .将酿酒葡萄看做自变量,葡萄酒看做因变量.留意,盘算时用的是经由处理后的Z 分数表.我们用() 301≤≤i X i 暗示酿酒葡萄的30个一级指标,作为自变量X;用()91≤≤j Y j 暗示葡萄酒的9个一级指标,作为因变量y.个中,理化指标的编号次序按照所给附件中的大小次序.例如,红葡萄酒中理化指标次序依次为花色苷.单宁.总酚.酒总黄酮.白藜芦醇.DPPH 半克制体积.L .a.b .经由MATLAB 对回归系数的最小二乘估量盘算,得出回归系数() 3010,...,,βββ,即自变量与因变量之间的接洽,见附表.根据回归系数表得出两者之间的正负相干性,个中数字为酿酒葡萄理化指标编号.表 9 酿酒红葡萄与红葡萄酒正相干回归系数表 10 酿酒红葡萄与红葡萄酒负相干回归系数表11 酿酒白葡萄与白葡萄酒正相干回归系数表12 酿酒白葡萄与白葡萄酒负相干回归系数5. 4. 1模子的树立若要剖析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,则应当先求出它们的相干性.本题应用灰色接洽关系度剖析对体系两者的关系进行器量.灰色分解剖析用以下模子W Y R ⨯=.R 为M 个被评价对象的分解评价成果向量:W 为N 个评价指标的权重向量:E 为评判矩阵.)(k i ς为第i 个被评价对象的第k 个指标与第k 个最优指标的接洽关系系数.根据R 的数值,进行排序.设],...,[21n j j j F =,此最优序列的每个指标值可所以各个评价对象的最优值.式中i k j 为第i 个葡萄样品第k 个指标的原始数值因为评价指标间有不合的量纲和数目级,故不克不及直接进行比较,是以须要对原始指标进行规范处理.则可以用下式将原始数值变成无量纲值)1,0(∈i k Cik k k i k i kj j j j C --=21,i=1,2,...m; k=1,2,...n.根据灰色体系理论将},...,{}{**2*1*n C C C C =.作为参考数列将},...,{}{21i n i i C C C C =作为比较数列,则用接洽关系剖析法分离求得第i 个被评价对象的第k 个指标与第k 个指标最优指标的接洽关系系数,.即:i kKiki kKi k K i ki k K kii CC C C C C C C -+--+-=****min min min min min min ρρς.上式中:),1,0(∈ρ一般取5.0=ρ. 如许分解评价的成果为:假如接洽关系度i r 最大,解释}{C 与最优指标}{*C 最接近,据此可排出被评价对象的好坏次序.拔取五种理化指标和六种葡萄酒进行研讨,具体数据见表: 部分理化指标数据乙醇 1-己醇 1-辛醇13,.6170617.4)()(0617.4067.0)()(min min )()()()(min min min min 0000*+-+=-+--+-=k X K X k X k X k X k X k X k X C C i i iki i ikik K kii ρρς.将值带人maxmax min )(∆+∆∆+∆=ρςk i 中,应用matlab 求得1ς={0.9980 0.9964 0.3337 0.9962 0.9974 0.9963}2ς={0.9995 0.9981 0.3334 0.9995 0.9997 0.9989}3ς={0.5371 0.8057 0.7110 0.7546 0.4160 0} 4ς={0.4357 0,7672 0.5516 0.7110 0.3643 0}5ς={0.4281 0.7380 0.5516 0.6059 0.3333 0}盘算接洽关系度),(0i X X R ,由公式∑==101)(1i i i k n R ς.分离盘算出乙醛,乙醇,1-己醇,1-辛醇,苯乙醇的接洽关系度2244.3,6344.3,7854.3,3142.4,9980.054321=====R R R R R .得出结论15432R R R R R >>>>.同理可得:白葡萄酒的接洽关系度大小关系为:51234R R R R R >>>>.由以上解释醇类物资等理化指标对葡萄酒的质量有重要影响,然而影响葡萄及质量的身分不止这些.比方:葡萄果实中糖的成分的若干,是制约发酵后葡萄酒的酒精度的要素.是以我们树立了分解指标评价模子来论证可否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.5.4.3 分解指标评价模子: 模子树立:分解指标盘算公式: 每一瓶酒对应一个分解指标红葡萄酒有27个分解指标i M (127i ≤≤) 白葡萄酒有28个分解指标i M (128i ≤≤) 5.4.4 模子求解:应用盘算机编程求解出每瓶葡萄酒的分解指标M(程序见附录)i见下表:应用matlab拟合分解指标的值与第二问中葡萄酒的分数得到下图:红葡萄酒:去除一个奇点后用指数函数拟合得下图:拟合成果:f(x) = a*exp(b*x)a = 6.06e+011 (-1.011e+013, 1.132e+013)b = -0.2746 (-0.5484, -0.0007818)白葡萄酒:用指数函数拟合后如下图:拟合成果:f(x) = a*exp(b*x)a = 1215 (-2.173e+004, 2.416e+004)b = -0.002948 (-0.2472, 0.2413)由R-square值可以看出两组曲线拟合的成果不好,变换拟合函数测验测验数次后所得拟合成果均不睬想,是以我们以为不克不及定量的用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,只能根据图像大致猜测分解指标与葡萄酒的质量负相干六模子评价长处:1.本文在建模进程中,应用了建模与软件剖析相联合的办法,进步了盘算成果的精确性;2.本文在求解是对统一问题应用两种不合办法,使模子得出的成果加倍靠得住;3.本文在建模进程中应用的办法简略有用,在原模子的基本上又有必定的创新.缺陷:经由过程经验设定分解指标进行求解,简化了响应的数学模子,只是缺乏对分解指标设立的磨练,根据性不强.七参考文献[1]陈光亭裘哲勇《数学建模》高级教导出版社 2010年2月[2]王宏洲《数学建模优良论文》清华大学出版社 2011年9月[3] 姜启源.谢金星.叶俊,《数学模子》(第四版),北京:高级教导出版社,2011年.[4] 白凤山.么焕平易近等,《数学建模》(上册),哈尔滨:哈尔滨工业大学出版社,2003年.附录酿酒红葡萄与红葡萄酒理化指标的回归系数酿酒白葡萄与白葡萄酒理化指标的回归系数代码T 磨练function[H,P,CI]=ttest(X,Y)%H暗示在明显性程度为0.05下,H=1时能谢绝原假设,验的零假设H0为两总体均值之间不消失明显差别%p<0.05 谢绝H0有明显性差别%Cl均值μ[Muhat, sigmahat, muci, sigmaci]=normfit(X)%Muhat为均值 muci为均值0.95 置信区间%sigmahat为尺度差 sigmaci尺度差0.95 置信区间a=Muhat;b=sigmahat;Cx=b/a%X的变异系数[Muhat, sigmahat, muci, sigmaci]=normfit(Y)%Muhat为均值 muci为均值0.95 置信区间%sigmahat为尺度差 sigmaci尺度差0.95 置信区间a=Muhat;b=sigmahat;Cy=b/a%Y的变异系数假如Cx<Cy,则解释x比y更靠得住if Cx<Cydisp('x比y 变异系数小,更稳固,成果更靠得住')elsedisp('y比x变异系数小,更稳固,成果更靠得住')endend聚类剖析程序:x = [68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5]';opts = statset('Display','final'); % 显示每次聚类的最终成果% 将原始的5个点聚为3类,距离采取绝对值距离,反复聚类5次,显示每次聚类的最终成果idx = kmeans(x,4,'Distance','city','Replicates',27,'Options',opts)%****************************绘制聚类轮廓图*********************************x = [68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5]';% 将原始的5个点聚为3类,距离采取绝对值距离,反复聚类5次idx = kmeans(x,4,'Distance','city','Replicates',27);[S, H] = silhouette(x,idx) % 绘制轮廓图,并返回轮廓值向量S和图形句柄Hopts = statset('Display','final'); % 显示每次聚类的最终成果% 将原始的5个点聚为3类,距离采取绝对值距离,反复聚类5次,显示每次聚类的最终成果idx = kmeans(x,4,'Distance','city','Replicates',27,'Options',opts)%****************************绘制聚类轮廓图*********************************x = [68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5]';% 将原始的5个点聚为3类,距离采取绝对值距离,反复聚类5次idx = kmeans(x,4,'Distance','city','Replicates',27);[S, H] = silhouette(x,idx) % 绘制轮廓图,并返回轮廓值向量S和图形句柄Htitle('聚类剖析(红葡萄酒K均值聚类)') % 为X轴加标签主成分剖析程序:PHO = [];%代入数据%******************挪用pcacov函数根据相干系数矩阵作主成分剖析*****************% 返回主成分表达式的系数矩阵COEFF,返回相干系数矩阵的特点值向量latent和主成分进献率向量explained[COEFF,latent,explained] = pcacov(PHO)% 为了加倍直不雅,以元胞数组情势显示成果result1(1,:) = {'特点值', '差值', '进献率', '累积进献率'}; result1(2:7,1) = num2cell(latent);result1(2:6,2) = num2cell(-diff(latent));result1(2:7,3:4) = num2cell([explained,cumsum(explained)])% 以元胞数组情势显示主成分表达式s = {'';'x1:';'x2:';'x3:';'x4:';'x5:';'x6:','x7:','x8:'}; result2(1, 2:4) = {'Prin1', 'Prin2', 'Prin3'};result2(2:7, 2:4) = num2cell(COEFF(:,1:3))回归系数求解function [beta_hat,Y_hat,stats]=mulregress(X,Y,alpha)% 多元线性回归(Y=Xβ+ε)MATLAB代码% X:自变量矩阵,列为自变量,行动不雅测值% Y:应变量矩阵,同X% alpha:置信度,[0 1]之间的随意率性数据% beta_hat:回归系数% Y_beata:回归目的值,应用Y-Y_hat来不雅测回归后果C=inv(X'*X);Y_mean=mean(Y);% 最小二乘回归剖析beta_hat=C*X'*Y % 回归系数βY_hat=X*beta_hat % 回归猜测% 离差和参数盘算Q=(Y-Y_hat)'*(Y-Y_hat); % 残差平方和U=(Y_hat-Y_mean)'*(Y_hat-Y_mean); % 回归离差平方和T=(Y-Y_mean)'*(Y-Y_mean); % 总离差平方和,且知足T=Q+U。
2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)
葡萄酒理化指标与质量的评鉴分析摘要用好的葡萄也许酿不出好酒,但没人能用劣质葡萄酿出好酒。
巧妇难为无米之炊,再优秀的酿酒师,如果没有优质的葡萄,也很难酿出好酒。
不同葡萄品种酿制出的葡萄酒是不同的,但是,除了品种间的差异,葡萄自身的质量是酿制高品质葡萄酒的关键。
本文通过建立meansK-聚类模型、典型相关分析等模型,逐步探求用葡萄和葡萄酒的理化指标来评鉴葡萄酒质量的方法。
问题一要求我们分析附件1中两组评酒员的评价结果是否存在显著性差异,为此我们依据小概率原理建立模型Ⅰ-显著性检验模型。
首先我们利用F检验求解两组评酒员之间是否存在显著性差异,再利用配对t检验对检验样本做再次检验,以提高研究效率,确保评价结果的准确性。
利用Excel软件处理数据后,进行t、F的联合检验,当联合检验均被接受,得到两组评酒员的评价结果有显著性差异的结论。
同时通过对两组品酒员对55种葡萄酒样品评分的稳定性、统一性分析,确定第二组品酒员的评价结果更可信。
针对问题二本文根据附件2提供的数据,利用模糊数学原理[3],建立模型ⅢK-聚类模型,对酿酒葡萄进行分类,再以葡萄酒品尝评分作为质量评价依据,means对酿酒葡萄进行分级。
首先,考虑到酿酒葡萄的理化指标过多,不便分类,我们利用多元统计分析原理对红、白酿酒葡萄进行主成分分析,得出红、白酿酒葡萄分别有8个和11个主成分,从而大大减少了分类指标。
再利用meansK-算法求出最佳聚类数k,建立meansK-聚类模型对各种葡萄样品在各个主成分上的得分进行聚类,将红、白葡萄样品分别划分为3类和4类。
最后,根据每个类别中葡萄样品对应的葡萄酒的品尝评分,对各类酿酒葡萄进行分级。
针对问题三建立模型Ⅳ-典型相关分析模型,定量分析酿酒葡萄与葡萄酒的理化指标之间的联系。
我们首先选取酿酒葡萄与葡萄酒皆含有的花色苷、单宁等成分作为理化指标,然后构建典型相关分析模型,研究酿酒葡萄与葡萄酒两组样品的理化指标之间的相关性。
2012A数学建模——葡萄酒的评价
2
三、模型的建立与验证
对红葡萄酒有显著影响的葡萄指标示意表
酒指标 花色苷 单宁 总酚 酒总黄酮 白藜芦醇 DPPH半抑制体 积 花色苷 花色苷 花色苷 花色苷 葡萄总黄酮 苹果酸 DPPH自由基 DPPH自由基 DPPH自由基 相关显著指标 褐变度 总酚 总酚 总酚 DPPH自由基 单宁 单宁 单宁 总酚 葡萄总黄酮 葡萄总黄酮 葡萄总黄酮 果皮质量 单宁 黄酮醇 果梗比
三、模型的建立与验证
问题四 (1)模型建立:由理化指标评价葡萄酒质量——逐步多元回归模型 红葡萄酒和葡萄的理化指标对红葡萄酒质量影响的回归方程为:
y 0.03341x1 0.06279x2 0.01282x3 0.09751x4 0.88596
白葡萄酒和葡萄的理化指标对白葡萄酒质量影响的回归方程为:
汇报提纲
一、问题重述 1、问题背景
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品 评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求 和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡 萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在 一定程度上反映葡萄酒和葡萄的质量。
28
1.040086
1.01961
0.019687
全国大学生数学建模大赛
-0.00726
0.019272 -0.00647 -0.0042 0.016057
1.01134
0.994353 1.038779 0.970834 1.006113
0.99236
1.01967 1.0121 1.02841 0.97964
0.018767
-0.02546 0.025683 -0.05931 0.026312
葡萄酒的评价-全国大学生数学建模竞赛题答案
数学实验计算机科学与技术成员:xxx学号:xxxxxxxxxx葡萄酒的评价摘要本文主要研究的是如何对葡萄酒进行评价的问题。
通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。
在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。
之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。
而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。
置信区间越窄,说明其越可信。
利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。
在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。
在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。
第二变量的方差次大,并且和第一变量不相关。
由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。
依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。
在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。
在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。
最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。
关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西安理工大学参赛队员 (打印并签名) :1. 郑晓东2. 罗璐3. 宫维静指导教师或指导教师组负责人 (打印并签名):日期: 2013 年 05月10 日葡萄酒质量的综合评价分析摘要近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。
对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。
对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。
对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。
对问题四,采用灰色关联度分析的方法进行求解,分别求出酿酒葡萄的理化指标与葡萄酒质量的关联度、葡萄酒理化指标与其质量的关联度,通过关联度值的大小,即可看出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响大小,并以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。
关键词:t检验主成分分析曲线拟合灰色关联度分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析2.1 问题一本题给出了两组评酒员对同一批葡萄酒的评价分数,在本文,采用假设检验中的t检验建立评估两组数据差异性的模型,研究两组评论员的评价是否存在差异,判断能否接受它们存在显著性差异的假设。
若接受,则继续第二步:可靠性分析,分别对两组数据求方差,方差小的说明波动小,既评酒员的评价较稳定,可靠性高。
2.2 问题二首先,我们利用问题一得到的结果,对可靠性高的一组数据进行处理,降低评论员之间的差异,提高葡萄酒样品最终得分的可靠度。
按得分对葡萄酒进行分级。
然后,用标准化处理后的酿酒葡萄的理化指标对葡萄进行主成分分析。
最后,结合葡萄酒的分级对酿酒葡萄进行分级。
2.3 问题三首先,用处理酿酒葡萄的理化指标的方法对葡萄酒的理化指标做同样的处理,得到葡萄酒理化指标的主成分。
然后,分别根据主成分获得红葡萄和红葡萄酒的的得分。
通过曲线拟合,分别建立红葡萄得分和专家的评分之间的关系;红葡萄酒得分和专家评分之间的关系。
最后,根据两种理化指标和专家的评分之间的关系,建立两种理化指标之间的关系。
2.4 问题四运用灰色关联度分析的方法,定量描述酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。
三、问题假设1.同种葡萄酒在同一组评酒员的得分下成正态分布。
2.一种葡萄对应酿制一种葡萄酒。
3.葡萄的成分充分转化为葡萄酒里的成分,不存在意外的浪费和挥发。
四、符号说明这里只列出主模型的全局参数,其他局部参数见具体模型。
(1)i J :第i 个红葡萄酒样品(1)ij a :第i 个红葡萄酒样品的得分T1:第一组评酒员全体 T2:第二组评酒员全体五、模型的建立与求解5.1 模型一:基于t 检验建立差异评估模型我们采用假设性检验验证是否能接受两组评酒员的评价结果存在显著性差异的假设。
然后用方差分析两组评酒员评价数据的波动,认为较平稳的一组比较可靠。
5.1.1、数据预处理我们在分析数据是发现了几个显著性的异常数据:第一组红酒数据——样品20——色调——评酒员4号 数据缺失 第一组白酒数据——样品3——持久性——评酒员7号 怀疑多了一个7 第一组白酒数据——样品8——口感分析——评酒员2号 数据明显异常 因为随机样本在均值附近振荡,所以我们选用均值来代替异常数据以求误差最小。
5.1.2 t 检验模型的建立21,T T 分别代表第一,第二组整体,分别对红葡萄酒i R (i=1,2, (27)和白葡萄酒i W(i=1,2,…,27)进行感官评价,1T 的评价结果通过组内的每一评酒员的评分的均值来表示。
同样的,T2的评价结果通过组内的每一评酒员的评分的均值来表示。
从而得到两组评论员分别对红葡萄酒的评价结果见表一:表1 红葡萄酒的评价结果表中对于同一酒样品的两个评价差异是由两个评酒员引起的,为鉴定他们的评价结果有无显著性差异,可对两组数据对同一样品的差值进行分析,既表中的D 。
以红葡萄酒为例:有27对相互独立的评价结果(X1,Y1)(X2,Y2)...(X27,Y27),D1=X1-Y1,D2=X2-Y2,...,D27=X27-Y27,由于Di (i=1,2, (27)是由同一因素造成的,可认为它们服从同一分布。
现假设Di~N (D μ,2D σ),i=1,2…,27,且D μ,2D σ未知,基于这一样本检验假设:0:,0:100≠=D H H μμ (1)分别记1227,,,D D D 的样本均值和样本方差的观测值为d ,2D s 。
对1227,,,D D D 进行单个均值的t 检验,检验问题的拒绝域为(显著水平为α):(1)t t n α=≥-. (2)当t 的值不落在拒绝域内时,接受0H ,既认为两组评价无显著性差异。
否则,两组评价有显著性差异。
对白葡萄酒的处理同红葡萄酒。
2)模型的求解现以红葡萄酒为例求解,首先,作出同一酒样品(1)i J (1,2,,27)i =分别由两组品酒员1T 、2T 得到的评价结果之差,列于表一的第三行,根据建立的模型检验假设:01:0,:0D D H H μμ=≠. (3)取α=0.05,运用spss 软件求解得到表二:表二 t 检验求解结果根据上表得到的Sig=0.020<0.05,所以拒绝接受,即认为两组品酒员的评价结果有显著性差异。
5.1.3 可信度定量分析记第一组10位品酒员对红葡萄酒样品(1)i J (1,2,,27)i =的评分为(1)ij a (1,2,,10)j =10(1)(1)1110iij j a a ==∑,10(1)(1)2(1)2111()10i ij i j s a a ==-∑ (4)其中,(1)i a 表示第一组品酒员对红葡萄酒样品(1)i J 的评分均值,(1)21i s 表示(1)i J 的评分方差;同样,第二组对红葡萄酒样品(1)i J 的评分均值和方差分别为10(1)(1)1110iij j c c ==∑,10(1)(1)2(1)2211()10i ij i j s c c ==-∑ (5)从而对每一组品酒员得到一个评分方差向量(1)2(1)2(1)2(1)211112127(,,,)S s s s = (1)2(1)2(1)2(1)222122227(,,,)S s s s =同理可求得白葡萄酒的(2)21S ,(2)22S 。
再对(1)21S 和(1)22S 中的元素分别求和得到总方差,对于同一批红葡萄酒用总方差来代表两组不同的评价水平。
总方差小的稳定性好,评价结果是更可信的。
运用excel 软件可以求解得到(1)21S ,(1)22S ,(2)21S 和(2)22S 。
得到(1)21S = 1415.513,(1)22S =821.11,(2)21S =2986.77,(2)22S =1411.69。
不管是红葡萄酒还是白葡萄酒,第一组的总方差总是远远大于第二组。
说明第二组的评价结果更为可信。
5.2 模型二:对于问题二,是要基于酿酒葡萄的理化性质和葡萄酒的质量对酿酒葡萄进行分级,因此,对于模型二可分为三步进行,即:1) 根据酿酒葡萄的理化指标对酿酒葡萄进行分级; 2) 根据评酒师的评分对葡萄酒的质量进行分级; 3) 综合两种因素,对酿酒葡萄进行分级。
5.2.1 根据酿酒葡萄的理化指标对酿酒葡萄进行分级根据附录给出的酿酒葡萄的理化指标,可以看出,有些理化指标含量很低,有些理化指标含量很高。
所以对于此种情况,我们采用主成分分析法对附录中的理化指标进行处理,将理化指标分为几种主成分,然后根据主成分对酿酒葡萄进行打分,通过得分对酿酒葡萄进行分级。
5.2.1.1 对于不同的理化指标可能存在着不同的量纲,因此在进行主成分分析之前应对酿酒葡萄的理化指标进行标准化处理。
处理方法如下: 将原始数据标准化,即做如下数据变换:(6)其中 , ,j = 1,2,…,p 。
标准化后的数 据阵记为X *,其中每个列向量(标准化变量)的均值为0,标准差为1,数据无量纲。
标准化后变量的协方差矩阵(Covariance Matrix )Σ = (s ij )p ⨯p ,即原变量的相关系数矩阵(Correlation Matrix )R= (r ij )p ⨯p :i ,j = 1,2,…,p (7) 此时n 个样品在m 个主成分上的得分应为:F j = a 1j X 1* + a 2j X 2* +...+ a pj X p * j = 1,2,…,m (8)*1,2,...,;1,2,...,ij jij j x x x i n j ps -===11nj ij i x x n ==∑2211()1n j ij j i s x x n ==--∑**11()()1111nkii kj j nnij ki kj ijk k xx x x x x xs x x r n n ==---====--∑∑5.2.1.2 主成分分析法的步骤如下: 步骤一:计算协方差矩阵计算样品数据的协方差矩阵:Σ = (s ij )p ⨯p ,其中i ,j = 1,2,…,p (9)步骤二:求出Σ的特征值及相应的特征向量求出协方差矩阵Σ的特征值λ1≥λ2≥…λp >0及相应的正交化单位特征向量:则X 的第i 个主成分为F i = a i 'X i = 1,2,…,p 。