数学建模--葡萄酒的分级(正式版)
数学建模毕业论文--葡萄酒的评价
![数学建模毕业论文--葡萄酒的评价](https://img.taocdn.com/s3/m/bf9b02d3846a561252d380eb6294dd88d0d23da6.png)
数学建模毕业论文--葡萄酒的评价
葡萄酒的评价是一项复杂的任务,涉及多个因素,包括葡萄品种、酿造过程、年份、产地和存储条件等。
在数学建模中,我们可以利用统计分析和机器学习算法来对葡萄酒进行评价,以预测其质量和特征。
首先,我们可以采集一定数量的葡萄酒样本,并测量其相关属性,如酒精含量、酸度、pH值、残留糖分、挥发性酸、柠檬
酸等。
利用统计分析方法,我们可以探索这些属性与葡萄酒质量之间的关系,建立相应的数学模型。
例如,可以使用线性回归分析来确定具体属性与葡萄酒得分之间的相关性。
另一方面,机器学习算法可以帮助我们构建更复杂的评价模型。
可以使用聚类算法将葡萄酒样本分成不同的类别,以发现具有相似特征的葡萄酒群体。
此外,可以使用分类算法或回归算法来预测葡萄酒的质量评分。
这些算法可以利用已知的葡萄酒样本数据进行训练,并在新样本上进行预测。
除了属性数据,我们还可以考虑其他因素对葡萄酒评价的影响。
例如,可以考虑葡萄酒的价格、评分和消费者评价等因素,以构建更综合的评价模型。
可以使用模糊数学方法来处理这些不确定性和主观性因素,以得出更准确的评价结果。
最后,为了验证模型的准确性和稳定性,可以使用交叉验证或留一验证的方法进行模型评估。
这些方法可以帮助我们评估模型的泛化能力,并进行必要的调整和改进。
数学建模可以帮助我们对葡萄酒进行评价,为葡萄酒生产商、消费者和酒评人提供有关葡萄酒质量和特征的有价值信息。
数学建模葡萄酒评价问题
![数学建模葡萄酒评价问题](https://img.taocdn.com/s3/m/c6b71bf259f5f61fb7360b4c2e3f5727a5e924c2.png)
数学建模葡萄酒评价问题葡萄酒作为一种重要的饮品,在许多场合都扮演着重要的角色。
但在选择和鉴赏葡萄酒时,往往需要一定的专业知识和经验。
如何评价葡萄酒的品质,成为一个重要的问题。
通过数学建模,可以对葡萄酒评价问题进行深入研究。
一、葡萄酒评价的一些基本概念在对葡萄酒进行评价时,我们需要了解一些基本概念。
其中有几个核心概念,包括:1.口感:葡萄酒口感主要包括甜度、酸度、单宁和酒精度四个方面。
其中,甜度和酸度是相反的两个方面,而单宁和酒精度则是影响葡萄酒深度和复杂度的关键因素。
2.香气:葡萄酒香气是葡萄酒评价中非常重要的部分,其中包括了果香、花香、木香等多种因素。
3.口感平衡度:葡萄酒口感的平衡度是评价葡萄酒品质的重要指标,它包括了口感中甜度、酸度、单宁和酒精度四个因素之间的和谐程度。
二、对葡萄酒品质的数学建模通过对葡萄酒的评价指标进行分析和量化,我们就可以建立一种数学模型,来对葡萄酒的品质进行评价。
其中的一些关键步骤包括:1.建立评价指标的量化模型:通过对葡萄酒评价指标的分析,我们可以建立相应的量化模型。
例如,将单宁的口感评价量化为0-10分,将香气的评价量化为0-5分等等。
2.确定评分标准:针对不同类型的葡萄酒,我们可以设定相应的评分标准。
例如,某种类型的葡萄酒,其平衡度得分要高于80分,香气得分要高于90分等等。
3.对葡萄酒样品进行测量和评分:在具体的评分过程中,我们需要对葡萄酒样品进行测量和评分,以得出相应的评价分数。
三、葡萄酒品质的数据分析通过对大量葡萄酒样品的评价数据进行收集和整理,我们可以进行相应的数据分析,以得到一些关于葡萄酒品质的重要结论。
例如:1.不同类型的葡萄酒在各项评价指标上存在差异。
例如,红葡萄酒相对白葡萄酒来说,具有更重的单宁和更鲜明的果香和木香。
2.葡萄酒品质在不同地区和不同产年之间也存在差异。
例如,同一品种的葡萄,在不同地区以及不同产年中,会产生明显的差异。
3.葡萄酒品质和价格之间的关系并不一定单调。
数学建模中葡萄酒评价模型(秩和检验 主成份分析 置信区间法 多元线性回归 相关性分析)
![数学建模中葡萄酒评价模型(秩和检验 主成份分析 置信区间法 多元线性回归 相关性分析)](https://img.taocdn.com/s3/m/51c30a3ea32d7375a41780ee.png)
三、模型假设
(1)两组评酒员在评论时相互之间不会受到令一组的影响; (2)所有同种葡萄酒的酿造工艺完全相同; (3)所给数据的测量都不受外部因素的影响; (4)评酒员评分时的标准都是相同的。
四、符号说明
总体观察值的秩和; T: n1 n 2 : 分别代表相同种类酒的总数;
x j , j : 评酒员对同一酒样的均值和标准差;
关键字
秩和检验
主成份分析
置信区间法
多元线性回归
相关性分析
1
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 需要建立数学模 型讨论下列问题: 1. 分析两组评酒员的评价结果有无显著性差异,判断哪一组结果更可信; 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并考虑能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量。
初始因子载荷矩阵主成份f1主成份f2主成份f3主成份f4主成份f5主成份f6主成份f7主成份f8氨基酸01292560214164014102028805801338702013502076180007092蛋白质02321820107030239632014029601250710001717016527011575vc含量004797011823014383700136904039300620910051160021634花色苷03212390023950004422017672005180801208180145090055696酒石酸012914301397190125499021730102400410065790226743037352苹果酸01332860192018003772038379005168101672630259270092096柠檬酸01005280186970081038022581025851700070190257026031042多酚氧化酶活力0124439000935012086034749016068400974301973220087214褐变质02244320010385003935304234002255004783005383007744dpph0288052012355016211101204670039601395710088888016599503284840062020013499014050700184400957930123930150099单宁02927440071620054610023201389022979600929050025719葡萄总黄027690901113400399790173841000244902146890059040144198白藜芦醇000882022360203519690023328016924012243201102630217942黄酮醇02056990036880024135004469011936022019046170602658100826070259406027065018373301018520062290064330226268可溶性固0085623021233603376201236990117750054640035650244496ph00986780056630186289039440101
数学建模经典案例分析以葡萄酒质量评价为例
![数学建模经典案例分析以葡萄酒质量评价为例](https://img.taocdn.com/s3/m/fd92d7a0112de2bd960590c69ec3d5bbfd0adaa5.png)
数学建模经典案例分析以葡萄酒质量评价为例一、本文概述本文旨在通过深入剖析数学建模在葡萄酒质量评价中的应用,展示数学建模的经典案例。
我们将首先简要介绍数学建模的基本概念及其在各个领域的应用,然后聚焦葡萄酒质量评价这一具体问题,阐述如何通过数学建模对其进行科学、客观的分析。
文章将详细分析数据的收集与处理、模型的建立与求解、模型的验证与优化等关键环节,并探讨不同数学模型在葡萄酒质量评价中的优缺点。
我们将总结数学建模在葡萄酒质量评价中的实际应用效果,展望其在未来葡萄酒产业中的发展前景。
通过阅读本文,读者将能够了解数学建模在葡萄酒质量评价中的重要作用,掌握相关数学建模方法和技术,为类似问题的解决提供有益的参考和借鉴。
本文也将促进数学建模在葡萄酒产业中的应用与发展,推动葡萄酒产业的科技进步和产业升级。
二、数学建模基础数学建模是一种将实际问题抽象化、量化的过程,通过数学工具和方法来求解问题的近似解。
在葡萄酒质量评价这一案例中,数学建模提供了从复杂的实际生产环境中提取关键信息,并建立预测模型的可能。
这需要我们具备一定的数学基础,如统计学、线性代数、微积分等,同时也需要理解并掌握数据处理的基本技术,如数据清洗、特征提取和选择等。
在葡萄酒质量评价问题中,我们首先需要收集大量的葡萄酒样本数据,这些数据可能包括葡萄品种、产地、气候、土壤、酿造工艺、化学成分等多个方面的信息。
然后,我们需要对这些数据进行预处理,如去除缺失值、异常值,进行数据标准化等,以提高模型的稳定性和准确性。
接下来,我们可以选择适合的模型进行训练。
在这个案例中,我们可以选择线性回归、决策树、随机森林、神经网络等模型进行尝试。
我们需要根据数据的特性和问题的需求,选择最合适的模型。
同时,我们还需要进行模型的训练和验证,通过调整模型的参数,提高模型的预测能力。
我们需要对模型进行评估和优化。
这可以通过交叉验证、ROC曲线、AUC值等评估指标来进行。
如果模型的预测能力不足,我们需要对模型进行优化,如改进模型的结构、增加更多的特征等。
关于葡萄酒问题的数学建模.
![关于葡萄酒问题的数学建模.](https://img.taocdn.com/s3/m/60fec035cfc789eb162dc81b.png)
葡萄酒评价模型摘要本文讨论了葡萄酒的评价问题。
对问题一,分别求出两组评酒员对各葡萄酒样品的平均评分,通过SPSS软件对同一类酒的两组得分进行T检验,检验结果表明两组评酒员的评价结果有显著性差异。
再建立评酒员和样品葡萄酒得分的典型相关分析模型,运用MATLAB 求解,以样品葡萄的得分与评酒员的相关系数越大评分越不可信为依据,得出第二组的评分更可信的结论。
对问题二,以第二组的评分为准,对葡萄酒的质量进行排序,得出排序向量,对酿酒葡萄中各个理化指标进行排序,得出排序矩阵,排序向量与排序矩阵的各列进行点乘,得到葡萄酒质量与酿酒葡萄中各个理化指标的内积,以此内积作为葡萄酒的质量与酿酒葡萄中各个理化指标的相似度指标,选出相似度较高的五项指标作为酿酒葡萄分级的参考指标。
根据参考指标对酿酒葡萄进行分级,分别得出了依香气、口感、外观进行分级的酿酒葡萄分级结果(见表五,表六)。
对问题三,建立非线性回归模型,讨论酿酒葡萄与葡萄酒理化指标的联系。
将葡萄和葡萄酒的理化指标进行无量纲化处理,利用最短距离法,选出葡萄理化指标中对葡萄酒理化指标影响最大的五项作为回归自变量,以葡萄酒的理化指标为回归因变量,运用MATLAB求解得到酿酒葡萄与葡萄酒的理化指标之间的4次函数关系式(见表七,表八)。
对问题四,建立酿酒葡萄的理化指标、葡萄酒的理化指标与葡萄酒质量的多重T检验模型。
应用SPSS软件进行T检验,通过检验结果所体现出的向量整体差异程度表明,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响较大,故可以用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量。
关键词理化指标;T检验;典型相关系数;回归模型;葡萄酒评价一、问题重述由于葡萄酒不仅饮用口感佳,而且还具有延缓衰老、滋补养颜、预防心脑血管病、预防癌症等功效,因而受到越来越多人的亲睐。
葡萄酒厂在对葡萄酒质量进行鉴定时,一般是通过聘请一批有专业知识和资质的评酒员对葡萄酒进行品评。
每名评酒员品评后会根据评判标准对所品葡萄酒进行打分,然后求其所有评酒员的打分之和,从而确定葡萄酒的质量。
数学建模 葡萄酒评价模型
![数学建模 葡萄酒评价模型](https://img.taocdn.com/s3/m/ed0b553d10661ed9ad51f334.png)
A题葡萄酒的评价摘要随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。
针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。
针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。
针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。
但主成分法去掉了一部分数据,我们有用最小二乘法进行。
针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
全国大学生数学建模竞赛A题葡萄酒评价分析
![全国大学生数学建模竞赛A题葡萄酒评价分析](https://img.taocdn.com/s3/m/945e8827fe00bed5b9f3f90f76c66137ee064f92.png)
全国大学生数学建模竞赛A题葡萄酒评价分析葡萄酒是一种古老而美妙的饮品,其种类繁多,风味各异。
如何对葡萄酒进行准确的评价和分析成为了葡萄酒爱好者和生产商们共同关注的问题。
在此次全国大学生数学建模竞赛A题中,我们将围绕葡萄酒的评价和分析展开讨论。
1. 引言葡萄酒是一种由葡萄经过发酵而成的酒类饮品。
葡萄酒的风味和品质受到许多因素的影响,如产地、葡萄品种、酿造工艺等。
为了准确评价葡萄酒的质量和特点,我们需要建立相应的评价指标和模型。
2. 数据分析为了进行葡萄酒评价,我们首先需要收集相关的数据。
通过对不同品牌、不同种类的葡萄酒进行采样和测试,我们可以获得葡萄酒的关键指标,如酒精含量、酸度、甜度、单宁含量等。
在数据分析中,我们可以运用统计学方法和数学建模技术,对数据进行整理和处理。
通过计算均值、方差、相关系数等指标,我们可以得到葡萄酒的基本特征和相互之间的关系。
3. 葡萄酒评价指标体系建立基于数据分析的结果,我们可以建立葡萄酒评价指标体系。
这一体系应该包含对葡萄酒各项指标的评价方法和权重。
常见的评价指标包括酒精含量、色泽、香气、口感等。
在指标体系中,我们可以采用层次分析法,通过对各个指标的重要性进行排序和评估。
同时,还可以利用数学模型,将各项指标综合起来,得到最终的评价结果。
4. 葡萄酒评价模型构建在对葡萄酒进行评价时,我们可以利用数学建模方法构建评价模型。
常用的模型包括多元回归模型、灰色关联度模型等。
多元回归模型可以用来分析葡萄酒各项指标之间的关系,进而预测葡萄酒的品质。
灰色关联度模型则可以用来度量葡萄酒各个指标对品质的影响程度。
通过不断地调整模型和参数,我们可以得到更准确的葡萄酒评价结果,并为葡萄酒生产商提供有针对性的改进建议。
5. 葡萄酒评价系统设计为了方便葡萄酒评价和分析的实施,我们可以设计一个葡萄酒评价系统。
该系统可以包括数据输入、数据处理、指标评价、模型计算等功能模块。
数据输入模块用于将葡萄酒相关数据录入系统。
数学建模-葡萄酒评价
![数学建模-葡萄酒评价](https://img.taocdn.com/s3/m/ce2638b2804d2b160b4ec0f9.png)
2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量?
2问题的分析
日期: 年 月
日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时便用):
评阅人
评分
n
n
n
n
n
n
n
n
n
n
备注
o
o
o
o
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
红葡萄酒的评价结果有显著性差异。
同理,正秩与负秩均值分别为11.06与16.13,大致相当。因此,Wilcoxon符号平均秩检验是可行的。由于P = .0018 <0.05 (a =0.05),拒绝原假设与日口 无显著差异,即两组评酒员的对白葡萄酒的评价结果有显著性差异。
由于两组品酒员对红葡萄酒与白葡萄酒的品尝评分均存在显著差异,因此, 可认为两组评酒员的评价结果由显著差异。
2.2问题二
将酿酒葡萄理化指标进行单因子方差分析,选取出在聚类分析中发挥明显作 用的m个指标。根据酿酒葡萄的好坏与所酿葡萄酒的质量关系有直接关系,把 对葡萄酒质量的评分当做特殊的第m+1个指标。由于各指标的对酿酒葡萄分级 所发挥作用的效果不同,而传统聚类分析把各指标放在了等同的地位。基于这点, 本文提出了考虑权重的聚类分析方法。通过网络査阅资料,对各指标在分级中所 起的重要性进行评分。最后对赋权的指标进行聚类分析,对所分类样品数据加权求平均分来分级。
葡萄酒的评价模型
![葡萄酒的评价模型](https://img.taocdn.com/s3/m/54297db065ce050876321352.png)
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):建模教练组日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):基于方差分析的葡萄酒分级方法及其选酒标准摘要:本文在解决问题时,考虑到数据的复杂性、繁琐性等难于完全量化的问题,首先分析并计算获取各附件中有用的数据。
再通过进一步分析计算将这些数据运用于各问题中。
对于问题1,我们根据附件1求出评酒员对两组红白葡萄酒样品的外观分析、香气分析、口感分析、整体评价的总分,然后在针对这10位评酒员的评价总分来求它们的方差,对求出的方差我们应用MALAB软件编程作其波动图,经过比较其波动性的大小,以及用方差分析法和t检验来分析,进而比较两组评酒员的评价结果的显著性,进而判断出两组的可信度。
对于问题2,根据国家最新给葡萄酒打分等级的标准,由于对各样品的成分的含量不同,我们根据附件2与附件3从每组样品酒中随机抽取部分样品成分所占总样品的比例与标准理化指标来比较,又由问题1可以知道两组评酒员所给的总分,从而进行计算分析给酿酒葡萄分级。
数学建模葡萄酒评价
![数学建模葡萄酒评价](https://img.taocdn.com/s3/m/8afcdfd30912a21615792980.png)
A题:葡萄酒的评价摘要本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理化指标之间的联系、评价结果统计分析等方面的研究。
通过方差分析、层次分析等方法建立模型,解决了葡萄酒的评价问题。
问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel画出图表(见正文),直观地观察出两组评价数据围接近,第二组评价数据波动不大,评价数据更可信。
问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。
采用系统工程学的层次分析法(AHP)来确定影响葡萄品质的各因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。
各等级下葡萄样品数如下表:问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP神经网络进行比较验证。
问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量间的联系。
通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。
本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。
关键词:方差分析Excel逐步回归分析Bp神经网络聚类分析Matlab DPS数据处理系统一、问题重述通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。
根据上述条件建立数学模型解决以下问题:1. 分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信。
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
葡萄酒的分级模型
![葡萄酒的分级模型](https://img.taocdn.com/s3/m/9d4b5dd7a58da0116c174977.png)
基于熵权法改进的TOPSIS法的酿酒葡萄评分分级模型摘要本文建立了对酿酒葡萄的分级模型,并分析了酿酒葡萄与葡萄酒的理化指标之间的联系及其对葡萄酒质量的影响。
两组评酒员的品评水平不同因而品评结果存在差异。
将每一组中每号酒的各评分项的品评结果的平均值将葡萄酒进行聚类分析发现,大多数酒号都聚集在同一类,此类定义为大类。
将聚类数定为2,当有某一酒号在任一组中不属于大类时,说明其数据处在分类边缘,所以对此类酒号予以剔除。
对每个评酒员给出的剩余酒号的葡萄酒的评价总分进行非参数检验,结果表明两组评酒员的评价结果存在显著性差异。
第一二组在剔除酒号之前的红葡萄酒的评价总分的方差分别为:103.633995、45.81948。
在剔除酒号之后的红葡萄酒的评价总分的方差分别为:66.46149、39.03894。
方差越小说明该组的评酒员品评结果更为稳定,因此第二组的品评结果更可信。
另外,剔除的酒号数据对第一组的方差影响较大,这说明第一组内评酒员对剔除的酒的品评能力差异较大。
同样,第一二组在剔除酒号之前的白葡萄酒的评价总分的方差分别为:142.8673、60.11325. 在剔除酒号之后的白葡萄酒的评价总分的方差分别为:129.6456、53.49408.分析结果同样是第二组的品评结果更可信。
在第二组品评结果的基础上研究酿酒葡萄的分级。
处理少量异常数据之后,用一级理化指标中数据的平均值作为其指标数据,然后结合评酒师的打分情况,建立基于熵权法定权值的TOPSIS法的评分模型,并根据求解出的评分,根据分数等距对酿酒葡萄进行分四级。
红葡萄的分级情况为:一级红葡萄为第9号,二级为第1、3、8、14、23、26号,三级为第2、5、10、11、13、17、19、21、24号,四级为第4、6、7、12、15、16、18、20、22、25、27号。
白葡萄的分级情况为:一级白葡萄为第21、27号,二级为第5、15、17、20、22、23、28号,三级为第1、2、3、4、6、7、9、10、12、13、14、18、19、25、26号,四级为第8、11、16号,第24号白葡萄酒因此测量数据异常不进行评级。
大学生数学建模竞赛A题优秀论文A题葡萄酒定稿版
![大学生数学建模竞赛A题优秀论文A题葡萄酒定稿版](https://img.taocdn.com/s3/m/2eca855152ea551811a68731.png)
大学生数学建模竞赛A 题优秀论文A题葡萄酒 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显着性差异,对于白葡萄酒只有53%的评价结果存在显着性差异。
通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显着性差异,而对于白葡萄酒的评分,评价差异性较为不明显。
为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。
综合来看,主观因素对葡萄酒质量的评价具有不确定性。
结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。
将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。
为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显着的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。
葡萄酒评价的数学模型2
![葡萄酒评价的数学模型2](https://img.taocdn.com/s3/m/ebd3aa64b84ae45c3b358cca.png)
葡萄酒评价的数学模型摘要自埃及有了制造葡萄酒的记录后,我们大多数都对他亲睐有加。
然而葡萄酒的鉴定却需要一批更加专业的以及有资历的评酒员进行评价,并通过这一环节得到葡萄酒的分类指标分值,进而得到总分,从而确定葡萄酒的质量。
酿葡萄酒的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本文主要解决以下几个问题:对于问题1,采用单因素分析法,运用MATLAB软件及SPSS进行求解分析,最后再根据方差来判断。
对于问题2,在问题一中得到的数据评分较为可靠,因此根据评分来分级,通过MATLAB软件对该组的成分进行检验,并且根据Excel软件作图分析数据,找出影响葡萄酒分级的成分,并在酿造葡萄酒的理化指标中找出与之相同的成分,再结合问题一中葡萄酒的评分对其进行分级,得出葡萄样品成分的排列,结合成分的量和葡萄酒分级得出影响酿酒葡萄分级的范围。
对于问题3,在问题2的基础上利用题目所提供的附件2,对所有理化指标进行分析,并用MATLAB软件拟合数据,做出拟合线性图,并采用多元回归分析法进行回归分析,最后综合分析各理化指标之间的关系。
对于问题4,可以结合题目中的附件3中关于芳香物质的数据,利用MATLAB 进行分析,拟合感官指标和理化指标的依据,得出结论:可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键字:方差分析法分级理化指标线性相关回归分析一.问题的重述作为世界上最富于变化的葡萄酒,是有生命的酒,得到了世界各地人们的亲睐,在我国也不例外。
据IWSR预测三年后中国将超过日本成为世界第七大葡萄酒消费市场,同事,一些不法商贩开始造假酒,影响国人的健康,虽然我国的GB15037-2006《葡萄酒》国家标准对葡萄酒的质量作了规定,但是我国关于葡萄酒质量等级划分的标准还未完善,国家需要制定相关统一的等级制度。
确定葡萄酒质量是一般通过聘请一些有资质的评酒家对葡萄酒的各类指标进行分类打分,最后得到总分,从而确定其质量。
2012A数学建模——葡萄酒的评价
![2012A数学建模——葡萄酒的评价](https://img.taocdn.com/s3/m/f2dd9daf0029bd64783e2c18.png)
2
三、模型的建立与验证
对红葡萄酒有显著影响的葡萄指标示意表
酒指标 花色苷 单宁 总酚 酒总黄酮 白藜芦醇 DPPH半抑制体 积 花色苷 花色苷 花色苷 花色苷 葡萄总黄酮 苹果酸 DPPH自由基 DPPH自由基 DPPH自由基 相关显著指标 褐变度 总酚 总酚 总酚 DPPH自由基 单宁 单宁 单宁 总酚 葡萄总黄酮 葡萄总黄酮 葡萄总黄酮 果皮质量 单宁 黄酮醇 果梗比
三、模型的建立与验证
问题四 (1)模型建立:由理化指标评价葡萄酒质量——逐步多元回归模型 红葡萄酒和葡萄的理化指标对红葡萄酒质量影响的回归方程为:
y 0.03341x1 0.06279x2 0.01282x3 0.09751x4 0.88596
白葡萄酒和葡萄的理化指标对白葡萄酒质量影响的回归方程为:
汇报提纲
一、问题重述 1、问题背景
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品 评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求 和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡 萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在 一定程度上反映葡萄酒和葡萄的质量。
28
1.040086
1.01961
0.019687
全国大学生数学建模大赛
-0.00726
0.019272 -0.00647 -0.0042 0.016057
1.01134
0.994353 1.038779 0.970834 1.006113
0.99236
1.01967 1.0121 1.02841 0.97964
0.018767
-0.02546 0.025683 -0.05931 0.026312
葡萄酒的评价-全国大学生数学建模竞赛题答案
![葡萄酒的评价-全国大学生数学建模竞赛题答案](https://img.taocdn.com/s3/m/b5bf83180740be1e650e9adc.png)
数学实验计算机科学与技术成员:xxx学号:xxxxxxxxxx葡萄酒的评价摘要本文主要研究的是如何对葡萄酒进行评价的问题。
通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。
在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。
之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。
而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。
置信区间越窄,说明其越可信。
利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。
在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。
在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。
第二变量的方差次大,并且和第一变量不相关。
由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。
依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。
在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。
在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。
最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。
关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
数学建模--葡萄酒分级(正式版)资料
![数学建模--葡萄酒分级(正式版)资料](https://img.taocdn.com/s3/m/cd33cd3ffc4ffe473368ab7c.png)
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西安理工大学参赛队员 (打印并签名) :1. 郑晓东2. 罗璐3. 宫维静指导教师或指导教师组负责人 (打印并签名):日期: 2013 年 05月10 日葡萄酒质量的综合评价分析摘要近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。
对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。
对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。
对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。
对问题四,采用灰色关联度分析的方法进行求解,分别求出酿酒葡萄的理化指标与葡萄酒质量的关联度、葡萄酒理化指标与其质量的关联度,通过关联度值的大小,即可看出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响大小,并以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西安理工大学参赛队员 (打印并签名) :1. 郑晓东2. 罗璐3. 宫维静指导教师或指导教师组负责人 (打印并签名):日期: 2013 年 05月10 日葡萄酒质量的综合评价分析摘要近年来,随着人们生活水平的提高,葡萄酒也随之受到人们的喜爱,加之食品科学技术的提高,人们对葡萄酒的品质也有了更高的要求,本文就针对葡萄酒品质的相关问题进行建模,求解和有关分析。
对问题一,首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,运用Spss软件求解,得到两组数据存在显著性差异的结论,其次,通过计算两组数据的方差,用以比较稳定性,得到第二组更可信的结论。
对问题二,首先对酿酒葡萄理化指标数据进行标准化处理,经过主成分分析法将葡萄分为四个等级,其次,按可信度高的一组(第二组)得分将葡萄酒分为五级,综合两种分级,将酿酒葡萄分为了——级。
对问题三,首先同问题二对酿酒葡萄与葡萄酒的理化指标进行主成分分析,用Matlab的曲线拟合得到葡萄酒的得分,分别与酿酒葡萄与葡萄酒的理化指标之间的函数关系,再进行反解即得到酿酒葡萄与葡萄酒的理化指标之间联系。
对问题四,采用灰色关联度分析的方法进行求解,分别求出酿酒葡萄的理化指标与葡萄酒质量的关联度、葡萄酒理化指标与其质量的关联度,通过关联度值的大小,即可看出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响大小,并以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。
关键词:t检验主成分分析曲线拟合灰色关联度分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量二、问题分析问题一本题给出了两组评酒员对同一批葡萄酒的评价分数,在本文,采用假设检验中的t检验建立评估两组数据差异性的模型,研究两组评论员的评价是否存在差异,判断能否接受它们存在显著性差异的假设。
若接受,则继续第二步:可靠性分析,分别对两组数据求方差,方差小的说明波动小,既评酒员的评价较稳定,可靠性高。
问题二首先,我们利用问题一得到的结果,对可靠性高的一组数据进行处理,降低评论员之间的差异,提高葡萄酒样品最终得分的可靠度。
按得分对葡萄酒进行分级。
然后,用标准化处理后的酿酒葡萄的理化指标对葡萄进行主成分分析。
最后,结合葡萄酒的分级对酿酒葡萄进行分级。
问题三首先,用处理酿酒葡萄的理化指标的方法对葡萄酒的理化指标做同样的处理,得到葡萄酒理化指标的主成分。
然后,分别根据主成分获得红葡萄和红葡萄酒的的得分。
通过曲线拟合,分别建立红葡萄得分和专家的评分之间的关系;红葡萄酒得分和专家评分之间的关系。
最后,根据两种理化指标和专家的评分之间的关系,建立两种理化指标之间的关系。
问题四运用灰色关联度分析的方法,定量描述酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以此为基准来论证酿酒葡萄和葡萄酒的理化指标能否用来评价葡萄酒的质量。
三、问题假设1.同种葡萄酒在同一组评酒员的得分下成正态分布。
2.一种葡萄对应酿制一种葡萄酒。
3.葡萄的成分充分转化为葡萄酒里的成分,不存在意外的浪费和挥发。
四、符号说明这里只列出主模型的全局参数,其他局部参数见具体模型。
(1)i J :第i 个红葡萄酒样品(1)ij a :第i 个红葡萄酒样品的得分T1:第一组评酒员全体 T2:第二组评酒员全体五、模型的建立与求解模型一:基于t 检验建立差异评估模型我们采用假设性检验验证是否能接受两组评酒员的评价结果存在显著性差异的假设。
然后用方差分析两组评酒员评价数据的波动,认为较平稳的一组比较可靠。
、数据预处理我们在分析数据是发现了几个显著性的异常数据:第一组红酒数据——样品20——色调——评酒员4号 数据缺失 第一组白酒数据——样品3——持久性——评酒员7号 怀疑多了一个7 第一组白酒数据——样品8——口感分析——评酒员2号 数据明显异常 因为随机样本在均值附近振荡,所以我们选用均值来代替异常数据以求误差最小。
t 检验模型的建立21,T T 分别代表第一,第二组整体,分别对红葡萄酒i R (i=1,2, (27)和白葡萄酒iW (i=1,2,…,27)进行感官评价,1T 的评价结果通过组内的每一评酒员的评分的均值来表示。
同样的,T2的评价结果通过组内的每一评酒员的评分的均值来表示。
从而得到两组评论员分别对红葡萄酒的评价结果见表一:表1 红葡萄酒的评价结果表中对于同一酒样品的两个评价差异是由两个评酒员引起的,为鉴定他们的评价结果有无显著性差异,可对两组数据对同一样品的差值进行分析,既表中的D 。
以红葡萄酒为例:有27对相互独立的评价结果(X1,Y1)(X2,Y2)...(X27,Y27),D1=X1-Y1,D2=X2-Y2,...,D27=X27-Y27,由于Di (i=1,2, (27)是由同一因素造成的,可认为它们服从同一分布。
现假设Di~N (D μ,2D σ),i=1,2…,27,且D μ,2D σ未知,基于这一样本检验假设:0:,0:100≠=D H H μμ (1)分别记1227,,,D D D 的样本均值和样本方差的观测值为d ,2D s 。
对1227,,,D D D 进行单个均值的t 检验,检验问题的拒绝域为(显著水平为α):2(1)t t n α=≥-. (2)当t 的值不落在拒绝域内时,接受0H ,既认为两组评价无显著性差异。
否则,两组评价有显著性差异。
对白葡萄酒的处理同红葡萄酒。
2)模型的求解现以红葡萄酒为例求解,首先,作出同一酒样品(1)i J (1,2,,27)i =分别由两组品酒员1T 、2T 得到的评价结果之差,列于表一的第三行,根据建立的模型检验假设:01:0,:0D D H H μμ=≠. (3)取α=,运用spss 软件求解得到表二:表二 t 检验求解结果根据上表得到的Sig=<,所以拒绝接受,即认为两组品酒员的评价结果有显著性差异。
可信度定量分析记第一组10位品酒员对红葡萄酒样品(1)i J (1,2,,27)i =的评分为(1)ij a (1,2,,10)j =10(1)(1)1110iij j a a ==∑,10(1)(1)2(1)2111()10i ij i j s a a ==-∑ (4)其中,(1)i a 表示第一组品酒员对红葡萄酒样品(1)i J 的评分均值,(1)21i s 表示(1)i J 的评分方差;同样,第二组对红葡萄酒样品(1)i J 的评分均值和方差分别为10(1)(1)1110iij j c c ==∑,10(1)(1)2(1)2211()10i ij i j s c c ==-∑ (5)从而对每一组品酒员得到一个评分方差向量(1)2(1)2(1)2(1)211112127(,,,)S s s s =(1)2(1)2(1)2(1)222122227(,,,)S s s s =同理可求得白葡萄酒的(2)21S ,(2)22S 。
再对(1)21S 和(1)22S 中的元素分别求和得到总方差,对于同一批红葡萄酒用总方差来代表两组不同的评价水平。
总方差小的稳定性好,评价结果是更可信的。
运用excel 软件可以求解得到(1)21S ,(1)22S ,(2)21S 和(2)22S 。
得到(1)21S = ,(1)22S =,(2)21S =,(2)22S =。
不管是红葡萄酒还是白葡萄酒,第一组的总方差总是远远大于第二组。
说明第二组的评价结果更为可信。
5.2 模型二:对于问题二,是要基于酿酒葡萄的理化性质和葡萄酒的质量对酿酒葡萄进行分级,因此,对于模型二可分为三步进行,即:1) 根据酿酒葡萄的理化指标对酿酒葡萄进行分级; 2) 根据评酒师的评分对葡萄酒的质量进行分级; 3) 综合两种因素,对酿酒葡萄进行分级。
根据酿酒葡萄的理化指标对酿酒葡萄进行分级根据附录给出的酿酒葡萄的理化指标,可以看出,有些理化指标含量很低,有些理化指标含量很高。
所以对于此种情况,我们采用主成分分析法对附录中的理化指标进行处理,将理化指标分为几种主成分,然后根据主成分对酿酒葡萄进行打分,通过得分对酿酒葡萄进行分级。
对于不同的理化指标可能存在着不同的量纲,因此在进行主成分分析之前应对酿酒葡萄的理化指标进行标准化处理。
处理方法如下: 将原始数据标准化,即做如下数据变换:(6)其中 , ,j = 1,2,…,p 。
标准化后的数 *1,2,...,;1,2,...,ij jij jx x x i n j ps -===11nj ij i x x n ==∑2211()1n j ij j i s x x n ==--∑据阵记为X *,其中每个列向量(标准化变量)的均值为0,标准差为1,数据无量纲。
标准化后变量的协方差矩阵(Covariance Matrix )Σ = (s ij )p p ,即原变量的相关系数矩阵(Correlation Matrix )R= (r ij )pp :i ,j = 1,2,…,p (7) 此时n 个样品在m 个主成分上的得分应为:F j = a 1j X 1* + a 2j X 2* +...+ a pj X p * j = 1,2,…,m (8)主成分分析法的步骤如下: 步骤一:计算协方差矩阵计算样品数据的协方差矩阵:Σ = (s ij )pp ,其中i ,j = 1,2,…,p (9)步骤二:求出Σ的特征值及相应的特征向量 求出协方差矩阵Σ的特征值12…p >0及相应的正交化单位特征向量:11()()1nij ki i kj j k s x x x x n ==---∑⎪⎪⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=pp p p p p p a a a a a a a a a a a a ......,,...,...21222122121111**1122221111()()1111()()()()11nkii kj j nn ki ik ijki kj ijnnnnk k ti i tj j tii tjj t t t t xx x x x x x s x x r n n x x x x xx xx n n =======---====--------∑∑∑∑∑∑则X 的第i 个主成分为F i = a i 'X i = 1,2,…,p 。