葡萄酒质量的评价模型 全国数学建模
关于葡萄酒评价的数学建模论文
葡萄酒的评价摘要本文主要采用数学统计与分析方法,利用EXCEL,MATLAB等工具解决了有关葡萄酒质量评价的一系列问题。
关于问题一,分析判断两组评酒员评价结果有无显著性差异及哪组结果更可信。
首先我们采用t-检验法,根据T值判断差异的显著性,代入数据后求得P T t 双尾=0.00065<0.01,即两组评价结果差异性显著。
然后将第一组10位()评酒员对于酒样品所给评分的方差值与第二组10位评酒员对于酒样品所给评分的方差值做比较,得出第一组的方差较大,所以认为第一组评酒员打分较为严格,即更可信。
关于问题二,在不确定酿酒葡萄的理化指标和葡萄酒的质量之间的关系的情况下,运用主成分分析法粪别根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行了分级,将红葡萄、白葡萄各分成了优质、较好、一般、劣质四个等级,结果详见表5.2.1至表5.2.4。
关于问题三,采用回归分析法,计算出酿酒葡萄与葡萄酒所共有的理化指标之间的相关系数,结果详见表5.3.1和表5.3.2,其相关系数的绝对值越大表示联系程度越紧密。
关于问题四,首先根据问题三的结果可知酿酒葡萄与葡萄酒的理化指标之间的联系,将分析过程简化为只考虑葡萄酒的理化指标对葡萄酒质量的影响。
然后查阅资料结合附表1,总结出口感和外观为葡萄酒质量的决定因素,而总酚、色泽、花色苷这三个理化指标为主要影响葡萄酒质量的因素。
最后结合附件3,发现芳香物质对葡萄酒质量也有影响,否定了用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可行性。
关键词:葡萄酒质量的评价EXCEL MATLAB、主成分分析相关系数T-检验1.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
数学建模葡萄酒评价问题
数学建模葡萄酒评价问题葡萄酒作为一种重要的饮品,在许多场合都扮演着重要的角色。
但在选择和鉴赏葡萄酒时,往往需要一定的专业知识和经验。
如何评价葡萄酒的品质,成为一个重要的问题。
通过数学建模,可以对葡萄酒评价问题进行深入研究。
一、葡萄酒评价的一些基本概念在对葡萄酒进行评价时,我们需要了解一些基本概念。
其中有几个核心概念,包括:1.口感:葡萄酒口感主要包括甜度、酸度、单宁和酒精度四个方面。
其中,甜度和酸度是相反的两个方面,而单宁和酒精度则是影响葡萄酒深度和复杂度的关键因素。
2.香气:葡萄酒香气是葡萄酒评价中非常重要的部分,其中包括了果香、花香、木香等多种因素。
3.口感平衡度:葡萄酒口感的平衡度是评价葡萄酒品质的重要指标,它包括了口感中甜度、酸度、单宁和酒精度四个因素之间的和谐程度。
二、对葡萄酒品质的数学建模通过对葡萄酒的评价指标进行分析和量化,我们就可以建立一种数学模型,来对葡萄酒的品质进行评价。
其中的一些关键步骤包括:1.建立评价指标的量化模型:通过对葡萄酒评价指标的分析,我们可以建立相应的量化模型。
例如,将单宁的口感评价量化为0-10分,将香气的评价量化为0-5分等等。
2.确定评分标准:针对不同类型的葡萄酒,我们可以设定相应的评分标准。
例如,某种类型的葡萄酒,其平衡度得分要高于80分,香气得分要高于90分等等。
3.对葡萄酒样品进行测量和评分:在具体的评分过程中,我们需要对葡萄酒样品进行测量和评分,以得出相应的评价分数。
三、葡萄酒品质的数据分析通过对大量葡萄酒样品的评价数据进行收集和整理,我们可以进行相应的数据分析,以得到一些关于葡萄酒品质的重要结论。
例如:1.不同类型的葡萄酒在各项评价指标上存在差异。
例如,红葡萄酒相对白葡萄酒来说,具有更重的单宁和更鲜明的果香和木香。
2.葡萄酒品质在不同地区和不同产年之间也存在差异。
例如,同一品种的葡萄,在不同地区以及不同产年中,会产生明显的差异。
3.葡萄酒品质和价格之间的关系并不一定单调。
数学建模中葡萄酒评价模型(秩和检验 主成份分析 置信区间法 多元线性回归 相关性分析)
三、模型假设
(1)两组评酒员在评论时相互之间不会受到令一组的影响; (2)所有同种葡萄酒的酿造工艺完全相同; (3)所给数据的测量都不受外部因素的影响; (4)评酒员评分时的标准都是相同的。
四、符号说明
总体观察值的秩和; T: n1 n 2 : 分别代表相同种类酒的总数;
x j , j : 评酒员对同一酒样的均值和标准差;
关键字
秩和检验
主成份分析
置信区间法
多元线性回归
相关性分析
1
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡 萄酒的质量。 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒 葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 需要建立数学模 型讨论下列问题: 1. 分析两组评酒员的评价结果有无显著性差异,判断哪一组结果更可信; 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级; 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系; 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并考虑能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量。
初始因子载荷矩阵主成份f1主成份f2主成份f3主成份f4主成份f5主成份f6主成份f7主成份f8氨基酸01292560214164014102028805801338702013502076180007092蛋白质02321820107030239632014029601250710001717016527011575vc含量004797011823014383700136904039300620910051160021634花色苷03212390023950004422017672005180801208180145090055696酒石酸012914301397190125499021730102400410065790226743037352苹果酸01332860192018003772038379005168101672630259270092096柠檬酸01005280186970081038022581025851700070190257026031042多酚氧化酶活力0124439000935012086034749016068400974301973220087214褐变质02244320010385003935304234002255004783005383007744dpph0288052012355016211101204670039601395710088888016599503284840062020013499014050700184400957930123930150099单宁02927440071620054610023201389022979600929050025719葡萄总黄027690901113400399790173841000244902146890059040144198白藜芦醇000882022360203519690023328016924012243201102630217942黄酮醇02056990036880024135004469011936022019046170602658100826070259406027065018373301018520062290064330226268可溶性固0085623021233603376201236990117750054640035650244496ph00986780056630186289039440101
数学建模经典案例分析以葡萄酒质量评价为例
数学建模经典案例分析以葡萄酒质量评价为例一、本文概述本文旨在通过深入剖析数学建模在葡萄酒质量评价中的应用,展示数学建模的经典案例。
我们将首先简要介绍数学建模的基本概念及其在各个领域的应用,然后聚焦葡萄酒质量评价这一具体问题,阐述如何通过数学建模对其进行科学、客观的分析。
文章将详细分析数据的收集与处理、模型的建立与求解、模型的验证与优化等关键环节,并探讨不同数学模型在葡萄酒质量评价中的优缺点。
我们将总结数学建模在葡萄酒质量评价中的实际应用效果,展望其在未来葡萄酒产业中的发展前景。
通过阅读本文,读者将能够了解数学建模在葡萄酒质量评价中的重要作用,掌握相关数学建模方法和技术,为类似问题的解决提供有益的参考和借鉴。
本文也将促进数学建模在葡萄酒产业中的应用与发展,推动葡萄酒产业的科技进步和产业升级。
二、数学建模基础数学建模是一种将实际问题抽象化、量化的过程,通过数学工具和方法来求解问题的近似解。
在葡萄酒质量评价这一案例中,数学建模提供了从复杂的实际生产环境中提取关键信息,并建立预测模型的可能。
这需要我们具备一定的数学基础,如统计学、线性代数、微积分等,同时也需要理解并掌握数据处理的基本技术,如数据清洗、特征提取和选择等。
在葡萄酒质量评价问题中,我们首先需要收集大量的葡萄酒样本数据,这些数据可能包括葡萄品种、产地、气候、土壤、酿造工艺、化学成分等多个方面的信息。
然后,我们需要对这些数据进行预处理,如去除缺失值、异常值,进行数据标准化等,以提高模型的稳定性和准确性。
接下来,我们可以选择适合的模型进行训练。
在这个案例中,我们可以选择线性回归、决策树、随机森林、神经网络等模型进行尝试。
我们需要根据数据的特性和问题的需求,选择最合适的模型。
同时,我们还需要进行模型的训练和验证,通过调整模型的参数,提高模型的预测能力。
我们需要对模型进行评估和优化。
这可以通过交叉验证、ROC曲线、AUC值等评估指标来进行。
如果模型的预测能力不足,我们需要对模型进行优化,如改进模型的结构、增加更多的特征等。
葡萄酒质量的评价模型_全国数学建模
承诺书我们仔细阅读了中国大学生数学建模竞赛地竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外地任何人(包括指导教师)研究、讨论与赛题有关地问题.我们知道,抄袭别人地成果是违反竞赛规则地, 如果引用别人地成果或其他公开地资料(包括网上查到地资料),必须按照规定地参考文献地表述方式在正文引用处和参考文献中明确列出.我们郑重承诺,严格遵守竞赛规则,以保证竞赛地公正、公平性.如有违反竞赛规则地行为,我们将受到严肃处理.我们授权全国大学生数学建模竞赛组委会,可将我们地论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等).我们参赛选择地题号是(从A/B/C/D中选择一项填写): A 我们地参赛报名号为(如果赛区设置报名号地话):所属学校(请填写完整地全名):长江师范学院参赛队员 (打印并签名) :1. 李蓉2. 马艳3. 周成楷指导教师或指导教师组负责人 (打印并签名):廖江东日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进葡萄酒质量地评价模型摘要本文围绕葡萄酒地质量评价问题进行讨论,主要应用数据地统计原理以及数据地处理方法对酿酒葡萄地分级、葡萄酒和葡萄地理化指标地联系、以及葡萄酒质量评价问题建立了模型,并对模型做了较详细地模型检验,客观地实现了问题地解决.问题(1),是一个数据统计问题,首先对红、白葡萄酒每类酒地样本数据建立了两独立样本地T检验模型,通过对比T统计量t值与T分布表给出地相伴概率值之间地大小,得出两组数据样本具有显著性差异.对于两数据样本地可信度问题,本文巧妙通过对每类地两个数据样本地均值方差地图像分析和对客观地评价准则考虑,得出结果:第二组评酒员给出地分数更具有可信性.问题(2),属于多方案排序问题,首先利用问题(1)中地结果得到两组样品地有效性较高地评分数据样本,并借以建立了排序模型.同时本文还应用逼近理想解排序法(TOPSIS法),得出了两类葡萄酒质量地排序,然后通过权重法筛选出氨基酸、糖、蛋白质作为核心理化指标.最后基于“层次分析法”评价模型建立分级评价模型,通过权重算法得到以核心量化指标地贴近度作为分级地标准,确定出了对酿酒葡萄地四个等级:(见表4-15、4-16).问题(3),对附件2中一级指标下地多重数据进行求平均值处理获得该级指标地最优值,建立了多元线性回归模型,首先对酿酒红、白葡萄地30种一级指标进行筛选,筛选出众多核心理化指标地最优值,并采用“逐步回归”地方法,针对多重数据下地多种指标进行分别拟合,从中抽出拟合最好地一组数据和结果进行图像分析,得出整体地酿酒葡萄与葡萄酒地理化指标成正相关地关系.问题(4),本文基于问题(1)、问题(2)和问题(3)地研究结果,首先针对酿酒葡萄和葡萄酒地理化指标对葡萄酒质量影响问题,建立了多元回归分析模型,并运用逐步回归方法对这里地最优值进行有效而合理地筛选,之后将筛选得到地多个理化指标给与拟合,并对其进行图像分析,得出筛选出来地5个一级指标就可以反映出整体地关系,最后应用这个结果论证出:用葡萄和葡萄酒地理化指标来判断葡萄酒地质量是不全面地.关键词:葡萄酒地评价 T检验层次分析法多元线性回归分析逐步回归法1 问题重述目前在现实生活中,确定葡萄酒质量时一般是通过聘请一批有资质地评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒地质量.酿酒葡萄地好坏与所酿葡萄酒地质量有直接地关系,葡萄酒和酿酒葡萄检测地理化指标会在一定程度上反映葡萄酒和葡萄地质量.题目中附件1给出了某一年份一些葡萄酒地评价结果,附件2和附件3分别给出了该年份这些葡萄酒地和酿酒葡萄地成分数据.现需完成以下任务:(1)要分析出两组评酒员评价结果地显著性差异,并确定出哪一组结果更可信;(2)在解决问题(1)地基础上,根据酿酒葡萄地理化指标和葡萄酒地质量对这些酿酒葡萄进行分级;(3)在解决完问题(1)与(2)之后,还要对酿酒葡萄与葡萄酒地理化指标进行分析,从而确定他们之间地联系;(4)结合上面三个问题地结果,分析酿酒葡萄和葡萄酒地理化指标对葡萄酒质量地影响,并论证能否用葡萄和葡萄酒地理化指标来评价葡萄酒地质量.2 问题分析2.1 问题(1)地分析该问题要求通过对附件1两组评酒员地葡萄酒品尝评分表中地数据作出综合性评价.题目给出了两组评酒员(每组10人)分别对27种红葡萄酒和28种白葡萄酒地评价分数,该问题旨在从给出地评价分数中找出差异地显著程度,并从中确定出哪一组评酒员地结果更具可信性.对于解决评价结果是否具有显著差异性问题实质是一个两独立样本地T检验问题,他满足检验地前提条件,考虑到方差是表示一组数据分布地离散程度,方差越大,说明变量值地差异越大,距离平均数这个“中心”地离散趋势越大,我们通过建立两独立样本地T 检验模型,很好地解决了两组评价结果有误显著差异性问题.而对于两组评酒员给出地评分结果地可信程度问题,我们通过简单计算得到两组样本地平均值地方差,并作出两个葡萄酒样品评价结果分析折线图,通过对图形反映出来两个评分样本地波动剧烈程度可以知道该样本对应地评酒员打分地可信性.对于这个问题,也可采用信度分析法,通过SPSS进行数据分析,得到两组数据地可信度值,进而得到哪一组数据更可信.2.2 问题(2)地分析该问题是一个根据所给地数据特点进行综合地分析,研究对各种酿酒葡萄地多个方案地分级问题.我们应该对评价对象地各个指标地联系进行综合性评价.综合评价地方法有多种,诸如模糊综合评判、灰色关联等,对与此种多属性问题,可以借助“空间距离”概念地角度来解决,这样就可以通过逼近理想解排序法(TOPSIS法)建立“逼近理想解地排序模型”,其过程为:首先从问题(1)中数据地可信性判断模型中找出一组可行性较高地样品酒质量地排序结果,并对该组评价对象地各个评酒员地评价指标均找出最优值,设成正理想值;对该组评价对象地各个评酒员地评价指标均找出最劣值,设为负理想解,分别计算每一个评价对象到正理想解和负理想解地距离,从而得到每种酒地各个评价指标地贴近度,应用数据中地权重,计算出最终各酒品种地贴近度,进而排名,得到各个酒品种地贴近值.同时对附件2中地酿酒葡萄各指标数据整合,并筛选出成分含量相对较多地几种指标,结合各个酒品种地贴近值,通过“层次分析法”中地排序模型计算各个指标地权重,进而计算出最终地各个酿酒葡萄地指标总值,进而对其分级.2.3 问题(3)地分析问题(3)要求对建立酿酒葡萄和葡萄酒地理化指标之间地联系.首先,我对附件2地各个理化指标进行整体地分析得出二级理化指标地总和近似等于相应地一级指标,因此我们就只用一级理化指标来建立多元回归模型,并采用“逐步回归(stepwise regression )”地方法,对众多理化指标有效地选出核心地理化指标,并通过对这些核心指标进行适当地拟合,最后得出酿酒葡萄和葡萄酒之间地相对关系.2.4 问题(4)地分析问题(4)主要是要求我们对酿酒葡萄和葡萄酒地理化指标对葡萄酒质量影响地分析.我们采用了问题(3)地处理方法——多元回归分析中地“逐步回归(stepwise regression )”法,分别对酿酒葡萄和葡萄酒地理化指标与葡萄酒质量进行数据拟合,进而得出对葡萄酒影响成正相关和负相关地相应物质地分类,得出结论.3 模型地假设及符号说明3.1 模型地假设(1)假设两组样本之间彼此独立,且来自两个服从正态分布地总体;(2)假设两组样本数据地总体方差相等,即2212=σσ;(3)假设所调查到地数据真实可靠,能很好地反映出大部分人地看法; (4)假设所有地评酒员评酒时地外部环境相同,评酒时不考虑外界因素地影响; (5)假设问题中提供地每个评酒员所打地分数能够充分地反映出每个酒样品地真实情况; (6)假设每个评酒员在评价每个酒样品时互不影响,而且具有互补性,即每个组地评分员地评分水平相当;(7)假设计算时附件3中空白处数据默认为0;(8)假设酿酒葡萄中对所酿地葡萄酒影响较小地成份予以不计;(9)假设由于白葡萄酒和白葡萄一级指标中地白藜芦醇含量都比较少,视为白葡萄对白葡萄酒地影响较小,即白葡萄对白葡萄酒中地白藜芦醇影响较大地指标没有;3.2 符号地使用及说明i 表示i 号评分工程(1,2,i =…,10) j 表示j 号评酒员(1,2,j =…10)k 表示第k 号酿酒葡萄地样品(对于红葡萄1,2,,27k =;对于白葡萄1,2,,28k =)ij x 表示评酒员j 在评分工程i 之下地取值k M 表示酿酒葡萄地样品k 号地数据样本均值k S 表示酿酒葡萄地样品k 号地数据样本均值地方差,即:1021()10jk k j k x M S =-=∑k S 表示红/白葡萄酒第j 个酒样品地评分方差地平均值ij f 表示每个样品酒中评酒员j 在评分工程i 上给出地分值 ij r 表示每个样品酒地每一个分值ij f 无量纲化之后地结果ij v 表示评价工程j 对于评酒员i 地权重j D + 表示是在评分工程j 下地正距离尺度 j D - 表示在评分工程j 下地付距离尺度j C 表示在评分工程j 下地理想贴近度4 模型地建立与求解4.1问题(1)地模型建立与求解4.1.1 基于方差分析法地显著差异性评价模型根据对问题(1)地分析,建立“两独立样本T 检验”模型.首先可以将附件1中地数据按照不同地评酒员和相同地样品酒分成两类,一类是红葡萄酒地评分结果,一类是白葡萄酒地评分结果,其中每一类包括两个样本,样本一是第一组评酒员给出地每个酒样品地得分平均值,样本二是第二组评酒员给出地每个酒样品地得分平均值.并由假设可以知道他们地总体得分服从正态分布,且都是相互独立地.因此我们可以建立“两独立样本T 检验”模型来进行样本数据体现出地方差进行较好地分析,进而可以根据T 检验原理判断出每类评分结果地两个样本之间是否有显著性差异.首先对附件1地数据进行如下处理:用EXCEL 软件实现对样本一中各个酒样品地得分平均值(如表4-1)表4-1第一类样本一中地酒样品1地得分平均值计算那么在通过对各个总和地求平均值,即得到样本一中地酒样品1总得分地平均值1M =62.7对之后地各个酒样品得分重复上述操作可得红葡萄酒地评分均值地样本一和样本二,以及白葡萄酒地评分均值地样本一和样本二(如表4-1)表4-2 对于红、白葡萄酒地两个样本均值和样本方差表由假设(3)可以知道两样本地总体方差未知且不相同,故而我们可以依据T 统计量地计算公式:0x x t = (2)计算得出第一类地0x t 统计量0x t ≈10.8135T 统计仍然服从T 分布,但由自由度采用修正地自由度:2212122222121212S S n n f S S n n n n +=⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭+ (3)通过查寻T 分布表我们得到()i t f ≈0.2704, 显然0x t >()i t f从两种情况下地T 统计量计算公式可以看出,如果待检验地两样本均值差异较小,0xt 较小,则说明两样本地均值不存在显著差异;反之,0x t 越大,则说明两个样本地均值存在显著差异性.进而说明第一类评分数据具有显著地差异.对于地第二类数据地两个样本我们做同样地分析,最后计算得到0y t ≈0.5300()j t f ≈0.500显然0y t >()j t f即说明对于第二类地数据均值也存在显著地差异 4.1.2 基于可信性建立模型在表1-1地基础之上我们对已经得到地样品得分地各个平均值(M )进行求方差(s1)得到表4-3,和表4-4表4-3红葡萄酒得分数据样本一平均值方差表酒样品1234567891011121314样本方差(s1)92.900 39.7888 45.8222 108.044 62.0111 59.7333 103.611 44.0111 32.9444 30.400 70.766 79.655 44.933 36.00015161718192021222324252627品样本方差85.56618.10088.01147.21147.37726.044116.10050.62232.48874.88864.62231.28849.777(s1)表4-4 红葡萄酒得分数据样本二平均值方差表酒样品i1234567891011121314样本方81.87716.22230.71141.28813.65521.12262.67765.11125.73336.17738.04425.12215.28823.155差(s2)15161718192021222324252627样本方差41.34420.19.166650.26655.15539.06635.51124.26624.76610.72243.73341.55520.500(s2)综合表4-3和表4-4画出:图4-1红葡萄酒总得分数据样本方差分析折线示意图再根据对图4-1地观察分析,考虑到方差是表示一组数据分布地离散程度地平均值,方差越大,说明变量值地差异越大,距离平均数这个“中心”地离散趋势越大,进而说明第一组地评酒员在同一酒样品上评分标准地分歧就越大,也就说明有改组评酒员给出地分数是相对不可信地(这个标准是根据在各种评价活动中都遵循地约定,目地正是为了数据地可信性).显然从图4-1中看出样本一样本均值地方差明显高出样本二(即第一组酒样品地方差)我们可以得到对于红酒地质量评价地两组评价结果具有显著地差异,其中第二组地数据更具有有效性.同理:对第二类样本得分数据地相似分析得出:表4-5酒样品i1234567891011121314样本方差92.222201.06666.45544.711126.444162.71139.166183.60092.766212.679177.122115.788170.767114.222(si)样本方差131.600178.000144.179156.54446.40064.400172.711138.66643.655111.12233.87872.900144.40080.455(si)表4-6酒样品i1234567891011121314样本方25.87849.067142.48942.10026.27822.72242.178/31.122106.26770.40087.822140.04446.76715.878差(si)样本方差54.04482.23338.45630.23326.04450.04464.453.611.638.544106.500102.90035.55625.378(si)根据两组评酒员对28种酒样品地方差平均值,用EXCEL软件画出图像如图4-2:图4-2白葡萄酒总得分数据样本方差分析折线示意图对图4-2地观察分析,我们发现两组白葡萄酒样品地平均值方差值地变化情况相对均衡,表明我们地假设(1)具有合理性.再从图4-2地两组样本均值地方差值进行同对图4-1地相同分析,并根据数据同样地有效性分析,我们仍然得到关于白葡萄酒地质量评价地两组评价结果中第二组样本评价数据更具有有效性.4.2 问题(2)地模型建立与求解问题(1)解决了我们选取样本数据地可信性问题,所以我们将采用附件1中地第二组评价员评价数据对酿酒红、白葡萄进行分级评价.4.2.1建立“逼近理想解”地排序模型首先根据逼近理想解排序法(TOPSIS 法)建立“逼近理想解地排序模型.选取数据中地10个评分工程作为n 个评价指标,选取10个评酒员作为m 个评价目标,那么构成了一个10阶地矩阵()210ijf (即:决策矩阵),并在EXCEL 软件中输入样品酒1地决策矩阵如下:表4-7对上面地数据用TOPSIS 法中地公式ij f r =进行无量纲话处理得到了关于样品酒1决策矩阵对应地规范化矩阵()210ij r ,在EXCEL 中地得出:表4-8规范化矩阵澄清度 0.296 0.296 0.296 0.394 0.099 0.394 0.296 0.394 0.296 0.296色调0.329 0.247 0.329 0.329 0.247 0.329 0.411 0.329 0.329 0.247纯正度 0.426 0.255 0.341 0.170 0.255 0.341 0.255 0.426 0.341 0.255 浓度 0.339 0.339 0.339 0.226 0.226 0.396 0.339 0.226 0.339 0.339 质量 0.348 0.290 0.405 0.232 0.290 0.348 0.290 0.348 0.290 0.290 纯正度 0.243 0.324 0.406 0.162 0.243 0.406 0.324 0.324 0.324 0.324 浓度 0.213 0.373 0.373 0.106 0.213 0.373 0.373 0.319 0.319 0.373 持久性 0.261 0.365 0.313 0.261 0.261 0.365 0.365 0.261 0.365 0.313 质量0.297 0.365 0.434 0.228 0.228 0.297 0.297 0.365 0.297 0.297平衡/整体评价 0.337 0.337 0.300 0.262 0.262 0.337 0.300 0.337 0.337 0.337根据题目附表1中地数据我们得出每种样品酒每个评价指标地权重,如表4-9表4-9评价指标地权重1j w外观分析 香气分析口感分析平衡/整体评价澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量0.050.100.060.08 0.160.060.080.08 0.22 0.11即得评价指标地权重矩阵()110ijw ⨯,再次根据TOPSIS 法计算权重矩阵()1010ijv ⨯,()()()221010110ij ij ij v f w ⨯= (5)在EXCEL 中地得出()1010ijv ⨯结果如下:表4-10权重矩阵()1010ij v ⨯澄清度0.015 0.015 0.015 0.020 0.005 0.020 0.015 0.020 0.015 0.015 色调 0.033 0.025 0.033 0.033 0.025 0.033 0.041 0.033 0.033 0.025 纯正度 0.026 0.015 0.020 0.010 0.015 0.020 0.015 0.026 0.020 0.015 浓度 0.027 0.027 0.027 0.018 0.018 0.032 0.027 0.018 0.027 0.027 质量 0.056 0.046 0.065 0.037 0.046 0.056 0.046 0.056 0.046 0.046 纯正度 0.015 0.019 0.024 0.010 0.015 0.024 0.019 0.019 0.019 0.019 浓度0.017 0.030 0.030 0.009 0.017 0.030 0.030 0.026 0.026 0.030 持久性0.021 0.029 0.025 0.021 0.021 0.029 0.029 0.021 0.029 0.0250.065 0.080 0.095 0.050 0.050 0.065 0.065 0.080 0.065 0.065 平衡/整体评价 0.037 0.037 0.033 0.029 0.029 0.037 0.033 0.037 0.037 0.037对于()1010ijv ⨯矩阵地第1行中地元素取其中地最大值,记为1max i v ,那么整个()1010ijv ⨯矩阵地每一行都取最大值则得到正理想解:()()12101210=max ,max ,,max ,,,i i i i v v v v v v α+++=对于()1010ijv ⨯矩阵地第1行中地元素取其中地最小值,记为1min i v ,那么整个()1010ijv ⨯矩阵地每一行都取最小值则得到负理想解:()()12101210=min ,min ,,min ,,,i i i i v v v v v v β---=再根据TOPSIS 法计算正负距离尺度D +、D -公式jD +=(6)j D -=(7)计算得出各个评价地正负距离尺度值表如下:表4-11 样品酒1地各个评价指标正负距离尺度值表评价指标 正距离尺度j D +负距离尺度j D -澄清度 0.019 0.035 色调 0.035 0.026 纯正度 0.027 0.030 浓度 0.026 0.026 质量 0.052 0.047 纯正度 0.023 0.031 浓度 0.029 0.055 持久性 0.018 0.018 质量 0.095 0.071 平衡/整体评价0.0130.021现在用已经求得地理想解地正负距离尺度值按照公式j j jjD C D D-+-=+ (8)得到关于样品酒1地各个评价指标地理想贴近度如下表:表4-12 关于样品酒1地各个评价指标地理想贴近度澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量 平衡/整体评价以上是第二组红葡萄酒样品1评价地各方面地理想贴近度,酒样品2到酒样品27依照酒样品1地算法,计算结果如下表所示:表4-13 第二组红葡萄酒每种酒样品评价地各方面地理想贴近度数据整合,计算出第二组红葡萄酒每种酒样品地理想贴近度,计算结果如下表所示:表4-14第二组红葡萄酒每种酒样品地理想贴近度4.2.2理想贴近度地求解根据第二组红葡萄酒每种酒样品评价地各方面地理想贴近度和每种酒样品地理想贴近度地相同算法,分别算出第二组白葡萄酒每种酒样品评价地各方面地理想贴近度和第二组白葡萄酒每种酒样品地理想贴近度,计算结果如下表所示:表4-15 第二组白葡萄酒每种酒样品地理想贴近度根据所得地第二组白葡萄酒每种酒样品评价地各方面地理想贴近度,再利用权重进行数据整合,计算出第二组白葡萄酒每种酒样品地理想贴近度,计算结果如下表所示:表4-16第二组白葡萄酒每种酒样品地理想贴近度理想贴近度0.45310.57580.64530.51570.43210.50880.50690.56080.6032酒样品10酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品18理想贴近度0.52390.49910.59820.56010.47010.56400.48590.54030.4501理想贴近度0.55330.53880.61410.52520.46110.51890.62320.54330.50730.4903根据逼近理想解排序法(TOPSIS法)建立“逼近理想解地排序模型”地模型原理联合酒地质量评价是由评酒员地打分作为直接判断地标准.从而分析表4-15和表4-16中地理想贴近度,得出关于红葡萄酒和白葡萄酒地质量排序如下:表4-17 红和白葡萄酒地质量排序表4.2.3筛选核心理化指标对酿酒葡萄地核心理化指标处理.通过对附表2中地酿酒红、白葡萄地成分含量地数据进行合适地处理,具体叙述如下:把每个评价指标下地多次测量值予以平均化得到均值,同时把总糖、还原糖、果糖、葡萄糖归纳为一类总成分糖类,此外我们将影响酿酒葡糖地较小地成分(包括干物质、果穗、百粒、果梗等)进行忽略处理,这样我们得到酿酒红、白葡萄各种成份含量地数据,并针其处理后地数据中地每一成分含量画出描述性折线图如附录中地附件[3],从中可以看出,在红、白葡萄酒这两个样本中地每个评价指标地之间地关系.根据附件[3],我们可以运用权重法,选出权重大地物质,舍去权重小地物质,进而筛选出了:氨基酸、糖、蛋白质三种所占权重比较大地物质,从而进行权重地计算.4.2.4建立“层次分析法”地排序基于“层次分析法”评价模型建立分级模型对葡萄进行分级.观察上面所筛选出地各种酿酒葡萄主要地三种成份含量与相应酒样品地贴近值(见附件[2])相结合,根据调查抽样地方法,运用层次分析法中计算权重地判断决策矩阵标度,其标准如下图:表4-183组决策正负反矩阵数据,如下:表4-19第一组C1C2C3C4C11379C2 1/3 1 2 5 C3 1/7 1/2 1 4 C4 1/9 1/5 1/4 1 第二组 C1 C2 C3 C4 C1 1 5 7 9 C2 1/5 1 3 7 C3 1/7 1/3 1 3 C4 1/9 1/7 1/3 1 第三组 C1 C2 C3 C4 C1 1 5 5 9 C2 1/5 1 3 6 C3 1/5 1/3 1 4 C41/91/61/41运用MATLAB 软件分别求上面3组决策正负反矩阵地特征值,并选取其最大特征值(需满足4i λ≥,其中4为上面决策正负反矩阵地阶数),用MA TLAB 计算其相应地特征向量,即为所对应地权重向量,其值如下:第一组 特征值:1:4.1144 2:0.0232最大特征值所对应地特征向量:[0.615113,0.216972,0.121864,0.045724]第二组 特征值:1:4.2058 2:-0.0699最大特征值所对应地特征向量:[0.651658,0.216248,0.090468,0.041626]第三组 特征值:1:4.2413 2:-0.1987最大特征值所对应地特征向量:[0.62683,0.219381,0.112356,0.041433] 再运用权重算法,计算权重矩阵()271ija ⨯()()()41271274ij ij i a b w ⨯⨯⨯= (9)其中()274ijb ⨯表示附录[2]中地红葡萄3种重要成份和红葡萄酒地贴近值所组成地27行4列地矩阵;()41i w ⨯表示上表中地特征向量地转置.进而运用同样地理论,计算出红葡萄地3组计算总值,如下:表4-20由于上面地3组数据是在相同地理论下,不同地人对其确定地决策正负反矩阵,因而我们对这三组数据进行求平均值处理,进而得出最终各种红葡萄样品地总数值,如下:表4-21葡萄样本71117122034113295824平均值1611.7481594.8381198.641727.8861545.25426.4131459.4161396.1571008.0231468.551555.7611278.9191348.0611140.822平均值1728.74646.31511092.7274119.3751614.4965.1831485.805893.4853371665.6952284.4971621.82608994.0416810.8982根据上面各种葡萄样品地平均值地大小,做出图像如下:图4-3红葡萄样品地总数值观察图中点地分布关系,显然有值越大,葡萄越好,因此我们运用27种红葡萄地总数值地大小来分级,即分为1000、2000、4000、5000四个级别(级别越高,葡萄越好),进而通过上面地图像对27种红葡萄进行分级,即靠近上面所给级别越近地(运用距离来算)就视为一级.则则级别由高到低分类为四星级★★★★、三星级★★★、二星级★★、一星级★(如表4-21所示):表4-21 红葡萄分级表我们在根据同样地标准,对附录[2]中白葡萄地4组数据进行调查取值,最后随机抽取3组决策正负反矩阵数据,如下表:表4-22第一组C1C2C3C4C11759C21/711/35C31/5317C41/91/51/71第二组C1C2C3C4C11669C21/611/25C31/6216C41/91/51/61第三组 C1 C2 C3 C4 C1 1 6 5 9 C2 1/6 1 1/2 6 C3 1/5 2 1 7 C41/91/61/71运用MATLAB 软件分别求上面3组决策正负反矩阵地特征值,并选取其最大特征值(需满足4i λ≥,其中4为上面决策正负反矩阵地阶数),用MA TLAB 计算其相应地特征向量,即为所对应地权重向量,其值如下:第一组特征值:1:4.3126 2:-0.2282最大特征值所对应地特征向量:[0.644695, 0.105339, 0.212811, 0.037154]第二组特征值:1:4.2647 2:-0.1477最大特征值所对应地特征向量:[0.660287, 0.121033, 0.179635, 0.039045]第三组特征值:1:4.2788 2: -0.1232最大特征值所对应地特征向量:[0.637366, 0.129541, 0.196353, 0.03674]在运用权重,计算权重矩阵()281ija ⨯()()()41281284ij ij i a b w ⨯⨯⨯= (10)其中()274ijb ⨯表示附录[2]中地白葡萄3种重要成份和白葡萄酒地贴近值所组成地28行4列地矩阵;()41i w ⨯表示上表中地特征向量地转置.进而运用同样地理论,计算出白葡萄地3组计算总值,如下:表4-23由于上面地3中数据是在相同地理论下,不同地人对其确定地决策正负反矩阵,因而我们对这三组数据进行求平均值处理,进而得出最终各种白葡萄样品地总数值,如下表:表4-24葡萄样本 325 21 9 12 2 15 8 13 19 26 17 20 22总数值 3352.212 1630.214 1119.782 1353.261 1214.965 1319.089 1829.579 919.6685 524.2811 625.7586 1448.884 845.808 1427.083 1035.761 葡萄样本 10 244 6 27 7 11 28 16 14 23 1 18 5总数值 1464.358 2110.297 1452.886 1296.478 1723.642 1218.174 1120.245 2551.619 737.3046 1102.443 1091.638 928.6894 943.5863 1821.606 根据上面各种葡萄样品地平均值地大小,做出图像如下:图4-4白葡萄样品地核心指标总数值观察图中点地分布关系,显然有值越大,葡萄越好,因此我们运用28种白葡萄地总数值地大小来分级,即分为1000、1500、2000、2500四个级别(级别越高,葡萄越好),进而通过上面地图像对28种白葡萄进行分级,即靠近上面所给级别越近地(运用距离来算)就视为一级.则级别由高到低分类为四星级★★★★、三星级★★★、二星级★★、一星级★(如表4-25所示):表4-25白葡萄分级表4.3 问题(3)地模型建立与求解根据附表2中地酿酒葡萄与葡萄酒地质量地理化指标进行综合性分析,得出第二级理化指标之总和近似地等于相应地一级指标,因而就只计算一级指标(红、白葡萄均有30种),在计算一级指标之前,首先对一级指标(酿酒葡萄和葡萄酒均要计算)下地多重数据进行求平均值处理,即为该级指标地最优值.用i X (1,2,,30i =)表示酿酒葡萄中地各一级指标地最优值.用j Y (红葡萄酒1,2,,9j =,白葡萄酒j 1,2,,8=)表示葡萄酒中地各一级指标地最优值.4.3.1建立多元回归模型并针对处理后得到地理化指标地最优值,建立多元回归模型并运用逐步回归方法对这里地众多最优值进行有效而合理地筛选.采用MA TLAB 软件对酿酒红、白葡萄地30种一级指标进行筛选,筛选程序见附录中地附件[1],其筛选后地结果分别如下:(1)酿酒红葡萄地筛选结果:与1Y 相对应地一级指标筛选后影响较大地一级指标有:4X 、26X ;与2Y 相对应地一级指标筛选后影响较大地一级指标有:1X 、8X 、9X 、10X 、18X ; 与3Y 相对应地一级指标筛选后影响较大地一级指标有:4X 、11X ; 与4Y 相对应地一级指标筛选后影响较大地一级指标有:11X ;与5Y 相对应地一级指标筛选后影响较大地一级指标有:2X 、4X 、5X 、6X 、13X 、14X ;与6Y 相对应地一级指标筛选后影响较大地一级指标有:11X ;。
数学建模 葡萄酒评价模型
A题葡萄酒的评价摘要随着我国葡萄酒业的逐步发展,葡萄酒生产企业的规模和数量不断扩大,葡萄酒的质量成为大家越来越关心的话题,本文旨在建立数学模型评价葡萄酒和酿酒葡萄的质量。
针对问题一,在对两组评酒员的评价是否存在显著性差异的问题中,首先用2 拟合检验法验证了两组评酒员的评价结果都服从正态分布,并对两组评酒员的评价结果进行了F检验和t检验,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,通过方差分析法处理,发现第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。
针对问题二,我们利用置信区间法计算出可信区间,再结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用Q型聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。
针对问题三,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。
但主成分法去掉了一部分数据,我们有用最小二乘法进行。
针对问题四,利用最小二乘法建立多元线性回归模型分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响,利用spss软件求出自变量与因变量间的相关系数为0.138,拟合线性回归的确定性系数为0.019,经方差分析及对回归系数进行显著性检验发现方程不显著,即不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键字:正态分布主成分分析聚类分析方法最小二乘法逐步回归 spss软件一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
全国大学生数学建模竞赛A题葡萄酒评价分析
全国大学生数学建模竞赛A题葡萄酒评价分析葡萄酒是一种古老而美妙的饮品,其种类繁多,风味各异。
如何对葡萄酒进行准确的评价和分析成为了葡萄酒爱好者和生产商们共同关注的问题。
在此次全国大学生数学建模竞赛A题中,我们将围绕葡萄酒的评价和分析展开讨论。
1. 引言葡萄酒是一种由葡萄经过发酵而成的酒类饮品。
葡萄酒的风味和品质受到许多因素的影响,如产地、葡萄品种、酿造工艺等。
为了准确评价葡萄酒的质量和特点,我们需要建立相应的评价指标和模型。
2. 数据分析为了进行葡萄酒评价,我们首先需要收集相关的数据。
通过对不同品牌、不同种类的葡萄酒进行采样和测试,我们可以获得葡萄酒的关键指标,如酒精含量、酸度、甜度、单宁含量等。
在数据分析中,我们可以运用统计学方法和数学建模技术,对数据进行整理和处理。
通过计算均值、方差、相关系数等指标,我们可以得到葡萄酒的基本特征和相互之间的关系。
3. 葡萄酒评价指标体系建立基于数据分析的结果,我们可以建立葡萄酒评价指标体系。
这一体系应该包含对葡萄酒各项指标的评价方法和权重。
常见的评价指标包括酒精含量、色泽、香气、口感等。
在指标体系中,我们可以采用层次分析法,通过对各个指标的重要性进行排序和评估。
同时,还可以利用数学模型,将各项指标综合起来,得到最终的评价结果。
4. 葡萄酒评价模型构建在对葡萄酒进行评价时,我们可以利用数学建模方法构建评价模型。
常用的模型包括多元回归模型、灰色关联度模型等。
多元回归模型可以用来分析葡萄酒各项指标之间的关系,进而预测葡萄酒的品质。
灰色关联度模型则可以用来度量葡萄酒各个指标对品质的影响程度。
通过不断地调整模型和参数,我们可以得到更准确的葡萄酒评价结果,并为葡萄酒生产商提供有针对性的改进建议。
5. 葡萄酒评价系统设计为了方便葡萄酒评价和分析的实施,我们可以设计一个葡萄酒评价系统。
该系统可以包括数据输入、数据处理、指标评价、模型计算等功能模块。
数据输入模块用于将葡萄酒相关数据录入系统。
2012年全国数学建模大赛 A题葡萄酒的评价
葡萄酒的评价摘要本文就影响葡萄酒的质量的因素进行了探究。
在问题一中,评酒员间存在评价尺度、评价位置以及评价方向等方面的差异,导致不同评酒员对同一酒样的评价差异很大,于是我们需要探讨两组评酒员的可信度。
对此,我们建立了单元素方差模型对其进行了显著性差异的判断,最后我们得出结论:两组评酒员的评价结果有显著性差异,并且第二组评酒员评价的结果更加可信。
在问题二中,我们首先将大量的数据进行了样本住分析塞选,大大减少了计算量,就红、白葡萄酒前17组样本葡萄酒的分数进行训练,由后十组的理性指标进行检验,也可检验俩个的准确性。
最后我们认为可以给酿酒葡萄分为一、二、三、四四个等级。
在问题三中,因为要讨论酿酒葡萄与葡萄酒的理化指标之间的联系,我们就其两者的重要理化指标进行了探讨,应用了回归模型将其各项重要指标进行了多元拟合处理,最后得出了葡萄酒和酿酒葡萄中的重要指标的等式关系。
在问题四中,我们首先利用了回归原理求得葡萄酒质量与葡萄酒和酿酒葡萄的理化指标之间的等式关系,由等式和图像细致的分析了葡萄酒和酿酒葡萄理化指标对葡萄酒质量的影响。
在一定范围内,理化指标的与葡萄酒的质量呈正相关,达到一定的量后呈现负相关趋势。
关键词:显著性差异判别主成分分析 BP神经网络回归模型1.问题的重述现今社会,随着人们生活水平的提高,人们对葡萄酒的质量要求也越来越高。
在确定葡萄酒质量的时候,一般聘请一批资深的评酒员进行评比,根据不同的指标所得的分数从而求得总分,以此确定葡萄酒的质量。
其中酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本题给出了3份材料,材料1是某一年份一些葡萄酒的评价结果,材料2和材料3分别给出了该年份这些葡萄酒和酿酒葡萄的成分数据。
我们必须解决以下问题:问题一:分析材料1中两组评酒员的评价结果是否有明显的差异,并且求出哪组评酒员的评价结果更可信。
问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄的品质进行分级。
2012高教社杯全国大学生数学建模竞赛A题葡萄酒的评价
2012高教社杯全国大学生数学建模竞赛葡萄酒的评价摘要本文以概率论与数理统计的相关知识为理论基础,综合运用正态分布和分级的原理,利用统计分析数据,研究了葡萄酒的评价指标体系,针对 葡萄酒的质量评价问题,建立合理的数学模型用以评价。
问题一:(1) 本问题的葡萄酒质量评价指标(即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析),先对指标归类按顺序,统计并整理出相关的数据,再利用正态分布的思想,假设并验证质量评价指标为正态分布并进行差异性分析,对比找出附件1中两组评酒员的显著差异为:两组评酒员对红葡萄酒的评价结果有显著性差异的是外观分析中的色调、香气分析中的浓度,其他的无显著性差异;两组评酒员对白葡萄酒的评价结果有显著性差异的是口感分析中的纯正度、浓度,持久性、质量和平衡/整体评价,其他的无显著性差异。
(2)本问题要求分析附件1中哪组指标更可信,这就要在问题(1)基础上分析两组指标的可信性,建立可信性分析模型,利用matlab 软件编程计算得(程序见附件4): 1var =0.0735 ,2var =0.0398。
可见21var var ,因此第二组可信性高。
问题二:此问题我们的总体思路是这样的:先根据样品葡萄酒的得分高低对葡萄酒进行分级,并且假设葡萄酒得分越高,那么酿酒葡萄就越好,等级就越高,于是我们利用一些分类模型就可以得到相应酿酒葡萄的级别差。
根据这条思路,我们建立如下一些模型来讨论(见表6、7、8)。
为了充分利用文中的数据,我们把第一组第二组葡萄酒品尝得分合并,这样就得到了一个更大的样本,对结论会更有说服力。
为了能比较客观的对葡萄酒分划分合理的等级,我们需要一种能从总体上正确的反应葡萄酒的评分,这里我们利用已经单位化的综合了所有指标的葡萄酒品尝评分的所得分评价,它们的得分范围理论上包含在[0,1]区间上,实际计算红葡萄的单位化归一化后的评分。
数学建模葡萄酒评价
A题:葡萄酒的评价摘要本文主要进行了葡萄酒感官评价的可信度比较、酿酒葡萄评价分级、酿酒葡萄与葡萄酒的理化指标之间的联系、评价结果统计分析等方面的研究。
通过方差分析、层次分析等方法建立模型,解决了葡萄酒的评价问题。
问题一:利用方差分析法对评酒员评价数据进行分析,并用Excel画出图表(见正文),直观地观察出两组评价数据围接近,第二组评价数据波动不大,评价数据更可信。
问题二:要求根据酿酒葡萄的理化指标和葡萄酒的质量,对这些酿酒葡萄进行分级,我们认为影响酿酒葡萄品质的因素较多,酿酒葡萄各理化指标之间的关系又是极其复杂的,对其的评价是一个多指标、多属性的问题。
采用系统工程学的层次分析法(AHP)来确定影响葡萄品质的各因素的权重,应用综合评判法,对酿酒葡萄进行了评价和分级。
各等级下葡萄样品数如下表:问题三:利用逐步回归法得到酿酒葡萄与葡萄酒的理化指标之间的关系,并用BP神经网络进行比较验证。
问题四:通过聚类分析与神经网络相结合,分析酿酒葡萄与葡萄酒的理化指标和葡萄酒质量间的联系。
通过理化指标得到葡萄酒质量评价分数,并与第二组评酒员评价出的葡萄酒质量评价分数对比分析,可知现阶段还不能用酿酒葡萄与葡萄酒的理化指标来评价酒的质量。
本文的建模过程中,对于每个问题都充分考虑了影响因素,一定程度上体现了模型的可靠性,具有较强的适用性和普遍性。
关键词:方差分析Excel逐步回归分析Bp神经网络聚类分析Matlab DPS数据处理系统一、问题重述通过聘请一些有资质的评酒员品尝葡萄酒,根据他们反馈意见来确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
已知某一年份一些葡萄酒的评价结果,及该年份这些葡萄酒的和酿酒葡萄的成分数据。
根据上述条件建立数学模型解决以下问题:1. 分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信。
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
全国大学生数学建模竞赛题葡萄酒的评价答案全解
数学实验计算机科学与技术成员:xxx学号:xxxxxxxxxx葡萄酒的评价摘要本文主要研究的是如何对葡萄酒进行评价的问题。
通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。
在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。
之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。
而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。
置信区间越窄,说明其越可信。
利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。
在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。
在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。
第二变量的方差次大,并且和第一变量不相关。
由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。
依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。
在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。
在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。
最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。
关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
2012年数学建模A题目--关于葡萄酒质量的评价
Mean
N
Std. Deviation
Std. Error Mean
Pair 1
First
73.0778
27
7.36093
1.41661
Second
70.5148
27
3.97799
.76556
Pair 2
f2
74.0107
28
4.80404
.90788
Cunulative contribution rate
1
6.963
23.211
23.211
2
4.984
16.612
39.824
3
3.692
12.305
52.129
4
2.842
9.472
61.601
5
1.994
6.647
68.248
6
1.738
5.795
74.042
7
1.428
4.761
78.803
Std. Error Mean
95% Confidence Interval of the Difference
Lower
Upper
Pair 1
Ft - Sd
2.56296
5.37424
1.03427
.43699
4.68894
2.478
26
.020
Pair 2
f2 - s2
-2.52143
5.35934
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系。葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒的质量。葡萄酒的每一项理化指标是其质量的单一体现,而感官指标则是葡萄酒质量的综合概括,换句话说,一个理化指标、卫生指标都合格的葡萄酒未必是高质量的葡萄酒。在今后的一个时期,我们需要做的是从葡萄酒的特点出发,围绕葡萄和葡萄酒理化指标、感官指标等众多因素对葡萄酒质量的联系进行研究,尽可能确定较为合理的葡萄酒质量评价标准,从而实现既保证市场中酒的质量,保护消费者利益,又能为市场定位提供决策信息,达到经济效益的目的,实现双赢。
葡萄酒评价 数学建模
葡萄酒评价数学建模篇一:葡萄酒评价是一个重要的领域,不仅涉及到口感、香气、颜色、平衡等方面,还受到酿造工艺、葡萄品种、气候和地点等因素的影响。
因此,对葡萄酒的评价需要综合考虑多个因素,而数学建模则可以为葡萄酒评价提供有力的支持。
首先,数学建模可以帮助葡萄酒评价者建立葡萄酒评价的数学模型。
例如,可以利用数学模型来预测不同葡萄品种在不同地区的表现,或者分析葡萄酒的颜色、香气和口感等特征之间的关系。
这些模型可以帮助我们更好地理解葡萄酒的特性,从而做出更明智的评价。
其次,数学建模还可以为葡萄酒评价提供数据支持。
通过对大量葡萄酒评价数据进行分析,可以挖掘出葡萄酒评价中的一些规律和趋势,为葡萄酒评价提供更准确的数据支持。
同时,数学建模也可以为葡萄酒评价者提供更高效的评价方法,例如利用数据分析工具来预测葡萄酒的品质,或者使用机器学习算法来自动化葡萄酒评价等。
最后,数学建模还可以应用于葡萄酒产业的各个领域。
例如,可以利用数学建模来优化葡萄酒酿造工艺,提高生产效率和产品质量;也可以利用数学建模来分析葡萄酒市场趋势,为营销策略提供依据。
因此,数学建模在葡萄酒评价、生产和市场等方面都有广泛的应用前景。
总之,葡萄酒评价需要综合考虑多个因素,而数学建模可以为葡萄酒评价提供有力的支持。
随着数学建模在葡萄酒评价领域的应用越来越广泛,相信它将为葡萄酒产业的发展带来更多的创新和变革。
篇二:葡萄酒评价是一个复杂的问题,不仅受到口感、香气、结构和酿造工艺等因素的影响,还受到年份、气候和地区等因素的影响。
因此,对葡萄酒的评价往往是高度主观的,并且难以量化。
为了解决这个问题,数学建模是一种有效的工具。
数学建模可以用来描述葡萄酒评价的过程。
例如,可以使用数学模型来预测不同葡萄品种和酿造工艺对葡萄酒口感和香气的影响。
或者可以使用数学模型来建立葡萄酒质量的指数模型,以衡量葡萄酒的品质和价格之间的相关性。
数学建模还可以用于葡萄酒评价的结果分析和解释。
葡萄酒的评价数学建模
葡萄酒的评价数学建模一、葡萄酒的成分分析葡萄酒的成分分析是评价葡萄酒质量的重要环节。
葡萄酒的成分包括酒精、糖分、酸度、单宁、色素等,这些成分的含量和比例都会影响葡萄酒的风味和品质。
通过对葡萄酒的成分进行分析,可以了解葡萄酒的基本特征和风格,为后续的质量评估和风格分类提供基础数据。
二、葡萄酒的感官评价感官评价是评价葡萄酒质量的重要手段。
感官评价主要包括视觉、嗅觉和味觉三个方面的评价。
视觉评价主要是观察葡萄酒的颜色、透明度、沉淀物等;嗅觉评价主要是闻葡萄酒的香气,判断其浓郁度、复杂度和持久度;味觉评价主要是品尝葡萄酒的口感,评价其酸度、甜度、单宁、酒精等成分的口感感受。
通过对葡萄酒的感官评价,可以全面了解其风味特征和品质状况。
三、葡萄酒的质量评估质量评估是评价葡萄酒的重要环节。
通过对葡萄酒的感官评价和成分分析结果的综合分析,可以对葡萄酒的质量进行评估。
质量评估主要包括以下几个方面:.产地质量:葡萄酒的产地对其品质有着重要影响。
产地环境包括气候、土壤、地理位置等,这些因素都会影响葡萄的生长和葡萄酒的品质。
.酿造工艺:酿造工艺对葡萄酒的品质也有重要影响。
酿造工艺包括葡萄采摘、发酵、陈酿、调配等环节,每个环节都会影响葡萄酒的成分和风味。
.口感质量:口感质量是评价葡萄酒质量的重要指标。
口感质量主要包括酸度、甜度、单宁、酒精等成分的口感感受,以及整体的口感平衡度和口感特点。
.风味质量:风味质量是评价葡萄酒质量的核心指标。
风味质量主要包括葡萄品种的特征、酿造工艺的特点、陈酿时间等,以及整体的复杂度、浓郁度和持久度。
通过对以上几个方面的综合分析,可以对葡萄酒的质量进行评估。
一般来说,优质的葡萄酒应该在以上几个方面都表现出色,而劣质的葡萄酒则会在其中一个或多个方面存在明显缺陷。
四、葡萄酒的风格分类风格分类是评价葡萄酒的重要手段。
通过对葡萄酒的风味特征进行分析,可以将其分为不同的风格类型。
常见的风格类型包括:.波尔多风格:以赤霞珠、美乐等葡萄品种为主,口感丰富、复杂,具有浓郁的果香和橡木桶陈酿的香气。
葡萄酒评价数学建模matlab
葡萄酒评价数学建模matlab摘要:一、引言二、葡萄酒评价的数学模型三、数学建模在葡萄酒评价中的应用四、MATLAB 在葡萄酒评价数学模型中的实现五、结论正文:一、引言随着生活水平的提高,人们对葡萄酒的需求也逐渐增加。
葡萄酒的质量评价成为了一个重要的问题。
传统的葡萄酒评价方法通常依赖于评酒师的主观感受,这种主观性较强的评价方式存在着一定的局限性。
因此,借助数学模型对葡萄酒进行客观评价成为了研究的热点。
本文将介绍葡萄酒评价的数学模型,以及如何利用MATLAB 实现这些模型。
二、葡萄酒评价的数学模型葡萄酒评价的数学模型主要包括以下几种:1.基于理化指标的评价模型:通过分析葡萄酒的理化指标,如酒精度、酸度、单宁等,建立数学模型,从而对葡萄酒的质量进行评价。
2.基于多元统计分析的评价模型:利用多元统计分析方法,如主成分分析(PCA)、线性判别分析(LDA)等,对葡萄酒的感官指标进行降维处理,从而实现葡萄酒的客观评价。
3.基于人工神经网络的评价模型:通过训练神经网络,建立葡萄酒感官指标与质量之间的映射关系,实现对葡萄酒的评价。
三、数学建模在葡萄酒评价中的应用数学建模在葡萄酒评价中的应用主要体现在以下几个方面:1.提高评价的客观性:数学模型可以减少评价过程中主观因素的影响,提高评价的客观性。
2.提高评价的效率:利用计算机程序进行数学建模,可以大大提高评价的效率。
3.促进葡萄酒产业的发展:通过数学建模,可以对葡萄酒的质量进行更加精确的评价,有利于促进葡萄酒产业的发展。
四、MATLAB 在葡萄酒评价数学模型中的实现MATLAB 是一种广泛应用于科学计算和数据分析的软件,可以方便地实现葡萄酒评价数学模型。
以下是一个简单的示例,基于MATLAB 实现多元统计分析的葡萄酒评价模型:1.收集葡萄酒的感官指标数据,如香气、口感、色泽等。
2.利用MATLAB 中的PCA 函数对感官指标数据进行降维处理,得到主成分得分。
3.根据主成分得分,利用MATLAB 中的LDA 函数建立葡萄酒质量的分类模型。
葡萄酒评价数学建模matlab
葡萄酒评价数学建模matlab【实用版】目录一、引言二、葡萄酒评价的数学模型三、数学建模在葡萄酒评价中的应用四、MATLAB 在葡萄酒评价数学模型中的实现五、结论正文一、引言随着人们生活水平的提高,对葡萄酒的需求也日益增加。
葡萄酒的质量评价成为了一个重要的问题。
传统的葡萄酒评价方法通常依赖于评酒师的主观判断,这种主观性较强的评价方式具有一定的局限性。
因此,采用数学建模方法对葡萄酒进行评价显得尤为重要。
本文将介绍葡萄酒评价数学建模及 MATLAB 在该模型中的实现。
二、葡萄酒评价的数学模型葡萄酒评价的数学模型主要包括以下几种:1.基于理化指标的评价模型:通过分析葡萄酒中的花色苷、总酚和单宁等理化指标,建立数学模型,从而对葡萄酒的质量进行评价。
2.基于多元统计的评价模型:利用多元统计方法,如主成分分析(PCA)和线性判别分析(LDA),对葡萄酒的感官指标进行降维和分类,从而实现葡萄酒的评价。
3.基于人工神经网络的评价模型:通过构建人工神经网络,将葡萄酒的理化指标和感官指标作为输入,输出葡萄酒的评价结果。
三、数学建模在葡萄酒评价中的应用数学建模在葡萄酒评价中的应用主要体现在以下几个方面:1.客观性:数学建模方法可以减少主观因素的影响,提高评价的客观性。
2.精确性:通过大量数据分析,数学建模可以得到更为精确的评价结果。
3.高效性:与传统的评酒师评价方式相比,数学建模方法可以大大提高评价效率。
四、MATLAB 在葡萄酒评价数学模型中的实现MATLAB 是一种强大的数学计算软件,可以方便地实现葡萄酒评价数学模型。
以下以基于多元统计的评价模型为例,介绍 MATLAB 在葡萄酒评价中的实现:1.数据预处理:利用 MATLAB 对葡萄酒的理化指标和感官指标数据进行预处理,如数据清洗、缺失值处理等。
2.建立数学模型:利用 MATLAB 进行主成分分析(PCA)和线性判别分析(LDA),建立葡萄酒评价的数学模型。
3.模型验证与优化:通过 MATLAB 对建立的数学模型进行验证和优化,提高模型的评价准确性。
利用数学模型评价葡萄酒质量
利用数学模型评价葡萄酒质量摘要:葡萄酒的质量评价是研究葡萄酒的一个重要因素,确定葡萄酒质量时由于认为主管因素的影响,对葡萄酒质量的评价带有一定的主观性。
所以酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒的质量。
本文根据酿酒葡萄以及葡萄酒的相关数据建立典型相关分析模型,求得典型变量的系数,根据典型变量的系数分析酿酒葡萄和葡萄酒理化指标之间的关系,从而客观评价葡萄酒的质量。
建立评价葡萄酒质量的多元线性回归模型,验证能够用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:典型相关、主成分分析法、多元回归一、建立典型相关分析的模型:典型相关分析是研究两组变量之间相关关系的一种统计分析法,类似于主成分分析的方法,在两组变量中分别选取若干有代表性的变量组成有代表性的综合指标,通过研究综合指标间的关系来代表两组变量间的相关关系,这些综合指标称为典型变量。
设有两随机变量的均值和方差矩阵为:E(X)=,COV(X)=.第二组变量的均值和协方差矩阵为:E(X)=,Cov(Y)=.第一组与第二组变量的协和方差矩阵为:E(Y)=,Cov(Y)=.于是,矩阵Z=[XY]有均值向量=E(Z)=E[E(x)E(Y)]=[].协方差矩阵为:(Z-u)(Z-u).设两组变量为,,…,和,,…,,研究两组变量之间的相关关系,分别作两组变量的线性组合,即 =++…+. = ++…+.典型变量系数:通过计算两组数据之间的系数可以得出各个数据之间的相关性的大小,比较相关性的大小再结合实际分析就可以得出变量之的关系。
对得到的数据进行标准化处理,再通过SPSS计算,得出Y与X这两组变量间的多元回归的标准化系数。
通过典型变量的重要程度和以及系数的大小,从模型中可以看出酿酒葡萄与葡萄酒的理化指标之间的联系:酿酒葡萄指标中,与花色苷呈比较大的相关的几个解释变量是苹果酸、葡萄总黄酮和单宁,并且与葡萄总黄酮有很强的相关性,由此可以得出花色苷的主要来源于酿酒葡萄中的葡萄总黄酮。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):长江师范学院参赛队员(打印并签名) :1. 李蓉2. 马艳3. 周成楷指导教师或指导教师组负责人(打印并签名):廖江东日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进葡萄酒质量的评价模型摘要本文围绕葡萄酒的质量评价问题进行讨论,主要应用数据的统计原理以及数据的处理方法对酿酒葡萄的分级、葡萄酒和葡萄的理化指标的联系、以及葡萄酒质量评价问题建立了模型,并对模型做了较详细的模型检验,客观地实现了问题的解决。
问题(1),是一个数据统计问题,首先对红、白葡萄酒每类酒的样本数据建立了两独立样本的T检验模型,通过对比T统计量t值与T分布表给出的相伴概率值之间的大小,得出两组数据样本具有显著性差异。
对于两数据样本的可信度问题,本文巧妙通过对每类的两个数据样本的均值方差的图像分析和对客观的评价准则考虑,得出结果:第二组评酒员给出的分数更具有可信性。
问题(2),属于多方案排序问题,首先利用问题(1)中的结果得到两组样品的有效性较高的评分数据样本,并借以建立了排序模型。
同时本文还应用逼近理想解排序法(TOPSIS法),得出了两类葡萄酒质量的排序,然后通过权重法筛选出氨基酸、糖、蛋白质作为核心理化指标。
最后基于“层次分析法”评价模型建立分级评价模型,通过权重算法得到以核心量化指标的贴近度作为分级的标准,确定出了对酿酒葡萄的四个等级:(见表4-15、4-16)。
问题(3),对附件2中一级指标下的多重数据进行求平均值处理获得该级指标的最优值,建立了多元线性回归模型,首先对酿酒红、白葡萄的30种一级指标进行筛选,筛选出众多核心理化指标的最优值,并采用“逐步回归”的方法,针对多重数据下的多种指标进行分别拟合,从中抽出拟合最好的一组数据和结果进行图像分析,得出整体的酿酒葡萄与葡萄酒的理化指标成正相关的关系。
问题(4),本文基于问题(1)、问题(2)和问题(3)的研究结果,首先针对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响问题,建立了多元回归分析模型,并运用逐步回归方法对这里的最优值进行有效而合理的筛选,之后将筛选得到的多个理化指标给与拟合,并对其进行图像分析,得出筛选出来的5个一级指标就可以反映出整体的关系,最后应用这个结果论证出:用葡萄和葡萄酒的理化指标来判断葡萄酒的质量是不全面的。
关键词:葡萄酒的评价 T检验层次分析法多元线性回归分析逐步回归法1 问题重述目前在现实生活中,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
题目中附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
现需完成以下任务:(1)要分析出两组评酒员评价结果的显著性差异,并确定出哪一组结果更可信;(2)在解决问题(1)的基础上,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;(3)在解决完问题(1)与(2)之后,还要对酿酒葡萄与葡萄酒的理化指标进行分析,从而确定他们之间的联系;(4)结合上面三个问题的结果,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
2 问题分析2.1 问题(1)的分析该问题要求通过对附件1两组评酒员的葡萄酒品尝评分表中的数据作出综合性评价。
题目给出了两组评酒员(每组10人)分别对27种红葡萄酒和28种白葡萄酒的评价分数,该问题旨在从给出的评价分数中找出差异的显著程度,并从中确定出哪一组评酒员的结果更具可信性。
对于解决评价结果是否具有显著差异性问题实质是一个两独立样本的T检验问题,他满足检验的前提条件,考虑到方差是表示一组数据分布的离散程度,方差越大,说明变量值的差异越大,距离平均数这个“中心”的离散趋势越大,我们通过建立两独立样本的T检验模型,很好的解决了两组评价结果有误显著差异性问题。
而对于两组评酒员给出的评分结果的可信程度问题,我们通过简单计算得到两组样本的平均值的方差,并作出两个葡萄酒样品评价结果分析折线图,通过对图形反映出来两个评分样本的波动剧烈程度可以知道该样本对应的评酒员打分的可信性。
对于这个问题,也可采用信度分析法,通过SPSS进行数据分析,得到两组数据的可信度值,进而得到哪一组数据更可信。
2.2 问题(2)的分析该问题是一个根据所给的数据特点进行综合的分析,研究对各种酿酒葡萄的多个方案的分级问题。
我们应该对评价对象的各个指标的联系进行综合性评价。
综合评价的方法有多种,诸如模糊综合评判、灰色关联等,对与此种多属性问题,可以借助“空间距离”概念的角度来解决,这样就可以通过逼近理想解排序法(TOPSIS 法)建立“逼近理想解的排序模型”,其过程为:首先从问题(1)中数据的可信性判断模型中找出一组可行性较高的样品酒质量的排序结果,并对该组评价对象的各个评酒员的评价指标均找出最优值,设成正理想值;对该组评价对象的各个评酒员的评价指标均找出最劣值,设为负理想解,分别计算每一个评价对象到正理想解和负理想解的距离,从而得到每种酒的各个评价指标的贴近度,应用数据中的权重,计算出最终各酒品种的贴近度,进而排名,得到各个酒品种的贴近值。
同时对附件2中的酿酒葡萄各指标数据整合,并筛选出成分含量相对较多的几种指标,结合各个酒品种的贴近值,通过“层次分析法”中的排序模型计算各个指标的权重,进而计算出最终的各个酿酒葡萄的指标总值,进而对其分级。
2.3 问题(3)的分析问题(3)要求对建立酿酒葡萄和葡萄酒的理化指标之间的联系。
首先,我对附件2的各个理化指标进行整体的分析得出二级理化指标的总和近似等于相应的一级指标,因此我们就只用一级理化指标来建立多元回归模型,并采用“逐步回归(stepwise regression )”的方法,对众多理化指标有效的选出核心的理化指标,并通过对这些核心指标进行适当的拟合,最后得出酿酒葡萄和葡萄酒之间的相对关系。
2.4 问题(4)的分析问题(4)主要是要求我们对酿酒葡萄和葡萄酒的理化指标对葡萄酒质量影响的分析。
我们采用了问题(3)的处理方法——多元回归分析中的“逐步回归(stepwise regression )”法,分别对酿酒葡萄和葡萄酒的理化指标与葡萄酒质量进行数据拟合,进而得出对葡萄酒影响成正相关和负相关的相应物质的分类,得出结论。
3 模型的假设及符号说明3.1 模型的假设(1)假设两组样本之间彼此独立,且来自两个服从正态分布的总体;(2)假设两组样本数据的总体方差相等,即2212=σσ;(3)假设所调查到的数据真实可靠,能很好的反映出大部分人的看法; (4)假设所有的评酒员评酒时的外部环境相同,评酒时不考虑外界因素的影响; (5)假设问题中提供的每个评酒员所打的分数能够充分地反映出每个酒样品的真实情况;(6)假设每个评酒员在评价每个酒样品时互不影响,而且具有互补性,即每个组的评分员的评分水平相当;(7)假设计算时附件3中空白处数据默认为0;(8)假设酿酒葡萄中对所酿的葡萄酒影响较小的成份予以不计;(9)假设由于白葡萄酒和白葡萄一级指标中的白藜芦醇含量都比较少,视为白葡萄对白葡萄酒的影响较小,即白葡萄对白葡萄酒中的白藜芦醇影响较大的指标没有;3.2 符号的使用及说明i 表示i 号评分项目(1,2,i = (10)j 表示j 号评酒员(1,2,j =…10)k 表示第k 号酿酒葡萄的样品(对于红葡萄1,2,,27k = ;对于白葡萄1,2,,28k = )ij x 表示评酒员j 在评分项目i 之下的取值 k M 表示酿酒葡萄的样品k 号的数据样本均值k S 表示酿酒葡萄的样品k 号的数据样本均值的方差,即:1021()10jk k j k x M S =-=∑k S 表示红/白葡萄酒第j 个酒样品的评分方差的平均值 ij f 表示每个样品酒中评酒员j 在评分项目i 上给出的分值 ij r 表示每个样品酒的每一个分值ij f 无量纲化之后的结果 ij v 表示评价项目j 对于评酒员i 的权重j D + 表示是在评分项目j 下的正距离尺度 j D - 表示在评分项目j 下的付距离尺度 j C 表示在评分项目j 下的理想贴近度4 模型的建立与求解4.1问题(1)的模型建立与求解4.1.1 基于方差分析法的显著差异性评价模型根据对问题(1)的分析,建立“两独立样本T检验”模型。
首先可以将附件1中的数据按照不同的评酒员和相同的样品酒分成两类,一类是红葡萄酒的评分结果,一类是白葡萄酒的评分结果,其中每一类包括两个样本,样本一是第一组评酒员给出的每个酒样品的得分平均值,样本二是第二组评酒员给出的每个酒样品的得分平均值。
并由假设可以知道他们的总体得分服从正态分布,且都是相互独立的。
因此我们可以建立“两独立样本T检验”模型来进行样本数据体现出的方差进行较好的分析,进而可以根据T检验原理判断出每类评分结果的两个样本之间是否有显著性差异。
首先对附件1的数据进行如下处理:用EXCEL软件实现对样本一中各个酒样品的得分平均值(如表4-1)表4-1第一类样本一中的酒样品1的得分平均值计算那么在通过对各个总和的求平均值,即得到样本一中的酒样品1总得分的平M=62.7均值1对之后的各个酒样品得分重复上述操作可得红葡萄酒的评分均值的样本一和样本二,以及白葡萄酒的评分均值的样本一和样本二(如表4-1)表4-2 对于红、白葡萄酒的两个样本均值和样本方差表T 统计量的计算公式:0t = (2)计算得出第一类的0x t 统计量0x t ≈10.8135T 统计仍然服从T 分布,但由自由度采用修正的自由度:2212122222121212S S n n f S S n n n n +=⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭+ (3)通过查寻T 分布表我们得到()i t f ≈0.2704, 显然0x t >()i t f从两种情况下的T 统计量计算公式可以看出,如果待检验的两样本均值差异较小,0x t 较小,则说明两样本的均值不存在显著差异;反之,0x t 越大,则说明两个样本的均值存在显著差异性。