葡萄酒的评价_全国数学建模大赛优秀论文
数学建模毕业论文--葡萄酒的评价
数学建模毕业论文--葡萄酒的评价
葡萄酒的评价是一项复杂的任务,涉及多个因素,包括葡萄品种、酿造过程、年份、产地和存储条件等。
在数学建模中,我们可以利用统计分析和机器学习算法来对葡萄酒进行评价,以预测其质量和特征。
首先,我们可以采集一定数量的葡萄酒样本,并测量其相关属性,如酒精含量、酸度、pH值、残留糖分、挥发性酸、柠檬
酸等。
利用统计分析方法,我们可以探索这些属性与葡萄酒质量之间的关系,建立相应的数学模型。
例如,可以使用线性回归分析来确定具体属性与葡萄酒得分之间的相关性。
另一方面,机器学习算法可以帮助我们构建更复杂的评价模型。
可以使用聚类算法将葡萄酒样本分成不同的类别,以发现具有相似特征的葡萄酒群体。
此外,可以使用分类算法或回归算法来预测葡萄酒的质量评分。
这些算法可以利用已知的葡萄酒样本数据进行训练,并在新样本上进行预测。
除了属性数据,我们还可以考虑其他因素对葡萄酒评价的影响。
例如,可以考虑葡萄酒的价格、评分和消费者评价等因素,以构建更综合的评价模型。
可以使用模糊数学方法来处理这些不确定性和主观性因素,以得出更准确的评价结果。
最后,为了验证模型的准确性和稳定性,可以使用交叉验证或留一验证的方法进行模型评估。
这些方法可以帮助我们评估模型的泛化能力,并进行必要的调整和改进。
数学建模可以帮助我们对葡萄酒进行评价,为葡萄酒生产商、消费者和酒评人提供有关葡萄酒质量和特征的有价值信息。
数学建模经典案例分析以葡萄酒质量评价为例
数学建模经典案例分析以葡萄酒质量评价为例一、本文概述本文旨在通过深入剖析数学建模在葡萄酒质量评价中的应用,展示数学建模的经典案例。
我们将首先简要介绍数学建模的基本概念及其在各个领域的应用,然后聚焦葡萄酒质量评价这一具体问题,阐述如何通过数学建模对其进行科学、客观的分析。
文章将详细分析数据的收集与处理、模型的建立与求解、模型的验证与优化等关键环节,并探讨不同数学模型在葡萄酒质量评价中的优缺点。
我们将总结数学建模在葡萄酒质量评价中的实际应用效果,展望其在未来葡萄酒产业中的发展前景。
通过阅读本文,读者将能够了解数学建模在葡萄酒质量评价中的重要作用,掌握相关数学建模方法和技术,为类似问题的解决提供有益的参考和借鉴。
本文也将促进数学建模在葡萄酒产业中的应用与发展,推动葡萄酒产业的科技进步和产业升级。
二、数学建模基础数学建模是一种将实际问题抽象化、量化的过程,通过数学工具和方法来求解问题的近似解。
在葡萄酒质量评价这一案例中,数学建模提供了从复杂的实际生产环境中提取关键信息,并建立预测模型的可能。
这需要我们具备一定的数学基础,如统计学、线性代数、微积分等,同时也需要理解并掌握数据处理的基本技术,如数据清洗、特征提取和选择等。
在葡萄酒质量评价问题中,我们首先需要收集大量的葡萄酒样本数据,这些数据可能包括葡萄品种、产地、气候、土壤、酿造工艺、化学成分等多个方面的信息。
然后,我们需要对这些数据进行预处理,如去除缺失值、异常值,进行数据标准化等,以提高模型的稳定性和准确性。
接下来,我们可以选择适合的模型进行训练。
在这个案例中,我们可以选择线性回归、决策树、随机森林、神经网络等模型进行尝试。
我们需要根据数据的特性和问题的需求,选择最合适的模型。
同时,我们还需要进行模型的训练和验证,通过调整模型的参数,提高模型的预测能力。
我们需要对模型进行评估和优化。
这可以通过交叉验证、ROC曲线、AUC值等评估指标来进行。
如果模型的预测能力不足,我们需要对模型进行优化,如改进模型的结构、增加更多的特征等。
葡萄酒的评价论文(1) (1)
葡萄酒的评价摘要随着时代的进步,经济的发展,葡萄酒渐渐地走进百姓的生活。
评判葡萄酒的方法则是通过聘请一批有资质的评酒员进行品评。
评酒员品尝葡萄酒并对其打分,通过求和确定葡萄酒的质量。
本文通过对所给数据的观察分析,先对数据预处理,再建立相对较好的模型评价葡萄酒的质量。
对于问题一,首先我们利用MATLAB软件制作Q-Q图,根据所得到的图观察得到,这些点可近似拟合成一条直线,从而证明该组数据满足正态分布。
然后利用T-检验方法判断评酒员的评价有无显著差异,最终得出两组评酒员的评价结果存在显著性差异的结论。
关于哪组评价结果更可信的问题,我们采用了方差分析法,根据所得到的红、白葡萄酒均值和方差表,经过计算比较,我们发现第二组的方差小于第一组的方差。
由于方差越小则数据越稳定,于是我们得到第二组评酒员的评价结果更可信的结论。
对于问题二,我们选择利用灰色关联分析法。
我们根据附件一中评分员的评分得出葡萄酒的得分,并对其标准化,将所得的数据作为葡萄酒质量的评分。
对于酿酒葡萄的理化指标,首先我们通过参考文献确定对葡萄酒影响较大的酿酒葡萄的理化指标,再采用均值化无差异法对数据求标准化值,然后利用变异系数法求得筛选出来的葡萄的理化指标的权重,通过计算权重和标准化值最后求得酿酒葡萄的综合评分。
再用均值化无差异法求葡萄和葡萄酒的标准化值。
将所得到的两组数据做和并排序,从而将酿酒葡萄划分为优、良、中、差四个等级。
对于问题三,我们采用了单个拟合和综合拟合的方法。
题目中要求寻找酿酒葡萄和葡萄酒的理化指标的关系,我们首先从参考文献中找到了对葡萄酒的主要理化指标有重大影响的酿酒葡萄的理化指标。
然后利用MATLAB软件进行拟合,建立线性回归方程,从而得出酿酒葡萄的部分理化指标对葡萄酒的理化指标的影响系数和两者之间的函数表达式,可见表N,为了进一步确定两者之间的相关关系,我们又对附件二和附件三中的数据进行处理,利用MATLAB软件再次进行拟合,从而得出酿酒葡萄与葡萄酒的理化指标之间呈正相关关系的结论。
葡萄酒质量的评价模型_全国数学建模
承诺书我们仔细阅读了中国大学生数学建模竞赛地竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外地任何人(包括指导教师)研究、讨论与赛题有关地问题.我们知道,抄袭别人地成果是违反竞赛规则地, 如果引用别人地成果或其他公开地资料(包括网上查到地资料),必须按照规定地参考文献地表述方式在正文引用处和参考文献中明确列出.我们郑重承诺,严格遵守竞赛规则,以保证竞赛地公正、公平性.如有违反竞赛规则地行为,我们将受到严肃处理.我们授权全国大学生数学建模竞赛组委会,可将我们地论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等).我们参赛选择地题号是(从A/B/C/D中选择一项填写): A 我们地参赛报名号为(如果赛区设置报名号地话):所属学校(请填写完整地全名):长江师范学院参赛队员 (打印并签名) :1. 李蓉2. 马艳3. 周成楷指导教师或指导教师组负责人 (打印并签名):廖江东日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进葡萄酒质量地评价模型摘要本文围绕葡萄酒地质量评价问题进行讨论,主要应用数据地统计原理以及数据地处理方法对酿酒葡萄地分级、葡萄酒和葡萄地理化指标地联系、以及葡萄酒质量评价问题建立了模型,并对模型做了较详细地模型检验,客观地实现了问题地解决.问题(1),是一个数据统计问题,首先对红、白葡萄酒每类酒地样本数据建立了两独立样本地T检验模型,通过对比T统计量t值与T分布表给出地相伴概率值之间地大小,得出两组数据样本具有显著性差异.对于两数据样本地可信度问题,本文巧妙通过对每类地两个数据样本地均值方差地图像分析和对客观地评价准则考虑,得出结果:第二组评酒员给出地分数更具有可信性.问题(2),属于多方案排序问题,首先利用问题(1)中地结果得到两组样品地有效性较高地评分数据样本,并借以建立了排序模型.同时本文还应用逼近理想解排序法(TOPSIS法),得出了两类葡萄酒质量地排序,然后通过权重法筛选出氨基酸、糖、蛋白质作为核心理化指标.最后基于“层次分析法”评价模型建立分级评价模型,通过权重算法得到以核心量化指标地贴近度作为分级地标准,确定出了对酿酒葡萄地四个等级:(见表4-15、4-16).问题(3),对附件2中一级指标下地多重数据进行求平均值处理获得该级指标地最优值,建立了多元线性回归模型,首先对酿酒红、白葡萄地30种一级指标进行筛选,筛选出众多核心理化指标地最优值,并采用“逐步回归”地方法,针对多重数据下地多种指标进行分别拟合,从中抽出拟合最好地一组数据和结果进行图像分析,得出整体地酿酒葡萄与葡萄酒地理化指标成正相关地关系.问题(4),本文基于问题(1)、问题(2)和问题(3)地研究结果,首先针对酿酒葡萄和葡萄酒地理化指标对葡萄酒质量影响问题,建立了多元回归分析模型,并运用逐步回归方法对这里地最优值进行有效而合理地筛选,之后将筛选得到地多个理化指标给与拟合,并对其进行图像分析,得出筛选出来地5个一级指标就可以反映出整体地关系,最后应用这个结果论证出:用葡萄和葡萄酒地理化指标来判断葡萄酒地质量是不全面地.关键词:葡萄酒地评价 T检验层次分析法多元线性回归分析逐步回归法1 问题重述目前在现实生活中,确定葡萄酒质量时一般是通过聘请一批有资质地评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒地质量.酿酒葡萄地好坏与所酿葡萄酒地质量有直接地关系,葡萄酒和酿酒葡萄检测地理化指标会在一定程度上反映葡萄酒和葡萄地质量.题目中附件1给出了某一年份一些葡萄酒地评价结果,附件2和附件3分别给出了该年份这些葡萄酒地和酿酒葡萄地成分数据.现需完成以下任务:(1)要分析出两组评酒员评价结果地显著性差异,并确定出哪一组结果更可信;(2)在解决问题(1)地基础上,根据酿酒葡萄地理化指标和葡萄酒地质量对这些酿酒葡萄进行分级;(3)在解决完问题(1)与(2)之后,还要对酿酒葡萄与葡萄酒地理化指标进行分析,从而确定他们之间地联系;(4)结合上面三个问题地结果,分析酿酒葡萄和葡萄酒地理化指标对葡萄酒质量地影响,并论证能否用葡萄和葡萄酒地理化指标来评价葡萄酒地质量.2 问题分析2.1 问题(1)地分析该问题要求通过对附件1两组评酒员地葡萄酒品尝评分表中地数据作出综合性评价.题目给出了两组评酒员(每组10人)分别对27种红葡萄酒和28种白葡萄酒地评价分数,该问题旨在从给出地评价分数中找出差异地显著程度,并从中确定出哪一组评酒员地结果更具可信性.对于解决评价结果是否具有显著差异性问题实质是一个两独立样本地T检验问题,他满足检验地前提条件,考虑到方差是表示一组数据分布地离散程度,方差越大,说明变量值地差异越大,距离平均数这个“中心”地离散趋势越大,我们通过建立两独立样本地T 检验模型,很好地解决了两组评价结果有误显著差异性问题.而对于两组评酒员给出地评分结果地可信程度问题,我们通过简单计算得到两组样本地平均值地方差,并作出两个葡萄酒样品评价结果分析折线图,通过对图形反映出来两个评分样本地波动剧烈程度可以知道该样本对应地评酒员打分地可信性.对于这个问题,也可采用信度分析法,通过SPSS进行数据分析,得到两组数据地可信度值,进而得到哪一组数据更可信.2.2 问题(2)地分析该问题是一个根据所给地数据特点进行综合地分析,研究对各种酿酒葡萄地多个方案地分级问题.我们应该对评价对象地各个指标地联系进行综合性评价.综合评价地方法有多种,诸如模糊综合评判、灰色关联等,对与此种多属性问题,可以借助“空间距离”概念地角度来解决,这样就可以通过逼近理想解排序法(TOPSIS法)建立“逼近理想解地排序模型”,其过程为:首先从问题(1)中数据地可信性判断模型中找出一组可行性较高地样品酒质量地排序结果,并对该组评价对象地各个评酒员地评价指标均找出最优值,设成正理想值;对该组评价对象地各个评酒员地评价指标均找出最劣值,设为负理想解,分别计算每一个评价对象到正理想解和负理想解地距离,从而得到每种酒地各个评价指标地贴近度,应用数据中地权重,计算出最终各酒品种地贴近度,进而排名,得到各个酒品种地贴近值.同时对附件2中地酿酒葡萄各指标数据整合,并筛选出成分含量相对较多地几种指标,结合各个酒品种地贴近值,通过“层次分析法”中地排序模型计算各个指标地权重,进而计算出最终地各个酿酒葡萄地指标总值,进而对其分级.2.3 问题(3)地分析问题(3)要求对建立酿酒葡萄和葡萄酒地理化指标之间地联系.首先,我对附件2地各个理化指标进行整体地分析得出二级理化指标地总和近似等于相应地一级指标,因此我们就只用一级理化指标来建立多元回归模型,并采用“逐步回归(stepwise regression )”地方法,对众多理化指标有效地选出核心地理化指标,并通过对这些核心指标进行适当地拟合,最后得出酿酒葡萄和葡萄酒之间地相对关系.2.4 问题(4)地分析问题(4)主要是要求我们对酿酒葡萄和葡萄酒地理化指标对葡萄酒质量影响地分析.我们采用了问题(3)地处理方法——多元回归分析中地“逐步回归(stepwise regression )”法,分别对酿酒葡萄和葡萄酒地理化指标与葡萄酒质量进行数据拟合,进而得出对葡萄酒影响成正相关和负相关地相应物质地分类,得出结论.3 模型地假设及符号说明3.1 模型地假设(1)假设两组样本之间彼此独立,且来自两个服从正态分布地总体;(2)假设两组样本数据地总体方差相等,即2212=σσ;(3)假设所调查到地数据真实可靠,能很好地反映出大部分人地看法; (4)假设所有地评酒员评酒时地外部环境相同,评酒时不考虑外界因素地影响; (5)假设问题中提供地每个评酒员所打地分数能够充分地反映出每个酒样品地真实情况; (6)假设每个评酒员在评价每个酒样品时互不影响,而且具有互补性,即每个组地评分员地评分水平相当;(7)假设计算时附件3中空白处数据默认为0;(8)假设酿酒葡萄中对所酿地葡萄酒影响较小地成份予以不计;(9)假设由于白葡萄酒和白葡萄一级指标中地白藜芦醇含量都比较少,视为白葡萄对白葡萄酒地影响较小,即白葡萄对白葡萄酒中地白藜芦醇影响较大地指标没有;3.2 符号地使用及说明i 表示i 号评分工程(1,2,i =…,10) j 表示j 号评酒员(1,2,j =…10)k 表示第k 号酿酒葡萄地样品(对于红葡萄1,2,,27k =;对于白葡萄1,2,,28k =)ij x 表示评酒员j 在评分工程i 之下地取值k M 表示酿酒葡萄地样品k 号地数据样本均值k S 表示酿酒葡萄地样品k 号地数据样本均值地方差,即:1021()10jk k j k x M S =-=∑k S 表示红/白葡萄酒第j 个酒样品地评分方差地平均值ij f 表示每个样品酒中评酒员j 在评分工程i 上给出地分值 ij r 表示每个样品酒地每一个分值ij f 无量纲化之后地结果ij v 表示评价工程j 对于评酒员i 地权重j D + 表示是在评分工程j 下地正距离尺度 j D - 表示在评分工程j 下地付距离尺度j C 表示在评分工程j 下地理想贴近度4 模型地建立与求解4.1问题(1)地模型建立与求解4.1.1 基于方差分析法地显著差异性评价模型根据对问题(1)地分析,建立“两独立样本T 检验”模型.首先可以将附件1中地数据按照不同地评酒员和相同地样品酒分成两类,一类是红葡萄酒地评分结果,一类是白葡萄酒地评分结果,其中每一类包括两个样本,样本一是第一组评酒员给出地每个酒样品地得分平均值,样本二是第二组评酒员给出地每个酒样品地得分平均值.并由假设可以知道他们地总体得分服从正态分布,且都是相互独立地.因此我们可以建立“两独立样本T 检验”模型来进行样本数据体现出地方差进行较好地分析,进而可以根据T 检验原理判断出每类评分结果地两个样本之间是否有显著性差异.首先对附件1地数据进行如下处理:用EXCEL 软件实现对样本一中各个酒样品地得分平均值(如表4-1)表4-1第一类样本一中地酒样品1地得分平均值计算那么在通过对各个总和地求平均值,即得到样本一中地酒样品1总得分地平均值1M =62.7对之后地各个酒样品得分重复上述操作可得红葡萄酒地评分均值地样本一和样本二,以及白葡萄酒地评分均值地样本一和样本二(如表4-1)表4-2 对于红、白葡萄酒地两个样本均值和样本方差表由假设(3)可以知道两样本地总体方差未知且不相同,故而我们可以依据T 统计量地计算公式:0x x t = (2)计算得出第一类地0x t 统计量0x t ≈10.8135T 统计仍然服从T 分布,但由自由度采用修正地自由度:2212122222121212S S n n f S S n n n n +=⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭+ (3)通过查寻T 分布表我们得到()i t f ≈0.2704, 显然0x t >()i t f从两种情况下地T 统计量计算公式可以看出,如果待检验地两样本均值差异较小,0xt 较小,则说明两样本地均值不存在显著差异;反之,0x t 越大,则说明两个样本地均值存在显著差异性.进而说明第一类评分数据具有显著地差异.对于地第二类数据地两个样本我们做同样地分析,最后计算得到0y t ≈0.5300()j t f ≈0.500显然0y t >()j t f即说明对于第二类地数据均值也存在显著地差异 4.1.2 基于可信性建立模型在表1-1地基础之上我们对已经得到地样品得分地各个平均值(M )进行求方差(s1)得到表4-3,和表4-4表4-3红葡萄酒得分数据样本一平均值方差表酒样品1234567891011121314样本方差(s1)92.900 39.7888 45.8222 108.044 62.0111 59.7333 103.611 44.0111 32.9444 30.400 70.766 79.655 44.933 36.00015161718192021222324252627品样本方差85.56618.10088.01147.21147.37726.044116.10050.62232.48874.88864.62231.28849.777(s1)表4-4 红葡萄酒得分数据样本二平均值方差表酒样品i1234567891011121314样本方81.87716.22230.71141.28813.65521.12262.67765.11125.73336.17738.04425.12215.28823.155差(s2)15161718192021222324252627样本方差41.34420.19.166650.26655.15539.06635.51124.26624.76610.72243.73341.55520.500(s2)综合表4-3和表4-4画出:图4-1红葡萄酒总得分数据样本方差分析折线示意图再根据对图4-1地观察分析,考虑到方差是表示一组数据分布地离散程度地平均值,方差越大,说明变量值地差异越大,距离平均数这个“中心”地离散趋势越大,进而说明第一组地评酒员在同一酒样品上评分标准地分歧就越大,也就说明有改组评酒员给出地分数是相对不可信地(这个标准是根据在各种评价活动中都遵循地约定,目地正是为了数据地可信性).显然从图4-1中看出样本一样本均值地方差明显高出样本二(即第一组酒样品地方差)我们可以得到对于红酒地质量评价地两组评价结果具有显著地差异,其中第二组地数据更具有有效性.同理:对第二类样本得分数据地相似分析得出:表4-5酒样品i1234567891011121314样本方差92.222201.06666.45544.711126.444162.71139.166183.60092.766212.679177.122115.788170.767114.222(si)样本方差131.600178.000144.179156.54446.40064.400172.711138.66643.655111.12233.87872.900144.40080.455(si)表4-6酒样品i1234567891011121314样本方25.87849.067142.48942.10026.27822.72242.178/31.122106.26770.40087.822140.04446.76715.878差(si)样本方差54.04482.23338.45630.23326.04450.04464.453.611.638.544106.500102.90035.55625.378(si)根据两组评酒员对28种酒样品地方差平均值,用EXCEL软件画出图像如图4-2:图4-2白葡萄酒总得分数据样本方差分析折线示意图对图4-2地观察分析,我们发现两组白葡萄酒样品地平均值方差值地变化情况相对均衡,表明我们地假设(1)具有合理性.再从图4-2地两组样本均值地方差值进行同对图4-1地相同分析,并根据数据同样地有效性分析,我们仍然得到关于白葡萄酒地质量评价地两组评价结果中第二组样本评价数据更具有有效性.4.2 问题(2)地模型建立与求解问题(1)解决了我们选取样本数据地可信性问题,所以我们将采用附件1中地第二组评价员评价数据对酿酒红、白葡萄进行分级评价.4.2.1建立“逼近理想解”地排序模型首先根据逼近理想解排序法(TOPSIS 法)建立“逼近理想解地排序模型.选取数据中地10个评分工程作为n 个评价指标,选取10个评酒员作为m 个评价目标,那么构成了一个10阶地矩阵()210ijf (即:决策矩阵),并在EXCEL 软件中输入样品酒1地决策矩阵如下:表4-7对上面地数据用TOPSIS 法中地公式ij f r =进行无量纲话处理得到了关于样品酒1决策矩阵对应地规范化矩阵()210ij r ,在EXCEL 中地得出:表4-8规范化矩阵澄清度 0.296 0.296 0.296 0.394 0.099 0.394 0.296 0.394 0.296 0.296色调0.329 0.247 0.329 0.329 0.247 0.329 0.411 0.329 0.329 0.247纯正度 0.426 0.255 0.341 0.170 0.255 0.341 0.255 0.426 0.341 0.255 浓度 0.339 0.339 0.339 0.226 0.226 0.396 0.339 0.226 0.339 0.339 质量 0.348 0.290 0.405 0.232 0.290 0.348 0.290 0.348 0.290 0.290 纯正度 0.243 0.324 0.406 0.162 0.243 0.406 0.324 0.324 0.324 0.324 浓度 0.213 0.373 0.373 0.106 0.213 0.373 0.373 0.319 0.319 0.373 持久性 0.261 0.365 0.313 0.261 0.261 0.365 0.365 0.261 0.365 0.313 质量0.297 0.365 0.434 0.228 0.228 0.297 0.297 0.365 0.297 0.297平衡/整体评价 0.337 0.337 0.300 0.262 0.262 0.337 0.300 0.337 0.337 0.337根据题目附表1中地数据我们得出每种样品酒每个评价指标地权重,如表4-9表4-9评价指标地权重1j w外观分析 香气分析口感分析平衡/整体评价澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量0.050.100.060.08 0.160.060.080.08 0.22 0.11即得评价指标地权重矩阵()110ijw ⨯,再次根据TOPSIS 法计算权重矩阵()1010ijv ⨯,()()()221010110ij ij ij v f w ⨯= (5)在EXCEL 中地得出()1010ijv ⨯结果如下:表4-10权重矩阵()1010ij v ⨯澄清度0.015 0.015 0.015 0.020 0.005 0.020 0.015 0.020 0.015 0.015 色调 0.033 0.025 0.033 0.033 0.025 0.033 0.041 0.033 0.033 0.025 纯正度 0.026 0.015 0.020 0.010 0.015 0.020 0.015 0.026 0.020 0.015 浓度 0.027 0.027 0.027 0.018 0.018 0.032 0.027 0.018 0.027 0.027 质量 0.056 0.046 0.065 0.037 0.046 0.056 0.046 0.056 0.046 0.046 纯正度 0.015 0.019 0.024 0.010 0.015 0.024 0.019 0.019 0.019 0.019 浓度0.017 0.030 0.030 0.009 0.017 0.030 0.030 0.026 0.026 0.030 持久性0.021 0.029 0.025 0.021 0.021 0.029 0.029 0.021 0.029 0.0250.065 0.080 0.095 0.050 0.050 0.065 0.065 0.080 0.065 0.065 平衡/整体评价 0.037 0.037 0.033 0.029 0.029 0.037 0.033 0.037 0.037 0.037对于()1010ijv ⨯矩阵地第1行中地元素取其中地最大值,记为1max i v ,那么整个()1010ijv ⨯矩阵地每一行都取最大值则得到正理想解:()()12101210=max ,max ,,max ,,,i i i i v v v v v v α+++=对于()1010ijv ⨯矩阵地第1行中地元素取其中地最小值,记为1min i v ,那么整个()1010ijv ⨯矩阵地每一行都取最小值则得到负理想解:()()12101210=min ,min ,,min ,,,i i i i v v v v v v β---=再根据TOPSIS 法计算正负距离尺度D +、D -公式jD +=(6)j D -=(7)计算得出各个评价地正负距离尺度值表如下:表4-11 样品酒1地各个评价指标正负距离尺度值表评价指标 正距离尺度j D +负距离尺度j D -澄清度 0.019 0.035 色调 0.035 0.026 纯正度 0.027 0.030 浓度 0.026 0.026 质量 0.052 0.047 纯正度 0.023 0.031 浓度 0.029 0.055 持久性 0.018 0.018 质量 0.095 0.071 平衡/整体评价0.0130.021现在用已经求得地理想解地正负距离尺度值按照公式j j jjD C D D-+-=+ (8)得到关于样品酒1地各个评价指标地理想贴近度如下表:表4-12 关于样品酒1地各个评价指标地理想贴近度澄清度 色调 纯正度 浓度 质量 纯正度 浓度 持久性 质量 平衡/整体评价以上是第二组红葡萄酒样品1评价地各方面地理想贴近度,酒样品2到酒样品27依照酒样品1地算法,计算结果如下表所示:表4-13 第二组红葡萄酒每种酒样品评价地各方面地理想贴近度数据整合,计算出第二组红葡萄酒每种酒样品地理想贴近度,计算结果如下表所示:表4-14第二组红葡萄酒每种酒样品地理想贴近度4.2.2理想贴近度地求解根据第二组红葡萄酒每种酒样品评价地各方面地理想贴近度和每种酒样品地理想贴近度地相同算法,分别算出第二组白葡萄酒每种酒样品评价地各方面地理想贴近度和第二组白葡萄酒每种酒样品地理想贴近度,计算结果如下表所示:表4-15 第二组白葡萄酒每种酒样品地理想贴近度根据所得地第二组白葡萄酒每种酒样品评价地各方面地理想贴近度,再利用权重进行数据整合,计算出第二组白葡萄酒每种酒样品地理想贴近度,计算结果如下表所示:表4-16第二组白葡萄酒每种酒样品地理想贴近度理想贴近度0.45310.57580.64530.51570.43210.50880.50690.56080.6032酒样品10酒样品11酒样品12酒样品13酒样品14酒样品15酒样品16酒样品17酒样品18理想贴近度0.52390.49910.59820.56010.47010.56400.48590.54030.4501理想贴近度0.55330.53880.61410.52520.46110.51890.62320.54330.50730.4903根据逼近理想解排序法(TOPSIS法)建立“逼近理想解地排序模型”地模型原理联合酒地质量评价是由评酒员地打分作为直接判断地标准.从而分析表4-15和表4-16中地理想贴近度,得出关于红葡萄酒和白葡萄酒地质量排序如下:表4-17 红和白葡萄酒地质量排序表4.2.3筛选核心理化指标对酿酒葡萄地核心理化指标处理.通过对附表2中地酿酒红、白葡萄地成分含量地数据进行合适地处理,具体叙述如下:把每个评价指标下地多次测量值予以平均化得到均值,同时把总糖、还原糖、果糖、葡萄糖归纳为一类总成分糖类,此外我们将影响酿酒葡糖地较小地成分(包括干物质、果穗、百粒、果梗等)进行忽略处理,这样我们得到酿酒红、白葡萄各种成份含量地数据,并针其处理后地数据中地每一成分含量画出描述性折线图如附录中地附件[3],从中可以看出,在红、白葡萄酒这两个样本中地每个评价指标地之间地关系.根据附件[3],我们可以运用权重法,选出权重大地物质,舍去权重小地物质,进而筛选出了:氨基酸、糖、蛋白质三种所占权重比较大地物质,从而进行权重地计算.4.2.4建立“层次分析法”地排序基于“层次分析法”评价模型建立分级模型对葡萄进行分级.观察上面所筛选出地各种酿酒葡萄主要地三种成份含量与相应酒样品地贴近值(见附件[2])相结合,根据调查抽样地方法,运用层次分析法中计算权重地判断决策矩阵标度,其标准如下图:表4-183组决策正负反矩阵数据,如下:表4-19第一组C1C2C3C4C11379C2 1/3 1 2 5 C3 1/7 1/2 1 4 C4 1/9 1/5 1/4 1 第二组 C1 C2 C3 C4 C1 1 5 7 9 C2 1/5 1 3 7 C3 1/7 1/3 1 3 C4 1/9 1/7 1/3 1 第三组 C1 C2 C3 C4 C1 1 5 5 9 C2 1/5 1 3 6 C3 1/5 1/3 1 4 C41/91/61/41运用MATLAB 软件分别求上面3组决策正负反矩阵地特征值,并选取其最大特征值(需满足4i λ≥,其中4为上面决策正负反矩阵地阶数),用MA TLAB 计算其相应地特征向量,即为所对应地权重向量,其值如下:第一组 特征值:1:4.1144 2:0.0232最大特征值所对应地特征向量:[0.615113,0.216972,0.121864,0.045724]第二组 特征值:1:4.2058 2:-0.0699最大特征值所对应地特征向量:[0.651658,0.216248,0.090468,0.041626]第三组 特征值:1:4.2413 2:-0.1987最大特征值所对应地特征向量:[0.62683,0.219381,0.112356,0.041433] 再运用权重算法,计算权重矩阵()271ija ⨯()()()41271274ij ij i a b w ⨯⨯⨯= (9)其中()274ijb ⨯表示附录[2]中地红葡萄3种重要成份和红葡萄酒地贴近值所组成地27行4列地矩阵;()41i w ⨯表示上表中地特征向量地转置.进而运用同样地理论,计算出红葡萄地3组计算总值,如下:表4-20由于上面地3组数据是在相同地理论下,不同地人对其确定地决策正负反矩阵,因而我们对这三组数据进行求平均值处理,进而得出最终各种红葡萄样品地总数值,如下:表4-21葡萄样本71117122034113295824平均值1611.7481594.8381198.641727.8861545.25426.4131459.4161396.1571008.0231468.551555.7611278.9191348.0611140.822平均值1728.74646.31511092.7274119.3751614.4965.1831485.805893.4853371665.6952284.4971621.82608994.0416810.8982根据上面各种葡萄样品地平均值地大小,做出图像如下:图4-3红葡萄样品地总数值观察图中点地分布关系,显然有值越大,葡萄越好,因此我们运用27种红葡萄地总数值地大小来分级,即分为1000、2000、4000、5000四个级别(级别越高,葡萄越好),进而通过上面地图像对27种红葡萄进行分级,即靠近上面所给级别越近地(运用距离来算)就视为一级.则则级别由高到低分类为四星级★★★★、三星级★★★、二星级★★、一星级★(如表4-21所示):表4-21 红葡萄分级表我们在根据同样地标准,对附录[2]中白葡萄地4组数据进行调查取值,最后随机抽取3组决策正负反矩阵数据,如下表:表4-22第一组C1C2C3C4C11759C21/711/35C31/5317C41/91/51/71第二组C1C2C3C4C11669C21/611/25C31/6216C41/91/51/61第三组 C1 C2 C3 C4 C1 1 6 5 9 C2 1/6 1 1/2 6 C3 1/5 2 1 7 C41/91/61/71运用MATLAB 软件分别求上面3组决策正负反矩阵地特征值,并选取其最大特征值(需满足4i λ≥,其中4为上面决策正负反矩阵地阶数),用MA TLAB 计算其相应地特征向量,即为所对应地权重向量,其值如下:第一组特征值:1:4.3126 2:-0.2282最大特征值所对应地特征向量:[0.644695, 0.105339, 0.212811, 0.037154]第二组特征值:1:4.2647 2:-0.1477最大特征值所对应地特征向量:[0.660287, 0.121033, 0.179635, 0.039045]第三组特征值:1:4.2788 2: -0.1232最大特征值所对应地特征向量:[0.637366, 0.129541, 0.196353, 0.03674]在运用权重,计算权重矩阵()281ija ⨯()()()41281284ij ij i a b w ⨯⨯⨯= (10)其中()274ijb ⨯表示附录[2]中地白葡萄3种重要成份和白葡萄酒地贴近值所组成地28行4列地矩阵;()41i w ⨯表示上表中地特征向量地转置.进而运用同样地理论,计算出白葡萄地3组计算总值,如下:表4-23由于上面地3中数据是在相同地理论下,不同地人对其确定地决策正负反矩阵,因而我们对这三组数据进行求平均值处理,进而得出最终各种白葡萄样品地总数值,如下表:表4-24葡萄样本 325 21 9 12 2 15 8 13 19 26 17 20 22总数值 3352.212 1630.214 1119.782 1353.261 1214.965 1319.089 1829.579 919.6685 524.2811 625.7586 1448.884 845.808 1427.083 1035.761 葡萄样本 10 244 6 27 7 11 28 16 14 23 1 18 5总数值 1464.358 2110.297 1452.886 1296.478 1723.642 1218.174 1120.245 2551.619 737.3046 1102.443 1091.638 928.6894 943.5863 1821.606 根据上面各种葡萄样品地平均值地大小,做出图像如下:图4-4白葡萄样品地核心指标总数值观察图中点地分布关系,显然有值越大,葡萄越好,因此我们运用28种白葡萄地总数值地大小来分级,即分为1000、1500、2000、2500四个级别(级别越高,葡萄越好),进而通过上面地图像对28种白葡萄进行分级,即靠近上面所给级别越近地(运用距离来算)就视为一级.则级别由高到低分类为四星级★★★★、三星级★★★、二星级★★、一星级★(如表4-25所示):表4-25白葡萄分级表4.3 问题(3)地模型建立与求解根据附表2中地酿酒葡萄与葡萄酒地质量地理化指标进行综合性分析,得出第二级理化指标之总和近似地等于相应地一级指标,因而就只计算一级指标(红、白葡萄均有30种),在计算一级指标之前,首先对一级指标(酿酒葡萄和葡萄酒均要计算)下地多重数据进行求平均值处理,即为该级指标地最优值.用i X (1,2,,30i =)表示酿酒葡萄中地各一级指标地最优值.用j Y (红葡萄酒1,2,,9j =,白葡萄酒j 1,2,,8=)表示葡萄酒中地各一级指标地最优值.4.3.1建立多元回归模型并针对处理后得到地理化指标地最优值,建立多元回归模型并运用逐步回归方法对这里地众多最优值进行有效而合理地筛选.采用MA TLAB 软件对酿酒红、白葡萄地30种一级指标进行筛选,筛选程序见附录中地附件[1],其筛选后地结果分别如下:(1)酿酒红葡萄地筛选结果:与1Y 相对应地一级指标筛选后影响较大地一级指标有:4X 、26X ;与2Y 相对应地一级指标筛选后影响较大地一级指标有:1X 、8X 、9X 、10X 、18X ; 与3Y 相对应地一级指标筛选后影响较大地一级指标有:4X 、11X ; 与4Y 相对应地一级指标筛选后影响较大地一级指标有:11X ;与5Y 相对应地一级指标筛选后影响较大地一级指标有:2X 、4X 、5X 、6X 、13X 、14X ;与6Y 相对应地一级指标筛选后影响较大地一级指标有:11X ;。
2021葡萄酒质评的数学建模分析范文2
2021葡萄酒质评的数学建模分析范文 摘要: 已知酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系, 葡萄酒和酿酒葡萄监测的理化指标会在一定程度上反映葡萄酒和酿酒葡萄的质量等条件, 建立模型解决问题。
文章主要通过正态分布、方差检验, 建立主成分分析、多元线性回归、聚类分析、相关系数和逐步回归模型来解决问题。
关键词: 葡萄酒;正态分布; 主成分分析; 多元线性回归; 聚类分析; Abstract: Itis known that the quality of wine grapes has a direct relationship with the quality of the wines being brewed. The physical and chemical indicators of wine and wine grape monitoring will ref lect the conditions of wine and wine grapes to some extent, and establish models to solve problems. This paper mainly solves the problem by using normal distribution and variance test, establishing principal component analysis, multiple linear regression, cluster analysis, correlation coefficient and stepwise regression model. Keyword: wine;normal distribution; principal component analysis; multiple linear regression; cluster analysis; 确定葡萄酒的质量好坏需要有资质的评酒员对其进行分类指标打分,最后综合确定葡萄酒的质量。
2012高教社杯全国大学生数学建模竞赛A题葡萄酒的评价论文范文
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):云南财经大学参赛队员(打印并签名) :1.鲁厚华2.李雅楠3.梁丽容指导教师或指导教师组负责人(打印并签名):陈龙伟日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):题目 A题葡萄酒的评价摘要:本文研究的是葡萄酒的评价问题。
通过对酿酒葡萄和葡萄酒的理化指标、芳香物质进行分析,统计出两组评酒员的评价结果,计算酿酒葡萄中影响葡萄酒质量重要指标的几个主要成份,建立相应的数学模型,得出最好的评价方法。
问题一,运用SPSS11.5分析两组评酒员的评分结果,分别求出它们的均值、标准差和离散系数,通过这三个系数来评价两组之间的差异性以及哪组结果更可信。
问题二,我们采用多元统计分析方法中的聚类分析对酿酒葡萄的理化指标进行了简化,选出酿酒葡萄中最具代表的几种理化指标,再运用相关系数分析他们对葡萄酒品质的影响程度,从而进一步结合酿酒葡萄的理化指标和酒的质量对葡萄进行分级。
2012年全国数学建模大赛 A题葡萄酒的评价
葡萄酒的评价摘要本文就影响葡萄酒的质量的因素进行了探究。
在问题一中,评酒员间存在评价尺度、评价位置以及评价方向等方面的差异,导致不同评酒员对同一酒样的评价差异很大,于是我们需要探讨两组评酒员的可信度。
对此,我们建立了单元素方差模型对其进行了显著性差异的判断,最后我们得出结论:两组评酒员的评价结果有显著性差异,并且第二组评酒员评价的结果更加可信。
在问题二中,我们首先将大量的数据进行了样本住分析塞选,大大减少了计算量,就红、白葡萄酒前17组样本葡萄酒的分数进行训练,由后十组的理性指标进行检验,也可检验俩个的准确性。
最后我们认为可以给酿酒葡萄分为一、二、三、四四个等级。
在问题三中,因为要讨论酿酒葡萄与葡萄酒的理化指标之间的联系,我们就其两者的重要理化指标进行了探讨,应用了回归模型将其各项重要指标进行了多元拟合处理,最后得出了葡萄酒和酿酒葡萄中的重要指标的等式关系。
在问题四中,我们首先利用了回归原理求得葡萄酒质量与葡萄酒和酿酒葡萄的理化指标之间的等式关系,由等式和图像细致的分析了葡萄酒和酿酒葡萄理化指标对葡萄酒质量的影响。
在一定范围内,理化指标的与葡萄酒的质量呈正相关,达到一定的量后呈现负相关趋势。
关键词:显著性差异判别主成分分析 BP神经网络回归模型1.问题的重述现今社会,随着人们生活水平的提高,人们对葡萄酒的质量要求也越来越高。
在确定葡萄酒质量的时候,一般聘请一批资深的评酒员进行评比,根据不同的指标所得的分数从而求得总分,以此确定葡萄酒的质量。
其中酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本题给出了3份材料,材料1是某一年份一些葡萄酒的评价结果,材料2和材料3分别给出了该年份这些葡萄酒和酿酒葡萄的成分数据。
我们必须解决以下问题:问题一:分析材料1中两组评酒员的评价结果是否有明显的差异,并且求出哪组评酒员的评价结果更可信。
问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄的品质进行分级。
大学生数学建模竞赛A题优秀论文A题葡萄酒定稿版
大学生数学建模竞赛A 题优秀论文A题葡萄酒 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显着性差异,对于白葡萄酒只有53%的评价结果存在显着性差异。
通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显着性差异,而对于白葡萄酒的评分,评价差异性较为不明显。
为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。
综合来看,主观因素对葡萄酒质量的评价具有不确定性。
结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。
将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。
为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显着的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。
数学建模葡萄酒论文
题目:葡萄酒的评价摘要关键词:可信度分析,K-S正态性检验,配对样本t检验,kruskal-wallis检验,主成分分析一、问题重述1.1背景为确定一批红葡萄酒的质量,现聘请两组评酒师对其进行品评及按分类指标打分。
求和得到的总分便是红葡萄酒的质量。
红葡萄酒是由葡萄皮和果肉综合酿造得到的,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
1.2需要解决的问题我们尝试通过三个附件所给出的数据,建立数学模型讨论以下问题:问题(1):分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?问题(4):分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型分析2.1问题(1)的分析题目要求我们根据两组评酒员对27种红葡萄酒的10个指标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著性差异,然后判断哪组评酒员的评价结果更可信。
初步分析可知:由于评酒员对颜色、气味等感官指标的衡量尺度不同,因此两组评酒员评价结果是否具有显著性差异应该与评价指标的类型有关,不同的评价指标的显著性差异可能会不同。
基于以上分析,我们可以分别两组品尝同一种类酒样品的评酒员的评价结果进行两两配对,分析配对的数据是否満足配对样品t检验的前提条件,而且根据常识可知评酒员对同一种酒的同一指标的评价在实际中是符合t检验的条件的。
接着我们就可以对数据进行多组配对样品的t检验,从而对西组评酒员评价结果的显著性差异进行检验。
由于对同一酒样品的评价数据只有两组,我们只能通过评价结果的稳定性来判定结果的可靠性。
而每组结果的可靠性又最终决定于每个评酒员的稳定性,因此将问题转化为对评酒员稳定性的评价。
2.2问题(4)的分析本题要求我们分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,同时论证能否能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
初步分析可知酿酒葡萄质量的好坏以及葡萄酒理化指标的合理会使醒出的葡萄酒的质量较好。
2012年全国大学生数学建模竞赛A题葡萄酒评价分析
2012年全国大学生数学建模竞赛A题葡萄酒评价分析葡萄酒是一种古老而神奇的饮品,它不仅有着悠久的历史,还拥有丰富的文化内涵和独特的口感。
在现代,葡萄酒已成为一种高品质、高雅的饮品,备受人们的青睐。
然而,如何准确地评价葡萄酒的品质,成为了学界和业界的一个共同难题。
本文将通过对2012年全国大学生数学建模竞赛A题的分析,探讨葡萄酒评价的数学建模方法。
1. 引言葡萄酒的评价一直以来是一项主观且复杂的任务。
传统的酒评方法主要依赖专业人士的经验和口感,但这种方法存在诸多不足。
为了解决这一问题,数学建模技术应运而生。
2012年的葡萄酒评价竞赛就是一个典型的例子。
2. 问题陈述2012年全国大学生数学建模竞赛A题要求参赛者基于给定的葡萄酒数据,利用数学模型对葡萄酒的品质进行评价。
竞赛提供的数据包括葡萄酒的理化指标、人工评分以及其他相关因素等。
3. 数据处理与分析为了对葡萄酒的品质进行准确评估,我们首先对提供的数据进行处理与分析。
通过统计学方法,我们可以计算出葡萄酒的平均评分、标准差等统计指标,从而评估数据的分布情况和变异程度。
此外,通过数据可视化技术,如散点图、箱线图等,我们可以观察数据的分布情况和异常值等。
4. 评价模型的建立基于提供的数据和问题要求,我们需要构建一个评价模型,来准确衡量葡萄酒的品质。
在建立模型时,我们可以考虑多个因素,如理化指标、人工评分等,并通过数学方法将这些因素进行权重分配、综合计算,从而得到一个综合评价指标。
例如,可以利用线性加权模型、层次分析法等来实现这一目的。
5. 模型求解与结果分析在完成评价模型的建立后,我们可以利用相应的数学算法对模型进行求解,并得到葡萄酒的评价结果。
通过分析结果,我们可以进一步了解葡萄酒品质的特点与变化趋势,为生产和消费提供科学依据和决策支持。
6. 模型的优化与改进为了提高评价模型的准确性和可靠性,我们可以进一步对模型进行优化和改进。
例如,引入更多的因素和数据,采用更复杂的数学方法,对模型进行验证和调整等。
数学建模论文葡萄酒的评价
数学建模论文---葡萄酒的评价承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):4198所属学校(请填写完整的全名):广东医学院(东莞校区)参赛队员(打印并签名) :1. 黄洁2. 顾家荣3. 陈婉君指导教师或指导教师组负责人(打印并签名):唐国平日期:2013年9月 9日编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒质量的评价模型摘要本文主要讨论了关于葡萄酒与葡萄之间关系的研究,主要分析了附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信;还根据酿酒葡萄的理化指标和葡萄酒的质量把这些酿酒葡萄分为3个等级;分析了酿酒葡萄与葡萄酒的理化指标之间的联系和酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
通过这些分析有益于对葡萄酒行业的发展有一定的贡献。
对于问题一,用10个品酒员对每种酒样品的总评分的来代表这种酒样品的质量,建立单因子数学模型,分别对两个水平进方差分析,由U检验,取置信区间为95%,最终得出两组品酒员对红葡萄酒的评分有显著性差异,对白葡萄酒的评分没有显著性差异。
萄葡酒的评价数学建模大赛国家二等奖论文--毕业设计
葡萄酒的评价摘要随着中国经济增长,葡萄酒也越来越普及化。
然而市场上也出现了葡萄酒造假现象。
于是怎样对葡萄酒进行评价越来越成为人民关注的重点。
本文就葡萄酒的评价问题进行了研究分析。
针对问题一,我们首先对附件1中各个指标的评分分数通过SAS软件进行归一化,得到一个统一的分数标准。
观察附件1所给的数据,我们发现少部分数据存在异常、缺失的情况,因此我们先分别用原始数据和处理后的数据通过SAS 软件对两组红葡萄酒之间,两组白葡萄酒之间进行正态性检验,结果得到正态性分布不太明显,所以继续用SAS软件对其进行配对两样本的非参数检验。
应用UNIVARIATE过程对数据进行检验后,得到两组品酒员对红、白葡萄酒的评价结果都存在显著性差异。
最后用假设检验的方法分别求两组品酒员评分的方差置信空间,接着进行方差比较,得出第二组品酒员的评价结果比较可信。
针对问题二,首先在EXCEL中整理附件2和附件3的数据,对测试多次的指标求平均值,将不同样品的芳香物质进行求和操作。
本题只考虑酿酒葡萄的一级指标,另外,将芳香物质也作为划分葡萄等级的标准之一。
然后对所要考虑的因素通过SAS软件进行主成分分析,留下主成分。
接着根据这些主成分,用WARD型相关分析。
首先考虑葡萄和葡萄酒所有指标之间的相关关系,用SAS软件进行分析后,发现两组指标之间的典型相关系数为1,所以剔除相关系数较大的葡萄指标,然后用剩下葡萄指标与葡萄酒指标再进行典型相关分析,得出酿酒葡萄与葡萄酒的理化指标之间的相关性很大,但不为1,说明两组指标之间的相关性很大,得出葡萄和葡萄酒理化指标之间联系密切。
针对问题四,根据问题三经过典型相关性分析得到的葡萄理化指标来讨论酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,建立多元线性回归模型,并通过MATLAB对所得模型进行残差分析和数据拟合,通过数据拟合图来论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,然后用残差图进行检验。
结果分析所建模型是合理的。
2012葡萄酒的评价
2012葡萄酒的评价(实用版)目录一、引言二、葡萄酒的评价标准三、葡萄酒与酿酒葡萄的关系四、数学模型的建立与应用五、结论正文一、引言2012 年全国大学生数学建模竞赛中的一道题目引起了人们对葡萄酒评价的关注。
葡萄酒作为日常生活中的一种常见饮品,其质量评价对于消费者来说具有重要意义。
本文将从数学建模的角度分析葡萄酒的评价问题,探讨葡萄酒与酿酒葡萄之间的关系。
二、葡萄酒的评价标准葡萄酒的质量评价主要取决于感官评价,包括外观、口感和香气等。
此外,葡萄酒的理化指标,如酸度、甜度、酒精度等也会影响其品质。
为了全面评价葡萄酒的质量,需要建立一个综合性的评价体系。
三、葡萄酒与酿酒葡萄的关系葡萄酒的质量是由酿酒葡萄的成分决定的。
酿酒葡萄的种类、产地、成熟度等都会影响葡萄酒的品质。
因此,研究酿酒葡萄与葡萄酒之间的理化关系对于葡萄酒的评价具有重要意义。
四、数学模型的建立与应用为了探究酿酒葡萄成分与葡萄酒品质之间的理化关系,我们可以建立以下三个数学模型:1.打分可信度模型:通过显著性分析和打分一致性分析,对评酒员给出的分数进行可信度评估。
2.酿酒葡萄等级评价模型:采用层次分析法和模糊层次分析法,根据酿酒葡萄的化学成分对其进行评价,分为五个等级:不好、一般、好、很好、完美。
3.理化指标相关关系模型:采用逐步回归分析的方法,判断酿酒葡萄中的理化指标与葡萄酒自身的指标的相关关系,发现酿酒红葡萄的理化指标数多于白葡萄。
利用主成分分析法降维。
五、结论通过建立数学模型,我们可以从多个角度全面评价葡萄酒的质量,为消费者提供参考。
数学建模大赛论文葡萄酒质量分析
葡萄酒基于数据驱动的葡萄酒质量评定摘要:如何在当今复杂的社会中让我们国家能对葡萄酒的好坏进行准确的鉴定,如何对酒产品的质量严格把关成为人们最关切的问题,也是政府要解决的当务之急.对于显著性差异我们运用基于成对数据的检验(t检验),对于可信度分析我们运用各组样品中10位人员的方差,再对27组数据方差求均值。
对应进行比较得出那组更可信。
对于第二个问题我们运用了主成分析,聚众分析对葡萄进行分级。
然后利用典型性相关分析对酿酒葡萄与葡萄酒理化指标之间的联系。
最后利用了数据拟合以及多元线性回归分析出酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响。
关键词:葡萄酒酿酒葡萄基于成对数据检验理化指标主成分析聚类分析典型相关分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
根据酿酒葡萄和葡萄酒的理化指标与成分数据讨论下述4个问题1.两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?5.关于哪一组更可信我们不能简单地求每一组各个平均值的中整体纵向方差,因为其不是等重复性试验我们可以看做同一个人做每件事的方差,我们可以对27组方差求均值进行比较他们的稳定性这样做起来可以避免酒样好坏的评分结果对方差的影响我们利用此种模型可以解决那组更可信的问题5.要对酿酒葡萄进行分级,我们要假设葡萄酒的质量以及酿酒葡萄的理化指标与葡萄酒的级别存在一定的关系6.我们首先要假设它们存在一定的模型关系,然后利典型相关分析进行处理得到一定的关系然后我们总结这些关系给问题下一个结论7.假设他们之间存在一定的线性关系,我们对数据进行拟合与多元线性回归分析二、模型的假设与符号说明1.假设把一二组关于同一样本。
2012年数学建模葡萄酒的评价一等奖论文
2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话): 20122129 所属学校(请填写完整的全名):参赛队员 (打印并签名) :1.2.3.指导教师或指导教师组负责人 (打印并签名):日期: 2012年 9月 9日赛区评阅编号(由赛区组委会评阅前进行编号):2011高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):A题葡萄酒的评价一,摘要第一问中,我们通过T-检验来判断两组评酒员的评价结果有无显著性差异,结果发现两组评酒员的评价结果无显著性差异;对红,白葡萄各自两组的可信度分析,我们引入稳定性指标X,即将每一组的十位品酒师对于同一样品所有指标所给的分求标准差并根据指标所占分数进行相应的加权求和。
最后求出总平均稳定性指标,数值较小的可信度较高。
结果发现红,白葡萄酒均是第二组品尝评分较合理。
第二问中,首先对酿酒葡萄的一些特殊理化指标进行简化处理(如Ph值,芳香物质,果皮颜色),接着采用用无量纲化对所有数据进行处理。
将指标分级后运用熵值法求出各个指标所占权重。
使用topsis算法求出各评价对象与最优方案的接近程度并进行排序,将红葡萄酒酿酒葡萄分为7级,白葡萄酒酿酒葡萄分为5级。
2012年数学建模A题葡萄酒的评价论文[定稿]
2012年数学建模A题葡萄酒的评价论文[定稿]第一篇:2012年数学建模A题葡萄酒的评价论文[定稿]葡萄酒的评价一,摘要二,问题重述葡萄酒质量的评定一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?三,问题分析三,模型假设1,白葡萄酒样品3数据有明显错误,建模过程中涉及白葡萄酒样品3都不予考虑;四,符号规定及说明五,模型求解(一)求解问题一模型1 方差分析法感官评价专家组成员的异质性及其原因表一列出了由10名葡萄酒品酒员,采用国际葡萄与葡萄酒的评价方法.对27(个白葡萄酒样品的感官评价结果。
采用加分制。
即得分越高的样品,感官评价质量越高。
将品酒员看成不同的“区组”.对表1的结果行双向方差分析以减少误差方差.同时分析不同品酒员之间是否存在差异。
分析结果表明,由于品酒员之间存在显著性差异.根据两组数据离平均值分散范围的大小,可以得到第二组人员的可信度高。
但是由于各人评价尺度的差异、评价位置的差异、评价方向的差异的客观存在,使得我们得到的这个白葡萄酒品酒品酒品酒品酒品酒品酒品酒品酒品酒品酒样品员1 员2 员3 员4 员5 员6 员7 员8 员9 员1085 80 88 61 76 93 83 80 95 79 2 78 47 86 54 79 91 85 68 73 81 4 75 77 80 65 77 83 88 78 85 86 5 84 47 77 60 79 62 74 74 79 74 6 61 45 83 65 78 56 80 67 65 84 7 84 81 83 66 74 80 80 68 77 82 8 75 46 81 54 81 59 73 77 85 83 9 79 69 81 60 70 55 73 81 76 85 10 75 42 86 60 87 75 83 73 91 71 11 79 46 85 60 74 71 86 62 88 72 12 64 42 75 52 67 62 77 56 68 70 13 82 42 83 49 66 65 76 62 65 69 14 78 48 84 67 79 64 78 68 81 73 15 74 48 87 71 81 61 79 67 74 82 16 69 49 86 6570 91 87 62 84 77 17 81 54 90 70 78 71 87 74 92 91 18 86 44 8371 72 71 85 64 74 81 19 75 66 83 68 73 64 80 63 73 77 20 80 68 82 71 83 81 84 62 87 80 21 84 49 85 59 76 86 83 70 88 84 22 65 48 90 58 72 77 76 70 80 74 23 71 66 80 69 80 82 78 71 87 75 24 82 56 79 73 67 59 68 78 86 85 25 86 80 82 69 74 67 77 78 77 81 26 75 66 82 75 93 91 81 76 90 84 27 58 40 79 67 59 55 66 74 73 77 28 66 75 89 69 88 87 85 76 88 90 表一:第一组人员对白葡萄酒样品的评分通过上述分析.可以认为在感官评价中.每个品酒员都是“分析仪器”.而且它们有各自的准确度和精确度。
葡萄酒的鉴定 2012年数模国赛A题论文
关键字 :t 检验
主成分析法
典型相关分析
多元线性回归
1
一、问题重述
1.1 问题的背景 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定 葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和 酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1 给 出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些 葡萄酒和酿酒葡萄的成分数据。 1.2 问题的提出 请尝试建立数学模型讨论下列问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异, 哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、基本假设
1、假设所有的数据都是可靠的,不包括人为造成的不合理因素。 2、假设数据中的奇异数据和缺省值忽略后对总体信息不会有显著的影响。 3、评酒师对葡萄酒的质量打分能真实的反映葡萄酒质量的好坏。 4、忽略酿酒葡萄和葡萄酒的色泽对酒样品质量的影响。 5、酿酒葡萄的各理化指标,如蛋白质、氨基酸含量在正常范围内越高越好。
5
我们对附件一中的各个评酒员给各种酒的指标打的分数相加之后, 按照酒的 序号分红葡萄酒、白葡萄酒进行排序,见附件 2. 我们对先对第一组的十个评酒员对白葡萄酒的打分总分的一组数据数据进行处 理,把前面处理的数据输入到 SPSS 中,得到的 Q—Q 图,它的 sig 值为 0.449, 大于 0.05,所以所给数据服从正态分布。
葡萄酒的评价优秀论文
题目葡萄酒的评价摘要近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增,特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平,如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。
随着经济的高速发展,葡萄酒作为一种跨国际的交流饮品越来越受欢迎,大量的古籍表明,中国是世界葡萄的起源中心,所以也很有可能是葡萄酒的起源国家。
早在我国文化巨著诗经中,就有元代的酒,比起前代来要丰富得多。
红葡萄酒十分常见,而对应的白葡萄酒,能使人精神焕发,心身舒泰,当然还能解渴,使人陶然而醉。
白葡萄酒往往比红葡萄酒更具异香之质,而酿造能让它的芳香更上层楼。
白葡萄酒往往不像红葡萄酒那样贮藏愈久愈好,而能发展其复合性,在瓶中渐渐演化、增加风味的白葡萄酒就更少了。
本文对影响葡萄酒品酒员对葡萄酒质量评价的因素进行分析,建立数学模型。
问题一根据层次分析法对品酒员自己的嗅觉、味觉以及品酒场所和心情因素分析影响葡萄酒品酒员品酒好坏的因素并对这些因素进行排序。
通过建立层次分析,然后构造判断矩阵同时赋值的方法,用matlab求出该矩阵最大特征值及此特征值对应的特征向量对u进行归一化处理,得出权重系数向量,对权重系数向量进行一致性检验。
问题二要求研究两组品酒员的评价结果有无显著性差异,这便可通过葡萄酒品尝评分表中第一组和二组白葡萄酒和红葡萄酒进行分析比较,每组都十人,从酒的外观分析(澄清度、色调),香气分析(纯正度、浓度、质量),口感分析(纯正度、浓度、持久性、质量),最后得出酒样的整体评价,由于数据量大,涉及因素多,我们无法甄别,本文用spass软件进行分析,求出每位评酒员对每种葡萄酒样品的各项指标的均值,通过对各项指标的离散系数进行分析。
通过一致性检验的方法得出两组具有显著性差异,得出结论第一组更可信。
关键词层次分析法一致性检验matlab s p a s s一、问题重述1.1问题背景随着经济的高速发展,葡萄酒作为一种跨国际的交流饮品越来越受欢迎,大量的古籍表明,中国是世界葡萄的起源中心,所以也很有可能是葡萄酒的起源国家。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆工商大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定的程度上反映葡萄酒和葡萄的质量。
本论文主要研究葡萄酒的评价、酿酒葡萄的分级以及酿酒葡萄与葡萄酒的理化指标之间的相互关系问题。
对于问题一:我们从假设检验的角度出发分析,对两组的评分进行均值和方差运算,并在零假设成立的前提下通过使用Matlab 做T 检验,得出两组评酒员对于红葡萄酒的评价结果无显著性差异,而对于白葡萄酒的评价结果存在显著性差异的结果。
再建立可信度模型H ,计算结果如下表,对于问题二:根据葡萄酒质量的综合得分,将其划分为优、良、合格、不合格四个等的偏相关系矩阵。
利用通径方法建立了数学模型,得出了它们之间的线性回归方程:11231123=2.001x 0.0680.015x +........=0.0540.7580.753x .........y x y x x ----+红红红红白白白白对于问题四:在前面主成分分析和葡萄酒分级的基础上,建立Logistic 回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。
运用SPSS 软件,通过matlab 编程运算,求出受它们综合影响的线性回归方程。
在验证时,随机从上面选取理化指标,将它们带入P 的计算式中,通过所求P 值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
最后,对模型进行了改进和推广。
关键词 T 检验 主成分分析 Logistic 回归模型一、问题的重述葡萄酒作为体现时尚品味的元素,同名茶、咖啡一样备受追捧。
在物质社会的今天,人们酿造葡萄酒的品质还是有待鉴定的,因此,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
此外,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据,现需要用数学建模方法研究解决以下问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题的分析针对问题一:分析评酒员的评价结果有无显著性差异,需要从反面来论证,要从假设性检验角度来分析问题。
由于样本容量较大,近似地服从正态分布。
因此,本论文采用了使用Matlab 做T检验,从而确定两组评价有无显著性差异。
为了确定哪一组的结果更可信,建立了一种可以替代可信度的模型。
又考虑到该样本涉及到的是正态分布,则数据的离散程度是对其影响最大的因素,所以采用用标准差与平均值的比值作为可信度模型H=来衡量可信度的高低。
针对问题二:该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量来对酿酒葡萄进行分级,故我们要对酿酒葡萄的理化指标和葡萄酒的质量进行综合评价,但是在进行综合评价以前我们有分别要对它们二者分别进行分析。
在第一问中,我们已经对葡萄酒的整体进行了打分,因此,葡萄酒的质量实际上已经分好类了,那么我们就需要对酿酒葡萄的理化指标进行分析。
但是,由于影响酿酒葡萄的理化指标的因素有30个,要使问题得到简化,我们只需取其几个主要的影响因素,因此,采用主成分分析法来分析主要影响因素。
然而,葡萄酒的质量的单位系与酿酒葡萄的理化指标的单位系不同,因此不能直接加减来判断,所以,我们采用了模糊综合评价模型来对酿酒葡萄进行分级。
针对问题三:对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。
利用通径方法建立了数学模型,得出了它们之间的线性回归方程针对问题四:基于前面主成分分析和葡萄酒分级的基础,建立Logistic回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。
运用SPSS软件,通过matlab 编程运算,求出受它们综合影响的线性回归方程。
在验证时,随机从上面选取理化指标,将它们带入P的计算式中,通过所求P值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
三、基本假设1、各个样品酒中原产地相似,酿酒葡萄的产地对葡萄酒的质量影响相同;2、酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系;3、葡萄酒的酿造工序和贮藏条件相同;4、各评酒员的资质较高,在对葡萄酒品平时都是客观的,不存在主观偏好;5、仪器对样本理化指标和所含芳香物质的测试不存在随机误差,附件所给的数据真实、准确、可靠;6、酒样品容量较大时,认为各组样本服从正态分布且相互独立;7、两种葡萄酒和酿酒葡萄的分级标准相同,且葡萄酒分为优、良、合格、不合格四个级别;8、假设附件1中,酒样品为一级指标,外观、口感、香气分析和整体评价为二级指标,澄清度、色调、纯正度、浓度、持久性和质量为三级指标;四、符号定义a :表示澄清度,色调等指标个数,1,2,,10a = ;b :表示评酒员的个数,1,2,,10b = ;ab x :表示第b 个评酒员对a 指标的评分;,,i m n :表示酒样品数,,,1,2,,2728i m n = 或;i x :表示第i 种酒样品评分的均值;μ:表示总体均值;d :表示两组对应红(白)酒的均值差;d t :表示对均值差(d )做t 检验时的统计量;w :表示拒绝域;H :表示总体可信度的指标;p :表示酿酒葡萄的理化指标数,1,2,,30p = ;np x :表示第n 种酒样品的第p 中理化指标的值;*npx :表示对np x 标准化后的值; p λ:表示相关系数矩阵的第p 个特征值;Q :表示主要理化指标的贡献率;Z :表示主要理化指标的累计贡献率;j F :表示主要理化指标的综合评价函数,1,2,,j p = ;α:表示显著性水平;2s :表示方差;i a :表示相关系数矩阵的特征向量;ik U :表示子集i U 中含有k n 个评判因素;i A :表示i 个因数的权数分配;五、模型的建立与求解5.1、问题一模型的建立与求解5.1.1显著性差异的T 检验针对于如何确定有无显著性差异,我们从假设检验的角度出发,通过使用Matlab 做T 检验,分析它们的均值与方差来确定显著性。
1、对数据均值进行分析计算均值即每种酒样品的平均得分,它表示每个评酒员对每种酒样品评定的质量的具体值,其公1⎡⎤⎣⎦式为: 10ab a,b=11x=x b ∑, (5.1.1) 其中,a 表示附件1中的三级指标;b 表示评酒员的个数。
将各种葡萄酒样品各个评分代入式子(5.1.1),运用excel 计算可得出如下结果:2、对数据方差进行分析计算方差即各个数据与平均数之差的平方的平均数,它表示两组葡萄酒质量的波动大小,其公1⎡⎤⎣⎦式为:m2k i i=11s =(μ-x )m ∑, (5.1.2)其中,m 表示酒样品数;k 表示组数,k =1,2.将以上各种葡萄酒样品的均值代入式子(5.1.2),可求得各组的方差,结果如下:3、成对数据进行T 检验根据表1、表2、表3和表4显示的结果,我们可将两组中红、白酒样品分别形成相应的成对数据,形式如下表:首先,假设:211(,)X μσ ,222(,)Y μσ 且独立,则2(,)d d X Y μσ=- ,其中12μμμ=-,22212d σσσ=+; 然后,T 检验问题为:零假设 0=0H μ: ,即12μμ=;对立假设10H μ≠:,即12μμ≠.此时,用T 统计量d dt =, (5.1.3)其中,11m i i d d m ==∑,()22111m d i i s d m ==--∑ ,m 表示酒样品数,(红酒27m =,白酒28m =);在零假设成立的前提下,此d t 统计量服从()1t m -分布。
这时,零假设的α(0.05α=)显著水平的拒绝域是如下的样本区域:12(1)w t t m α-⎧⎫=>-⎨⎬⎩⎭. (5.1.4) 将表1和表2中的数据代入式子(5.1.3)中,可求得红葡萄酒的统计量t 值,通过查表法将m 值代入(5.1.4)可以求得显著水平的拒绝域。
结果为:t =2.04569d t =2.04106所以可得评酒员对红葡萄酒的评价没有显著性差异。
同理,我们可计算出白葡萄酒的统计量t 值,即d t =-2.66648,不在拒绝域内,所以,结果可得两组评酒员对白葡萄酒的评价存在显著性差异。
5.1.2可信度模型的建立及求解针对可信度的问题,我们用H 表示可信度。
在一定程度上,当平均值相等时,标准差能反映一个总体的离散程度,即标准差越大,离散程度越大,则表明这个总体的水平不稳定;标准差越小,反之水平越稳定。
基于标准差和平均值的性质,我们用标准差与平均值比值的大小来表示一个总体可信度的高低。
因而,我们建立一个可信度模型:H σμ=,其中,H 表示标准差与平均值的比值,即H 可见,H 值越大时它的可信度越低,H 值越小时可信度越高。
由此,可算得两组红葡萄酒样本的标准差与平均值的比值,如下表:由以上表格显示的结果可得出如下结论:对于两组中的红葡萄酒,有:2111H H <,所以第二组对红葡萄酒的评价结果的可信度更高;对于两组中的白葡萄酒,有:2212H H <,所以第二组对白葡萄酒的评价结果的可信度更高;综上所述:第二组更可信。