2012年国赛A葡萄酒获奖论文带附录(完整版)
2012全国竞赛论文评分建议2012全国赛A题:葡萄酒的评价
2012全国赛A题:葡萄酒的评价评阅要点解读与评分建议[广东赛区提供]总体评分分布:摘要10分●写作5分●总体评价5分●问题1 35分●问题2 15分●问题3 15分●问题4 10分●数据处理(缺失、异常)5分问题1:(35分)同一酒样评酒员之间差距小20分=原理5分+模型和方法 10分+结果与说明5分不同酒样之间区分度明显15分=原理5分+模型和方法 5分+结果与说明5分问题2:(15分)分级原则5分模型5分算法和结果5分问题3:(15分)分析关系的原理、结论评价5分模型和方法5分理化指标的分类和筛选5分问题4:(10分)建立模型5分结论及详细说明5分关于2012-A题评分要点的具体分析(至少17处)看到了网上几乎所有的参考答案,也听了一些老师的建议,现在结合评分要点来谈下自己的分析:在问题一中,答案是固定的,也就是显著和可信的问题,不管什么方法,但关键的还是说明假设检验的原理的依据,为什么要用这种方法,合适吗?所以,评分要点有以下几处:(1)数据的处理,包括缺失和异常数据,说明你处理的方法。
(2)检验模型的假设进行检验,例如样本的正态分布检验等(3)在前面的基础上,有些统计的方法不太适用,这时候要介绍你的方法原理和为什么要这么做。
(4)显著性分析和可信性分析。
这里面可能不同的方法结果不太一致,这时候要利用多个检验方法进行综合分析和考虑,给出较好的结果。
(5)由于评酒员都是感官评价的结果,前面是分两组样本分析的,这里可以针对每组评酒员的差异进行分析,即给出每个评酒员的品酒差异进行分析。
所以,第一问应该越详细越好。
这一问解决的感官评价的问题。
在问题二中,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
这里的方法较多,例如模糊综合评判,神经网络,聚类等。
每种方法都有自己的局限性,而且分级的个数也会有很大差异,这时候就要对自身的模型进行分析和判断。
关键点(1)无论哪种方法,酿酒葡萄的理化指标和葡萄酒的质量必须要说明清楚(2)模型本身的优缺点和适用范围进行分析明确(3)分级结果中应该对不同的酿酒葡萄进行明确的区分,例如哪种葡萄能造哪种级别的酒可以分析出来。
国赛数学建模A题葡萄酒论文
葡萄酒的评价一、摘要对于问题一,考虑到分数间不存在相关性,样本量偏小,需要对两组数据进行比较分析,我们采用了非参数检验中的Wilcoxon符号秩检验,评判结果均有显著性差异。
在此情况下,比较同组内十名品酒员对同一样品酒给出的总分的方差,再令得到的多组方差取平均,无论红葡萄酒和白葡萄酒,都是第一组方差较大,故第二组的评分较为可信。
另外由于所给数据大量且复杂,需预先对数据进行预处理,排除明显错误数据,用组内均值替代缺失数据。
对于问题二,先用SPSS对芳香物质和香气指标总分进行简单相关分析,筛选芳香物质中与香气评分相关性较大的成分。
将保留的芳香物质和葡萄的理化指标与葡萄的质量进行逐步回归分析,得到回归方程。
在得到结果后,我们也检验了数据满足逐步回归分析的条件。
最后将不同组葡萄的指标系数代入,根据分数值对葡萄分级,最终红、白葡萄酒都被分为六级。
对于问题三,我组首先对葡萄酒与酿酒葡萄当中相同的指标进行了简单相关性检验,得出其中大部分指标是强相关的,但是有一些指标(例如白酒的色素)是不相关的。
为了对这些指标进行进一步的分析,我组对含有二级指标的指标组进行了典型相关性分析,分析多个指标与多个指标间的关系。
而像酒总黄酮这类的单独指标,则进行了逐步线性回归,探究与所有可能有联系的指标间的联系。
对于问题四,我组以品酒员测定的指标等级为依据,希望通过逐步线性回归与Topsis排序的方法归纳出葡萄酒和葡萄理化指标间的数量关系,进而还原出品酒员所评定的等级。
但是在具体实践过后,两种方法的分级都与品酒员的分级有较大的误差,故认定不能直接通过理化指标去确定葡萄酒的等级。
关键词:葡萄酒质量符号秩检验主成分分析逐步回归主成分分析二、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
2012国赛A题附件1-葡萄酒品尝评分表
第二组白葡萄酒品尝评分酒样号项目26葡酒萄样品26外观分析澄清度色调8888香气分析纯正度5554浓度6467质量14101214口感分析纯正度4435浓度7667持久性6567质量16161619平衡/整体评价1010910 16葡萄酒样品16外观分析澄清度3441色调6464香气分析纯正度3453浓度6464质量10101010口感分析纯正度3554浓度6476持久性6676质量16131613平衡/整体评价9999 3葡萄酒样品3外观分析澄清度3344色调8888香气分析纯正度5445浓度7767质量14141014口感分析纯正度5445浓度7467持久性7578质量19161319平衡/整体评价109910 12葡萄酒样品12外观分析澄清度3443色调8868香气分析纯正度5445浓度7767质量12121214口感分析纯正度3544浓度6667持久性5667质量16191616平衡/整体评价8109811葡萄酒样品11外观分析澄清度3443色调8844香气分析纯正度5444浓度7776质量14141410口感分析纯正度4454浓度7774持久性6676质量16191613平衡/整体评价910109 21葡萄酒样品21外观分析澄清度4333色调8868香气分析纯正度5455浓度7778质量14121414口感分析纯正度5545浓度6777持久性6676质量16191619平衡/整体评价1091010 9葡萄酒样品9外观分析澄清度3444色调8888香气分析纯正度5455浓度8788质量16121614口感分析纯正度4555浓度6778持久性5677质量13161919平衡/整体评价991010 20葡萄酒样品20外观分析澄清度3433色调8868香气分析纯正度6445浓度7476质量14121214口感分析纯正度5544浓度7677持久性7677质量19161616平衡/整体评价1099825葡萄酒样品25外观分析澄清度3444色调8888香气分析纯正度5454浓度7677质量14121212口感分析纯正度4555浓度6677持久性7667质量16161622平衡/整体评价99910 4葡萄酒样品4外观分析澄清度4434色调8868香气分析纯正度5545浓度7766质量14121212口感分析纯正度5545浓度7677持久性6677质量19161619平衡/整体评价99910 10葡萄酒样品10外观分析澄清度3443色调6864香气分析纯正度6455浓度8778质量14121216口感分析纯正度5455浓度8778持久性7665质量19161619平衡/整体评价10999 2葡萄酒样品2外观分析澄清度3444色调8888香气分析纯正度5446浓度7777质量14121214口感分析纯正度5455浓度6666持久性6666质量16161619平衡/整体评价99910 14葡萄酒样品14外观分析澄清度4444色调8868香气分析纯正度4454浓度6766质量12121212口感分析纯正度4554浓度6676持久性6667质量16161616平衡/整体评价9999 6葡萄酒样品6外观分析澄清度4334色调8846香气分析纯正度5454浓度7774质量14121212口感分析纯正度5444浓度7676持久性7675质量16161616平衡/整体评价10998 27葡萄酒样品27外观分析澄清度3444色调8888香气分析纯正度4455浓度6787质量12121412口感分析纯正度4554浓度4677持久性6777质量16161616平衡/整体评价910109 18葡萄酒样品18外观分析澄清度4444色调8866香气分析纯正度4445浓度7777质量12141214口感分析纯正度4555浓度6686持久性5686质量16191916平衡/整体评价910910 15葡萄酒样品15外观分析澄清度2344色调8868香气分析纯正度6465浓度7787质量14121614口感分析纯正度4555浓度7676持久性6776质量19161916平衡/整体评价109109 1葡萄酒样品1外观分析澄清度4444色调8866香气分析纯正度5554浓度6776质量14121214口感分析纯正度5554浓度6676持久性7676质量19161916平衡/整体评价109109 13葡萄酒样品13外观分析澄清度4444色调6866香气分析纯正度4455浓度6767质量12121214口感分析纯正度3554浓度4667持久性5776质量16161919平衡/整体评价8999 17葡萄酒样品17外观分析澄清度4444色调8866香气分析纯正度5455浓度6477质量12121414口感分析纯正度5445浓度6677持久性6576质量16131619平衡/整体评价99910 28葡萄酒样品28外观分析澄清度4444色调8888香气分析纯正度4445浓度6777质量12121214口感分析纯正度4545浓度6776持久性6676质量16191916平衡/整体评价910910 22葡萄酒样品22外观分析澄清度4444色调8868香气分析纯正度5556浓度7778质量14121414口感分析纯正度5545浓度6477持久性6677质量16161919平衡/整体评价99910 24葡萄酒样品24外观分析澄清度3434色调6888香气分析纯正度4445浓度4777质量10121212口感分析纯正度4445浓度6776持久性5676质量16191616平衡/整体评价9998 8葡萄酒样品8外观分析澄清度4434色调6866香气分析纯正度4554浓度6664质量12121212口感分析纯正度5554浓度6664持久性6665质量16161616平衡/整体评价91098 19葡萄酒样品19外观分析澄清度3443色调6866香气分析纯正度5554浓度7466质量14121412口感分析纯正度4544浓度6677持久性6677质量16161613平衡/整体评价9998 5葡萄酒样品5外观分析澄清度3434色调6868香气分析纯正度5555浓度7777质量14121414口感分析纯正度5444浓度7777持久性7776质量19161616平衡/整体评价109109 7葡萄酒样品7外观分析澄清度3433色调8866香气分析纯正度5545浓度7766质量14121212口感分析纯正度4554浓度6766持久性6677质量16161613平衡/整体评价9997 23葡萄酒样品23外观分析澄清度4434色调6888香气分析纯正度5555浓度6777质量12121412口感分析纯正度4545浓度6777持久性6666质量16161616平衡/整体评价9101010748080806108488 545335 747447 141012101014 355335 676446 677566 132219101316 99107810233343 646464 452424 474644 10141212810 464524 676646 686655 162216161016 9108978243233 686266 555254 767274 14121481412 454355 676276 677477 191619131916 109971010 233334 6884106 554255 776277 12131481414 444225 476227 676447 131619101019 89107710333244 448666 454434 466446 101212101012 454435 467446 668557 131619131316 810109810343344 688488 544354 766277 141014101414 555355 786677 766667 191619131919 109981010344343 6108486 566455 787486 141614121414 655345 776267 776556 191619101619 1010107910 354343 668866 554344 786466 161414101212 554345 776467 767566 191616131616 10998910343243 688486 565355 787477 14141481414 554355 776277 777567 191919131919 10101081011343243 668686 555353 466464 121214101210 455455 477666 687667 161919161619 91010999343243 468448 565445 787677 141614101214 544456 776467 778667 191919131622 1010108911 343343 688686 535344 747664 141212101210 555355 676266 676566 161919131616 91098910343343 668466554455 776677 141212121214 554455 676477 777666 161919161619 9101091010353243 266466 545455 767666 141214121412 554455 776466 677666 161619161619 10999910353243 6106686 554454 776676 121214121412 454345 777466 777567 161616131619 99108910 343343 668666 464444 466664 101214121210 564454 786666 785565 191919161616 999999343343 668666 564454 887674141412101212 555454 766466 787566 191619131616 10109899343243 668666 554454 777464 141214121212 564455 686666 787666 161919161616 10999910343243 666446 534345 766467 141014101214 554445 667446 777666 161616161319 9989810 343243 688666 555435 767677 141414121214 565446 677677 787677 161922191922 10101010911343343 688686 554445 776767 141214141214 555456677667 777568 161916131622 91099911343243 6108686 564456 886677 141414121214 454446 477447 677667 161919131319 9989911343243 688686 444335 766467 121214101014 555445 677667 777567 191619161619 109109910 343243 688666 554444 666664 121214121210 455444 667464 666665 161616131613 9910999343243 688466 655454 677666 121214121212 554355 777466 777666191619161919 10999910353243 6108686 555556 786777 141214121416 455456 667667 677667 161919161922 1010891011343343 688466 464454 687466 121414101212 455345 666667 666656 131619131619 9988810 353243 6108686 544454 776674 121012121412 454455 666777 676776 161616161619 991091010 747975738376。
2012年全国数学建模大赛 A题葡萄酒的评价
葡萄酒的评价摘要本文就影响葡萄酒的质量的因素进行了探究。
在问题一中,评酒员间存在评价尺度、评价位置以及评价方向等方面的差异,导致不同评酒员对同一酒样的评价差异很大,于是我们需要探讨两组评酒员的可信度。
对此,我们建立了单元素方差模型对其进行了显著性差异的判断,最后我们得出结论:两组评酒员的评价结果有显著性差异,并且第二组评酒员评价的结果更加可信。
在问题二中,我们首先将大量的数据进行了样本住分析塞选,大大减少了计算量,就红、白葡萄酒前17组样本葡萄酒的分数进行训练,由后十组的理性指标进行检验,也可检验俩个的准确性。
最后我们认为可以给酿酒葡萄分为一、二、三、四四个等级。
在问题三中,因为要讨论酿酒葡萄与葡萄酒的理化指标之间的联系,我们就其两者的重要理化指标进行了探讨,应用了回归模型将其各项重要指标进行了多元拟合处理,最后得出了葡萄酒和酿酒葡萄中的重要指标的等式关系。
在问题四中,我们首先利用了回归原理求得葡萄酒质量与葡萄酒和酿酒葡萄的理化指标之间的等式关系,由等式和图像细致的分析了葡萄酒和酿酒葡萄理化指标对葡萄酒质量的影响。
在一定范围内,理化指标的与葡萄酒的质量呈正相关,达到一定的量后呈现负相关趋势。
关键词:显著性差异判别主成分分析 BP神经网络回归模型1.问题的重述现今社会,随着人们生活水平的提高,人们对葡萄酒的质量要求也越来越高。
在确定葡萄酒质量的时候,一般聘请一批资深的评酒员进行评比,根据不同的指标所得的分数从而求得总分,以此确定葡萄酒的质量。
其中酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本题给出了3份材料,材料1是某一年份一些葡萄酒的评价结果,材料2和材料3分别给出了该年份这些葡萄酒和酿酒葡萄的成分数据。
我们必须解决以下问题:问题一:分析材料1中两组评酒员的评价结果是否有明显的差异,并且求出哪组评酒员的评价结果更可信。
问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄的品质进行分级。
2012国赛A题-葡萄酒
4.1.1 置信区间法 为了降低各评酒员之间的异质性, 先分别计算每一组中所有评酒员对同一酒样的平 均值( s j )和标准差( j ),评酒员 i 对酒样品 j 评价的置信区间为 s j j[1] 。 如果评酒员 i 对酒品 j 的评分( sij )在其置信区间内则保留;如果评酒员 i 对酒品 j 的评分( sij ) 不在其置信区间内则逐步调整,使评分都处于置信区间 s j j 内,具体为: 若 sij <j , 则 Sij =sij + j ; 若 sij >j ,则 Sij =sij - j 。 直接使用 matlab (附录一) 通过置信区间法对两组评酒员对红葡萄酒和白葡萄酒的 评分进行修正, 此时的数据更加可信, 同时对每一个酒样的得分求均值, 结果见表 4.1.2 (只给出第一组的红葡萄酒数据) 。 表 2 红葡萄酒样品经置信区间检验转 zg jx Fjx Yj
四、模型建立及求解
说明:限于篇幅因素,本文说明模型原理时一律用红葡萄(酒)数据说明,白葡萄(酒) 只给出最终结果。 4.1 问题一的求解 首先,将每个评酒员对葡萄酒样品的分类指标打分求和,用得到的总分代表该评酒 员对葡萄酒样品质量的评价结果。然而,由于每个评酒员的评价尺度、评价位置以及评 价方向的差异,在对评价结果进行统计分析时,必须对评酒员的原始数据进行相应的处 理,以降低评酒员的系统误差(即异质性) ,真实反映样品间的差异。 表 1 红葡萄酒样品的原始数据
葡萄酒质量评价方法的研究
摘要
本文给出了判别评价结果显著性差异以及可信度的方法, 建立了模糊综合评价模型 用熵权法对酿酒葡萄进行分级, 根据多元回归分析拟合出了酿酒葡萄与葡萄酒理化指标 间的关系, 问题一:用评酒员对葡萄酒各类指标打分的总分衡量葡萄酒的质量,并利用置信区 间法降低评酒员的异质性,使数据更真实的反映酒样间的差异。再将这些数据进行方差 分析可知两组评酒员评价对红葡萄酒的评价没有显著差异, 对白葡萄酒的评价有显著性 差异。最后根据信度分析可知第一组评酒员更可信。 问题二:首先将酿酒葡萄的理化指标进行主成分分析,将葡萄酒质量和提取的主成 分一起作为衡量酿酒葡萄质量的指标,利用模糊综合评价法的原理及其评价方法,同时 将信息论中的熵值引入模糊综合评价隶属矩阵的确定过程, 利用熵权法构造隶属函数矩 阵, 尽量消除传统权重确定中主观因素的影响, 从而对酿酒葡萄进行了良好的质量评价。 问题三:首先借上问主成分分析法,将葡萄和葡萄酒的理化指标进行处理。然后, 在假设条件下,建立多元线性回归模型,运用多元线性回归分析法分析葡萄和葡萄酒理 化指标,做近似拟合,得出相应的拟合度值。对相关且拟合度高的自、因变量之间进行 分析,最终得到结论。 问题四:先建立因果关系模型,分别对葡萄芳香物质与葡萄酒芳香物质,葡萄酒理 化指标与葡萄酒评价分数进行如上问的分析,综合两者,并在给出的关系模型的基础上 对能否用葡萄及葡萄酒理化指标作为判断方法给予阐述。
2012高教社杯全国大学生数学建模竞赛A题葡萄酒的评价
2012高教社杯全国大学生数学建模竞赛葡萄酒的评价摘要本文以概率论与数理统计的相关知识为理论基础,综合运用正态分布和分级的原理,利用统计分析数据,研究了葡萄酒的评价指标体系,针对 葡萄酒的质量评价问题,建立合理的数学模型用以评价。
问题一:(1) 本问题的葡萄酒质量评价指标(即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析),先对指标归类按顺序,统计并整理出相关的数据,再利用正态分布的思想,假设并验证质量评价指标为正态分布并进行差异性分析,对比找出附件1中两组评酒员的显著差异为:两组评酒员对红葡萄酒的评价结果有显著性差异的是外观分析中的色调、香气分析中的浓度,其他的无显著性差异;两组评酒员对白葡萄酒的评价结果有显著性差异的是口感分析中的纯正度、浓度,持久性、质量和平衡/整体评价,其他的无显著性差异。
(2)本问题要求分析附件1中哪组指标更可信,这就要在问题(1)基础上分析两组指标的可信性,建立可信性分析模型,利用matlab 软件编程计算得(程序见附件4): 1var =0.0735 ,2var =0.0398。
可见21var var ,因此第二组可信性高。
问题二:此问题我们的总体思路是这样的:先根据样品葡萄酒的得分高低对葡萄酒进行分级,并且假设葡萄酒得分越高,那么酿酒葡萄就越好,等级就越高,于是我们利用一些分类模型就可以得到相应酿酒葡萄的级别差。
根据这条思路,我们建立如下一些模型来讨论(见表6、7、8)。
为了充分利用文中的数据,我们把第一组第二组葡萄酒品尝得分合并,这样就得到了一个更大的样本,对结论会更有说服力。
为了能比较客观的对葡萄酒分划分合理的等级,我们需要一种能从总体上正确的反应葡萄酒的评分,这里我们利用已经单位化的综合了所有指标的葡萄酒品尝评分的所得分评价,它们的得分范围理论上包含在[0,1]区间上,实际计算红葡萄的单位化归一化后的评分。
2012年国赛A葡萄酒获奖论文带附录(完整版)
2012年国赛A葡萄酒获奖论文带附录(完整版)2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):A 题葡萄酒的评价摘要:确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
一方面由于每个品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价存在差异,从而不能真实地反映不同酒样间的差异。
另一方面葡萄酒的质量和酿酒葡萄的好坏又有直接的关系,于是根据题中所给的条件和问题提出相关的约束条件和目标函数,建立合理的数学模型。
对于问题一,在分析附件1中所给的数据后,首先根据每组的10名评酒员对其中的一种酒进行品尝后确定葡萄的质量,然后在进行分析评酒员评27种红葡萄酒的差异,最后运用方差分析对两组评酒员的评价结果进行测定,得出两组评酒员存在是否有显著性差异的结果,看其哪组评酒员的技术水平更高些。
问题二是为了对酿酒葡萄进行分级,要从酿酒葡萄的理化指标和葡萄酒的质量进行分级,在附件2、3中,发现酿酒葡萄的成分数据中有很多因素,首先对酿酒葡萄的理化指标经过查找资料、专家咨询进行了较为有效的分类,我们从中选取一些有效因素,例如:氨基酸总量、糖、单宁、色差值、酸、芳香物质等。
然后再采取系统聚类分析法对酿酒葡萄进行分级。
等级大致分为优、良、中、差四个级别。
在解决问题三时,不仅要考虑酿酒葡萄还要考虑葡萄酒的理化指标,因而采用多元回归模型,模型如下:其中,b0为常数项,为回归系数,错误!未找到引用源。
是随机误差。
国赛A题优秀论文
葡萄酒的评价模型摘要本文主要解决葡萄酒的评价问题,运用多种数理统计方法通过MATLAB和SPSS软件对可能影响葡萄酒质量的因素进行统计分析,初步得出对葡萄酒的理化指标评价和主观评价具有差异性。
对于问题一中的显着性差异分析,针对两组评酒员对于每一种酒的评分,本文用α=),结果显示两组评酒员对红葡萄酒和白葡萄酒的评分MATLAB进行t检验(0.05都具有显着性差异。
对于可信度的问题,我们用EXCEL进行方差与置信区间的综合分析,得出对红、白葡萄酒的评价结果第二组可信度均较高。
问题二,首先用相关性分析计算出各个理化指标之间以及各理化指标与葡萄酒质量间的Pearson相关系数r,然后选取和葡萄酒质量相关程度较大(0.2r>)的理化指标进行聚类分析,依照指标的不同情况可将其分别分为3、4、5类,得出在每种分类情况下的分类方案。
最后,我们计算每种分类方案下各类酿酒葡萄质量得分的平均值,分值越高则级别越高,确定了最终的分级方案。
问题三,我们先对酿酒葡萄的理化指标进行主成分分析,利用降维技术找出能代表酿酒葡萄的主要理化指标,然后再将得出的主要理化指标与葡萄酒的理化指标进行相关性分析,根据相关系数确定二者理化指标间的关系。
结果表明,葡萄酒的理化指标除了由相对应的酿酒葡萄的理化指标决定外,还可由其它相关性大的理化指标决定。
最后,对问题四建立多元线性回归分析模型,对第一问中计算出了红、白葡萄酒和葡萄的样本相关系数进行比较,发现用葡萄的理化指标衡量葡萄酒的质量是不全面的,芳香物质可能会影响酒的香气从而影响酒的整体质量。
因此在第二小问中,先根据葡萄酒中芳香物质的化学成分将其分类(醛、烃、醇、酯、酸、酮以及其他含氧有机物),再利用多元线性回归模型计算出其样本相关系数,说明芳香物质通过酒的香气来影响酒的品质,从而说明了理化指标分析和主观评分在葡萄酒质量分析中的差异性。
关键词:t检验相关性分析聚类分析主成分分析多元线性回归问题重述葡萄酒是世界公认的对人体有益的健康酒精饮品,其生产方式方便,经济,且风味极佳.因而越来越受到广大市民的青睐,同时葡萄酒的质量以及等级划分也越来越受到人们的关注。
2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文
葡萄酒的评价摘要本文主要对两组评酒员的评价结果及可信度、酿酒葡萄的分级、酿酒葡萄与葡萄酒的理化性质之间的联系和是否影响葡萄酒的质量进行分析及研究。
对于问题一,利用附件一中评酒员群体对红、白葡萄酒进行两次评分的数据,运用t检验模型,求出P值用于判定有无显著性差异。
出于对结果的科学性考虑,建立了二值化可信度模型对评酒员的可信度进行定量描述。
若可信度值i p越大,则说明评价结果越可信。
通过比较第一、二组的P值,得出第一组的可信度更高些。
对于问题二,运用主成分分析法,选取葡萄酒样品中含有的一级指标物的数据,得出贡献率。
再利用贡献率(贡献率越大对葡萄的质量影响越大)的大小,选出影响酿酒葡萄分级的主成分因素,并利用红地球葡萄的分级标准对酿酒葡萄进行分级。
对于问题三,首先利用主成分分析法和SPSS软件对红葡萄酒的量化指标进行筛选,选出总酚、酒总黄酮、白藜芦醇等6种物质作为对葡萄酒理化指标的一组样本。
借用在问题二中筛选出来的花色苷、干物质含量、顺式白藜芦醇苷等六种红葡萄的理化指标作为另一组样本。
然后利用上述两组数据,建立典型相关分析模型,求出葡萄酒理化指标和酿酒葡萄的相关系数,从而确定两者之间的关联度。
最后建立二元回归模型进而求出两者之间的关系。
对于问题四,运用主成分分析降维的思想,运用灰色关联度模型,利用几组变量的数据,通过MATLAB软件求得关联度,进而来反映两变量之间的线性关系。
根据关联度的大小,考虑多方面的因素对葡萄酒的质量进行评价与论证。
关键词:t检验法、可信度模型、主成分分析法、多元回归模型、灰色关联度1 问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
2012高教社杯全国大学生数学建模竞赛 葡萄酒的评价 全国奖
2
(14) (15)
En He
ቤተ መጻሕፍቲ ባይዱ:一组样酒分值的熵 :一组样酒分值的超熵
六、模型的建立与求解
6.1 问题(一)模型的建立与求解 信度分析是一种测度综合评价体系是否具有一定的稳定性和可靠性的有效分析工 具。量表编制的合理性和有效性将决定着评价结果的的可信性和可用性,信度分析正是 要对量表的有效性(信度)进行研究,量表的信度分析包括内在信度分析和外在信度分 析,内在信度分析重在考查一组评估项目是否测量的是同一个特征,这些项目之间是否 具有较高的内在一致性。内在信度高意味着一组评估项目的一致程度高,相应的评估项 目有意义,所得的评估结果可信,外在信度分析是指在不同时间对同批被评估对象实施 重复评估时,评估结果是否具有一致性。如果两次评估的结果相关性较强,则说明在被 评估对象没有故意隐瞒的前提下,评估项目的概念和内容是清晰的、不模糊的,没有二 义性的,因而所得的结果是可信的[1]。 6.1.1 信度分析的基本原理 信度分析主要用于对量表内在的信度进行研究。它首先对各个评估项目做基本统计 描述、计算各项目间的相关系数,对内在信度进行初步分析。然后采用信度分析系数对 内在信度或外在信度做进一步的研究。 信度系数主要包括克郎巴哈 (Cronbach) 系数、 折半(Split-half)信度系数等。 (1)克郎巴哈(Cronbach) 系数: 克郎巴哈(Cronbach) 系数用于测量表内部的一致性,其计算方法是: ①计算各评估项目的相关系数距阵,计算相关系数的均值; ②计算克郎巴哈 系数,其数学定义为:
2012 高教社杯全国大学生数学建模竞赛
编 号 专 用 页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注
国赛数学建模A题葡萄酒论文
葡萄酒的评价一、摘要对于问题一,考虑到分数间不存在相关性,样本量偏小,需要对两组数据进行比较分析,我们采用了非参数检验中的Wilcoxon符号秩检验,评判结果均有显著性差异。
在此情况下,比较同组内十名品酒员对同一样品酒给出的总分的方差,再令得到的多组方差取平均,无论红葡萄酒和白葡萄酒,都是第一组方差较大,故第二组的评分较为可信。
另外由于所给数据大量且复杂,需预先对数据进行预处理,排除明显错误数据,用组内均值替代缺失数据。
对于问题二,先用SPSS对芳香物质和香气指标总分进行简单相关分析,筛选芳香物质中与香气评分相关性较大的成分。
将保留的芳香物质和葡萄的理化指标与葡萄的质量进行逐步回归分析,得到回归方程。
在得到结果后,我们也检验了数据满足逐步回归分析的条件。
最后将不同组葡萄的指标系数代入,根据分数值对葡萄分级,最终红、白葡萄酒都被分为六级。
对于问题三,我组首先对葡萄酒与酿酒葡萄当中相同的指标进行了简单相关性检验,得出其中大部分指标是强相关的,但是有一些指标(例如白酒的色素)是不相关的。
为了对这些指标进行进一步的分析,我组对含有二级指标的指标组进行了典型相关性分析,分析多个指标与多个指标间的关系。
而像酒总黄酮这类的单独指标,则进行了逐步线性回归,探究与所有可能有联系的指标间的联系。
对于问题四,我组以品酒员测定的指标等级为依据,希望通过逐步线性回归与Topsis排序的方法归纳出葡萄酒和葡萄理化指标间的数量关系,进而还原出品酒员所评定的等级。
但是在具体实践过后,两种方法的分级都与品酒员的分级有较大的误差,故认定不能直接通过理化指标去确定葡萄酒的等级。
关键词:葡萄酒质量符号秩检验主成分分析逐步回归主成分分析二、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
2012年全国大学生数学建模竞赛A题葡萄酒评价分析
2012年全国大学生数学建模竞赛A题葡萄酒评价分析葡萄酒是一种古老而神奇的饮品,它不仅有着悠久的历史,还拥有丰富的文化内涵和独特的口感。
在现代,葡萄酒已成为一种高品质、高雅的饮品,备受人们的青睐。
然而,如何准确地评价葡萄酒的品质,成为了学界和业界的一个共同难题。
本文将通过对2012年全国大学生数学建模竞赛A题的分析,探讨葡萄酒评价的数学建模方法。
1. 引言葡萄酒的评价一直以来是一项主观且复杂的任务。
传统的酒评方法主要依赖专业人士的经验和口感,但这种方法存在诸多不足。
为了解决这一问题,数学建模技术应运而生。
2012年的葡萄酒评价竞赛就是一个典型的例子。
2. 问题陈述2012年全国大学生数学建模竞赛A题要求参赛者基于给定的葡萄酒数据,利用数学模型对葡萄酒的品质进行评价。
竞赛提供的数据包括葡萄酒的理化指标、人工评分以及其他相关因素等。
3. 数据处理与分析为了对葡萄酒的品质进行准确评估,我们首先对提供的数据进行处理与分析。
通过统计学方法,我们可以计算出葡萄酒的平均评分、标准差等统计指标,从而评估数据的分布情况和变异程度。
此外,通过数据可视化技术,如散点图、箱线图等,我们可以观察数据的分布情况和异常值等。
4. 评价模型的建立基于提供的数据和问题要求,我们需要构建一个评价模型,来准确衡量葡萄酒的品质。
在建立模型时,我们可以考虑多个因素,如理化指标、人工评分等,并通过数学方法将这些因素进行权重分配、综合计算,从而得到一个综合评价指标。
例如,可以利用线性加权模型、层次分析法等来实现这一目的。
5. 模型求解与结果分析在完成评价模型的建立后,我们可以利用相应的数学算法对模型进行求解,并得到葡萄酒的评价结果。
通过分析结果,我们可以进一步了解葡萄酒品质的特点与变化趋势,为生产和消费提供科学依据和决策支持。
6. 模型的优化与改进为了提高评价模型的准确性和可靠性,我们可以进一步对模型进行优化和改进。
例如,引入更多的因素和数据,采用更复杂的数学方法,对模型进行验证和调整等。
2012年数学建模国赛一等奖
首先,计算针对每一个样本 10 个品酒员的评分均值,即
m 1, 2, ,10n 1, 2, ,10 10 其次,利用 SPSS 统计软件中的 P-P 图和单样本 K-S 检验,对数据集两组品酒员分 别对红、白葡萄酒品尝得到的四组评价结果(见附录 8.1.2)进行了正态分布检验,若样 点在正态分布 P-P 图上呈直线散布,则被检验数据基本上成一条直线[3]。 x
表 2 第一组白葡萄酒品尝评分样本 3 持久性数值异常
品酒员 持久性 1号 7 2号 5 3号 7 4号 5 5号 6 6号 7 7号 77 8号 5 9号 6 10 号 7
对于类似的异常数据采取“先剔除,后替换”的策略,对异常数据进行修正。 5.1.2 各葡萄酒样本评分数据概率分布的确定 对两组品酒员差异性评价的假设检验一般要求数据符合正态分布。统计规律表明, 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近 似地用正态分布来描述[2]。因此,对葡萄酒质量的评分进行正态性检验有助于我们分析 得出该评分是否科学、合理。
三、模型假设
1. 假设各样本能真实客观地反映酿酒葡萄与葡萄酒的情况; 2. 葡萄酒的质量只与酿酒葡萄的好坏有关,忽略酿造过程中的温度、湿度、人为干扰 等其他因素的影响; 3. 不考虑理化性质的二级指标; 4. 每组评酒员的打分不受上个酒样品的影响,即各评分数据间独立;
四、符号说明
序号
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
关键词:秩相关 主成分分析 层次分析综合评价 典型相关分析 多元线性回归
1
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒员在对 葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系, 葡萄酒和酿酒葡萄检测的理化指标 会在一定程度上反映葡萄酒和葡萄的质量。附件 1 给出了某一年份一些葡萄酒的评价结 果,附件 2 和附件 3 分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建 立数学模型讨论下列问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和 葡萄酒的理化指标来评价葡萄酒的质量?
2012年全国大学生数学建模A题 葡萄酒质量评价
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):统计学在葡萄酒质量评价中的应用摘要:随着酿酒业的发展,越来越多不同层次的葡萄酒涌入市场,葡萄酒质量的评价也越发的重要。
对于第一题,在对两组评酒员评价结果进行显著性检验的过程就是假设检验的过程。
为了推断两组品酒员的评价结果是否有显著性差异,需要提出一个没有显著性差异的零假设。
通过对样本的总体特征来判断假设的合理性。
我们用双样本的Kolmogorov-Smirnov 检验方法得到两组评价结果是有明显性差异的。
在可信度分析中,通过方差分析,得出第二组的评价结果更合理。
第二题,这是个多对象多指标的分级问题。
所以我们采用综合评价方法,结合评价员对葡萄酒的评分,分别对酿酒葡萄的理化指标和葡萄酒的质量进行评价并分级(为方便数据处理,分为10个等级)。
2012年国赛数学建模A题优秀论文
葡萄酒的评价模型海军航空工程学院(烟台)史成巍许志鹏王鑫指导教师司守奎专家点评:本文格式基本规范,表达较清晰。
解决问题一方法适当,结论正确;问题二以相关系数筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,进行聚类分析,思路简明,结论较合理。
问题三进行理化指标的相关性分析,切入准确,但对结果的说明不够充分。
不足之处是在问题二到问题四中没有充分考虑芳香类物质的使用,问题四中对如何判定“葡萄和葡萄酒的理化指标是否能用来评价葡萄酒”时方法略有不妥,导致结论不当。
点评人:济南大学数学科学学院许振宇副教授摘要:本文主要针对葡萄酒的评价问题建立了相关数学模型。
在对两组评酒员的评价是否存在显著性差异的问题中,首先验证了两组评酒员的评价结果服从正态分布,并通过方差分析法对两组评酒员的评价结果进行了分析,发现两组评酒员对于红葡萄酒和白葡萄酒的评价结果均存在显著性差异,由于第二组评酒员的评分方差更小,故评价结果均衡度更好,其结果可信度更大。
在对酿酒葡萄进行分级的问题中,首先以相关系数衡量葡萄理化指标与葡萄酒质量的相似性程度,然后筛选出与葡萄酒质量相关性较大的理化指标与葡萄酒质量一起作为评估葡萄质量的评价指标,利用筛选出的评价指标对酿酒葡萄进行聚类分析,将红葡萄和白葡萄均分成了四类。
最后以每类中对应葡萄酒质量评分的均值作为该类葡萄的分数,从而定出四类的级别,以对应国家葡萄酒的四级分类标准。
在分析酿酒葡萄与葡萄酒的理化指标间的联系问题中,本文采用偏最小二乘回归分析法对指标间的联系进行了分析计算,发现葡萄酒中的某些理化指标与葡萄的某些理化指标存在较强的相关性,比如白葡萄中的总糖和还原糖对白葡萄酒中顺式白藜芦醇苷和顺式白藜芦醇以及反式白藜芦醇的影响较大。
在判断葡萄与葡萄酒的理化指标与葡萄酒的质量间关系的问题中,首先对葡萄和葡萄酒的理化指标与葡萄酒的质量进行了相关性分析,发现某些理化指标与葡萄酒的质量相关性很大。
2012国赛A题优秀论文
葡萄酒的评价模型摘要本文主要解决葡萄酒的评价问题,运用多种数理统计方法通过MATLAB和SPSS软件对可能影响葡萄酒质量的因素进行统计分析,初步得出对葡萄酒的理化指标评价和主观评价具有差异性。
对于问题一中的显著性差异分析,针对两组评酒员对于每一种酒的评分,本文用α=),结果显示两组评酒员对红葡萄酒和白葡萄酒的评分MATLAB进行t检验(0.05都具有显著性差异。
对于可信度的问题,我们用EXCEL进行方差与置信区间的综合分析,得出对红、白葡萄酒的评价结果第二组可信度均较高。
问题二,首先用相关性分析计算出各个理化指标之间以及各理化指标与葡萄酒质量间的Pearson相关系数r,然后选取和葡萄酒质量相关程度较大(0.2r>)的理化指标进行聚类分析,依照指标的不同情况可将其分别分为3、4、5类,得出在每种分类情况下的分类方案。
最后,我们计算每种分类方案下各类酿酒葡萄质量得分的平均值,分值越高则级别越高,确定了最终的分级方案。
问题三,我们先对酿酒葡萄的理化指标进行主成分分析,利用降维技术找出能代表酿酒葡萄的主要理化指标,然后再将得出的主要理化指标与葡萄酒的理化指标进行相关性分析,根据相关系数确定二者理化指标间的关系。
结果表明,葡萄酒的理化指标除了由相对应的酿酒葡萄的理化指标决定外,还可由其它相关性大的理化指标决定。
最后,对问题四建立多元线性回归分析模型,对第一问中计算出了红、白葡萄酒和葡萄的样本相关系数进行比较,发现用葡萄的理化指标衡量葡萄酒的质量是不全面的,芳香物质可能会影响酒的香气从而影响酒的整体质量。
因此在第二小问中,先根据葡萄酒中芳香物质的化学成分将其分类(醛、烃、醇、酯、酸、酮以及其他含氧有机物),再利用多元线性回归模型计算出其样本相关系数,说明芳香物质通过酒的香气来影响酒的品质,从而说明了理化指标分析和主观评分在葡萄酒质量分析中的差异性。
关键词:t检验相关性分析聚类分析主成分分析多元线性回归一、问题重述葡萄酒是世界公认的对人体有益的健康酒精饮品,其生产方式方便, 经济, 且风味极佳. 因而越来越受到广大市民的青睐,同时葡萄酒的质量以及等级划分也越来越受到人们的关注。
2012数学建模A葡萄酒地评价与衡量
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规如此.我们完全明白,在竞赛开始后参赛队员不能以任何方式〔包括、电子、网上咨询等〕与队外的任何人〔包括指导教师〕研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规如此的, 如果引用别人的成果或其他公开的资料〔包括网上查到的资料〕,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们X重承诺,严格遵守竞赛规如此,以保证竞赛的公正、公平性。
如有违反竞赛规如此的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进展公开展示〔包括进展网上公示,在书籍、期刊和其他媒体进展正式或非正式发表等〕。
我们参赛选择的题号是〔从A/B/C/D中选择一项填写〕: A我们的参赛报名号为〔如果赛区设置报名号的话〕:所属学校〔请填写完整的全名〕:参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012 年 9 月 7 日赛区评阅编号〔由赛区组委会评阅前进展编号〕:编号专用页赛区评阅编号〔由赛区组委会评阅前进展编号〕:全国统一编号〔由赛区组委会送交全国前编号〕:全国评阅编号〔由全国组委会评阅前进展编号〕:葡萄酒的评价摘要目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。
葡萄酒的质量与酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反响葡萄酒和酿酒葡萄的质量。
对于问题1,我们采用方差分析的方法建模解决。
根本思路是:对两组评酒员的评价结果进展单因素方差分析,然后再用F检验对得出的结果进展进一步验证,得出两组评酒员的评价结果无显著性差异,通过比拟两组评酒员评价结果的方差值,得出第二组的结果更可信。
对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进展分级。
根本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指标的8种主成分,在此根底上把综合因子作为一项排名指标,结合问题1得出的葡萄酒的质量,对酿酒葡萄进展排名,用两种排名的名次之和作为对酿酒葡萄分级的主要依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):A 题葡萄酒的评价摘要:确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
一方面由于每个品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价存在差异,从而不能真实地反映不同酒样间的差异。
另一方面葡萄酒的质量和酿酒葡萄的好坏又有直接的关系,于是根据题中所给的条件和问题提出相关的约束条件和目标函数,建立合理的数学模型。
对于问题一,在分析附件1中所给的数据后,首先根据每组的10名评酒员对其中的一种酒进行品尝后确定葡萄的质量,然后在进行分析评酒员评27种红葡萄酒的差异,最后运用方差分析对两组评酒员的评价结果进行测定,得出两组评酒员存在是否有显著性差异的结果,看其哪组评酒员的技术水平更高些。
问题二是为了对酿酒葡萄进行分级,要从酿酒葡萄的理化指标和葡萄酒的质量进行分级,在附件2、3中,发现酿酒葡萄的成分数据中有很多因素,首先对酿酒葡萄的理化指标经过查找资料、专家咨询进行了较为有效的分类,我们从中选取一些有效因素,例如:氨基酸总量、糖、单宁、色差值、酸、芳香物质等。
然后再采取系统聚类分析法对酿酒葡萄进行分级。
等级大致分为优、良、中、差四个级别。
在解决问题三时,不仅要考虑酿酒葡萄还要考虑葡萄酒的理化指标,因而采用多元回归模型,模型如下:其中,b0为常数项,为回归系数,错误!未找到引用源。
是随机误差。
把酿酒葡萄作为自变量,葡萄酒的理化指标中的因素作为因变量,这样通过多元回归模型就能拟合出两者之间的图像,从而得到酿酒葡萄与葡萄酒理化指标的联系。
针对问题四,我们采用层次分析法用问题二得出来的酿酒葡萄的等级和葡萄酒的理化指标对葡萄酒进行选优排序,把葡萄酒的排序作为目标层(O),把酿酒葡萄的等级和葡萄酒的理化指标作为准则层(C),把酿酒葡萄的等级和葡萄酒的理化指标的影响因素作为子准则层。
然后再应用一元线性回归模型,即:y=a+bx+错误!未找到引用源。
其中,a和b是未知常数,称为回归系数;错误!未找到引用源。
是随机误差。
只要能从观测数据中得到y^=a^+b^x,它近似地反映了变量x和y之间的线性关系,其中a^,b^也称为回归系数,x称为回归自变量,y称为回归因变量。
这样就对酿酒葡萄和问题一中评酒员对葡萄酒评分后的排序进行拟合来分析并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:酿酒葡萄;葡萄酒;理化指标;系统聚类分析法;回归分析;层次分析法;一问题重述三国时期的魏文帝曹丕说过:“且说葡萄,醉酒宿醒。
掩露而食;甘而不捐,脆而不辞,冷而不寒,味长汁多,除烦解渴。
又酿以为酒,甘于曲糜,善醉而易醒……”。
这已对葡萄和葡萄酒的特性认识得非常清楚了。
葡萄酒具有很高的营养价值和保健作用, 内含一种称为白藜芦醇的物质, 以红葡萄酒中含量最多, 可用于癌症的化学预防。
葡萄酒能调节人体新陈代谢, 促进血液循环, 防止胆固醇增加, 同时还有利尿、激发肝功能和防止衰老的作用, 长期适量( 每天控制在50mL) 饮用, 可以起到滋补、强身、美容的作用, 可防止坏血病、贫血、眼角膜炎, 降低血脂, 促进消化, 对预防癌症和医治心脏病大有益处。
但现在的葡萄酒种类繁多,我们怎么确定酒的质量还得聘请一些有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员酒的外观分析、香气分析、口感分析和整体评价打分后的总体分数来确定葡萄的质量,从而测定两组评酒员对其的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标(单宁、糖、氨基酸、色素、芳香物质酸)和葡萄酒的质量(问题一中评酒员对各种酒的综合打分,从而确定酒的质量)对这些酿酒葡萄进行分级(优、良、中、差)。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量(评酒员打的总分)的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二:基本假设基本假设:(1)假设测试过程中的时间基本一致;(2)假设测量的数据都是真实有效的;(3)假设各评酒员打的总分服从正态分布;(4)假设测试过程中忽略葡萄本身的变化(5)各评判员以参评对象的量化打分都是公平的;(6)问题所确定的评酒员及权限是合理的,并具有成分的民主性;(7)问题中所确定的参评条件能够充分反映出参评对象的真实水平;(8)假设建模时在所有的问题答卷中剔除那些相关性不大的选项如(第三问)以减少建模的复杂度。
三:符号说明符号说明:A1,。
A10:指把各组的每个评酒员看成一个因子;X i(i=1 ,2…10):指评酒员对每一种酒的评分;F:统计量;A:指比较矩阵;X1:花色苷;X2:单宁;X3:芳香物质;X4:色差值;X5:DHHP自由基;Y:酿酒葡萄的等级排名;B1…B n=常数;a ij:任意两个因素对决策层的影响程度;W:指矩阵A的的特征向量;O:指目标层;C:指准则层;C K:指影响的因素;四:问题分析与模型的建立4.1 问题一的模型分析、建立与求解4.1.1问题的分析两组评酒员的评价结果就是评酒员对各种酒进行品尝后对其分类指标打分,然后求和得到总分,从而确定葡萄酒的质量。
首先根据每组的10名评酒员对其中的一种酒进行品尝后确定葡萄的质量,然后在进行分析评酒员评27种红葡萄酒和28种白葡萄酒的差异。
从而判断其有无显著性差异。
4.1.2 模型的建立与求解为了更好的测定葡萄酒的质量,我们采用方差分析法来进行对两组评酒员的评价结果有无显著差异,达到更好的测定效果。
由于品酒员间存在评价尺度、评价位置和评价方向等方面的差异,导致不同品酒员对同一酒样的评价差异很大,从而不能真实地反映不同酒样间的差异。
因此,运用软件Matlab编程(程序见附录)来分析,各组内和各组间的评酒员的差异,我们把每个评酒员看做一个因子,分别记为A1A 2,…,A 10,他们在品尝同一种酒时,观察其对每种酒的评分X ,故我们采用单因子分析法。
即:2(,),1,2,...,.i i X N i s μσ= (1)显著性影响问题转化为因素A 不同水平下各随机变量总体的均值是否相等问题,即 检验假设是: 1021...μμμ=== 是否成立 (2)于是我们用Matlab 对各组红葡萄酒和白葡萄酒数据进行处理,得到下图:第一组红葡萄酒:图1 方差分析表图2 方差分析图方差分析表的最后一项,即F 统计量的上侧概率值为0.0003,其小于0.05,故我们认为第一组10个评酒员间存在显著性差异。
第二组红葡萄酒:图3 方差分析表图4 方差分析图方差分析表的最后一项,即F统计量的上侧概率值为1.44895e-012,其小于0.05,故我们认为第二组的10个评酒员间也存在显著性差异。
第一组白葡萄酒:图5 方差分析表图6 方差分析图第二组白葡萄酒:图7 方差分析表图8 方差分析图从图5、6、7、8中可以看出两组评酒员对白葡萄酒的评价F统计量的上侧概率值都为0,故认为都存在极大的显著性差异。
综上所述,在第一组对红葡萄酒的测定中,根据方差分析的判定知:第一组的F值大于第二组的F值,所以认为第一组的评酒员更可信些。
4.2问题二的模型分析、建立与求解4.2.1 问题的分析:问题二是要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,其中任何一种物质的优越,在排序中都不能是绝对的优越,需要的是综合实力的优越。
而酿酒葡萄的好坏和葡萄酒的质量有直接的关系,因此对酿酒葡萄进行分级一定要考虑到葡萄酒的质量。
于是整体就从两大因素考虑。
4.2.2 模型的建立与求解:在大部分实际问题中,需要考察的变量多,变量之间是有一定的相关性的,主要对于葡萄酒来说每一个微量元素都是很重要的,根据附件2给的数据将数据处理,如色泽采用色值差等,构成了具有说服力的众多指标,从而深刻的反映了问题的内在规律。
采用系统聚类分析法对酿酒葡萄进行分类,过程如下:本文是用SPSS软件进行分析(程序见附录),首先先将数据处理得到下表:描述统计量N 极小值极大值均值标准差氨基酸总量27 851.16921803889 8.39728381375E32.3853086455674E31.56555467561337E3蛋白质27 487.171948072892 700.827981438516555.5464269319785045.395729006263494VC含量27 .015 10.250 .49516 1.953180花色苷27 7.787320776794 408.027*******76 105.3770510245609189.615520288037640多酚氧化酶活力27 10.426580309030 50.43390128048823.828320025518629.803084228027409酒石酸27 2.06 15.51 6.4174 3.21707褐变度27 72.904870403936 1.305594765547E3358.79074298450460337.522696809669800DPPH 27 .175555132367 .665753501929 .34263179456513 .112084607013125总酚27 6.0746******** 30.114005296864 14.709066269927696.630424470421410单宁27 3.777921582644 25.417006774065 13.887894702794576.620137974872234总黄酮27 2.516944417819 24.294911906979 8.216711770084314.881087919900744白藜芦醇27 .210642547364 26.850873173754 4.803324999913925.474184934911904黄酮醇27 2.480205634715 164.992708162260 35.4449463963116340.447421068140756总糖27 150.337301587301 256.190476190476204.0740740740740823.090534952186808还原糖27 156.038107025682 303.950059475934226.4770815987317334.458724658480214可溶性固形物27 181.226666666667 261.100000000000216.1664197530864019.191543764727225PH值27 2.92 3.95 3.5019 .24534可滴定酸27 4.336666666667 9.313333333333 6.71827160493827 1.366125086678855固酸比27 22.808762480899 44.05271690522432.455420515187876.108781062615550干物质含量27 18.515 28.997 24.47784 2.469426 果穗质量27 63.61 793.47 239.8903 161.61720百粒质量27 98.300000000000 334.300000000000177.4481481481481659.319767487868795果梗比27 2.396666666667 6.406666666667 3.94086419753086 1.106576916577136出汁率27 53.0 78.4 67.200 7.2808 果皮质量27 .10 .33 .1922 .05667 色差值27 23.85648 30.79155 26.3958548 1.41519622 苹果酸27 .83 18.21 5.0467 3.80735 柠檬酸27 .00 2.51 1.1011 .73794 葡萄酒的质量27 53.9 85.6 73.056 7.3426 有效的 N (列表状态)27从上表可以可以得到对于所有元素中平均值较大有:氨基酸总量、蛋白质褐变度,相对较小的有:VC含量、DPPH自由基、柠檬酸、果皮质量,对于极值方面,极小值较小的DPPH自由基、果皮质量、柠檬酸、白藜芦醇,极大值较大有氨基酸总量、褐变度、蛋白质。