第二组红白葡萄酒酒均值标准差

合集下载

数学建模之葡萄酒的评价

数学建模之葡萄酒的评价

葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。

目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。

葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。

本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。

对于本题,我们主要采用SPSS和MATLAB软件对模型进行求解。

针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。

最后,我们通过T检验,在SPSS中可其相应的标准差,通过比较标准差来确定哪个组更可靠。

针对问题二,首先利用主成分分析法对酿酒葡萄的指标进行简化,将问题转化成一个多元函数的求解问题,然后分别对酿酒葡萄中的指标和葡萄酒理化指标进行相关性分析,得出指标间的相关性关系,将问题转化为求解超定方程组的解,最后利用最小二乘法建立了酿酒葡萄与葡萄酒理化指标间的关系式。

一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

二、问题分析2.1针对问题一,我们将它分成两个问题去解决1、针对问题一中的两组评酒员的评价结果有无显著性差异,我们在SPSS 中利用T检验去判断。

在这之前,我们对附录1中数据进行处理,利用excel 分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。

2012CUMCM_A题葡萄酒评价讲评

2012CUMCM_A题葡萄酒评价讲评

数据问题:缺失与异常数据处理
• 第一组红葡萄酒20号样本,评酒员4号中缺 色调数据-------取其他评酒员的均值,6; • 第一组白葡萄酒3号样本, 7号评酒员的持久 性超上限------77--7; • 第一组白葡萄酒8样本, 9号评酒员的持久性 超上限,16--6; • 酿酒白葡萄的百粒质量第三组数据太大, 2226.1--226.1。
问题一:建模
• 第一问:两组专家对同一组样本打分,分析两 组数据是否有显著性差异------直观理解:方差 分析,或t检验,F检验,秩和检验,Wilcoxon 符号秩检验,构造一些统计量,计算它们的值, 是否通过检验,给出结果。 • 第二问:确定哪一组专家更可信, 直观理解: 总体方差过小的组别区分度不好, 因此可以通 过比较方差大小来确定,也可以采用Cronbach 可信度系数,比较酒样F值和评酒员F值的相对 大小,Spearman秩相关系数,肯德尔和谐系 数法。
两组专家对红葡萄酒打分统计结果
白葡萄酒品评结果
第一组专家 第二组专家
总均值
73.98214
总均值
76.537037
方差
标准方差 最大
119.329
11.3597 95
方差
标准方差 最大
61.699
7.8548944 91
最小
中位值
40
76
最小
中位值Βιβλιοθήκη 4478初步分析结果
红葡萄酒: 二组均值基本相同,差异性不大 • 第一组方差明显大于第二组,从样本 区分度上说,第一组专家对红葡萄酒 的品评结果更可信 • 白葡萄酒评价结果类似:第一组优于 第二组
• 葡萄酒: 花色苷(mg/L) , 单宁(mmol/L), 总酚(mmol/L), 酒总黄酮(mmol/L), 白藜芦醇(mg/L), DPPH半抑制体积, 色泽; • 酿酒葡萄: 氨基酸总量,蛋白质,VC含量, 花色苷mg/100g鲜重, 酒石酸, 苹果酸, 柠檬酸, 多酚氧化酶活力, 褐变度, DPPH自由基1/IC50, 总酚,单宁,葡萄总黄酮,黄酮醇,白藜芦醇, 总糖,还原糖,可溶性固形物,PH值,可滴定酸, 固酸比,干物质含量,果穗质量,百粒质量, 果梗比,出汁率,果皮质量,果皮颜色

2012数学建模A题葡萄酒答案

2012数学建模A题葡萄酒答案

图一的两组红葡萄酒的平均值、和标准差第二组红葡萄酒标准差平均值标准差酒样品1 9.638465 酒样品1 68.1 9.048634 酒样品2 80.3 6.307843 酒样品2 74 4.027682 酒样品3 80.4 6.769211 酒样品3 74.6 5.541761 酒样品4 68.6 10.39444 酒样品4 71.2 6.425643 酒样品5 73.3 7.874713 酒样品5 72.1 3.695342 酒样品6 72.2 7.728734 酒样品6 66.3 4.595892 酒样品7 71.5 10.17895 酒样品7 65.3 7.91693 酒样品8 72.3 6.634087 酒样品8 66 8.069146 酒样品9 81.5 5.739725 酒样品9 78.2 5.072803 酒样品10 74.2 5.51362 酒样品10 68.8 6.014797 酒样品11 61.7 7.91693 酒样品11 61.6 6.168018 酒样品12 53.9 8.924996 酒样品12 68.3 5.012207 酒样品13 74.6 6.703233 酒样品13 68.8 3.910101 酒样品14 73 6 酒样品14 72.6 4.812022 酒样品15 58.7 9.250225 酒样品15 65.7 6.429965 酒样品16 74.9 4.254409 酒样品16 69.9 4.483302 酒样品17 79.3 9.381424 酒样品17 74.5 3.02765 酒样品18 59.9 6.871034 酒样品18 65.4 7.089899 酒样品19 69.4 6.25744 酒样品19 72.6 7.426679 酒样品20 78.6 5.103376 酒样品20 75.8 6.250333 酒样品21 77.1 10.77497 酒样品21 72.2 5.95912 酒样品22 77.2 7.11493 酒样品22 71.6 4.926121 酒样品23 85.6 5.699903 酒样品23 77.1 4.976612 酒样品24 78 8.653837 酒样品24 71.5 3.27448 酒样品25 69.2 8.038795 酒样品25 68.2 6.613118 酒样品26 73.8 5.593647 酒样品26 72 6.44636 酒样品27 73 7.055337 酒样品27 71.5 4.527693图二两组白葡萄酒的平均值、和标准差第一组白葡萄酒第二组白葡萄酒干白品种平均值标准差干白品种平均值标准差酒样品1 82 9.60324 酒样品1 77.9 5.087021 酒样品2 74.2 14.1798 酒样品2 75.8 7.00476 酒样品3 85.3 19.10817 酒样品3 75.6 11.93687 酒样品4 79.4 6.686637 酒样品4 76.9 6.488451 酒样品5 71 11.24475 酒样品5 26.1 5.126185 酒样品6 68.4 12.75583 酒样品6 75.5 4.766783 酒样品7 77.5 6.258328 酒样品7 74.2 1.212265 酒样品8 71.4 13.54991 酒样品8 72.3 5.578729 酒样品9 72.9 9.631545 酒样品9 80.4 10.30857 酒样品10 74.3 14.58348 酒样品10 79.8 8.390471酒样品11 72.3 13.30873 酒样品11 71.4 9.371351 酒样品12 63.3 10.76052 酒样品12 72.4 11.83404 酒样品13 65.9 13.06777 酒样品13 73.9 6.838616 酒样品14 72 10.68748 酒样品14 77.1 3.984693 酒样品15 72.4 11.4717 酒样品15 78.4 7.351493 酒样品16 74 13.34166 酒样品16 53.1 9.06826 酒样品17 78.8 12.00741 酒样品17 80.3 6.201254 酒样品18 73.1 12.51177 酒样品18 76.7 5.498485 酒样品19 72.2 6.811755 酒样品19 76.4 5.103376 酒样品20 77.8 8.024961 酒样品20 43.2 7.07421 酒样品21 76.4 13.14196 酒样品21 79.2 8.024961 酒样品22 71 11.77568 酒样品22 79.4 7.321202 酒样品23 75.9 6.607235 酒样品23 77.4 3.405877 酒样品24 73.3 10.54145 酒样品24 76.1 6.208417 酒样品25 77.1 5.820462 酒样品25 79.5 10.31988 酒样品26 81.3 8.53815 酒样品26 74.3 7.532168 酒样品27 64.8 12.01666 酒样品27 77 5.962848 酒样品28 81.3 8.969702 酒样品28 79.6 5.037636描述统计量N 均值标准差方差统计量统计量标准误统计量统计量VAR00003 27 68.5185 1.50722 7.83174 61.336 VAR00004 27 74.4444 2.24201 11.64980 135.718 VAR00005 27 72.7037 2.70265 14.04338 197.217 VAR00006 27 65.2963 1.44393 7.50290 56.293 VAR00007 27 74.1852 2.64469 13.74223 188.849 VAR00008 27 72.7037 2.13091 11.07254 122.601 VAR00009 27 71.2222 1.51002 7.84628 61.564 VAR00010 27 72.0741 1.95456 10.15619 103.148 VAR00011 27 78.4444 1.23035 6.39311 40.872 VAR00012 0Zscore(VAR00003) 0Zscore(VAR00004) 0Zscore(VAR00005) 0Zscore(VAR00006) 0Zscore(VAR00007) 0Zscore(VAR00008) 0Zscore(VAR00009) 0Zscore(VAR00010) 0Zscore(VAR00011) 0Zscore(VAR00012) 0描述统计量N 均值标准差方差统计量统计量标准误统计量统计量VAR00003 27 68.5185 1.50722 7.83174 61.336 VAR00004 27 74.4444 2.24201 11.64980 135.718 VAR00005 27 72.7037 2.70265 14.04338 197.217 VAR00006 27 65.2963 1.44393 7.50290 56.293 VAR00007 27 74.1852 2.64469 13.74223 188.849 VAR00008 27 72.7037 2.13091 11.07254 122.601 VAR00009 27 71.2222 1.51002 7.84628 61.564 VAR00010 27 72.0741 1.95456 10.15619 103.148 VAR00011 27 78.4444 1.23035 6.39311 40.872 VAR00012 0Zscore(VAR00003) 0Zscore(VAR00004) 0Zscore(VAR00005) 0Zscore(VAR00006) 0Zscore(VAR00007) 0Zscore(VAR00008) 0Zscore(VAR00009) 0Zscore(VAR00010) 0Zscore(VAR00011) 0Zscore(VAR00012) 0有效的 N (列表状态)0模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001个案处理摘要N变量处理摘要变量因变量自变量VAR00003 VAR00007 VAR00005 VAR00011 VAR00008 VAR00004 正值数27 27 27 27 27 27 零的个数0 0 0 0 0 0 负值数0 0 0 0 0 0 缺失值数用户自定义缺失0 0 0 0 0 0 系统缺失0 0 0 0 0 0模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001个案处理摘要N个案总数27已排除的个案a0模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001。

2012高教杯数学建模竞赛论文A题(省三等奖)

2012高教杯数学建模竞赛论文A题(省三等奖)

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):03011所属学校(请填写完整的全名):东北林业大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012年 09 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要为了让葡萄酒的潜在投资者进入葡萄酒市场,让优秀的新葡萄酒生产商快速的建立知名度,也为了增强购买者的决策信心,葡萄酒市场通常采取聘请一批有资质的评酒员对葡萄酒进行品评打分的方法,从而对葡萄酒的质量进行量化标识。

本文要解决的问题即是以此为背景而提出的。

我们解决的问题有:(1)问题一中,本文利用SPSS软件,首先分析出附录1中对第一组红葡萄酒、第一组白葡萄酒、第二组红葡萄酒和第二组白葡萄酒四组葡萄酒评价结果的数据分布基本服从正态分布,进而通过SPSS配对样本t检验,检验出两组评酒员的评价结果存在显著性差异,并通过方差分析比较判断出第二组评酒员的评价结果更加可信。

基于数据分析的葡萄酒评价模型

基于数据分析的葡萄酒评价模型

基于数据分析的葡萄酒评价模型摘要本文就葡萄酒的评价问题进行了分析研究,首先对所有评酒员的评分结果采用逐对比较法()1(2-≥=hn t hns hd ht hdα)和双样本t 假设检验法进行分析,然后对葡萄和葡萄酒的理化指标基本数据进行统计分析及无量纲化处理,再对其用主成分分析法(),,2,1,(),(p j i e x z p l ij i j i ij ===λ)、典型性相关分析法、多元线性规划分析法([][]alpha X Y regress stats r b b ,,int,int,,=,int),(r r rcopht )和TOPSIS 法(n j m i a a b mi ijijij ,,2,1,,,2,1,12===∑=)进行相关性分析,最后针对各个问题建立模型求解.针对问题一,我们首先利用EXCEL 对葡萄酒品尝评分表的分数数据进行处理,然后利用MATLAB 软件绘制出所有葡萄酒样品的分数曲线图,因为样本总体相同,i i y x -服从正态分布,采用逐对比较法得到两组红白葡萄酒综合评价的差值,确定出两组评分无显著性差异.再利用双样本t 假设检验方法判断最终得出第二组评酒员的评分结果更可信.针对问题二,我们首先利用EXCEL 及MATLAB 软件对附件二指标总表中的一、二级指标数据分别进行处理,然后利用主成份分析法,用贡献率(),,2,1(1p i pk ki=∑=λλ)对各主成分加权求和,得到样本总得分,由于我们在问题一中已得出第二组评酒员的评分结果更可信,故设样本总得分与第二组数据符合二八原理,计算得到一组综合分数,最终分析确定红葡萄可分为五个等级,白葡萄可分为六个等级.针对问题三,我们首先对酿酒葡萄和葡萄酒的理化指标数据进行预处理,提取两个有代表性的综合变量,再利用典型性相关分析处理得到两组指标之间的整体相关性联系,呈现出对应相关关系.针对问题四,由于在问题三中已得出酿酒葡萄和葡萄酒的理化指标之间存在着整体相关关系,我们首先对附件二指标总表中的数据进行无量纲化处理,然后采用多元线性回归分析得到酿酒葡萄和葡萄酒的理化指标与葡萄酒质量(分数)的线性相关关系,最后利用TOPSIS 法论证确定出不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.关键字 t 假设检验 无量纲化 主成分分析 典型性相关分析 多元线性规划分析一问题提出1.1问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量.酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量.附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据.请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级.3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系.4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?1.2 问题分析问题要求我们通过研究葡萄酒和酿酒葡萄的理化指标以及葡萄酒的品尝评分,分析评价结果的差异性、可信度,以及酿酒葡萄对葡萄酒质量之间的影响,说明酿酒葡萄与葡萄酒的理化指标之间的关系,确定是否能用葡萄酒和葡萄的理化指标来评价葡萄酒的质量.问题一,根据附件一中两组品酒员对红白两种葡萄酒的评分,利用逐对比较法得出hd,bd,hs,bs,hd,bd,再得出btht,值,在利用双样本均值差t检验法得出两组评价结果有无显著性差异,再对所得数据进行双样本t假设检验方法判断哪组更可信.问题二,根据附件二中酿酒葡萄的理化指标,先对每种含量进行求和再平均,(见附录三表三、表四),然后利用主成分分析法,得出所有成分中的主成分、特征值特征向量以及主成分得分等,最后利用贡献率对主成分得分加权,得出一组得分,将总得分与附件一中二组的数据根据一定的比例进行加权计算,得到总得分,对总得分进行排序,就得到了酿酒葡萄的分级.问题三,针对本问题,先提取两组变量中具有代表性的数据,利用典型性分析,对这些数据建模求解,得到一个整体的相关性.反应酿酒葡萄与葡萄酒理化指标之间的联系.问题四,因为酿酒葡萄和葡萄酒的理化指标之间有联系,所以在考虑他们对葡萄酒质量影响时,可以把它们两个综合起来考虑对葡萄酒质量的影响,即希望能建立一种关系,所以用多元线性回归分析,这样便能得出它们对葡萄酒的质量有否影响.二模型假设1、假设题目所给数据真实可靠.2、假设每组评酒员品的是同一样酒.3、假设附件一中评酒员的评价结果反映了葡萄酒的质量.4、假设葡萄酒样品和葡萄酒一一对应,例如27号红葡萄酒是由27号红葡萄生产而来.5、假设二级指标影响很小,我们可以忽略它的影响.6、不考虑因个人口味、爱好不同对葡萄酒打分的影响,不考虑因环境等不同对葡萄酒和葡萄理化指标的影响.三符号说明x:第一组得分.y:第二组得分.hx:第一组每位品酒师对每个红酒样品各个方面评分的和,即综合评价.bx:第一组每位品酒师对每个白酒样品各个方面评分的和,即综合评价.hy:第二组每位品酒师对每个红酒样品各个方面评分的和,即综合评价.by:第二组每位品酒师对每个白酒样品各个方面评分的和,即综合评价.hd:两组红葡萄酒综合评价的差值.bd:两组白葡萄酒综合评价的差值.hs:hd的标准差.bs:bd的标准差.hd:hd的平均值.bd:bd的平均值.hn:红葡萄酒样品个数,即27.bn:白葡萄酒样品个数,即28.四模型建立与求解问题一1、数据处理利用附件一中的数据,求出每个评酒员对每个酒样评价的综合评分,用MATLAB 对这些数据进行处理,见附录三(表一,表二).2、模型建立我们首先考虑对每个样品的十个综合评分求平均值,用MATLAB作图(见下图),结果不能判断有无显著性差异.然后采用逐对比较法,以红葡萄酒为例:红葡萄酒共有27对相互独立的观察结果:),(,),,(),,(27272211hy hx hy hx hy hx ,令272727222111,,,hy hx hd hy hx hd hy hx hd -=-=-= ,则2721,,,hd hd hd 相互独立,又由于2721,,,hd hd hd 是有统一因素所引起的,可认为他们服从同一分布.今假设i hd ~),(2hd hd N δμ,27,,2,1 =i .这就是说2721,,,hd hd hd 构成正态总体),(2hd hd N δμ的一个样本,其中2,hd hd δμ未知.我们需要基于这一样本检验假设: (1);0:,0:10≠=hd hd H H μμ (2);0:,0:10〉≤hd hd H H μμ (3) ;0:,0:10〈≥hd hd H H μμ分别记2721,,,hd hd hd 的样本均值和样本方差的观察值,hd 2hd s .检验问题(1),(2),(3)的拒绝域分别为(显著性水平为α):)1(2-≥=hn t hns hd ht hdα,)1(-≥=hn t hns hd ht hdα, )1(--≤=hn t hns hd ht hd α.现在回过来讨论本例的检验问题.先做出同一试块分别由y x h h ,测得的结果之差.按题意需检验假设;0:,0:10≠=hd hd H H μμ现在4786.2)26()26(,27005.02===t t h n ε即知拒绝域为4786.2≥=hns hd ht hd.若4786.2〈ht ,则t 的值不落在拒绝域内,故接受0H ,认为两组对红葡萄酒的评分无显著性差异,反之则反. 3、 模型求解利用逐对比较法(程序见附录二附件一),求出ht 与bt (见图1),在α=0.01下进行t 分布的显著性分析,得出两组评酒员的评价结果无显著性差异,再对数据进行双样本均值差t 检验法(见图二),结果得出二组更可信.问题二1、 数据分析首先对附件二酿酒葡萄的理化指标进行数据处理(见附录三表三、表四) 2、 模型建立1)计算相关系数矩阵⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=pp p p p p r r r r r r r r r R 212222111211... (1) ij r (p j i ,...2,1,=)为原变量的i x 与j x 之间的相关系数,其计算公式为∑∑∑===----=nk nk j kj i kij j k nk i ik j i x x x xx x x xr 11221)()()()( (2)因为R 是是对称矩阵(即i j j i r r =),所以只需计算上三角元素或下三角元素即可. 2)计算特征值与特征向量首先解特征方程0=-R I λ,通常可用雅可比法(Jacobi )求出特征值),,2,1(p i i =λ,并使其按顺序大小排列,即0...,321≥≥≥≥p λλλλ;然后分别求出对应于特征值i λ的特征向量),,2,1(p i e i =.这里要求,1=即∑==pj ij e 121,其中ij e 表示向量i e 的第j 个分量.3)计算主成分贡献率及累计贡献率 主成分i z 的贡献率i α为),,2,1(1p i pk ki=∑=λλ累计贡献率为),,2,1(11p i pk kik k=∑∑==λλ一般取累计贡献率达85-95%的特征值m λλλλ,,,,321 所对应的第一、第二、第)(p m m ≤个主成分. 4)计算主成分载荷量 其计算公式为),,2,1,(),(p j i e x z p l ij i j i ij ===λ (3)得到各主成分的载荷后,利用特征向量,得到各主成分的得分⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=nm n n m m z z z z z z z z z Z 212222111211 (4)5)主成分分析用于系统评估利用主成分p z z z ,,,21 做线性组合,并以每一个主成分i z 的方差贡献率i α作为权数,构造一个综合评价函数p p z z z y ⋅++⋅+⋅=ααα 2211 (5) 也称y 为评估指数,依据对每个样品得出的y 值进行分级. 3、 模型求解利用MATLAB 编写程序,得出y 的值.(程序见附录二附件二) 得出的y 值越大说明酿酒葡萄的质量越高,葡萄酒质量的衡量用附件一中二组的数据(由题一知二组比一组更可靠),利用二八原理得出葡萄酒和酿酒葡萄的综合得分(见附录三表五),找出最大值max ,最小值min ,组距6min)(max -=d ,红葡萄酒得出5个小区间,划分为5个等级,白葡萄酒得出6个小区间,划分为6个等级,划分等1、 数据分析在两组变量中提取有代表性的两个综合变量,对综合变量进行标准化处理(见附录二附件三),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性.2、 模型建立本模型对两组指标酿酒葡萄和葡萄酒的理化指标作典型相关分析.其中, 酿酒葡萄指标:211,,A A葡萄酒的理化指标:3022,,A A第一步,计算相关系数阵3030)(⨯=ij r R ,具体结果见附录表1A 2A … 29A 30A⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎣⎡--------0000.13113.02401.03680.03113.00000.13486.01073.02401.03486.00000.11097.03680.01073.01097.00000.1302921A A A A 第二步,典型相关系数及其检验,将酿酒葡萄指标和葡萄酒的理化指标数据经过整理利用 MATLAB 软件的canoncorr 函数进行处理,得出如表1所示结果:由表1可知,前6个典型相关系数均较高,表明相应典型变量之间密切相关.进行相关系数的2χ统计量检验确定典型变量相关性的显著程度,比较统计量2χ计算值从上表得知这9对典型变量均通过统计量检验,表明相应典型变量之间相关关系显著,酿酒葡萄与葡萄酒的理化指标之间有相关联系.第三步:典型相关模型由于原始变量的计量单位不同,不宜直接比较,本文采用标准化的典型系数,给出典型相关模型,如公式⑴~⑹所示⎪⎪⎪⎩⎪⎪⎪⎨⎧+++++=++++++++++++-=302928272625242322121201918171615141312111098765432110.1859A -0.1243A 0.8060A0.9033A - 0.1438A 0.7253A 1.1161A -0.5222A 0.9882A V0.2576A - 0.6898A 0.6145A 0.3881A 0.8054A -0.9221A -0.0797A 0.8424A 0.1035A-0.1112A 0.6588A 0.5552A - 0.6333A - 0.8875A 2.1858 -0.53080.07880.53010.0333- 0.14192666.0 A A A A A A A U ⑴ ⎪⎪⎪⎩⎪⎪⎪⎨⎧++++++=++++++++=302928272625242322221201918171615141312111098765432120.3811A 1.0582A 1.9635A0.7222A 0.6133A - 1.1626A -2.8979A 1.2812A - 0.5658A V0.2346A 0.2256A -0.1844A 0.1093A 0.0087A -1.4993A 0.1513A 0.7407A - 0.6954A-0.6504A - 0.3317A - 0.1804A - 0.0854A - 0.6617A -0.7315 0.2775 0.4173- 0.0114 0.0908- 0.8853-0.1777 A A A A A A A U ⑵ ⎪⎪⎪⎩⎪⎪⎪⎨⎧+-+++=+++++-+++++=302928272625242322321201918171615141312111098765432130.6108A 1.1652A -0.2270A0.2647A 0.5229A 0.4005A 1.3208A -0.3465A -0.0115A V0.7740A 0.0768A 0.1494A - 0.5894A 0.7736A 0.8003A 0.0571A 0.0390A -0.1631A - 0.1316A 0.3281A - 0.3523A - 0.5051A 0.7135A -1.9691 1.6219-0.6603 1.1176-0.4611- 0.0626 -0.1341A A A A A A A U ⑶ ⎪⎪⎪⎩⎪⎪⎪⎨⎧-++++=++++++++++++=302928272625242322421201918171615141312111098765432140.8632A - 0.6128A -2.1413A0.3405A 0.1296A 0.1725A 1.7119A -1.1137A 2.7421A - V0.4821A 0.2111A -0.0337A - -0.4764A 0.8511A - 3.8525A -0.4394A -0.8279A 0.7593A 1.6148A 1.4068A 0.0829A 0.4232A -1.5406A 2.0668 -0.90220.17060.2461-0.5411 0.1621-0.0964A A A A A A A U ⑷ ⎪⎪⎪⎩⎪⎪⎪⎨⎧-+++=+++++++++++=302928272625242322521201918171615141312111098765432150.9032A -0.5843A -1.5873A0.0911A - 0.1586A 0.1056A 1.3940A 1.8497A -1.4755A - VA 0.2073 0.0210A 0.6044A - 0.1196A - 0.8591A 0.2084A 0.2593A -0.1736A - 0.7033A - -0.3871A - 0.0474A 0.1275A - 0.3342A 0.0629A - 1.6602 -1.22400.1262 0.3456- 0.4287- 0.2810 -0.0774A A A A A A A U ⑸ ⎪⎪⎪⎩⎪⎪⎪⎨⎧-++=+++++++++++++=302928272625242322621201918171615141312111098765432160.0113A - 0.2930A -1.2336A 0.5983A 0.6340A 1.1863A -1.1943A -0.1001A -0.1006A V1.1199A 1.6234A -0.5710A - 0.4459A 1.2038A 1.1480A -1.0176A -0.2293A 0.1792A0.1712A 0.4702A 0.3912A 0.8888A 0.0378A - 1.1037 2.3197-0.59180.4889-0.2723 0.3094 0.3201- A A A A A A A U ⑹ 3、结果分析由公式⑴典型相关方程可知,酿酒葡萄的主要指标是7A ,8A ,14A ,16A ,17A ,说明酿酒葡萄中影响葡萄酒理化指标的主要因素是总酚(7A )、单宁(8A )、PH(14A )、干物质含量(16A )、果穗质量(17A ),葡萄酒的第一典型变量1V 与22A ,24A ,27A ,28A 呈高度相关;根据公式⑵典型相关方程,2A (花色苷)是酿酒葡萄的主要因素,葡萄酒的第二典型变量2V 与23A ,24A ,25A ,28A ,29A 呈高度相关;公式⑶中酿酒葡萄的主要指标是6A ,7A ,16A ,葡萄酒的第三典型变量3V 与24A ,29A 呈高度相关;公式⑷酿酒葡萄的主要指标是6A ,7A ,8A ,11A ,12A ,14A ,17A ,葡萄酒的第四典型变量4V 与22A ,23A ,24A ,28A 呈高度相关;公式⑸酿酒葡萄的主要指标是6A ,7A ,葡萄酒的第五典型变量5V 与22A ,23A ,24A ,28A 呈高度相关;公式⑹酿酒葡萄的主要指标是15A ,16A ,17A ,20A ,21A ,葡萄酒的第六典型变量6V 与24A ,25A ,28A 呈高度相关.由于第一组典型变量信息比重较大,所以总体上酿酒葡萄与葡萄酒主要理化高度相关的主要指标是7A ,6A ,16A ,17A ,8A ,14A ,2A ,11A ,12A ,14A ,15A ,20A ,21A ,反映葡萄酒的理化指标与酿酒葡萄高度相关的指标为22A ,23A ,24A ,25A ,27A ,28A ,29A .问题四1、模型建立[][]alpha X Y regress stats r b b ,,int,int,,= int),(r r rcophtn j m i aa b mi ijijij ,,2,1,,,2,1,12 ===∑=程序见附表二附件,残差图见附录一图三、图四. 2、结果分析 以红葡萄酒为例 2997.5;5148.7010==ββ y =70.5148+5.29971x ,9842.02=r ;(越接近于1,回归效果越显著) 05.00255.0≤=p ,回归模型成立.从残差图可以看出,除第8,11,20三个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型y =70.5148+5.29971x ,能较好的符合原始数据,而这三个个数据可视为异常点. 同理,白葡萄的多元线性回归成立. 用TOPSIS 法,对能否用葡萄酒和葡萄酒的理化指标来评价葡萄酒的质量进行分析, (1)用向量规划化的方法求得规范决策矩阵。

大学生数学建模竞赛A题优秀论文A题葡萄酒定稿版

大学生数学建模竞赛A题优秀论文A题葡萄酒定稿版

大学生数学建模竞赛A 题优秀论文A题葡萄酒 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显着性差异,对于白葡萄酒只有53%的评价结果存在显着性差异。

通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显着性差异,而对于白葡萄酒的评分,评价差异性较为不明显。

为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。

综合来看,主观因素对葡萄酒质量的评价具有不确定性。

结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。

将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。

为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显着的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。

葡萄酒的质量评估

葡萄酒的质量评估

72.9 72.3 63.3 65.9 72 72.4 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3 采用单因素分析,Matlab 软件作图如下:
80.4 71.4 72.4 73.9 77.1 78.4 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6
得到 P=0.0017<0.01 说明两组评酒员的评价结果存在显著性差异 采用双因素分析,得出下图,
抽取红葡萄酒中的 7、10、11 号样品 第一 1 2 3 4 5 组评 酒员 7 63 70 76 64 59 10 67 82 83 68 75 11 73 60 72 63 63 第二 1 2 3 4 5 组评 酒员 7 68 65 68 65 47 10 67 73 82 62 63 11 64 61 67 62 50
P 值均小于 0.05,说明两组样品存在显著性差异,而且某组评酒员之间的评价也存在显 著性差异。 样品 11 通过软件计算出 P 值,P=0.0003<0.01 说明两组样品评价存在非常显著性差异, 而另一个 P=0.1978>0.05,说明每个组各个评酒员间对于样品 11 的评价差异不大。
所以,对于红葡萄酒而言,第二组评酒员的结果更可信。 对于白葡萄酒可以采用相同的分析方法, 白葡萄酒: 第一组平均值 第二组平均值 82 77.9 74.2 75.8 79.4 76.9 71 81.5 68.4 75.5 77.5 74.2 71.4 72.3
白葡萄酒 样品 1 样品 2 样品 4 样品 5 样品 6 样品 7 样品 8 样品 9 样品 11 样品 12 样品 13 样品 14 样品 15 样品 17 样品 18 样品 19 样品 20 样品 21 样品 22 样品 23 样品 24 样品 25 样品 26 样品 27 样品 28

葡萄酒评价的数学模型2

葡萄酒评价的数学模型2

葡萄酒评价的数学模型摘要自埃及有了制造葡萄酒的记录后,我们大多数都对他亲睐有加。

然而葡萄酒的鉴定却需要一批更加专业的以及有资历的评酒员进行评价,并通过这一环节得到葡萄酒的分类指标分值,进而得到总分,从而确定葡萄酒的质量。

酿葡萄酒的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

本文主要解决以下几个问题:对于问题1,采用单因素分析法,运用MATLAB软件及SPSS进行求解分析,最后再根据方差来判断。

对于问题2,在问题一中得到的数据评分较为可靠,因此根据评分来分级,通过MATLAB软件对该组的成分进行检验,并且根据Excel软件作图分析数据,找出影响葡萄酒分级的成分,并在酿造葡萄酒的理化指标中找出与之相同的成分,再结合问题一中葡萄酒的评分对其进行分级,得出葡萄样品成分的排列,结合成分的量和葡萄酒分级得出影响酿酒葡萄分级的范围。

对于问题3,在问题2的基础上利用题目所提供的附件2,对所有理化指标进行分析,并用MATLAB软件拟合数据,做出拟合线性图,并采用多元回归分析法进行回归分析,最后综合分析各理化指标之间的关系。

对于问题4,可以结合题目中的附件3中关于芳香物质的数据,利用MATLAB 进行分析,拟合感官指标和理化指标的依据,得出结论:可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键字:方差分析法分级理化指标线性相关回归分析一.问题的重述作为世界上最富于变化的葡萄酒,是有生命的酒,得到了世界各地人们的亲睐,在我国也不例外。

据IWSR预测三年后中国将超过日本成为世界第七大葡萄酒消费市场,同事,一些不法商贩开始造假酒,影响国人的健康,虽然我国的GB15037-2006《葡萄酒》国家标准对葡萄酒的质量作了规定,但是我国关于葡萄酒质量等级划分的标准还未完善,国家需要制定相关统一的等级制度。

确定葡萄酒质量是一般通过聘请一些有资质的评酒家对葡萄酒的各类指标进行分类打分,最后得到总分,从而确定其质量。

2012年数学建模A题葡萄酒评价

2012年数学建模A题葡萄酒评价

摘要对于问题一,我们首先对数据进行预处理,分别求出了第一、二组的评酒员对红白葡萄酒品尝评分的平均值,然后把问题转换成两独立样本的参数检验问题。

考虑到两个独立样本分布形态不确定,我们采用非参数检验中的Wilcoxon秩和检验判断样本是否有显著性差异,结果显示两组双侧渐近显著值分别为0.044,0.022,均小于0.05,即两组评酒员的评价结果有显著性差异。

对于可信度,我们是通过标准差来评判,标准差能反映一个数据集的离散程度。

计算得到的标准差值如表5.1.2.3所示,第一组的标准差值均大于第二组,所以可信度比第一组要高。

对于问题二,我们通过spss软件运用聚类分析,将酿酒葡萄大致分为了四类,结果以表5.2.7,表5.2.8显示。

除此之外,我们根据主成分分析法,得到酿酒葡萄的主成分和权重,再计算出综合主成分值,进而对样品进行等级分类。

相比较而言,主成分分析法的等级分类更精确。

对于问题三,酿酒葡萄包含多个理化指标,我们首先根据问题二中主成分分析的成分矩阵表,对其简化得到了相关的主要指标。

然后对酿酒葡萄的理化指标和葡萄酒的理化指标进行双变量相关性分析,得出二者的相关性关系如表5.3.1,表5.3.2所示。

对于问题四,我们将附件一中的平均评分高低视为葡萄酒质量好坏,直接将酿酒葡萄和葡萄酒的理化指标的数据导入spss中,分别进行双变量分析,得出了理化指标与葡萄酒评分的相关性联系,如附录3 所示。

结果发现,在影响白葡萄酒的质量上,白葡萄与白葡萄酒的理化指标皆对其影响不大,没有一个相关系数超过了0.5。

红葡萄酒的影响情况与白葡萄酒一样,但是红葡萄的PH值、果酸、褐变度与多酚化氧活力,这些指标对红葡萄的评分的影响较高,相关系数皆高于了0.5.所以,相对于酿酒葡萄而言,红葡萄的理化指标影响比白葡萄要大,因而不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键词:非参数检验聚类分析主成分分析双变量相关性分析 SPSS1问题重述葡萄酒的生产有着非常久远的历史,可上溯至几千年前,它是一种世界通畅性酒种,有着广泛交流的基础,现已发展成最主要的酒种之一。

基于理化指标分析的葡萄及葡萄酒的评价

基于理化指标分析的葡萄及葡萄酒的评价

基于理化指标分析的葡萄与葡萄酒的评价摘要针对酿酒葡萄与葡萄酒理化指标的统计,通过聚类法,典型相关分析及逐步回归分析法等,建立数据统计模型:对于问题一,首先对两组数据进行整理分析,然后利用spss软件进行配对数据t-检验(详见第三页表二),从而判断出两组评酒员的评价结果具有显著性差异。

而后利用excel进行方差分析-无重复双因子分析得出二组结果更为可信。

详细见第 3 页。

对于问题二,使用matlab软件对原始变量进行主成分分析得出中和变量,然后使用spss软件应用离差平方和法对中和变量进行聚类分析,从而根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,为了检验欧式测距是否可以正确区分出葡萄的等级,所以对主成份分析后的理化指标求均值,经过验证,均值相差大,足以区分葡萄等级,最终将红葡萄分为3级,白葡萄分为4级。

详细见第 5 页。

对于问题三,首先通过matlab软件对葡萄酒的理化指标进行主成分分析,得出中和指标。

然后使用spss软件进行典型相关分析,得到葡萄酒的理化指标与酿酒葡萄的理化指标的关联度。

再通过对关系度表格的分析,得到酿酒葡萄与葡萄酒的理化指标之间的联系。

详细见第 14 页。

对于问题四,考虑到葡萄酒质量与酿酒葡萄和葡萄酒理化指标可能成线性关系,故应用逐步回归分析,将葡萄酒质量设为因变量,酿酒葡萄和葡萄酒理化指标设为自变量,列出线性回归方程,通过spss软件进行数据拟合和显著性分析,排除影响不显著的变量,将因变量与评酒员打分结果对比,得出拟合结果基本符合。

再通过分析得到分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。

最后根据F检验判断所得数据的正确性。

由于葡萄酒可能会收到年份和贮藏环境等其他因素的影响,因此不能单纯地通过葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

详细见第 16 页。

关键字:典型相关分析 t检验主成分分析一、问题重述葡萄酒是一种成分复杂的酒精饮料,不同产地、年份和品种的葡萄酒成分不同。

红,白葡萄酒品尝评分的均值和标准差 - 副本

红,白葡萄酒品尝评分的均值和标准差 - 副本

第一组第二组第一组第二组第一组第二组第一组酒样品162.7068.109.649.05酒样品173.3076.4310.54酒样品280.3074.00 6.31 4.03酒样品273.1074.8712.51酒样品380.4074.60 6.77 5.54酒样品364.8075.6012.02酒样品468.6071.2010.39 6.43酒样品479.4074.35 6.69酒样品573.3072.107.87 3.70酒样品571.0078.5111.24酒样品672.2066.307.73 4.60酒样品665.9075.3913.07酒样品771.5065.3010.187.92酒样品777.1078.77 5.82酒样品872.3066.00 6.638.07酒样品874.3077.9914.58酒样品981.5078.20 5.74 5.07酒样品982.0073.579.60酒样品1074.2068.80 5.51 6.01酒样品1072.9074.619.63酒样品1170.1061.608.41 6.17酒样品1172.3073.0513.31酒样品1253.9068.308.92 5.01酒样品1268.4072.4012.76酒样品1374.6068.80 6.70 3.91酒样品1371.4076.6913.55酒样品1473.0072.60 6.00 4.81酒样品1472.0075.1310.69酒样品1558.7065.709.25 6.43酒样品1572.4076.1711.47酒样品1674.9069.90 4.25 4.48酒样品1663.3067.3010.76酒样品1779.3074.509.38 3.03酒样品1777.5076.95 6.26酒样品1859.9065.40 6.877.09酒样品1871.0075.9111.78酒样品1978.6072.60 6.887.43酒样品1972.2078.25 6.81酒样品2078.6075.80 5.10 6.25酒样品2077.8073.838.02酒样品2177.1072.2010.77 5.96酒样品2178.8073.3112.01酒样品2277.2071.607.11 4.93酒样品2276.4077.4713.14酒样品2385.6077.10 5.70 4.98酒样品2375.9079.03 6.61酒样品2478.0071.508.65 3.27酒样品2474.0077.7313.34酒样品2569.2068.208.04 6.61酒样品2585.3074.0919.11酒样品2673.8072.00 5.59 6.45酒样品2681.3074.308.54酒样品2773.0071.507.06 4.53酒样品2774.2075.6514.18酒样品2881.3077.218.97均值标准差白葡萄酒评分均值标准差红葡萄酒评分标准差第二组5.097.0011.946.495.134.776.495.5810.318.399.3711.836.843.987.359.076.205.505.107.078.027.327.416.2110.3210.145.965.04。

葡萄酒的评价-全国大学生数学建模竞赛题答案

葡萄酒的评价-全国大学生数学建模竞赛题答案

数学实验计算机科学与技术成员:xxx学号:xxxxxxxxxx葡萄酒的评价摘要本文主要研究的是如何对葡萄酒进行评价的问题。

通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。

在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。

之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。

而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。

置信区间越窄,说明其越可信。

利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。

在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量再按照方差依次递减的顺序排列。

在数学变换中保持变量的总方差不变,使第一变量具有最大的方差。

第二变量的方差次大,并且和第一变量不相关。

由于变量较多,虽然每个变量都提供了一定的信息,但其重要性有所不同。

依次类推,最后我们将酿酒葡萄分为了四个等级:优质、次优、中等、下等。

在问题三中,我们通过多项式曲线拟合的方法,构造一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正相关。

在问题四中,我们用无交互作用的双因素试验的方差分析方法,通过对观测、比较、分析实验数据的结果,鉴别出了两个因素在水平发生变化时对实验结果产生显著性影响的大小程度。

最后,我们认为能用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显著。

关键词:T检验法,Matlab,正态分布,主成分分析法,多项式曲线拟合,方差分析一.问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

葡萄酒评价模型.

葡萄酒评价模型.

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) : 1.2.3.指导教师或指导教师组负责人 (打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价模型摘要本文对葡萄酒的评价过程及其重要评价指标做了较为科学细致的研究。

为客观公正的评价葡萄酒的质量并揭示酿酒葡萄与葡萄酒质量之间的关系,提供了一套客观完整的从原材料到产成品的评价体系。

目前国内外对葡萄酒的评价主要依靠评酒员,鉴于不同评酒员的能力及偏好等对酒品评价的影响,我们在第一问中运用统计学中常用的方差分析法,找出了两组评酒员评价结果的置信区间。

进而对两组评酒员的评价结果进行差异性、合理性分析,得出结论。

第二问中对于对酿酒葡萄的分级,我们先利用国际通用的主要理化指标对葡萄进行分级,然后用主成分分析法得出酿酒葡萄的主要评价指标,进而用科学而又简便的人工神经网络分析法建立了一套BP神经网络对葡萄进行分级,并用部分数据进行验证,取得了较好的模拟效果。

数学建模——葡萄酒的质量分析

数学建模——葡萄酒的质量分析

数学建模——葡萄酒的质量分析葡萄酒的质量分析摘要据考古学家考证,人类在10000年前的新石器时代就开始了采集野生葡萄果实及进行天然的葡萄酒酿造。

而中国古代即有各种野生葡萄,古人称葡萄为蒲桃,为皇家果园的珍奇果品。

周朝已有蒲桃的记载。

葡萄酒历史悠久,在今天也越来越受广大人民的喜爱,我们将在本文中对葡萄酒的评价及葡萄酒与酿酒葡萄之间的联系建立模型。

针对问题1:我们要分析两组评酒员的评价结果有无明显差异。

我们先求出它们的方差进行对比,在评价酒的质量的好坏时,要考虑外观、香气、口感和平衡(整体),将它们综合起来才是评价葡萄酒的综合标准。

我们求出每一个小组对某一种酒的评价的平均值及方差,用Matlab 程序作出对应的方差波动图。

通过两组数据和图的对比,可看出第一小组的变化波动比第二组的变化波动大。

因此,我们认为第二组的评价结果更可信。

针对问题2:在附录二中葡萄酒的理化指标只取一级指标,剔除二级指标。

对多次测试的项目取平均值,精简得到酿酒葡萄的理化指标分析表,共27个指标。

为了把指标复杂的关系进行简化,对理化指标用spss 做主成分分析并求解第i 样红葡萄综合指数Zi 。

Zi=1(1,1)2(1,2)3(1,3)(1,)****n n a Y a Y a Y a Y ++++b1 i=1,2,3.....27 , n=1,2 (7)同理可求白葡萄的综合指数,然后根据所求解得到的数据Zi 进行分段划分,进而划分酿酒葡萄的级别:红葡萄酒为:第一类:得分大于2, 9、23。

第二类:得分2~1,3、17、2、20。

第三类:得分1~0,14、5、19。

第四类:得分小于-2, 10、25、15、18、7、11。

白葡萄酒为:第一类,得分大于2: 17、22。

第二类,得分2~0: 5、9、28、10、21、27、1。

第三类,得分0~-2,26、2、18、13、14、7。

第四类,得分小于-2: 12、8、11、16。

针对问题3:所用的方法和问题2相同,我们仍用主成分分析法来建立模型。

数学建模竞赛试题-葡萄酒质量评价

数学建模竞赛试题-葡萄酒质量评价

葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。

通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。

为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。

综合来看,主观因素对葡萄酒质量的评价具有不确定性。

结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。

将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。

为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。

由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对葡萄酒的质量的作用。

葡萄酒质量评价模型

葡萄酒质量评价模型

葡萄酒质量评价模型摘要葡萄酒质量的高低评估是通过评酒专家对葡萄酒的感官评分来体现。

酿酒葡萄和葡萄酒的理化指标一定程度上反映了葡萄酒的质量。

问题一,首先对附件1的数据进行预处理,分别求得评酒员关于样品酒的4组平均得分,在此基础上,利用F检验,发现不管对于红葡萄酒还是白葡萄酒,两组评酒专家的评分结果都存在显著的差异。

此外,建立了评价可信度的层次分析模型,发现第二组评酒员的评分更加可信。

问题二,运用主成分分析对酿酒葡萄的30个理化指标进行降维,主成分降维后减少了变量间的重叠部分,然后通过Q型聚类对酿酒葡萄酒的样品进行归类,利用问题一中第二组评分数据,得到每一类样品的平均得分,通过得分的大小来分等级。

问题三,建立了酿酒葡萄与葡萄酒理化指标的典型相关分析模型,得出酿酒葡萄与葡萄酒理化指标之间有着密切的联系。

如:红葡萄与红葡萄酒的理化指标的第一典型相关系数(1)1=0.99r,第一典型变量)1(1u可以解释29.9%红葡萄理化指标组内变差,并解释39%红葡萄酒理化指标的变差;其两者的相关系数相互解释每组内的变差。

问题四,对于酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,本文先通过线性回归做初步的分析,然后运用TOPSIS模型进行了进一步的分析,得到葡萄和葡萄酒的理化指标不一定能评价葡萄酒的质量,但有一定的联系。

关键词:F检验;主成分分析;Q型聚类;样品典型相关分析;TOPSIS模型1、问题提出葡萄酒是用新鲜的葡萄或者葡萄汁经发酵酿成的酒精饮料。

质量评价主要通过外观、香气、口味、典型性体现。

所以确定葡萄酒的质量一般通过聘请一批有资深的评酒员对葡萄酒进行品尝后对其分类指标打分,然后求和得到总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

(完结版)葡萄酒的评价

(完结版)葡萄酒的评价

精心整理葡萄酒的评价摘要本文通过对品酒员的葡萄酒评价结果、葡萄酒和酿酒葡萄的理化指标、芳香物质的数据统计分析,利用SPSS软件、EVIEWS软件、MATLAB软件,对葡萄酒作出评价。

问题一:首先对缺失的数据采用热卡插值法填补,缺失值为2;其次我们对每一酒样品总分求均值,利用SPSS软件进行配对t检验,进行显着性差异分析,可知两组品酒员的评价结果之间存在显着性差异;然后我们采用方差分析法,对每组品酒员内部打分结果进行方差比较,利用MATLAB求解得出:对于红白葡萄酒,第二组的方差普遍都比第一组小,第二组的打分结果比较可信。

问题二:通过SPSS软件的因子分析,分别对酿酒葡萄的一级理化指标和二级理化指标进行主成分分析,得出可以囊括酿酒葡萄重要特征的重要主成分,其中红葡萄得到9种主成分,白葡萄得到10种主成分。

再以主成分为自变量进行聚类,将具有共同特征的酿酒葡萄归为一类,再对葡萄样品进行聚类,对酿酒葡萄进行等级划分,红白葡萄均归为5类。

最后结合在第一问中求得的可信组品酒师的葡萄酒的总评分,确定每一类酿酒葡萄的等级。

分类红葡萄样品编号白葡萄样品编号1 2,3,9,232,3,5,9,10,12,22,24,25,26,282 10,13,19,20,25,26,27?273 4,5,6,7,12,15,16,17,18,21,22,24 1,2,154 1,8,144,6,7,11,14,17,18,20,21,235 11 8,16,19通过SPSS软件对葡萄酒质量进行聚类,将聚类结果与对应的一级理化指标聚类结果比较,得到的红、白葡萄酒的吻合率分别为0.25926、0.37037,可见仅用酿酒葡萄的理化指标来评价葡萄酒质量不是很合理。

问题三:首先通过pearson相关性分析,对酿酒葡萄和葡萄酒的理化指标进行初步的相关性判定,得出两者的理化指标大多数指标呈正相关,然后对葡萄酒的理化指标进行标准化,将酿酒葡萄的理化指标作为自变量,将葡萄酒的理化指标作为应变量,采用EVIEWS软件将标准化后的葡萄酒的理化指标和酿酒葡萄的主成份进行逐步回归,建立回归模型,分析得到白藜芦醇等白葡萄相关关系式的R方值较小,可见虽然存在着一定的线性关系,但是关系较弱。

葡萄酒评价问题

葡萄酒评价问题

葡萄酒评价问题摘要葡萄酒评价问题属于数理统计分析问题,需要对大量数据进行处理分析建立模型,从而对酿酒葡萄进行分级,并确定酿酒葡萄与葡萄酒的理化指标之间的联系,从而给出葡萄酒的综合评价模型,并用MATLAB进行求解。

问题一,我们对两组评酒员的评价结果进行了显著性差异分析。

根据已给的数据特点,两组数据的均值差服从同一分布,于是我们选用了基于数据的t 假设检验法,求解可知两组评酒员的评价结果基本上不存在显著性差异。

在对于评酒师的评价结果的可信度分析中,采用方差比的基于数据的F假设检验法,求解可知第二组的可信度更高。

问题二,我们以累计贡献率0.85作为限值,用主成分分析法对酿酒葡萄的理化指标进行了分析,再根据主成分的值对理化指标进行聚类分析,红葡萄酒和白葡萄各得到6类。

最后对葡萄的理化指标和葡萄酒的评价得分赋予0.5:0.5的权重进行相加计算总得分Q。

由修正后的总得分Q得到葡萄聚类后的分级。

问题三,通过相关性分析得到每个葡萄酒样品和葡萄理化指标之间的相关系数,找到线性关系较强的理化指标,然后对这些指标建立多元线性回归方程,并利用残差分析拟合方程效果,拟合效果良好。

问题四,我们用二级模糊综合评判评价葡萄酒的质量,以各项评分所占的比例为A,由相关性分析得到权重A。

分析葡萄酒和葡萄的理化指标,得到模i糊评价的结果。

并与第二组评酒员的评价结果进行比较,发现可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键词:t假设检验;F假设检验;主成分分析;聚类分析;回归分析;模糊分析一、问题重述葡萄酒质量的确定一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

根据所给出的某一年份一些葡萄酒的评价结果,以及所给出的该年份这些葡萄酒的和酿酒葡萄的成分数据。

2021葡萄酒质评的数学建模分析范文2

2021葡萄酒质评的数学建模分析范文2

2021葡萄酒质评的数学建模分析范文 摘要: 已知酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系, 葡萄酒和酿酒葡萄监测的理化指标会在一定程度上反映葡萄酒和酿酒葡萄的质量等条件, 建立模型解决问题。

文章主要通过正态分布、方差检验, 建立主成分分析、多元线性回归、聚类分析、相关系数和逐步回归模型来解决问题。

关键词: 葡萄酒;正态分布; 主成分分析; 多元线性回归; 聚类分析; Abstract: Itis known that the quality of wine grapes has a direct relationship with the quality of the wines being brewed. The physical and chemical indicators of wine and wine grape monitoring will ref lect the conditions of wine and wine grapes to some extent, and establish models to solve problems. This paper mainly solves the problem by using normal distribution and variance test, establishing principal component analysis, multiple linear regression, cluster analysis, correlation coefficient and stepwise regression model. Keyword: wine;normal distribution; principal component analysis; multiple linear regression; cluster analysis; 确定葡萄酒的质量好坏需要有资质的评酒员对其进行分类指标打分,最后综合确定葡萄酒的质量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档