2012数学建模A题
2012年全国大学生数学建模竞赛A题国一
摘要
在问题一中,首先根据 T 检验、方差显著性检验和 Wilcoxon 秩和检验对两组评酒 员给葡萄酒的评价结果的差异的显著性检验。在大多数评酒员评分可靠的假设下,分别 利用评分方差比较模型,说明第二组结果可靠。在此基础上引入了评酒员“失误度”概 念来衡量每位评酒员与所有评酒员总体评价的差异, 对各组失误度求和得到第二组结果 更可靠。为了进一步优化评酒员评分,利用根据失误度对评酒员排序,跨组选取失误度 最小的 10 位评酒员组成新的评分组,其平均值认为比第二组更可靠,作为整个文章中 评价葡萄酒质量的标准指标。 在问题二中,由于红、白葡萄的理化指标有较大差异,分开考虑红白两种葡萄酒: 对于红葡萄酒,对应问题一得出的葡萄酒质量指标,从三个角度,即外观分析(又分为 由大分子因子决定的澄清度和基于 LAB 色彩模型的色调考虑到指标间存在的竞争关系 采用非线性回归分析和逐步回归分析) 、香气分析(Fisher 线性判别分析)和口感分析 (主成分分析和因子分析) ,后进行异常点检验,逐一剔除异常点来求解酿酒葡萄的量 化指标。对于白葡萄酒的三个指标采用 Fisher 判别分析求解。最后将三个方面得分加权 平均得到酿酒葡萄量化的总分,进行聚类分析,根据聚类分析结果将红葡萄和白葡萄各 分为四级。 在问题三中,为研究酿酒葡萄与葡萄酒的理化指标之间的联系,将葡萄酒的理化指 标用酿酒葡萄的理化指标来表示。根据指标间的相关性,剔除部分相关性不强的指标, 选择部分相关性较好的酿酒葡萄的指标作为自变量, 对不同的葡萄酒指标分别进行多元 线性回归、逐步回归和回归检验。根据指标本身的特点及 AIC 信息统计量,剔除不显著 的自变量,而达到用尽量少的葡萄的理化指标来表示葡萄酒的理化指标的目的。在求解 过程中,建立典型相关分析模型来分析红葡萄酒色泽指标间的关系,利用主成分分析将 白葡萄的多个指标综合为少数几个主成分,再进行回归分析。模型求解结果显示,葡萄 酒的每个指标都能用部分葡萄的指标来线性表示,且具有较好的拟合效果。 在问题四中,为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,结合问 题一、二、三的结果以及理化指标和芳香物质的化学意义,综合评估各个广义上的理化 指标(附件二和附件三) ,针对红葡萄酒和白葡萄酒的区别分别在酿酒葡萄和葡萄酒的 理化指标中选取对葡萄酒质量影响较大的指标, 通过线性回归分析将理化指标和葡萄酒 质量进行拟合,从而得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。为进一步 论证结果,首先,对模型进行残差分析以及拟合情况分析;其次,用分组样本检验方法, 将白葡萄酒的 28 个样本数据分成两组,采用用一组进行拟合,另一组进行结果回带分 析的方式,进一步论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可靠性。通过 论证分析得出结论:葡萄和葡萄酒的理化指标可以用来评价葡萄酒的质量,但也有其不 足之处,如当从葡萄酒食用性方便角度考虑,用评酒员评价方法就更直接。 关键词:葡萄酒质量 识别聚类 失误度 非线性回归 逐步回归 Fisher 判别分析 主成 分分析 因子分析 显著性检验 残差分析 异常点检测
2012数学建模A题论文:葡萄酒的评价
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012年 9月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。
目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。
葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。
本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。
对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。
对于本题,我们主要采用SPSS软件对模型进行求解。
针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。
2012年全国数学建模竞赛A题第一问数据综合整理
0.27
0.516398
第二组
10
9
9
9
8
9
10
9
9
9
91
9.1
0.32
0.567646
酒样品3
第一组
9
10
10
9
8
10
9
10
10
9
94
9.4
0.49
0.699206
第二组
10
9
9
9
8
9
8
9
9
9
89
8.9
0.32
0.567646
酒样品4
第一组
7
9
9
8
7
8
9
8
10
9
84
8.4
0.93
0.966092
0.40
0.632456
酒样品16
第一组
9
10
10
9
8
8
10
9
9
9
91
9.1
0.54
0.737865
第二组
9
9
9
9
9
8
8
9
9
9
88
8.8
0.18
0.421637
酒样品17
第一组
8
10
10
8
11
9
7
10
10
9
92
9.2
1.51
1.229273
第二组
9
9
9
9
9
8
10
9
9
9
全国大学生数学建模优秀论文A题
2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):S55001所属学校(请填写完整的全名):郑州科技学院参赛队员(打印并签名) :1. 刘超2. 赵芬芳3. 尹峰指导教师或指导教师组负责人(打印并签名):闫天增日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
本文通过对27种红葡萄酒和28种白葡萄的理化指标数据进行分析,采用显著性差异分析法、可靠度分析、因子分析法、相关系数分析、主成分分析法以及聚类分析法,借助统计软件SPSS和数学软件MATLAB,分析了两组评酒员的评价结果有无显著性差异和可信度,给出了酿酒葡萄与葡萄酒的理化指标之间的联系,建立了基于酿酒葡萄理化指标和葡萄酒质量的聚类分析模型确定了葡萄酒质量的影响因素,最后通过补充相关信息,建立基于分析模型确定了葡萄酒质量的影响因素。
2012年数学建模A题资料
(一)葡萄酒观察方法1 酒液总体观察1.1 澄清度观察衡量葡萄酒澄清程度的指标有透明度、浑浊度等,与之相关的指标还有是否光亮、有无沉淀等。
优良的葡萄酒必须澄清、透明(色深的红葡萄酒例外)、光亮。
a.澄清:是衡量葡萄酒外观质量的重要指标。
澄清表示的是葡萄酒明净清澈、不含悬浮物。
通常情况下,澄清的葡萄酒也具有光泽。
b.透明度:表示的是葡萄酒允许可见光透过的程度。
红葡萄酒如果颜色很深,则澄清的葡萄酒也不一定透明。
c.浑浊度:表示的是葡萄酒的浑浊程度,浑浊的葡萄酒含有悬浮物。
葡萄酒的浑浊往往是由微生物病害、酶破败或金属破败引起的。
浑浊的葡萄酒其口感质量也差。
d.沉淀:指的是从葡萄酒中析出的固体物质。
沉淀是由于在陈酿过程中,葡萄酒构成成份的溶解度变小引起的,一般不会影响葡萄酒的质量。
1.2 颜色观察葡萄酒的颜色受酒龄影响,新红葡萄酒由于源于果皮花色素苷的作用,通常颜色鲜艳,为紫红色和宝石红色,带紫色色调;在葡萄酒的成熟过程中,丹宁逐渐与游离花色素苷等结合而使成年葡萄酒带有黄色色调。
瓦红或砖红色为成年红葡萄酒的常有的颜色,而棕红色则为在瓶内陈酿10年以上的红葡萄酒的颜色。
因此,可根据颜色,判断葡萄酒的成熟状况。
葡萄酒的颜色和口感的变化存在着平行性,颜色和口感之间必须相互协调平衡。
颜色的深浅反应葡萄酒的结构、丰满度以及尾味和余味。
如在红葡萄酒中,颜色的深浅与丹宁的含量往往正相关。
如果红葡萄酒颜色深而浓,几乎处于半透明状态,多数情况下它必然醇厚、丰满、丹宁感强。
相反,色浅的葡萄酒,则味淡、味短。
当然,如果较柔和,具醇香,仍不失为好酒。
例如瓦红色的红葡萄酒,必须与浓郁的醇香和柔顺的口感同时存在,否则表明该酒是人工催熟条件下陈酿而未能表现出最佳感官质量。
带紫色的新葡萄酒往往口味平淡、瘦弱、尖酸、粗糙;褐色过重的成年葡萄酒,氧化过重、老化。
1.3 浑浊度观察观察葡萄酒有无下列情况:略失光,失光,欠透明,微混浊,极浑浊,雾状混浊,乳状混浊;1.4 沉淀观察观察葡萄酒有无下列情况:有无沉淀,沉淀类型:纤维状沉淀,颗粒状沉淀,絮状沉淀,酒石结晶,片状沉淀,块状沉淀。
2012年数学建模A题解题思路
2012年数学建模A题解题思路1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?要分析两组评酒员的评价结果是否有显著性差异,可以使用统计方法进行分析。
一种常用的方法是使用t检验来比较两组平均值的差异,确定是否有统计学意义上的差异。
首先,对于每个评酒员,计算他们对每种葡萄酒的评分的平均值。
然后,对于每组评酒员,计算他们对每种葡萄酒的平均评分的平均值。
接下来,使用t检验来比较两组评酒员对每种葡萄酒的平均评分的平均值是否有显著性差异。
如果t检验的结果显示两组评酒员对某种葡萄酒的评分存在显著性差异,那么可以认为这种葡萄酒的评分更可信的那组评酒员的结果更可信。
1. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
要根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,可以使用聚类分析或者判别分析等方法。
聚类分析可以根据酿酒葡萄的理化指标和葡萄酒的质量将它们分为几个不同的类别。
这样可以根据每个类别的平均质量评分来进行分级。
判别分析可以建立一个数学模型,根据酿酒葡萄的理化指标预测葡萄酒的质量等级。
这样可以根据酿酒葡萄的理化指标将其进行分级。
1. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
要分析酿酒葡萄与葡萄酒的理化指标之间的联系,可以使用相关性分析来确定它们之间的相关性。
首先,计算每个理化指标与葡萄酒质量评分之间的相关性系数。
可以使用皮尔逊相关系数或者斯皮尔曼相关系数等方法。
相关性分析的结果可以告诉我们哪些理化指标与葡萄酒质量评分有显著相关性,从而可以了解酿酒葡萄的哪些理化指标对葡萄酒的质量有重要影响。
1. 分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,可以使用回归分析等方法。
回归分析可以建立一个数学模型,根据酿酒葡萄和葡萄酒的理化指标来预测葡萄酒的质量评分。
这样可以分析每个理化指标对葡萄酒质量的影响程度,并确定哪些指标对葡萄酒的质量影响最为重要。
2012全国数学建模A题分析
2012全国数学建模竞赛A题详细分析1.问题重述在设计太阳能小屋时,需在建筑物外表面(屋顶及外墙)铺设光伏电池,光伏阵列件所产生的直流电需要经过逆变器转换成220V交流电才能供家庭使用,并将剩余电量输入电网。
不同种类的光伏电池每峰瓦的价格差别很大,且每峰瓦的实际发电效率或发电量还受诸多因素的影响。
因此,在太阳能小屋的设计中,研究光伏电池在小屋外表面的优化铺设是很重要的问题。
对下列三个问题,分别给出小屋外表面光伏电池的铺设方案,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,并计算出小屋光伏电池35年寿命期内的发电总量、经济效益(当前民用电价按0.5元/kWh计算)及投资的回收年限。
在同一表面采用两种或两种以上类型的光伏阵列件时,同一型号的电池板可串联,而不同型号的电池板不可串联。
在不同表面上,即使是相同型号的电池也不能进行串、并联连接。
应注意分组连接方式及逆变器的选配。
问题1:请根据山西省大同市的气象数据,仅考虑贴附安装方式,选定光伏阵列件,对小屋(见附件2)的部分外表面进行铺设,并根据电池组件分组数量和容量,选配相应的逆变器的容量和数量。
问题2:电池板的朝向与倾角均会影响到光伏电池的工作效率,请选择架空方式安装光伏电池,重新考虑问题1。
问题3:根据附件7给出的小屋建筑要求,请为大同市重新设计一个小屋,要求画出小屋的外形图,并对所设计小屋的外表面优化铺设光伏电池,给出铺设及分组连接方式,选配逆变器,计算相应结果。
2.问题的分析2.1 问题一的分析问题一中要求根据山西省大同市的气象数据,选定光伏阵列件对小屋的部分外表面以贴附安装方式进行铺设,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,最后给出铺设方案,包括电池组件分组数量和容量,以及相应的逆变器的容量和数量。
首先,附表中提供的大同地区的光照数据并未直接告知每个面获得的光照总量,需要根据光散射和直射的关系,建立光照模型,确定每个面的总的光照强度。
高教杯2012年数学建模A题
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): a我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要本文利用SPSS和MATLAB软件对葡萄酒评价问题进行了分析,综合采用了t检验、主成分分析、聚类分析和灰色关联度分析等方法,建立了数学模型,并设计了一套对葡萄酒质量的评价体系。
关于问题一:首先,对两组评酒员对同一种葡萄酒给出的评分结果进行处理;其次,采用t检验判断出两组评分结果存在显著性差异;最后,利用每一组评酒员对同一种葡萄酒的评分方差作为衡量依据,建立评分机制,评估两个小组所给结果的可信性,经分析第一组、第二组得分分别为13分、42分。
因此,第二组评酒员的评分结果更可信。
关于问题二:首先,对酿酒葡萄的理化指标进行主成分分析,挖掘出若干个影响酿酒葡萄理化指标的主要成分;其次,根据第一问的结果,将第二组评酒员的评分作为衡量葡萄酒质量的量化指标;最后,通过聚类分析将酿酒葡萄分为4个等级。
2012年大学生数学建模竞赛A题(优秀论文A题葡萄酒)
葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。
通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。
为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。
综合来看,主观因素对葡萄酒质量的评价具有不确定性。
结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。
将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。
为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。
由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对葡萄酒的质量的作用。
2012全国数学建模竞赛A题数据分析
品酒员1号 品酒员2号 品酒员3号 品酒员4号 品酒员5号 品酒员6号 品酒员7号 7 9 9 10 9 10 7 10 8 9 8 9 8 9 7 9 9 10 8 8 8 8 9 9 8 9 9 9 8 8 9 9 8 9 8 9 9 9 9 10 8 10 9 10 10 8 9 10 9 10 9 9 10 9 9 9 9 9 9 9 9 9 10 10 9 8 8 7 9 10 8 9 9 7 8 10 9 10 9 8 9 10 8 10 10 10 9 9 10 10 7 8 10 9 10 9 9 8 8 9 8 9 9 9 8 9 9 10 9 9 9 9 7 8 10 8 8 10 7 9 10 9 10 9 7 10 10 10 9 9 11 9 8 10 10 8 7 9 9 9 9 8 9 8 9 8 9 8 8 8 7 10 10 8 8 8 7 8 8 7 9 8 9 8 7 9 9 8 9 7 8 8 8 9 8 9 9 9 7 9 8 7 10 8 8 8 7 8 9 9 10 8 8 7 8 8 10 8 9 8 8 7 8 9 8 9 9 9 7 8 8 9 11 9 8 9 8 8 10 9 8 8 10 8 11 7 9 10 9 10 9 8 9 8 9 8 8 10 8 8 9 11 9 8 8 7 9 8 9 9 8 8 10 7 9 8 8 9 8 8 9 9 9 8 9 8 10 9 9 11 8 8 10 10 9 8 9 8 7 8 8 9 9 7 8 8 10 10 9 8 8 8 7 8 10 9 9 9 7 8 10 8 7 10 8 8 9 8 9 10 10 8 9 8 10
和 77 84 96 91 94 89 84 88 86 89ቤተ መጻሕፍቲ ባይዱ86 86 89 84 84 84 97 94 88 84 84 81 79 87 89 86 87 93 76 82 91 88 92 90 79 88 92 87 92 93 92 90 90 89 100
2012数学建模大赛a试题
葡萄酒的评价模型摘要区分葡萄酒好坏的量化标准,主要采用百分制评分体系[1]。
该评分体系基于以下四个因素:外观,香气,风味,总体质量或潜力。
评酒员对葡萄酒进行品尝后按照酒的质量特点对其分类指标进行打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反应葡萄酒和酿酒葡萄的质量。
现对葡萄酒的评价问题进行分析研究,针对葡萄酒的各项指标数据进行统计和分析,建立起模糊综合评价模型,创建模糊关系矩阵:R=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⋯⋯⋯⋯⋯⋯⋯mn 2m 1m n 22221n 11211r r r r r r r r r 运用SPSS 软件等数学工具,来讨论出葡萄酒的评价结果。
问题一,采用求方差的方法,S 2 =()112--∑=n x x ni将各组酒样品横向求方差,纵向求和,将两组的变异系数和进行比较。
得出“第二组的变异系数和更小”的结论,即第二组结果更为可信。
继而使用t-检验,t = 1-n (X - μ)/S对于红葡萄酒,t 值小于0.05,则红葡萄酒存在显著性差异;而白葡萄酒t 值大于0.05,则白葡萄酒不存在显著性差异。
问题二,运用了SPSS 软件中因子分析功能,得到红葡萄理化指标分析(附录1)、白葡萄理化指标分析(附录2),对附件二中的海量数据进行批处理,优化出6项最重要因素简化数据,最后运用聚类分析法分别得出红葡萄与白葡萄的等级分类。
问题三,为了求得酿酒葡萄与葡萄酒的理化指标之间的联系,运用了统计学原理,结合图表,将酿酒葡萄与葡萄酒的几大决定因素提取出来,将其绘制成成分矩阵,进行详细的数据分析,并得出“酿酒葡萄酿制成葡萄酒之后主要成分中的蛋白质与VC 消失,其余理化指标在不同程度上有所改变”的结论。
问题四,通过统计对比,结合数据折线图,直观反映并论证了两种理化指标对葡萄酒质量的影响,即葡萄酒的质量与酿酒葡萄、葡萄酒的各项理化指标呈正相关的关系,也就是葡萄酒的质量随着葡萄酒和酿酒葡萄中的各理化指标的综合变化情况而变化,当产生“峰值”时,存在产生负相关的可能性。
数学建模2012a
题。在做这些工作之前,需要对数据进行正态分布检验。由于所给数据是评分,
在求解第一问时也可以用秩和检验模型。 对于第二问,评分标准要求方差较小 的结果更可靠。
3
问题2的求解
问题2是对酿酒葡萄进行分级,这本质上是一个分类问题。 在分类之资料给出
的分类标准也未必满足本题的要求,因此需要自己建立一个分类标准。解决这一问题
和芳香物质是构成酿酒葡萄品质优劣的要素,另外芳香物是葡萄酒质量评价最重
要的影响因素。这是你结论中应该把握的方向。这道题的背景是:国内最初对葡 萄酒的质量鉴别在于感官评价上,这具有一定的主观性和不确定性,后来又引入 了理化指标来进行鉴别。相对客观,而最近的研究表明,芳香物质以及影响葡萄 酒质量的主要理化指标的物质相互平衡是综合质量优劣的关键。所以在不考虑工 艺等因素的影响下,就根据葡萄酒的质量评价分为感官评价指标和理化指标两类 进行综合鉴别就可以了。 2012 年全国竞赛的A 题充分体现了概率统计的相关知识在数学建模中的应
好的成绩。
16
概率统计在数学建模 中的应用
—— 以2012年全国大学生数 学建模竞赛(本科组)A 题为例
1
问题重述
2
问题1的求解
仔细研究题目,看到“著性差异”的字眼,我们自然会想起概率论与数理统 计中的“假设检验”和“方差分析”部分。只要把问题转化为概率统计中假设 检验或方差分析模型,便能得到相应的结论。 在题目给出的原始数据中还有一个缺失值和一个异常值,在数据预测处理中 可用正常值的平均值代替缺失值或异常值,这样问题1 就可以分解为统计中的 “有两批产品,分别经过两次检验,求两批产品是否有显著差异? 哪次检验更可 靠”的经典模型。 显然,对于第一问,可以转化为假设检验问题,也可以转化为方差分析问
2012高教社杯全国大学生数学建模竞赛题目
A题葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格)B题太阳能小屋的设计在设计太阳能小屋时,需在建筑物外表面(屋顶及外墙)铺设光伏电池,光伏电池组件所产生的直流电需要经过逆变器转换成220V交流电才能供家庭使用,并将剩余电量输入电网。
不同种类的光伏电池每峰瓦的价格差别很大,且每峰瓦的实际发电效率或发电量还受诸多因素的影响,如太阳辐射强度、光线入射角、环境、建筑物所处的地理纬度、地区的气候与气象条件、安装部位及方式(贴附或架空)等。
因此,在太阳能小屋的设计中,研究光伏电池在小屋外表面的优化铺设是很重要的问题。
附件1-7提供了相关信息。
请参考附件提供的数据,对下列三个问题,分别给出小屋外表面光伏电池的铺设方案,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,并计算出小屋光伏电池35年寿命期内的发电总量、经济效益(当前民用电价按0.5元/kWh计算)及投资的回收年限。
在求解每个问题时,都要求配有图示,给出小屋各外表面电池组件铺设分组阵列图形及组件连接方式(串、并联)示意图,也要给出电池组件分组阵列容量及选配逆变器规格列表。
2012年数学建模竞赛A题答案参考
承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):A题:葡萄酒的评价一、摘要确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
2012年高教社杯全国大学生数学建模竞赛A题全国一等奖论文
葡萄酒的评价摘要本文主要对两组评酒员的评价结果及可信度、酿酒葡萄的分级、酿酒葡萄与葡萄酒的理化性质之间的联系和是否影响葡萄酒的质量进行分析及研究。
对于问题一,利用附件一中评酒员群体对红、白葡萄酒进行两次评分的数据,运用t检验模型,求出P值用于判定有无显著性差异。
出于对结果的科学性考虑,建立了二值化可信度模型对评酒员的可信度进行定量描述。
若可信度值i p越大,则说明评价结果越可信。
通过比较第一、二组的P值,得出第一组的可信度更高些。
对于问题二,运用主成分分析法,选取葡萄酒样品中含有的一级指标物的数据,得出贡献率。
再利用贡献率(贡献率越大对葡萄的质量影响越大)的大小,选出影响酿酒葡萄分级的主成分因素,并利用红地球葡萄的分级标准对酿酒葡萄进行分级。
对于问题三,首先利用主成分分析法和SPSS软件对红葡萄酒的量化指标进行筛选,选出总酚、酒总黄酮、白藜芦醇等6种物质作为对葡萄酒理化指标的一组样本。
借用在问题二中筛选出来的花色苷、干物质含量、顺式白藜芦醇苷等六种红葡萄的理化指标作为另一组样本。
然后利用上述两组数据,建立典型相关分析模型,求出葡萄酒理化指标和酿酒葡萄的相关系数,从而确定两者之间的关联度。
最后建立二元回归模型进而求出两者之间的关系。
对于问题四,运用主成分分析降维的思想,运用灰色关联度模型,利用几组变量的数据,通过MATLAB软件求得关联度,进而来反映两变量之间的线性关系。
根据关联度的大小,考虑多方面的因素对葡萄酒的质量进行评价与论证。
关键词:t检验法、可信度模型、主成分分析法、多元回归模型、灰色关联度1 问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
2012年全国大学生数学建模竞赛A题“特等奖”译文
2012年美国大学生数学建模竞赛A题题目翻译:一棵树的叶子。
一棵树的叶子有多重?怎么能估计树的叶子(或者树的任何其它部分)的实际重量?怎样对叶子进行分类?建立一个数学模型来对叶子进行描述和分类。
摘要我们构建了四个模型来研究叶的分类,叶子形状和叶片分布之间的关系,叶子的形状和树的轮廓的关联,以及一棵树的树叶总质量。
模型1处理叶的分类。
我们主要侧重于最显着的叶片的特征,即,形状。
我们创建七个几何参数以量化叶的形状。
然后,我们选择了六种常见的类型的叶子构造一个数据库。
通过计算的样品的与这些典型叶子的偏差指数,我们可以将叶子进行分类。
为了说明这个分类过程中,我们使用了枫叶作为测试。
模型2研究叶的形状和叶片分布之间的关系。
首先,我们将一棵树化为理想模型,然后介绍太阳高度的概念。
通过考虑叶片长度和节间在不同太阳高度下的关系,分析重叠的片叶阴影,我们发现树叶的形状和分布随着太阳高度进行优化以最大化接受阳光照射。
我们将该模型应用到三类试验树木。
模型3讨论树的轮廓和叶的形状之间可能存在关联。
基于叶脉和树的分支结构的相似性,我们认为,叶子的形状在二维上相似于一个树的轮廓。
采用模型1的方法,我们设置了几个参数来反映每棵树的大概形状,并通过它们的叶子将其进行比较。
在统计工具的帮助下,我们展示了一个树的轮廓与其叶子形状之间的粗略的关联。
模型4通那过给定的树的大小特征,估计了一棵树叶子的总质量。
并引入固碳率和树龄来建立叶的总质量和树的大小之间的联系。
由于单位质量的一个叶以一个恒等的速率固碳,固碳率与树龄之间是一个二次关系,并且树的年龄关系经历逻辑斯蒂增长。
介绍:我们解决四个主要子问题:•分类的叶子,•叶分布和叶片形状之间的关系,•树的轮廓和叶的形状的关系,和•一棵树叶片总质量的计算。
要解决的第一个问题,我们选择一组参数来量化叶片的形状特征和使用叶的形状作为我们的分类过程的主要标准。
对于第二个问题,由于叶子的形状影响着叶之间的重叠,我们将一片叶子直接投射到它下面的一片叶子的阴影重叠区域作为叶片分布和叶片形状之间的一个联系,我们假设叶片分布总是趋于尽量减少重叠的区域。
2012研究生数学建模A题
(由组委会填写)
第九届“华为杯”全国研究生数学建模竞赛
题 目基因识别问题及其算法的研究
摘
在生物学、医学、药学等诸多方面,DNA的研究都具有重要的理论意义和实际价值。在面对大量、复杂的基因序列数据时,如何更好更快捷地获取准确的基因信息,如何能够在众多的基因序列中确定功率谱和信噪比,如何能够对每类基因快速地得到其阈值确定方法,如何快速实现基因识别算法,是摆在我们面前的一个具有研究意义的实际课题。
(2)傅里叶变换方法
假设给定的一段DNA序列片段为S=ATCGTACTG,则所生成的四个0-1序列分别为:
: ; : ;
: ; : 。
这样产生的四个数字序列又称为DNA序列的指示序列。为研究DNA编码序列(外显子)的特性,对指示序列分别做离散Fourier变换(DFT)
以此可得到四个长度均为N的复数序列 , 。
问题一:
(1)基于Voss映射,探求功率谱和信噪比的计算方法。
(2)基于Z-curve映射,求解频谱与信噪比并对Z-curve映射和Voss映射下的频谱和信噪比进行比较。
(3)基于实数映射,求解功率谱与信噪比的计算方法。
问题二:
对8个人类和92个鼠类的基因序列进行分析,找到每类基因研究其阈值的确定方法和阈值结果,并对所得到的结果进行评价。
: ; : ;
: ; : 。
这样产生的四个数字序列又称为DNA序列的指示序列,并通过利用MATLAB软件对Voss映射进行编程分析(见附件1),得到功率谱和信噪比的快速计算方法。
(2)根据附件1中的Z-curve映射来探求频谱与信噪比的快速计算方法。通过运行程序得到Z-curve映射下频谱和信噪比的值,然后采用100个组进行对比分析,发现在Voss映射和Z-curve映射下得到的信噪比之间呈现一定的倍数比例关系。
2012大学生数学建模试题[1]A题 原油开采与输送问题
2008
2009
2010
2011
1号井
32.2
31.3
29.7
28.6
27.5
26.1
25.3
23.7
22.7
2号井
21.5
15.9
11.8
8.7
6.5
4.8
3.5
2.6
2.0
3号井
27.9
25.8
23.8
21.6
19.5
17.4
15.5
13.3
11.2
4号井
46.2
32.6
26.7
23.0
8.2:
y1=[32.2 31.3 29.7 28.6 27.5 26.1 25.3 23.7 22.7];
x0=[1 2 3 4 5 6 7 8 9];
a=polyfit(x0,y1,1)
x=0:0.1:15;
y=a(1)*x+a(2);
plot(x,y,'r',x0,y1,'o')
grid
8.3:
a[3]=-2.0850,b[3]=29.9806;
a[4]=76.2582,b[4]=7.7158;
intx;
for(x=1;x<=15;x++)
{
printf("%d %f %f %f %f\n",x,a[1]*x+b[1],a[2]/x+b[2],a[3]*x+b[3],a[4]/x+b[4]);
通过计算我们认为打井得到的油在短时间内(10年)比从管道输油单价便宜的多。所以对于单纯的5年计划,如果不对最大输油量由最低100万吨的限制,那么能够通过打更多的井满足未来5年的油量需求。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的误差。
在此基础上,还可以得到组间均方差和组内均方差:
(4) (5)
在方差相等的假定下,要检验n个总体的均值是否相等,须首先给定原 假设和备择假设。
原假设
:均值相等即
备择假设
:均值不完全不相等
则可以应用统计量进行方差检验:
(6) 该统计量服从分子自由度,分母自由度为的分布。给定显著性水
平,如果根据样本计算出的统计量的值小于等于临界值,则说明原假设
我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 杨晓宇
2. 梁 言 3. 李玉珠 指导教师或指导教师组负责人 (打印并签名):
日期: 年 月 日
赛区评阅编号(由赛区组委会评阅前进行编号):
三 模型的假设
3.1 假设题目所给的数据真实可靠; 3.2 评酒员的评价尺度相同; 3.3 二级指标里的因素对酿酒葡萄分级的影响不大,可忽略不计; 3.4 测试理化指标用的葡萄和相应酒样的酿酒葡萄是同一批; 3.5 附件所给的理化指标具有代表性;
四 符号说明
—— 总方差; ——组内方差; ——组间方差; ——实验次数; ——组间均方差; ——组内均方差; ——酿酒葡萄的主成分即为新的指标; ——葡萄酒的第项理化指标; ——酿酒红葡萄的前十二个主成分; ——红葡萄酒的各理化指标; ——酿酒白葡萄的前十三个主成分; ——第种葡萄样品的第个指标的值; ——葡萄样品的第个理化指标的值; ——无量纲化处理后的第种葡萄样品的第个理化指标的值; ——第个品酒员给第类葡萄酒的评分; ——第个品酒员给第类葡萄酒的第项指标的评分; ——第类葡萄酒的平均总得分。
针对问题一,要分析两组评酒员的评价结果有无显著性差异以及哪 一组结果更可信。首先对葡萄酒的得分数据进行无量纲化处理,然后运 用单因素方差分析法,将各样品酒的总分作为唯一的因子,取显著性水 平为0.05,通过计算可信度指标值来判断差异性,最后通过计算出的方 差来判断出第二组的评价结果更可信。
针对问题二,首先用因子分析法,对酿酒葡萄的理化指标进行选 择,得到十种因子。再用0-1规划模型,对酿酒红葡萄进行分级:一级 (优)包含样品9,25,20,2,17,3;二级(良)包含样品26,5, 21,14,19;三级(中)包含样品4,24,27,22;四级(合格)包含 样品1,25,12,10,13,16;五级(不合格)包含样品11,7,18, 15,8,6。酿酒白葡萄分级:一级(优)包含样品17,15,9,1,22;二级 (良)包含样品6,18,7,27,13;三级(中)包含样品 5,20,28,4,14,21;四级(合格)包含样品23,26,2,12,10,24;五级 (不合格)有样品8,11,19,25,16,3。
二 问题分析
2.2.1问题一的分析 根据附件1的数据可知:两组评酒员分别对27组红葡萄酒和28组白
葡萄酒进行评分,相当于每件样品都进行了两次评分,故可以求出平均 的评分。此问题要求分析两组评酒员的评价结果有无显著性差异以及哪 一组结果更可信,对于分析显著性的差异,我们用单因素方差分析法, 取显著性水平为0.05,运用Excel求出值,根据值与0.05的关系来判断 有无显著差异性。方差是描述数据波动的大小的,求出方差,比较两组 数据方差的大小来判断哪一组结果更可信。 2.2.2问题二的分析
组内方差 908.51 54
16.82426
总方差 994.02 55
通常情况下,实验结果达到0.05水平或0.01水平,才可以说数据之 间具备了差异显著或是极显著。在作结论时,应确实描述方向性(例如 显著大于或显著小于),在此我们取0.05作为显著性水平标准。
根据以上两表可知:红葡萄酒中表中值为0.119961>0.05,故接受,且 对应的也很小,故可知品酒员对红葡萄酒的评分没有显著性差异。白酒 表中的值为0.028247<0.05,故拒绝,则评酒员对白酒的评分具有显著 性差异。 5.1.2评价结果的可信度
关键词: 单因子方差分析 0--1规划 主成分分析法 多元回归模型
一 问题重述
随着我国经济的快速发展,葡萄酒市场竞争也日趋激烈。虽然国家 已经对葡萄酒的质量做了规定,但由于相应规范的制定工作的限制,我 国关于葡萄酒质量等级划分的标准还未完善,所以国家需要制定统一的 质量等级制度。
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其 总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有 直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡 萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附 件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请 尝试建立数学模型讨论下列问题:
利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质 量的影响因素,将附件3中4个表格里的每张样品中所含各种芳香物质求 和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比较 前后两者结果中由样品中的芳香指标导致的影响差异来确定,不能只用 葡萄和葡萄酒的理化指标来评价葡萄酒的质量,最后结合感官指标做出 分析。
第三因子:(Z)-2-庚烯醛,(E)-2-己烯-1-醇,1-庚醇,反式-2-壬 烯酸; 第四因子:三氯甲烷,(E)-2-壬烯-1-醇; 第五因子:柠檬烯; 第六因子:á-蒎烯,(Z)-3,7-二甲基-2,6-辛二烯醛,(R)-3,7-二甲
以就需要进行主成分分析。
主成分的理论分析:因为在所有的线性组合中所选取的应该是方差
最大的,故称为第一主成分。如果第一主成分不足以代表原来个变量的
信息,再考虑选取即第二个线性组合,为了有效地反映原来信息,已有
的信息就不需要再出现在中,用数学语言表达就是要求,称为第二主成
分,依此类推可以构造出第三、四……第个主成分。
对于哪组数据更加可信,我们知道方差是考察数据的波动性的,方 差小就说明数据比较稳定,方差大就是波动性比较大。故我们将红酒, 白酒每组样品酒的平均组内方差求出来,比较方差和的大小,则可知道 哪组数据更加可信。
平均组 内方差
红葡萄酒 第一组 第二组 51.92 15.24
白葡萄酒 第一组 第二组 22.75 9.70
分。主成分又叫主分量。这里我们称为主成分系数。
上述模型可用矩阵表示为:
,其中
(13) 称为主成分系数矩阵。 基于因子分析法的理论,运用SPSS软件,分析酿酒红葡萄的理化指标, 可得以下结果: 第一因子:乙醛,乙酸甲酯,乙酸乙酯,乙醇,丙酸乙酯,2-戊酮,甲 苯,乙酸 丁酯,3-甲基-1-丁醇乙酸酯,乙酸戊酯,乙酸己酯,2-辛 酮,4-己烯-1-醇-乙酸盐,1-己醇,(Z)-3-己烯-1-醇, 乙酸辛酯,5-甲基糠醛,甲氧基苯基丙酮肟; 第二因子:花色苷鲜重,DPPH自由基,总酚,单宁,葡萄总黄酮;
(7) 对葡萄酒的评分进行无量纲化处理:
(8) (2)对量化指标进行选择
因子分析法应用原理:在这个问题中,需要研究多个变量,并且
这多个变量之间存在一定的相关性。为了从多个变量中综合为少数几个
代表性变量,既能够代表原始变量的绝大多数信息(80%或85%)以上,
又互不相关,并且在新的综合变量基础上,可以进一步的统计分析,所
主成分分析的数学模型:对于一个样本资料,观测个变量
(10)
主成分分析就是将个观测变量综合成为个新的变量(综合变量),即
(11)
简写为:
(12)
要求模型满足以下条件:
①互不相关(,)
②的方差大于的方差大于的方差,依次类推
③
于是,称为第一主成分,为第二主成分,依此类推,有第个主成
针对问题三,分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运 用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成 分,进而通过多元回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系 的模型。
针对问题四,首先利用因子分析法分别给出酿酒葡萄和葡萄酒的理 化指标对葡萄酒质量的影响因素,再将每类葡萄和葡萄酒中的芳香物质 总和作为样品中的芳香指标,与葡萄酒的理化指标一并进行因子分析, 根据前后两者结果中由样品的芳香指标导致的影响差异,再结合感官指 标,最终确定感官指标是评价葡萄酒质量的最有效指标。
不成立,总体均值不完全相等,差异并非仅由随机因素引起。在本题
中,分析红酒时,分析白酒时,此题设显著性水平,
说明:值反应了可以以多大的把握认为原假设成立。如果计算的值
小于给定的显著性水平0.05则应该接受原假设,否则应拒绝原假设。如
果值小于显著性水平,则均值相等,否则不相等。 首先我们对数据进行处理,附件1里有四组数据:红葡萄酒和白葡萄酒
方差
自由度 均方差 F值
P值
组间方差 87.50
1
87.15
2.499297 0.119961
组内方差 1813.23 52
34.86981
总方差 1900.38 53
(2)根据一、二组对白葡萄酒的综合评价可以得到表二:
方差
自由度 均方差 F值
P值
组间方差 85.51
1
85.51
5.082542 0.028247
首先对附件一中的数据进行无量纲化处理,得到每种葡萄酒的平均 得分,用因子分析法,对酿酒葡萄的理化指标进行选择,得到十种因 子,再用0-1规划模型,最后对酿酒红葡萄进行分级。 2.2.3问题三的分析
要求研究葡萄与葡萄酒理化指标之间的联系,我们先对于葡萄的30 个理化指标进行主成分分析法,得到葡萄一些具有代表性的理化指标。 然后我们建立葡萄的理化指标与葡萄酒的7个理化指标之间的多元线性 回归方程,得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。 2.2.4问题四的分析
2012高教社杯全国大学生数学建模竞赛