数学建模2012a剖析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用多个检验方法进行综合分析和考虑,给出较好的结果。
(5)由于评酒员都是感官评价的结果,前面是分两组样本分析的,这里可以针对 每组评酒员的差异进行分析,即给出每个评酒员的品酒差异进行分析。所以,第
一问应该越详细越好。这一问解决的感官评价的问题。
9
问题2. 给出根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒
概率统计在数学建模 中的应用
—— 以2012年全国大学生数 学建模竞赛(本科组)A 题为例
1
问题重述
2
问Leabharlann Baidu1的求解
仔细研究题目,看到“著性差异”的字眼,我们自然会想起概率论与数理统 计中的“假设检验”和“方差分析”部分。只要把问题转化为概率统计中假设 检验或方差分析模型,便能得到相应的结论。 在题目给出的原始数据中还有一个缺失值和一个异常值,在数据预测处理中 可用正常值的平均值代替缺失值或异常值,这样问题1 就可以分解为统计中的 “有两批产品,分别经过两次检验,求两批产品是否有显著差异? 哪次检验更可 靠”的经典模型。 显然,对于第一问,可以转化为假设检验问题,也可以转化为方差分析问
7
评分要点
问题1.
附件1中给出的是评酒员对27种红葡萄酒和28种白葡萄酒的两组品评结 果。这两组评酒员各不相同,两组中的每个酒样都取自相同葡萄酒厂家的同一批 次的产品。要求学生给出判断这两组评价结果好坏的原理、模型和方法,给出具 体的结果,并对结果进行说明。好的品评结果应该是对同一酒样评价时这些评酒 员之间的差距小、且这些酒样之间的区分度明确(注:一些学生的模型和方法仅 考虑评酒员的打分差距)。 参考:红酒中样品23是好酒,样品12是较差的酒。
的一个方法,可以考虑多元统计分析中的聚类分析方法,把酿酒葡萄的相关数据
进行聚类,从聚类结果中分析每类的数据特征,最后得到相应的分类标准。
在聚类分析之前需要问题解决: (1) 所给数据指标太多且有一级指标和二级指标; (2) 如何确定聚类分析中的类别数。
4
对于(1),可以先用层次分析法把不同级别的指标统一成同一级别的指标,
题。在做这些工作之前,需要对数据进行正态分布检验。由于所给数据是评分,
在求解第一问时也可以用秩和检验模型。 对于第二问,评分标准要求方差较小 的结果更可靠。
3
问题2的求解
问题2是对酿酒葡萄进行分级,这本质上是一个分类问题。 在分类之前,必须给出分类标准,而题目不会给出相应标准,查阅相关资料给出
的分类标准也未必满足本题的要求,因此需要自己建立一个分类标准。解决这一问题
8
在问题一中,答案是固定的,也就是显著和可信的问题,不管什么方法,但 关键的还是说明假设检验的原理的判据,为什么要用这种方法,合适吗?所以, 评分要点有以下几处: (1) 数据的处理,包括缺失和异常数据,说明你处理的方法。 (2)检验模型的假设进行检验,例如样本的正态分布检验等 (3)在前面的基础上,有些统计的方法不太适用,这时候要介绍你的方法原理和 为什么要这么做。 (4)显著性分析和可信性分析。这里面可能不同的方法结果不太一致,这时候要
关键点(1)无论哪种方法,酿酒葡萄的理化指标和葡萄酒的质量必须要说明清楚
(2)模型本身的优缺点和适用范围进行分析明确 (3)分级结果中应该对不同的酿酒葡萄进行明确的区分,例如哪种葡萄能造哪种
级别的酒可以分析出来。参考答案中说明23和12其实是不一类的,只是一个参考,
不同的分级数和不同的方法可能分的不是很明显,但能把样本中大多数好坏分开 (4)最好能给出酿酒葡萄分级标准中影响较大的理化指标和相应的分级标准即哪 种理化指标对应哪种级别的酿酒葡萄等。这一问是问题的关键,建立了酿酒葡萄 的分级标准,将酒的评价深入到理化指标和原料上。
鉴于该方法在构造一致互反矩阵时主观因素较强,可以用多元统计分析中的主
成分分析方法通过提取第一主成分把两个级别的指标统一到同一个级别,然后
再一次用主成分分析方法对数据进行降维处理. 对于问题(2) 需要参考比较专业的聚类分析理论相关文献或其它行业标准 才能解决.
5
问题3的求解
为了研究酿酒葡萄与葡萄酒的理化指标之间的相关性,可以采用多元统计分 析中的典型相关分析方法,令酿酒葡萄为输入变量,葡萄酒为输出变量,建 立典型相关分析模型,然后提取典型相关变量进行分析得到结论。 也可以对葡萄的30个理化指标进行主成分分析法,得到葡萄一些具有代 表性的理化指标,然后建立葡萄的理化指标与葡萄酒的7个理化指标之间的多元
(2) 进行回归系数显著性检验,取t值对应最大概率Pmax;
(3) 判断Pmax≤0.05( 即取α = 0.05) 是否成立,若成立进入第5 步,否则进 入第4 步; (4) 接受H0,即这个指标与因变量线性关系不显著,将指标剔除,返回第一步; (5) 拒绝H0,则所有指标与因变量线性关系显著,输出方程,结束。
线性回归方程,进而得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。
还可以用偏最小二乘回归分析法解答此问.
6
问题4的求解
本问题是分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能 否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。由于所给的数据自变量太多, 因此可以考虑多元统计分析中的逐步回归分析方法进行因子筛选,其 具体过程如下: (1) 建立多元线性回归方程;
11
问题3. 给出分析酿酒葡萄与葡萄酒的成分之间关系的
原理、模型和方法,得到葡萄酒的理化指标是否与葡萄 的理化指标相关的结论,相关时给出具体的依赖关系。 求解时最好先对葡萄的理化指标(包括芳香物质)进行 分类和筛选,然后进行评价。注:仅把葡萄的全部理化 指标进行简单回归不够完整。
葡萄进行分级的原则、模型、算法和结果。确定酿酒葡萄质量好坏
的主要依据是问题1中评酒员对酒的质量的评价结果,根据这个评价
结果和酿酒葡萄的各种理化指标给出确定葡萄质量的模型,由此给
出这些酿酒葡萄的分级结果。
参考:分级结果中好的红葡萄应包含样品23,差的应该包含样 品12。
10
在问题二中,根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行 分级。这里的方法较多,例如模糊综合评判,神经网络,聚类等。每种方法都有 自己的局限性,而且分级的个数也会有很大差异,这时候就要对自身的模型进行 分析和判断。