2012数学建模A葡萄酒的评价

合集下载

2012年全国大学生数学建模竞赛A题 附件1-葡萄酒品尝评分表

2012年全国大学生数学建模竞赛A题 附件1-葡萄酒品尝评分表
平衡/整 体评价
2 葡萄酒样品2
外观分析 澄清度 色调

6
7
7
7
6
7
7
19
16
16
16
10
9
9
8
3
4
4
4
8
8
8
8
5
4
5
4
7
6
7
7
14
12
12
12
4
5
5
5
6
6
7
7
7
6
6
7
16
16
16
22
9
9
9
10
4
4
3
4
8
8
6
8
5
5
4
5
7
7
6
6
14
12
12
12
5
5
4
5
7
6
7
7
6
6
7
7
19
16
16
7
14
12
12
14
5
4
5
5
6
6
6
6
6
6
6
6
16
16
16
19
9
9
9
10
4
4
4
4
8
8
6
8
4
4
5
4
6
7
6
6
12
12
12
12
4
5
5
4
6
6
7

2012年数学建模竞赛-葡萄酒的评价模型

2012年数学建模竞赛-葡萄酒的评价模型

葡萄酒的评价模型摘要本题主要讨论了酿酒葡萄与葡萄酒的理化指标之间的关系,并得出结论能够用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,这对于盛行的葡萄酒的鉴赏具有重要意义。

从建模的角度来说,这道题偏重于统计学的知识,因此,我们利用应用广泛的统计学软件SPSS19.0来进行分析。

问题一用独立样本T检验判断两组有无显著性差异。

对红、白葡萄酒分别检验,则两组评分均有显著性差异,并且第二组评酒员的评分更为可信。

对于问题二,我们利用了问题一的结果作为葡萄酒的质量,使之与葡萄的理化指标相结合进行聚类分析,分别将红白葡萄酒都分为四个等级。

对于问题三,要研究葡萄与葡萄酒理化指标之间的联系,用多元统计中的典型相关分析研究两个变量组之间的联系。

由于两组变量存在组内多重共线性,因而先用因子分析缩减变量,使分析结果准确可靠。

得到结果葡萄的各指标对葡萄酒的综合影响大于个体指标的影响。

问题四则在问题三因子分析的基础上,对公因子变量和葡萄酒质量进行回归分析,得出可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。

关键字:独立样本T检验聚类分析因子分析典型相关分析综合影响回归分析一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析2.1问题1的分析分析两组打分结果有无显著性差异,实质是对这两个独立样本均值的t检验。

数学建模葡萄酒检验数据分析-2012年

数学建模葡萄酒检验数据分析-2012年

2012高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范”)
A题葡萄酒的评价
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
附件1:葡萄酒品尝评分表(含4个表格)
附件2:葡萄和葡萄酒的理化指标(含2个表格)
附件3:葡萄和葡萄酒的芳香物质(含4个表格)。

2012年全国大学生数学建模A题 葡萄酒质量评价

2012年全国大学生数学建模A题 葡萄酒质量评价

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):统计学在葡萄酒质量评价中的应用摘要:随着酿酒业的发展,越来越多不同层次的葡萄酒涌入市场,葡萄酒质量的评价也越发的重要。

对于第一题,在对两组评酒员评价结果进行显著性检验的过程就是假设检验的过程。

为了推断两组品酒员的评价结果是否有显著性差异,需要提出一个没有显著性差异的零假设。

通过对样本的总体特征来判断假设的合理性。

我们用双样本的Kolmogorov-Smirnov 检验方法得到两组评价结果是有明显性差异的。

在可信度分析中,通过方差分析,得出第二组的评价结果更合理。

第二题,这是个多对象多指标的分级问题。

所以我们采用综合评价方法,结合评价员对葡萄酒的评分,分别对酿酒葡萄的理化指标和葡萄酒的质量进行评价并分级(为方便数据处理,分为10个等级)。

2012全国大学生数学建模竞赛A题 葡萄酒的评价

2012全国大学生数学建模竞赛A题  葡萄酒的评价

A题葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?对问题的分析与类比归纳:1、笔者认为,对于同一事物的评价 如果大家的意见越一致 那么评价的可信度就越高。

所以对于问题1的解题思路也就清晰明了了. 我们可以通过方差。

所谓方差即观测变量各个取值之间的差异程度。

它是用以衡量风险大小的指标。

这一概念来对每一组评酒员作出的评估作出风险分析。

显而易见的是若风险评估的值越高 这组评酒员的评价就存在问题了。

若风险评估值大小相当 这说明这两组评酒员是没有明显差异的。

2、题目中要求对葡萄作出评级。

看起来似乎没有思路 那么我们可以动一下我们的小脑筋。

既然对于评级我们没有参考标准 那么我们可以参考评酒员的评价。

即使用逆向思维 从评酒员的评分发出 那么大体上葡萄的分级基本上就能确定下来 根据确定先来的葡萄分级进行逆推 就可以得出结论。

3、对于这个问题 最直观也是最基本的思路就是看两者之间的趋势。

应用MATLAB软件,作出两者的趋势图。

通过对趋势图的直接观察 两者之间的大体关系即可确定 然后根据曲线拟合的方法可得出两者间的函数关系。

可以类比手机套餐问题解决归纳。

对于我们这些消费用户来说,手机的资费问题一直是我们所关注的热点问题。

2012年全国大学数学建模赛题

2012年全国大学数学建模赛题

2012年全国大学数学建模赛题D2012高教社杯全国大学生数学建模竞赛题目(请先阅读“全国大学生数学建模竞赛论文格式规范”)A题葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格)东立面南立面透视图西立面(请先阅读“全国大学生数学建模竞赛论文格式规范”)C题脑卒中发病环境因素分析及干预脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。

这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。

对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。

同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。

数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。

2012A葡萄酒问题点评

2012A葡萄酒问题点评

点评:葡萄酒的质量分析与评价一数据预处理1 缺省数据①补充:均值,拟合值,回归值,查阅资料得到……如:第一组红葡萄酒品尝评分表——F76号数据缺失②剔除2 异常数据①修正:均值,拟合值,回归值,查阅资料得到,根据数据异常情况酌情处理(数字录入重复?如:第一组白葡萄酒品尝评分表——J233;多录入一位数字?如:第一组白葡萄酒品尝评分表——L 298号)……➢特别注意:极端数据不一定是异常数据!有时候极端数据甚至是关键数据!②剔除3 数据变换①数据方向上的变换在葡萄和葡萄酒的所有指标中,绝大多数指标都属于极大型指标(其取值越大越好)。

因此首先将全部指标化为极大型指标,根据原始指标类型不同,分为三类:●极小型化为极大型:褐变度✧参见:评酒问题点评——数据预处理——理化指标(原始数据+处理后数据).xls●居中型化为极大型:单宁✧参见:评酒问题点评——数据预处理——理化指标(原始数据+处理后数据).xls✧参见:评酒问题点评——数据预处理——居中型化为极大型语法.sps●区间性化为极大型:PH值,总酸,固酸比②数据量纲上的变换✧参见:SPSS—Analyze—Classify—HierarchicalCluster—Method—Transform Values 的选项●标准化(Z Scores)●极差标准化变换(Range–1 to 1):变换后的数据均值为0,极差为1●正规化(规格化)变换(Range 0 to 1):变换后的数据最小为0,最大为1✧参见:评酒问题点评——数据预处理——理化指标(原始数据+处理后数据).xls中的“归一化”数据●Maximum magnitude of 1:变换后的数据最大值为1●Mean of 1:变换后的数据均值为1二问题一➢注意,下面几种提问方式是等价的:两组评分有无差异?⇔两组评分的均值是否相等?⇔分组对评分是否有影响?⇔分组结果和评分结果是否独立?……◆参数检验方法:1 两个正态总体的均值检验SPSS—Analyze—Compare Means—Independent-Samples T Test也可以用Excel做,但Excel做统计分析需要首先加载分析工具库:Excel—快速工具栏—其它命令—加载项—分析工具库Excel—数据—数据分析—t-检验: 双样本等方差假设Excel—数据—数据分析—t-检验: 双样本异方差假设✧参见:评酒问题点评——问题一——两个正态总体均值的检验2 配对样本T检验SPSS—Analyze—Compare Means—Paired-Samples T Test Excel—数据—数据分析—t-检验: 平均值的成对二样本分析✧参见:评酒问题点评——问题一——配对样本T检验➢配对样本T检验比两个正态总体的均值检验更好!3 方差分析①单因素方差分析Excel—数据—数据分析—方差分析:单因素方差分析SPSS—Analyze—Compare Means—One-Way ANOVA✧参见:评酒问题点评——问题一——单因素方差分析➢注意:用excel来做组别对评分的单因素方差分析时,数据结构需要重新布局。

2012数学建模A题---葡萄酒评价---国家奖

2012数学建模A题---葡萄酒评价---国家奖

葡萄酒的评价摘要本文主要运用统计分析方法,解决与所酿葡萄酒有关的问题。

对于问题一,,分别对白酒和红酒的两组数据进行差异性检验。

构建一个能反应葡萄酒本身质量的量,对两组数据分别进行相关性分析,得到第二组评酒员的结果更可信。

对于问题二,先做聚类分析,再做线性回归分析,得到白、红葡萄分为4级和3级。

对于问题三,利用问题二中聚类得到的7个主成分,把每种葡萄酒的理化指标与酿酒葡萄之间的7个主成分进行相关性分析,得到7个回归方程,即为酿酒葡萄与葡萄酒的理化指标之间的联系。

对于问题四,首先建立模型:12W=a *Y +b *Y 。

其中a,b 分别为酿酒葡萄和葡萄酒对葡萄酒质量的贡献率,1Y ,2Y 分别为两种因素的贡献值。

然后,通过确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。

问题一中,本文运用excel 做两组数据的显著性差异检验,得到两组评酒员在评论白酒和红酒都存在显著性差异,且通过了F 检验。

接着本文通过确定各指标的权重,构建一个能反应各葡萄酒实际平分的量,把两组数据与之做相关性分析,发现第二组与之相关性更大,故第二组评酒员的结果更可信。

问题二中,本文通过SPSS 做理化指标的聚类分析,得到7个主成分;再做指标与评分的线性回归分析,得到白葡萄的分级结果为4级:一级:白酿酒葡萄14,22;二级:白酿酒葡萄4,5,9,19,23,25,26,28;三级:白酿酒葡萄24,27;四级:白酿酒葡萄1,2,3,6,7,8,10,11,12,13,15,16,17,18,20。

红葡萄酒为3级:一级:红酿酒葡萄2,9;二级:红酿酒葡萄3,4,10,22,24;三级:红酿酒葡萄1,5,6,7,8,11,12,13,14,15,16,17,18,19,20,21,23,25,26,27。

问题三中,本文运用excel 将葡萄酒的一级指标分别与7个主成分进行相关性分析然后对每种主要成分利用SPSS 进行线性回归分析得到以下7个回归方程:()()()()()r1134r21367r3137r4136r6137r71Y =-39.542+1.727+21.850+3.9463Y =4.044+0.026-0.156-0.005-0.1954Y =2.807+0.021-0.030-0.1895Y =2.700+0.024-0.169-0.0056Y =0.069+0.001-0.006-0.0077Y =70.028-0.188+x x x x x x x x x x x x x x x x x ()()2347r8123560.841+0.280-0.187+1.7048Y =58.545-0.021-1.028+1.666+27.045-0.0049x x x x x x x x x 即为每种酿酒葡萄与葡萄酒理化指标之间的联系。

2012年全国数学建模葡萄酒的评价

2012年全国数学建模葡萄酒的评价

葡萄酒的评价摘要本文针对题目中的问题,运用系统建模及计算机仿真,解决葡萄酒的评价问题。

问题(1)中,首先运用正态概率纸发对葡萄酒得分进行分布检验,在葡萄酒得分分布具有正态性的条件下,建立双因素重复实验方差模型,结果显示二组品酒员打分具有显著性差异;然后采用双因素无重复实验方差分析对二组品酒员打分进行可信度评定,评定认为第一组品酒员对红葡萄酒的打分更可信,第二组品酒员对白葡萄酒的打分更可信。

问题(2)中,首先对酿酒葡萄理化指标建立主成分分析模型,提取白葡萄酒酿酒葡萄的11个主成分和红葡萄酒酿酒葡萄的9个主成分;然后将主成分结合对应葡萄酒的质量,建立基于最邻近规则的酿酒葡萄试探聚类模型,最佳聚类数目利用统计量2R来确定;最后根据酿酒葡萄的聚类情况,计算各类酿酒葡萄对应葡萄酒的质量,并依此建立酿酒葡萄的分级模型。

问题(3)中,首先对酿酒葡萄和葡萄酒理化指标数据进行直接正交处理,消除数据在采集过程中所产生噪声的影响;然后建立葡萄酒和酿酒葡萄理化指标之间的偏最小二乘回归模型,求解出葡萄酒理化指标与酿酒葡萄理化指标的多元线性关系;最后通过分析葡萄酒和酿酒葡萄理化指标标准数据的相关系数和葡萄酒理化指标的预测图定性讨论回归方程的效果。

问题(4)中,运用典型相关分析方法,通过比较酿酒葡萄和葡萄酒理化指标、感官指标与葡萄酒质量的相关系数,得到酿酒葡萄和葡萄酒的理化指标影响葡萄酒的质量这一结论。

关键词:显著性检验主成分分析试探聚类偏最小二乘回归一、问题重述与分析1.1问题重述确定葡萄酒质量时一般是通过聘请有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

2012年全国数学建模大赛 A题葡萄酒的评价

2012年全国数学建模大赛 A题葡萄酒的评价

葡萄酒的评价摘要本文就影响葡萄酒的质量的因素进行了探究。

在问题一中,评酒员间存在评价尺度、评价位置以及评价方向等方面的差异,导致不同评酒员对同一酒样的评价差异很大,于是我们需要探讨两组评酒员的可信度。

对此,我们建立了单元素方差模型对其进行了显著性差异的判断,最后我们得出结论:两组评酒员的评价结果有显著性差异,并且第二组评酒员评价的结果更加可信。

在问题二中,我们首先将大量的数据进行了样本住分析塞选,大大减少了计算量,就红、白葡萄酒前17组样本葡萄酒的分数进行训练,由后十组的理性指标进行检验,也可检验俩个的准确性。

最后我们认为可以给酿酒葡萄分为一、二、三、四四个等级。

在问题三中,因为要讨论酿酒葡萄与葡萄酒的理化指标之间的联系,我们就其两者的重要理化指标进行了探讨,应用了回归模型将其各项重要指标进行了多元拟合处理,最后得出了葡萄酒和酿酒葡萄中的重要指标的等式关系。

在问题四中,我们首先利用了回归原理求得葡萄酒质量与葡萄酒和酿酒葡萄的理化指标之间的等式关系,由等式和图像细致的分析了葡萄酒和酿酒葡萄理化指标对葡萄酒质量的影响。

在一定范围内,理化指标的与葡萄酒的质量呈正相关,达到一定的量后呈现负相关趋势。

关键词:显著性差异判别主成分分析 BP神经网络回归模型1.问题的重述现今社会,随着人们生活水平的提高,人们对葡萄酒的质量要求也越来越高。

在确定葡萄酒质量的时候,一般聘请一批资深的评酒员进行评比,根据不同的指标所得的分数从而求得总分,以此确定葡萄酒的质量。

其中酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

本题给出了3份材料,材料1是某一年份一些葡萄酒的评价结果,材料2和材料3分别给出了该年份这些葡萄酒和酿酒葡萄的成分数据。

我们必须解决以下问题:问题一:分析材料1中两组评酒员的评价结果是否有明显的差异,并且求出哪组评酒员的评价结果更可信。

问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄的品质进行分级。

2012高教社杯全国大学生数学建模竞赛A题葡萄酒的评价

2012高教社杯全国大学生数学建模竞赛A题葡萄酒的评价

2012高教社杯全国大学生数学建模竞赛葡萄酒的评价摘要本文以概率论与数理统计的相关知识为理论基础,综合运用正态分布和分级的原理,利用统计分析数据,研究了葡萄酒的评价指标体系,针对 葡萄酒的质量评价问题,建立合理的数学模型用以评价。

问题一:(1) 本问题的葡萄酒质量评价指标(即外观分析中的澄清度、色调,香气分析中的纯正度、浓度、质量,口感分析中的纯正度、浓度、持久度,平衡/整体分析),先对指标归类按顺序,统计并整理出相关的数据,再利用正态分布的思想,假设并验证质量评价指标为正态分布并进行差异性分析,对比找出附件1中两组评酒员的显著差异为:两组评酒员对红葡萄酒的评价结果有显著性差异的是外观分析中的色调、香气分析中的浓度,其他的无显著性差异;两组评酒员对白葡萄酒的评价结果有显著性差异的是口感分析中的纯正度、浓度,持久性、质量和平衡/整体评价,其他的无显著性差异。

(2)本问题要求分析附件1中哪组指标更可信,这就要在问题(1)基础上分析两组指标的可信性,建立可信性分析模型,利用matlab 软件编程计算得(程序见附件4): 1var =0.0735 ,2var =0.0398。

可见21var var ,因此第二组可信性高。

问题二:此问题我们的总体思路是这样的:先根据样品葡萄酒的得分高低对葡萄酒进行分级,并且假设葡萄酒得分越高,那么酿酒葡萄就越好,等级就越高,于是我们利用一些分类模型就可以得到相应酿酒葡萄的级别差。

根据这条思路,我们建立如下一些模型来讨论(见表6、7、8)。

为了充分利用文中的数据,我们把第一组第二组葡萄酒品尝得分合并,这样就得到了一个更大的样本,对结论会更有说服力。

为了能比较客观的对葡萄酒分划分合理的等级,我们需要一种能从总体上正确的反应葡萄酒的评分,这里我们利用已经单位化的综合了所有指标的葡萄酒品尝评分的所得分评价,它们的得分范围理论上包含在[0,1]区间上,实际计算红葡萄的单位化归一化后的评分。

葡萄酒的鉴定 2012年数模国赛A题论文

葡萄酒的鉴定            2012年数模国赛A题论文

关键字 :t 检验
主成分析法
典型相关分析
多元线性回归
1
一、问题重述
1.1 问题的背景 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。 每个评酒 员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定 葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和 酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件 1 给 出了某一年份一些葡萄酒的评价结果,附件 2 和附件 3 分别给出了该年份这些 葡萄酒和酿酒葡萄的成分数据。 1.2 问题的提出 请尝试建立数学模型讨论下列问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异, 哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡 萄和葡萄酒的理化指标来评价葡萄酒的质量?
二、基本假设
1、假设所有的数据都是可靠的,不包括人为造成的不合理因素。 2、假设数据中的奇异数据和缺省值忽略后对总体信息不会有显著的影响。 3、评酒师对葡萄酒的质量打分能真实的反映葡萄酒质量的好坏。 4、忽略酿酒葡萄和葡萄酒的色泽对酒样品质量的影响。 5、酿酒葡萄的各理化指标,如蛋白质、氨基酸含量在正常范围内越高越好。
5
我们对附件一中的各个评酒员给各种酒的指标打的分数相加之后, 按照酒的 序号分红葡萄酒、白葡萄酒进行排序,见附件 2. 我们对先对第一组的十个评酒员对白葡萄酒的打分总分的一组数据数据进行处 理,把前面处理的数据输入到 SPSS 中,得到的 Q—Q 图,它的 sig 值为 0.449, 大于 0.05,所以所给数据服从正态分布。

2012年数学建模A题——葡萄酒高质量地评价与衡量

2012年数学建模A题——葡萄酒高质量地评价与衡量

2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A (隐去论文作者相关信息)日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。

通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。

2012年数学建模A题目--关于葡萄酒质量的评价

2012年数学建模A题目--关于葡萄酒质量的评价
Paired Samples Statistics
Mean
N
Std. Deviation
Std. Error Mean
Pair 1
First
73.0778
27
7.36093
1.41661
Second
70.5148
27
3.97799
.76556
Pair 2
f2
74.0107
28
4.80404
.90788
Cunulative contribution rate
1
6.963
23.211
23.211
2
4.984
16.612
39.824
3
3.692
12.305
52.129
4
2.842
9.472
61.601
5
1.994
6.647
68.248
6
1.738
5.795
74.042
7
1.428
4.761
78.803
Std. Error Mean
95% Confidence Interval of the Difference
Lower
Upper
Pair 1
Ft - Sd
2.56296
5.37424
1.03427
.43699
4.68894
2.478
26
.020
Pair 2
f2 - s2
-2.52143
5.35934
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系。葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒的质量。葡萄酒的每一项理化指标是其质量的单一体现,而感官指标则是葡萄酒质量的综合概括,换句话说,一个理化指标、卫生指标都合格的葡萄酒未必是高质量的葡萄酒。在今后的一个时期,我们需要做的是从葡萄酒的特点出发,围绕葡萄和葡萄酒理化指标、感官指标等众多因素对葡萄酒质量的联系进行研究,尽可能确定较为合理的葡萄酒质量评价标准,从而实现既保证市场中酒的质量,保护消费者利益,又能为市场定位提供决策信息,达到经济效益的目的,实现双赢。

2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)

2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)

葡萄酒理化指标与质量的评鉴分析摘要用好的葡萄也许酿不出好酒,但没人能用劣质葡萄酿出好酒。

巧妇难为无米之炊,再优秀的酿酒师,如果没有优质的葡萄,也很难酿出好酒。

不同葡萄品种酿制出的葡萄酒是不同的,但是,除了品种间的差异,葡萄自身的质量是酿制高品质葡萄酒的关键。

本文通过建立meansK-聚类模型、典型相关分析等模型,逐步探求用葡萄和葡萄酒的理化指标来评鉴葡萄酒质量的方法。

问题一要求我们分析附件1中两组评酒员的评价结果是否存在显著性差异,为此我们依据小概率原理建立模型Ⅰ-显著性检验模型。

首先我们利用F检验求解两组评酒员之间是否存在显著性差异,再利用配对t检验对检验样本做再次检验,以提高研究效率,确保评价结果的准确性。

利用Excel软件处理数据后,进行t、F的联合检验,当联合检验均被接受,得到两组评酒员的评价结果有显著性差异的结论。

同时通过对两组品酒员对55种葡萄酒样品评分的稳定性、统一性分析,确定第二组品酒员的评价结果更可信。

针对问题二本文根据附件2提供的数据,利用模糊数学原理[3],建立模型ⅢK-聚类模型,对酿酒葡萄进行分类,再以葡萄酒品尝评分作为质量评价依据,means对酿酒葡萄进行分级。

首先,考虑到酿酒葡萄的理化指标过多,不便分类,我们利用多元统计分析原理对红、白酿酒葡萄进行主成分分析,得出红、白酿酒葡萄分别有8个和11个主成分,从而大大减少了分类指标。

再利用meansK-算法求出最佳聚类数k,建立meansK-聚类模型对各种葡萄样品在各个主成分上的得分进行聚类,将红、白葡萄样品分别划分为3类和4类。

最后,根据每个类别中葡萄样品对应的葡萄酒的品尝评分,对各类酿酒葡萄进行分级。

针对问题三建立模型Ⅳ-典型相关分析模型,定量分析酿酒葡萄与葡萄酒的理化指标之间的联系。

我们首先选取酿酒葡萄与葡萄酒皆含有的花色苷、单宁等成分作为理化指标,然后构建典型相关分析模型,研究酿酒葡萄与葡萄酒两组样品的理化指标之间的相关性。

【数学建模】2012年全国大学生数学建模-葡萄酒的评价问题全面解析(附R语言实现部分代码)

【数学建模】2012年全国大学生数学建模-葡萄酒的评价问题全面解析(附R语言实现部分代码)

【数学建模】2012年全国⼤学⽣数学建模-葡萄酒的评价问题全⾯解析(附R语⾔实现部分代码)
问题背景
确定葡萄酒质量时⼀般是通过聘请⼀批有资质的评酒员进⾏品评。

每个评酒员在对葡萄酒进⾏品尝后对其分类指标打分,然后求和得到其总分,从⽽确定葡萄酒的质量。

完整代码详见
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在⼀定程度上反映葡萄酒和葡萄的质量。

附件1 给出了某⼀年份⼀些葡萄酒的评价结果。

请尝试建⽴数学模型讨论下列问题:
附件1-葡萄酒品尝评分表
分析附件1 中两组评酒员的评价结果有⽆显著性差异,哪⼀组结果更可信?
根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进⾏分级。

模型建⽴
由于27 种红葡萄酒样品和28 种⽩葡萄酒样品是随机选取的,故两组评酒员对27 种红葡萄酒样品和28 种⽩葡萄酒样品的评分可以认为是随机并且服从正态分布的。

根 据⽅差分析的数学假设前提,可以知道⽅差统计变量是符合F 分布的统计变量,故以 下利⽤F 检验的模型,计算两组数据的差异性。

# ⽅差分析输出
# https:///article/4b07be3c4e314548b380f3a5。

2012A数学建模——葡萄酒的评价

2012A数学建模——葡萄酒的评价
2
2
三、模型的建立与验证
对红葡萄酒有显著影响的葡萄指标示意表
酒指标 花色苷 单宁 总酚 酒总黄酮 白藜芦醇 DPPH半抑制体 积 花色苷 花色苷 花色苷 花色苷 葡萄总黄酮 苹果酸 DPPH自由基 DPPH自由基 DPPH自由基 相关显著指标 褐变度 总酚 总酚 总酚 DPPH自由基 单宁 单宁 单宁 总酚 葡萄总黄酮 葡萄总黄酮 葡萄总黄酮 果皮质量 单宁 黄酮醇 果梗比
三、模型的建立与验证
问题四 (1)模型建立:由理化指标评价葡萄酒质量——逐步多元回归模型 红葡萄酒和葡萄的理化指标对红葡萄酒质量影响的回归方程为:
y 0.03341x1 0.06279x2 0.01282x3 0.09751x4 0.88596
白葡萄酒和葡萄的理化指标对白葡萄酒质量影响的回归方程为:
汇报提纲
一、问题重述 1、问题背景
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品 评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求 和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡 萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在 一定程度上反映葡萄酒和葡萄的质量。
28
1.040086
1.01961
0.019687
全国大学生数学建模大赛
-0.00726
0.019272 -0.00647 -0.0042 0.016057
1.01134
0.994353 1.038779 0.970834 1.006113
0.99236
1.01967 1.0121 1.02841 0.97964
0.018767
-0.02546 0.025683 -0.05931 0.026312

2012年数模国赛A题葡萄酒

2012年数模国赛A题葡萄酒

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):A 题 葡萄酒的评价摘要本文探讨的是判定两组评价结果有无显著性差异,研究葡萄分级,葡萄与葡萄酒理化指标间联系,酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响的问题。

首先,不同的两组的评酒员对一种葡萄酒进行品评打分时,打分的高低不同既可能源于不同组的评酒员的差别,也可能源于组内评酒员的差别。

这种特征符合单因素方差分析法的适用问题。

因此,可以利用统计学中单因素方差分析的方法,对每一种酒以组别为控制变量,打分值为观测变量,利用EXCEL2007自带的单因素方差分析功能求解出F 检验值和P 值,查表得F 临界值,在给定05.0=α的检验水平下,若临界值F F >,P<0.05则判断控制变量给观测变量带来了显著影响。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012 年 9 月 7 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要目前,葡萄酒备受大家的青睐,其质量也日益受到人们的关注。

葡萄酒的质量与酿酒葡萄的好坏有直接关系,葡萄酒和酿酒葡萄的理化指标会在一定程度上反应葡萄酒和酿酒葡萄的质量。

对于问题1,我们采用方差分析的方法建模解决。

基本思路是:对两组评酒员的评价结果进行单因素方差分析,然后再用F检验对得出的结果进行进一步验证,得出两组评酒员的评价结果无显著性差异,通过比较两组评酒员评价结果的方差值,得出第二组的结果更可信。

对于问题2,我们采用主成分分析方法,建立综合评价模型,对酿酒葡萄进行分级。

基本思路是运用因子分析的方法,以特征值大于1为标准,得出酿酒葡萄理化指标的8种主成分,在此基础上把综合因子作为一项排名指标,结合问题1得出的葡萄酒的质量,对酿酒葡萄进行排名,用两种排名的名次之和作为对酿酒葡萄分级的主要依据。

此方法消除了主观加权的盲目性,保证了分级的客观性;避免了两个指标中因某一指标数值上远远大于另一指标而使另一指标对排名起不到作用的现象的发生。

最终将酿酒葡萄分为了Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ五个等级。

对于问题3,我们对酿酒葡萄和葡萄酒的理化指标中具有可比性的同类指标一一对比,经相关性检验得到他们具有显著的线性相关性,进而用线性回归的方法得出回归方程,找到酿酒葡萄和葡萄酒的理化指标之间的联系。

对于问题4,先将酿酒葡萄和葡萄酒的量化指标进行无量纲化处理,用F检验验证两组值的相似程度为1,得出酿酒葡萄和葡萄酒的理化指标会对葡萄酒质量产生影响,所以可以用葡萄和葡萄酒的理化指标来评判葡萄酒的质量。

文章最后对论文的优缺点做了评价,并给出了一些改进方向,以利于在实际中应用和推广。

关键词:方差分析;因子分析;主成分分析法;线性回归分析;SPSS软件;F检验1.问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

附件1给出了某一年分一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。

请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果又无明显差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。

3.分析酿酒葡萄与葡萄酒的理化指标之间的关系。

4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2.问题的分析对问题1,我们对附件一所给的葡萄酒品尝评分表进行统计学分析,根据各组评酒员对同一种葡萄酒的评价结果算出每种酒样品的得分,并对每组的数据进行方差分析,利用F检验求出两组间的显著水平,并与0.05的显著水平比较,从而判断两组评酒员的评价结果有无显著性差异。

确定哪组更可信时,分别求出两组评价结果的方差进行比较,方差越小,可信度也就越高。

对问题2,要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,属于分类问题。

对该问题,可以采用主成分分析法,建立综合评价模型。

选取附件2中关于葡萄的一级指标作为影响等级划分的因素,采用因子分析法,确定主成分,结合问题1所得出的葡萄酒的质量对酿酒葡萄进行综合评价并分级。

对问题3,分析酿酒葡萄与葡萄酒的理化指标之间的联系,既然是分析两指标之间的联系,就少不了作比较,从比较数据成对出现这一方面考虑,应该选取酿酒葡萄与葡萄酒理化指标中的共有指标进行分析,用一元线性回归模型求出对应指标之间的函数关系,进而确定酿酒葡萄与葡萄酒的理化指标之间的联系。

对问题4,分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,参照问题2中酿酒葡萄的理化指标的处理方法,对葡萄酒的理化指标做同样分析。

加权处理得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量产生影响的综合因子E,根据葡萄酒质量排名和E排名比较出产生的影响大小。

3.模型的假设(1)假设评酒员都有很高的品评资质,给出的评价结果客观可信。

(2)假设问题1中葡萄酒的质量只与评酒员的评分有关。

(3)假设更可信的评分组给出的数据可以代表葡萄酒的真实质量。

4.符号说明符号一SS方差符号二df自由度符号三MS标准差符号四F统计量符号五valueP 假定值符号六critF F临界值符号七Sig F值实际显著性概率符号八F对应的主成分值i符号九G总主成分值y因变量符号十ix自变量符号十一i符号十二E综合因子5.模型的建立与求解5.1问题1的模型建立与求解在评价结果采用百分制的前提下,对每一个品酒员所给出的每一种样品酒的评价结果求和,并求出每一组10名评酒员对同一种酒评价结果总分的平均值,此平均值即为本组针对该样品酒给出的评分,得到两组分别对27个红葡萄酒样品和28个白葡萄酒样品给出的评分。

用Excel中的数据分析对每组的数据进行方差分析,利用F检验判断两组评酒员的评价结果有无显著性差异。

方差分析结果如下:(1)分析两组评酒员对红葡萄酒的评价表(1):方差分析方差分析:单因素方差分析SUMMARY组观测数求和平均方差列 1 27 1972.9 73.07037 53.51524列 2 27 1903.9 70.51481 15.82439方差分析差异源SS df MS F P-value F crit组间88.16667 1 88.16667 2.543038 0.116842 4.026631组内1802.83 52 34.66981总计 1890.997 53因为统计量)52,1(0266.45430.205.0F F ≈<≈,所以对红葡萄酒而言,两组评酒员的评价结果没有显著性差异。

因为第二组的方差远小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。

(2)分析两组评酒员对白葡萄酒的评价表(2):方差分析方差分析:单因素方差分析SUMMARY组 观测数 求和 平均 方差 列 1 28 2079.3 74.26071 27.05284 列 2 28 2142.9 76.53214 10.05485 方差分析差异源 SS df MS F P-value F crit 组间 72.23143 1 72.23143 3.89307 0.053613 4.019541 组内 1001.908 54 18.55385 总计 1074.139 55因为统计量)54,1(0195.48931.305.0F F ≈<≈,所以对白葡萄酒而言,两组评酒员的评价结果没有显著性差异。

因为第二组的方差小于第一组,所以第二组的可信度高于第一组,即第二组的结果更可信。

综上所述,两组评酒员的评价结果无显著性差异,且第二组的结果更可信。

5.2 问题2的模型建立与求解对于问题2,要求根据酿酒葡萄的理化标准及葡萄酒的质量,对酿酒葡萄进行分级,我们考虑红白两种酿酒葡萄及葡萄酒,建立模型,采运因子分析的方法进行主成分分析。

(1) 首先对所给附件二的数据进行求平均值等优化处理,以便于进行运算。

为了对酿酒葡萄进行客观分级,采用主成分分析法,应用SPSS 软件对数据进行因子分析,具体实施步骤如下:1、数据的标准化2、求出R 及其特征值,贡献率运用SPSS 软件计算出相关矩阵R 及其特征值,贡献率。

在主成分个数选取时,按照特征值大于1的原则,计算结果如下表:表(3):方差分解主成分提取分析表成份初始特征值提取平方和载入合计方差的% 累积% 合计方差的% 累积%1 6.966 23.221 23.221 6.966 23.221 23.2212 4.940 16.467 39.687 4.940 16.467 39.6873 3.737 12.457 52.144 3.737 12.457 52.1444 2.840 9.467 61.611 2.840 9.467 61.6115 1.999 6.663 68.274 1.999 6.663 68.2746 1.742 5.808 74.082 1.742 5.808 74.0827 1.418 4.728 78.810 1.418 4.728 78.8108 1.270 4.234 83.044 1.270 4.234 83.0449 .961 3.203 86.24710 .738 2.461 88.70811 .691 2.302 91.01012 .514 1.713 92.72313 .494 1.645 94.36814 .372 1.240 95.60815 .296 .986 96.59416 .254 .846 97.44017 .218 .728 98.16918 .200 .668 98.83619 .112 .375 99.21120 .070 .234 99.44521 .062 .206 99.65122 .043 .143 99.79423 .032 .108 99.90224 .016 .053 99.95525 .010 .034 99.98826 .003 .012 100.00027 1.135E-16 3.782E-16 100.00028 -3.056E-17 -1.019E-16 100.00029 -1.201E-16 -4.003E-16 100.00030 -3.414E-16 -1.138E-15 100.000由上表可知,有8种成分的特征值大于1,总贡献率达到83%,适宜做主成分分析,因此我们选取前8个成分作为主要成分,即:F1、……、F8。

相关文档
最新文档