数学建模 葡萄酒评价

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

聚类分析图示(二) 根据图表内容,将酿酒红葡萄分为 4 类:
(2)对酿酒白葡萄进行分类: 同 3(1) ,在 SPSS 中运行程序,得到如下图表(详见附录一) : Cluster Membership 4 Clus Case ters 1:葡萄样品1 1
2:葡萄样品2 3:葡萄样品3 4:葡萄样品4 5:葡萄样品5 6:葡萄样品6 7:葡萄样品7 8:葡萄样品8 9:葡萄样品9 10:葡萄样品10 11:葡萄样品11 12:葡萄样品12 13:葡萄样品13 14:葡萄样品14 15:葡萄样品15 16:葡萄样品16 17:葡萄样品17 18:葡萄样品18 19:葡萄样品19 20:葡萄样品20 21:葡萄样品21 22:葡萄样品22 23:葡萄样品23 24:葡萄样品24 25:葡萄样品25 26:葡萄样品26 27:葡萄样品27 28:葡萄样品28
关键词:SPSS T 检验 聚类分析法 原理 偏相关系数 EXCEL 判别分析
相关系数
回归分析原理
相关分析
一、问题重述
葡萄酒的质量一般通过聘请一批有资质的评酒员对葡萄酒进行品尝后, 对其 分类指标打分及求和获得总分而确定。葡萄酒的质量受酿酒葡萄的直接影响,且 葡萄酒和酿酒葡萄的质量可在一定程度上由其检测的理化指标反映。 请参照某年份一些葡萄酒的评价结果(附件 1)和这些葡萄酒和其酿酒葡萄 的成分数据(附件 2、附件 3),建立数学模型分析研究下列问题: 1.分析附件 1 中两组评酒员的评价结果有无显著性差异,并判断哪一组结 果更可信。 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
二、问题分析
2.1 针对问题一,我们将它分成两个问题去解决 1、 针对问题一中的两组评酒员的评价结果有无显著性差异,我们在 SPSS 中利用 T 检验去判断。在这之前,我们对附录 1 中数据进行处理,利用 excel 分别求出两组评酒员分别对红葡萄酒和白葡萄酒的评价结果的平均值。 2、针对问题一中选择哪组结果更加可靠,我们利用 SPSS 求出两组葡萄 酒评价结果的平均值的标准差, 通过对比两组相应葡萄酒评价结果的平均值的标 准差,从而确定出第几组的结果更可靠。 2.2 针对问题二 首先我们将附录 2 和附录 3 中的一些数据进行了处理(例如:求平均值) , 然后通过聚类分析的原理,在 SPSS 实现对酿酒葡萄的分类。 2.3 针对问题三,我们分两个问题去解决 1、 针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,我们先计算 酿酒葡萄和葡萄酒理化指标之间的相关系数,通过 SPSS 实现。由于酿酒葡萄的 理化指标远远多于葡萄酒的理化指标,通过整理数据,在 excel 中得到一个葡萄 酒的理化指标与多个酿酒葡萄的理化指标之间的相关系数的数据。 规定两者的相 关系数大于 0.6(酿酒红葡萄与红葡萄酒的理化指标)时,认为两者的相关性显 著。从而筛选出与葡萄酒理化指标相关性显著的酿酒葡萄的理化指标。 2、 针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,最后我们利 用上面整理好的数据,采用回归分析原理,在 SPSS 中得到酿酒葡萄与葡萄酒的 理化指标之间的联系。 2.4 针对问题四 首先我们知道,葡萄酒的理化指标若理想,葡萄酒的质量就较高;但葡萄的
(2)用同样的方法对两组白葡萄酒质量的平均值运行配对样本的 T 检验, 如图二所示, 我们得到的检验结果是:两组评酒员对白葡萄酒的评价结果有显著 性差异。
图二 综合(1) 、 (2)我们得到的结果是:两组评酒员的评价结果有显著性差异。 5.1.2 结果可靠性的选则 通过对 5.1.1 的解答,我们可以清楚的看到第一组、第二组红葡萄酒质量 的平均值的标准差分别是:7.3426、3.9780。第一组、第二组白葡萄酒质量的平 均值的标准差分别是:5.201、3.1709。 通过比较我们得到的结果是:第二组评酒员的评价结果更可信。 5.2 根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级——聚类分 析-分层聚类-凝聚法 1.聚类分析的概念 聚类分析是根据事物本身的特性研究个体分类的方法。在这里我们采用分 层聚类中的凝聚法, 即聚类开始把参与聚类的每个个体视为一类,根据两类之间 的距离或相似性逐步合并,直到合并为一个大类为止。 2.建立模型: (1)将所要分析的数据转变为矩阵:
理化指标理想,葡萄酒的质量不一定高。因此我们在 SPSS 中,运用相关分析, 分别计算出葡萄酒的理化指标与葡萄酒质量的相关系数、 葡萄的理化指标与葡萄 酒质量的相关系数。 然后通过对相关系数的比较,分析葡萄和葡萄酒的理化指标 对葡萄酒质量的影响。从而论证葡萄和葡萄酒的理化指标能否评价葡萄就的质 量。
a =( a
i
i1
, , aip )’
a
j
=( a j1 , , a jp )’
(3)将每一个样品看作一个类,即为: G1 , G 2 ,…… G n , 观察比较 D (G i , G j ) 哪个最小,将 G i , G j 聚为一类,计算新类与其余各类 之间的距离,得到新距离矩阵 D 2 。 (4)依此类推,最终将样品 G1 , G 2 ,…… G n 分出类来。 3.模型求解: (1)对酿酒红葡萄进行分类: 在 SPSS 中运行聚类分析的程序,得到如下图表: Cluster Membership 4 Clust Case ers 1:葡萄样品1 1 2:葡萄样品2 1 3:葡萄样品3 2 4:葡萄样品4 3 5:葡萄样品5 3 6:葡萄样品6 3 7:葡萄样品7 3 8:葡萄样品8 1 9:葡萄样品9 1 10:葡萄样品10 3 11:葡萄样品11 4 12:葡萄样品12 3 13:葡萄样品13 3 14:葡萄样品14 3 15:葡萄样品15 3
x y
( xi
i 1
n
y ) 2 [ ( xi
i
n
n ( n 1)
i 1
y )]
i
2
/n
(式中,n-1 为自由度,n 为数据对数) 2.建立检验假设:
H
0
: d 0, H 1 : d 0 (其中 为均值差异)其假设的意义为,当差
d
异为零时,可以认为某种试验方法无效;反之,当差异不为零,可以认为某种试 验方法在发生作用或有效。 1.3 模型求解:
三、基本假设
1、假设制作葡萄酒的工艺是一样且稳定的; 2、假设两组评酒员是随机分配的; 3、假设评酒员对每种葡萄酒的评价结果是大致符合正态分布的; 4、假设酿造葡萄酒的环境是相同的; 5、假设酿酒葡萄与葡萄酒中的芳香物质主要成分是:低醇、酯类、苯等,其余 成份忽略; 6、假设不考虑多种葡萄可制成一种酒,只考虑一种葡萄制成一种酒; 7、假设只考虑红葡萄制成红葡萄酒,白葡萄制成白葡萄酒,忽略去皮红葡萄可 酿制白葡萄酒; 8、假设酿酒葡萄中存在的而葡萄酒中不存在的理化指标也会影响葡萄酒的质 量; 9、假设质量高的葡萄酒一定由质量好的酿酒葡萄制成,但是质量好的酿酒葡萄 不一定能酿制成质量高的葡萄酒; 10、假设本文所引用的数据、资料均真实可靠。
四、符号说明
x x
1i
——第一组每种红葡萄酒的平均得分 ——第二组每种红葡萄酒的平均得分 ——第一组每种白葡萄酒的平均得分 ——第二组每种白葡萄酒的平均得分
1
y
1i
2i
y
2i
x - y ——两组红葡萄酒平均数之差
1
xFra Baidu bibliotek-y
2
2
——两组白葡萄酒平均数之差
r
xy , z
——是控制了 z 条件下, x , y 之间的偏相关系数 ——是控制了 z1 , z 2 条件下, x , y 之间的偏相关系数
2013 年大学生数学建模期末小组作业
理工学院
数学(1)班
组员
姓名 殷文 王杰
学号
指导老师: 蔡光卉、施继红、宗荣、尉洪
完卷日期 2013 年 6 月 5 日
葡萄酒的评价
摘要
葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为 原料的葡萄酒也蕴藏了多种营养物质, 而且这些物质都是人体必须补充和吸收的 营养品。目前,已知的葡萄酒中含有的对人体有益的成分大约就有 600 种。葡萄 酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。 本文通过对葡萄酒的评价, 以及酿酒葡萄和葡萄酒的理化指标之间的关系进 行讨论分析。 对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否 影响葡萄酒质量。对于本题,我们主要采用 SPSS 软件对模型进行求解。 针对问题一,首先我们将附件 1 中数据在 Excel 中进行处理;其次,我们在 SPSS 中,采用 T 检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差 异性。最后,我们通过 T 检验,在 SPSS 中可其相应的标准差,通过比较标准差 来确定哪个组更可靠。 针对问题二,我们分别对两组葡萄进行分类。在这里我们采用聚类分析法, 在 SPSS 中实现对酿酒葡萄的分类。 针对问题三,首先,我们利用 SPSS 计算出酿酒葡萄与葡萄酒的理化指标的 相关系数。由于葡萄的理化指标较多,通过整理数据,在 Excel 中得到某个葡萄 酒的理化指标与若干个酿酒葡萄的理化指标的相关系数,并且规定相关系数大于 等于 0.6 表示两者相关性显著;最后,在 SPSS 中分别求出回归方程。 针对问题四,首先利用 SPSS 分别计算出葡萄酒的理化指标与葡萄酒质量的 相关系数、 葡萄的理化指标与葡萄酒质量的相关系数。 然后通过分析其相关系数, 分析葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
16:葡萄样品16 17:葡萄样品17 18:葡萄样品18 19:葡萄样品19 20:葡萄样品20 21:葡萄样品21 22:葡萄样品22 23:葡萄样品23 24:葡萄样品24 25:葡萄样品25 26:葡萄样品26 27:葡萄样品27
3 3 3 3 3 2 3 1 3 3 3 3
聚类分析图示(一)
r
xz , z1z2
r r
xy
——是变量 x , ,
y
之间的简单相关系数(零阶相关系数)
xz
r
yz
——分别是变量 x , z 之间和 y , z 之间的简单相关系数
r ——特定的偏相关系数 n ——观测值个数
k
——控制变量个数 -2——自由度
n -k
五、模型建立与求解
5.1 两组评酒员的评价结果有无显著性差异,选择哪一组更可靠 5.1.1 两组评酒员的评价结果有无显著性差异——配对样本的 T 检验 1.1 配对样本 T 检验的概念 若实验设计是将条件、 性质相同或相近的两个供试单元配成一对,并设有多 个配对, 然后对每一个配对的两个供试单元分别随机的基于不同处理,这样的实 验叫做配对实验。它的特点是配成对子的两个试验单元的非处理条件尽量一致, 不同对子的试验单元之间的非处理条件允许有差异, 每一个对子就是试验处理的 一个重复。 SPSS 配对样本的 T 检验主要解决来自配对样本数据的两个总体均值有否显 著差异的问题。 所谓配对样本,通常是指对同一观察对象在使用某种新方法的有 效性。配对样本的 T 检验对数据的要求: (1)是抽取样本数据的两个总体必须服从正态分布。 (2)两个样本的样本容量相同。 1.2 建立模型: 1.基本数学原理: 成对样本的均值比较 t 检验,假设这两个样本之间的均值差异为零,用于 检验的统计量为: t=
a a a
11 21

a a a
12 22
... ...
... ...

a a
1p 2p
n1
n2

a
k 1 p
(其中 a ij 表示样品 i 的第 j 个指标)
np
(2)写出样品间的距离矩阵 d( a i , a j )=
D
2
1
(欧氏距离为例)

(
a ik a jk )
(1) 在 SPSS 中对两组红葡萄酒质量的平均值运行配对样本的 T 检验,得到 如下图一所示:
图一 对表中的分析结论表明:两个样本平均数分别为 73.056、70.515 ,相关系 数为 0.700 ,T 检验的临界值为 2.458 。我们可以得到检验结论为:拒绝原假设
H
0
,即可认为两组评酒员对红葡萄酒的评价结果有显著性差异。
相关文档
最新文档