葡萄酒及酿酒葡萄理化指标及质量关系分析A题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书
参赛队员 (打印并签名) :
题目葡萄酒与酿酒葡萄理化指标与质量关系分析
关键词 t检验、Q型聚类分析、主成分分析、葡萄酒质量、理化指标
题目
摘要
葡萄酒的品尝是一门学问。本文通过两组品评员对红葡萄酒(27个样本)与白葡萄酒(28个样本)的评分表入手,根据酿酒葡萄与葡萄酒的理化指标的内在联系,运用t 检验、Q型聚类分析、主成分分析等方法,深入讨论酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响。
对于问题一:通过每组样本的总得分算出红葡萄与白葡萄的样本总方差,每组对应数据运用t检验进行统计。结果为T1=1.7437<2.101,且P1=0.2130>0.05;T2=1.1641<2.101,且P2=0.3501>0.05。所以两组品酒员对红葡萄酒、白葡萄酒的评价结果均无显著性差异。且第一组的方差比第二组大,所以第二组的结果更可信。
对于问题二:通过建立Q型聚类分析模型,以酿酒葡萄的理化指标和葡萄酒的质量为标准来对酿酒葡萄进行分类,用类平均法来求相似性度量得到红葡萄、白葡萄分级图。
对于问题三:对红葡萄与白葡萄共有的理化指标进行相关性分析,根据他们之间的相关系数,根据各个指标建立典型相关系数表,同时画出相关系数大的指标的关系图。
对于问题四:根据对葡萄与葡萄酒的理化性质的分类,并将其对应于对葡萄酒的外观、香气、口感和整体评价的影响,由第三问知道他们之间存在线性关系,则利用多元回归模型将他们拟合出一个线性方程,进而找出他们的联系,从而得出可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。
关键词:t检验、Q型聚类分析、主成分分析、葡萄酒理化性质、多元线性回归
一.问题重述
本次研究对象为两组红葡萄酒与白葡萄酒,葡萄酒的主要质量指标为专业性评酒提供了依据,葡萄酒的主要质量指标大体可分为感官指标和理化指标两大类。尤其是感官品评,是目前国内外鉴定葡萄酒品质的主要手段。本论文从三大感官指标项目入手,分别是外观分析、香气分析、口感分析。其中每个项目中有几项指标。外观分析包含澄清度和色调;香气分析包含纯正度、浓度和质量;口感分析包含纯正度、浓度、持久性和质量。理化指标主要指酒精含量(酒精度)、酸度和芳香物质浓度【1】。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
在研究葡萄酒的质量时,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系【2】,我们需要研究葡萄酒和酿酒葡萄检测的理化指标与葡萄酒和葡萄的质量之间的关系。
综上所述,我们需要解决以下问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
二.符号说明和模型假设
2.1符号说明
n 样品数
2
S方差
df 自由度
x均值
j
s标准差
j
2.2 模型假设
1、假设所选取的样本值真实可信。本文引用数据、资料均真实可靠。
2、假设全部品酒员符合品评葡萄酒的要求且在品评当天表达正常且真实的分数。
3、假设整个建模过程中忽略计算误差。
4、两组品酒员在评分时不会受另一组的影响。
5、假设二级指标的信息可以再一级指标中反映出来。
三.模型的建立与求解
3.1.1 问题分析
该题主要利用题目中的附件一的数据来进行求解,观察图表可以知道对葡萄酒的评分算得满分为100分,其中包括有十个评分项目,那么我们将品酒员给的十个项目分数相加来表示品酒员对这个酒样品的评价标准,这样每一个样品都有十个数据,然后两组
之间对应样品号的数据就可以进行t 检验,从而确定两组对同一个样品评价有无显著性差异,从而可以通过建立这个分组对应样品进行t 检验的方法来解决第一小问。求得两组评价都无显著性差异之后,要确定评价结果的可信度我们可以通过比较方差来得出结果。
3.1.2 建模求解
首先对数据进行处理:
(1)求各品酒员对各样品的总分并排序形成矩阵; (2)求t ;
(3)查t(df)0.05和t(df)0.01,以便后面与t 进行比较; (4)结合P 与0.05比较,判断是否有显著性差异; 求解过程:
)
(成立如果1)()
1()()
()
1
1(2)()
(212
222
1
1
2
12
1212222
1
1
2
1n n n n x x x x n n n n x x x x t =--+--=
+-+-+--=
∑∑μμμμ
用matlab 编程运算得到红葡萄酒两组之间评价结果的t 检验如下:
t1=[1.2917 2.6620 2.0965 0.6728 0.4362 2.0749 1.5204 1.9071 1.3623 2.0928 2.5768 4.4486 2.3635 0.1645 1.9649 2.5582 1.5398 1.7616 1.8738 1.0973 1.2584 2.0463 3.5523 2.221 0.3038 0.6669 0.5658]
求t1的平均值得T1=1.7437<2.101,且P1=0.2130>0.05 所以两组品酒员对红葡萄酒的评价结果无显著性差异。
同理,对白葡萄酒的评价结果数据进行计算,t 检验结果如下:
t2=[1.1931 0.3199 1.3615 0.8485 2.6868 1.6488 1.1570 0.1942 1.6811 1.0337 0.1748 1.7991 1.7152 1.4139 1.3925 1.3134 0.3510 0.8330 1.5604 0.3547 0.5750 1.9157 0.6381 0.7238 0.6406 1.6695 2.8759 0.5226]
求t2的平均值得T2=1.1641<2.101,且P2=0.3501>0.05 所以两组品酒员对白葡萄酒的评价结果无显著性差异。 Matlab 运行结果如图一: