基于理化指标分析的葡萄与葡萄酒的评价
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于理化指标分析的葡萄与葡萄酒的评价
摘要
针对酿酒葡萄与葡萄酒理化指标的统计,通过聚类法,典型相关分析及逐步回归分析法等,建立数据统计模型:
对于问题一,首先对两组数据进行整理分析,然后利用spss软件进行配对数据t-检验(详见第三页表二),从而判断出两组评酒员的评价结果具有显著性差异。而后利用excel进行方差分析-无重复双因子分析得出二组结果更为可信。详细见第 3 页。
对于问题二,使用matlab软件对原始变量进行主成分分析得出中和变量,然后使用spss软件应用离差平方和法对中和变量进行聚类分析,从而根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,为了检验欧式测距是否可以正确区分出葡萄的等级,所以对主成份分析后的理化指标求均值,经过验证,均值相差大,足以区分葡萄等级,最终将红葡萄分为3级,白葡萄分为4级。详细见第 5 页。
对于问题三,首先通过matlab软件对葡萄酒的理化指标进行主成分分析,得出中和指标。然后使用spss软件进行典型相关分析,得到葡萄酒的理化指标与酿酒葡萄的理化指标的关联度。再通过对关系度表格的分析,得到酿酒葡萄与葡萄酒的理化指标之间的联系。详细见第 14 页。
对于问题四,考虑到葡萄酒质量与酿酒葡萄和葡萄酒理化指标可能成线性关系,故应用逐步回归分析,将葡萄酒质量设为因变量,酿酒葡萄和葡萄酒理化指标设为自变量,列出线性回归方程,通过spss软件进行数据拟合和显著性分析,排除影响不显著的变量,将因变量与评酒员打分结果对比,得出拟合结果基本符合。再通过分析得到分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。最后根据F检验判断所得数据的正确性。由于葡萄酒可能会收到年份和贮藏环境等其他因素的影响,因此不能单纯地通过葡萄和葡萄酒的理化指标来评价葡萄酒的质量。详细见第 16 页。
关键字:典型相关分析 t检验主成分分析
一、问题重述
葡萄酒是一种成分复杂的酒精饮料,不同产地、年份和品种的葡萄酒成分不同。成分与葡酒的质量关系密切,是划分葡萄酒等级的重要依据。而通过测量葡萄酒的物理化学性质进而评估其质量,应该是最有效的方法。理化实验室常规检验包括葡萄酒的密度,酒精或pH 值,而质量评价主要依靠专家的感官。应该强调指出味道是最难理解的一种感官,因此葡萄酒质量分类是一项艰巨的任务。根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。分析酿酒葡萄与葡萄酒的理化指标之间的联系。分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?等等属于此范畴。
二、问题分析
本题是研究酿酒葡萄的理化指标,葡萄酒的理化指标,酿酒葡萄的质量,葡萄酒的质量之间的关系。根据已有的数据分析出他们之间存在的关系来判断能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
问题一使用matlab 进行显著性差异分析,并判断出哪组评酒员的评价更可信。
问题二利用SPSS 统计分析软件分别对红、白葡萄的理化指标进行因子分析,确定哪些因素对酿酒葡萄的分级起主要作用,并根据对主要因素的分析划分酿酒葡萄的等级。
问题三根据典型相关分析,得到酿酒葡萄与葡萄酒理化指标的关联度,通过对关系度表格的分析,可以得到酿酒葡萄与葡萄酒的理化指标之间的联系。 问题四由典型相关分析分别得到酿酒葡萄理化指标与葡萄酒质量的关联度和葡萄酒的理化指标对葡萄酒的质量的关联度,再通过分析得到分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。
三、模型假设
1. 评酒员为人正派,品德高尚,有充足的精力和体力。
2.评酒员有好的感官和较低的感官阀值,对样品有较高的鉴赏能力。 3.评酒时所处的环境是相同,且未收到外界干扰。 4. 采集数据时数据误差在可控范围内。 5. 不考虑不同葡萄酒的酿造时间。
四、定义与符号说明
1X ,2X 分别为两样本平均数。
1
2X σ,22X σ分别为两样本方差。
γ为相关样本的相关系数。
ij e 表示向量i e 的第j 个分量。
11R ,22R 分别为第一组变量和第二组变量的相关系数阵。 12R = 21
R '为第一组变量和第二组变量的相关系数。 五、模型的建立与求解
(一) 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更
可信?
附件一的数据分析可知,我们采用配对数据t 检验和方差分析法。
双总体t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。
相关样本的t 检验公式为:
t =
。
第一步:建立假设、确定检验水准α。
H0:假设两组评酒员评价结果无显著性差异。 H1:假设两组评酒员评价结果有显著性差异。 双侧检验,检验水准:α=0.05
第二步:在spss 的Variable View 中建立数据库,并输入数据,对数据样品进行配对T 检验。
红酒一组 7.309 270 3.7919
0.2308 白酒一组 7.426 280 3.8108 0.2277
红酒一组
第三步判断
由表一可以看出:红酒一组、红酒二组、白酒一组、白酒二组的均值分别为:7.309、7.051、7.426、7.653,标准差分别为:3.7919、3.7919、3.7919、3.9565,标准误为:0.2308、0.2198、0.2277、0.2364。
由表二可知:红酒共抽取270个指标,白酒共抽取280指标。相关性和sig 分别为:0.978、0.974、9.724E-184、7.031E-182。由于选取的α=0.05,即选取置信度为95%,若P<0.05拒绝H0,接受H1,若P>=0.05,则还不能拒绝H0。
由表3看出P〈0.05两组评酒员评价结果有显著性差异。
我们采用方差分析法来确定可信度。
第一步:对每组数据进行无重复双因子分析。
方差分
析
差异源SS df MS F P-value F crit
行7304.268 27 270.5284 4.523772 6.01E-11 1.531778 列18023.93 9 2002.659 33.48844 6.41E-38 1.918539 误差14531.77 243 59.80151
总计39859.97 279
标准差比较图: