2012高教社杯全国大学生数学建模竞赛A题论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):
参赛队员(打印并签名) :1.
2.
3.
指导教师或指导教师组负责人(打印并签名):
日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价
摘要
本文讨论的是葡萄酒的评价,首先把两组品酒员对27种葡萄酒的感官评分的算术平均值作为27种葡萄酒的两组质量得分,然后把每一种葡萄酒的两组得分作为一对数据它们差的值作为一个随机变量的27个取值,因为这27组值可以看成是仅由品酒员的差异引起的,然后利用基于成对数据的检验(t检验)进行显著性检验,得出的结论是两组品酒员的评价结果有显著性差异,然后通过认为品酒员对同一种葡萄酒的评分的方差越小越可信,确定第二组结果更可信。
第二问是通过葡萄酒的质量得分确定葡萄的等级,然后再利用酿酒葡萄的理化指标进行聚类分析得出分类,最后将酿酒葡萄的分类与葡萄酒的评分综合考虑最终得出酿酒葡萄的等级。
第三问先通过主成分分析把多个理化指标转化为几个综合的指标,然后与对应葡萄酒的理化指标做典型性相关分析,得出两者之间的关系。
第四问则是把酿酒葡萄的综合理化指标和葡萄酒的理化指标与葡萄酒的得分做多元线性回归,得出回归方程,最终的出结论可以通过酿酒葡萄与葡萄酒的理化指标来评价葡萄酒的质量。
关键词:基于成对数据的检验主成分分析聚类分析典型性相关分析多元线性回归分析
一、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。现要求建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 二、问题分析
本问题是关于葡萄酒质量分析,首先通过对附录一的观察,先要对其中的数据进行处理,我们采用假设检验中,基于成对数据的检验(t 检验),利用t 检验的方法分别求出第一组和第二组评酒员对红、白葡萄酒总评分,进而求得均值、方差。利用t 检验所求的t 值是否落在拒绝域内,评定结果是否具有显著性差异。然后利用两组标准差的均值,通过对两组数据的对比,判断出哪一组结果更可靠,从而解决了问题一。 三、模型假设
1 在进行聚类分析和主成分分析时忽略二级指标对于理化性质的影响;
2 在对样本进行t 检验室时,要将样本均值作为一对随机变量。 四、符号说明
i x :第一组评酒员对一种红葡萄酒评定总分的均值 i y :第二组评酒员对一种红葡萄酒评定总分的均值 j x :第一组评酒员对一种白葡萄酒评定总分的均值 j
y :第二组评酒员对一种白葡萄酒评定总分的均值
n :葡萄酒种数
d :样本均值的观察值
i
s :样本的标准差
:F 主成分
五、模型的建立与求解
5.1问题一
5.1.1 对附件一的数据进行整合
为了比较两组数据的差异,我们需要在相同的条件下做对比试验,得到一批成对的观察值,然后分析观察数据作出判断。本题附件一中的数据是成对的,即是两组人对此酒样品评出的两组数据。首先,我们对两组数据进行了整理,将每个评酒员的各项评分进行求和,再将每组十个评酒员对同一酒样的总评分求平均值。
5.1.2问题一的模型建立与求解
一般,设有n 对相互独立的观察结果:()1,1Y X ,()2,2Y X ,…,()n Y X ,n ,令111Y -X =D ,
222Y -X =D ,…n n n D Y -X =,则1D ,2D ,…,n D 相互独立。又由于1D ,2D ,…,n
D 是有同一因素所引起的,可认为他们服从统一分布。今假设()
D
D i N D 2
~σμ,,.21n i ,,,Λ=这就是说1D ,2D ,…,n D 构成正态总体()
D D N 2,σμ的一个样本,其中
D D 2,σμ未知。我们需要基于这一样本检验假设:
;
0:,0:10≠=D D H H μμ
分别记1D ,2D ,…,n D 的样本均值和样本方差的观察值为-
d ,D
s
2,关于单个正态总
体均值的t 检验。知检验问题的拒绝域分别为(显著性水平为05.0=α):
(),
12/-≥=
-
n t n
S d t a D
根据此模型,讨论本题的检验问题,由公式分别求出两组的
i
d ,
'
i d ,i s ,'
i s 公式如下:
,
11
∑=-
=n
i i D n d
.112
1∑=-⎪⎭⎫
⎝⎛--=n i i d D n s
把以上两式代入t 检验方程,根据excel 中的计算数据(见附录),可分别求出第一组和
第二组的拒绝域为≥t )26(025.0t 和≥t )27(025.0t .