2012研究生数学建模A题

合集下载

2012数学建模A题论文:葡萄酒的评价

2012数学建模A题论文:葡萄酒的评价

承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2012年 9月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒的评价摘要葡萄拥有很高的营养价值,含有多种氨基酸、蛋白质和维生素,而以葡萄为原料的葡萄酒也蕴藏了多种营养物质,而且这些物质都是人体必须补充和吸收的营养品。

目前,已知的葡萄酒中含有的对人体有益的成分大约就有600种。

葡萄酒的营养价值由此也得到了广泛的认可,可以说葡萄酒是一个良好的滋补品。

本文通过对葡萄酒的评价,以及酿酒葡萄和葡萄酒的理化指标之间的关系进行讨论分析。

对不同的酿酒葡萄进行了分类,并更深入讨论两者的理化指标是否影响葡萄酒质量。

对于本题,我们主要采用SPSS软件对模型进行求解。

针对问题一,首先我们将附件1中数据在Excel中进行处理;其次,我们在SPSS中,采用T检验,分别分析出两组评酒品红、白葡萄酒的评价结果有无差异性。

2012年全国数学建模竞赛A题第一问数据综合整理

2012年全国数学建模竞赛A题第一问数据综合整理
9.6
0.27
0.516398
第二组
10
9
9
9
8
9
10
9
9
9
91
9.1
0.32
0.567646
酒样品3
第一组
9
10
10
9
8
10
9
10
10
9
94
9.4
0.49
0.699206
第二组
10
9
9
9
8
9
8
9
9
9
89
8.9
0.32
0.567646
酒样品4
第一组
7
9
9
8
7
8
9
8
10
9
84
8.4
0.93
0.966092
0.40
0.632456
酒样品16
第一组
9
10
10
9
8
8
10
9
9
9
91
9.1
0.54
0.737865
第二组
9
9
9
9
9
8
8
9
9
9
88
8.8
0.18
0.421637
酒样品17
第一组
8
10
10
8
11
9
7
10
10
9
92
9.2
1.51
1.229273
第二组
9
9
9
9
9
8
10
9
9
9

2012年数学建模A题资料

2012年数学建模A题资料

(一)葡萄酒观察方法1 酒液总体观察1.1 澄清度观察衡量葡萄酒澄清程度的指标有透明度、浑浊度等,与之相关的指标还有是否光亮、有无沉淀等。

优良的葡萄酒必须澄清、透明(色深的红葡萄酒例外)、光亮。

a.澄清:是衡量葡萄酒外观质量的重要指标。

澄清表示的是葡萄酒明净清澈、不含悬浮物。

通常情况下,澄清的葡萄酒也具有光泽。

b.透明度:表示的是葡萄酒允许可见光透过的程度。

红葡萄酒如果颜色很深,则澄清的葡萄酒也不一定透明。

c.浑浊度:表示的是葡萄酒的浑浊程度,浑浊的葡萄酒含有悬浮物。

葡萄酒的浑浊往往是由微生物病害、酶破败或金属破败引起的。

浑浊的葡萄酒其口感质量也差。

d.沉淀:指的是从葡萄酒中析出的固体物质。

沉淀是由于在陈酿过程中,葡萄酒构成成份的溶解度变小引起的,一般不会影响葡萄酒的质量。

1.2 颜色观察葡萄酒的颜色受酒龄影响,新红葡萄酒由于源于果皮花色素苷的作用,通常颜色鲜艳,为紫红色和宝石红色,带紫色色调;在葡萄酒的成熟过程中,丹宁逐渐与游离花色素苷等结合而使成年葡萄酒带有黄色色调。

瓦红或砖红色为成年红葡萄酒的常有的颜色,而棕红色则为在瓶内陈酿10年以上的红葡萄酒的颜色。

因此,可根据颜色,判断葡萄酒的成熟状况。

葡萄酒的颜色和口感的变化存在着平行性,颜色和口感之间必须相互协调平衡。

颜色的深浅反应葡萄酒的结构、丰满度以及尾味和余味。

如在红葡萄酒中,颜色的深浅与丹宁的含量往往正相关。

如果红葡萄酒颜色深而浓,几乎处于半透明状态,多数情况下它必然醇厚、丰满、丹宁感强。

相反,色浅的葡萄酒,则味淡、味短。

当然,如果较柔和,具醇香,仍不失为好酒。

例如瓦红色的红葡萄酒,必须与浓郁的醇香和柔顺的口感同时存在,否则表明该酒是人工催熟条件下陈酿而未能表现出最佳感官质量。

带紫色的新葡萄酒往往口味平淡、瘦弱、尖酸、粗糙;褐色过重的成年葡萄酒,氧化过重、老化。

1.3 浑浊度观察观察葡萄酒有无下列情况:略失光,失光,欠透明,微混浊,极浑浊,雾状混浊,乳状混浊;1.4 沉淀观察观察葡萄酒有无下列情况:有无沉淀,沉淀类型:纤维状沉淀,颗粒状沉淀,絮状沉淀,酒石结晶,片状沉淀,块状沉淀。

2012年数学建模A题优秀论文

2012年数学建模A题优秀论文
(4)利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因 素,将附件 3 中 4 个表格里的每张样品中所含各种芳香物质求和作为样品中的芳香指标 与葡萄酒的理化指标一并进行因子分析,比较前后两者结果中由样品中的芳香指标导致 的影响差异来确定不能只用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量还需要 结合感官指标,感官指标是评价葡萄酒质量的最终及最有效的指标。
11.
2 T
:为全酒样总得分的方差。
13.Xki:葡萄的理化指标变量
10.
2 i
:为第
i
种酒样品得分的方差
12: :为随机误差项。
14.Βk: 未知参数
15. :解释变量估计值
16. : 实际观测值
17. :变量
18. :残差
五、模型的建立与求解
5.1 问题一模型的建立和求解 5.1.1.评价结果的显著性差异分析
4
行结果:
对1
一红 - 二红
对2
一白 - 二白
t 2.390 -2.127
n
Sig.(双侧)
26
.024
26
.043
结论分析:本题中的自由度 n=27-1=26, t (26) 2.0555,即知拒绝域为 2
t 2.0555,由上表可知两组评酒师对红、白葡萄酒的评价结果的检验值
t1 2.390 2.0555, t2 2.127 2.0555,因为两个检验值均在拒绝域,所以两组评酒师
66.3
68.4
75.5
样品 7
71.5
65.3
77.5
74.2
样品 8
72.3
66
71.4
72.3
样品 9
81.5

2012 数学建模A题 3-2 相关系数

2012 数学建模A题 3-2 相关系数

27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27
多酚氧化酶活力 褐变度 DPPH自由基 总酚 单宁 葡萄总黄酮 白藜芦醇 黄酮醇 总糖 还原糖 可溶性固形物 PH值 可滴定酸 固酸比 干物质含量 果穗质量 百粒质量 果梗比 出汁率 果皮质量 L 果皮颜色红绿 果皮颜色黄蓝
27 27 27 27 27 27 27 27 27Байду номын сангаас27 27 27 27 27 27 27 27 27 27 27 27 27 27
褐变度 DPPH自由基 0.445 0.753 -0.153 0.105 0.198 0.749 0.071 -0.003 0.696 0.654 -0.063 0.275 0.644 0.052 0.389 -0.004 0.556 0.095 1.000 0.295 0.295 1.000 0.361 0.857 0.473 0.645 0.236 0.836 0.025 0.211 0.421 0.428 -0.066 -0.102 -0.069 -0.287 -0.019 -0.107 -0.241 0.404 -0.285 -0.343 0.364 0.171 0.085 -0.090 -0.268 0.016 -0.393 -0.136 0.498 0.501 0.215 0.456 -0.048 -0.042 -0.201 -0.253 -0.233 -0.253 -0.139 -0.220 0.010 0.000 0.223 0.301 0.161 0.000

2012年数学建模A题

2012年数学建模A题

葡萄酒质量评定模型摘要葡萄酒质量的评定长久以来都是采用聘请品酒员,通过品酒员对葡萄酒各项指标打分求和来确定葡萄酒的质量。

葡萄酒的价格因品酒员评分高低的不同有显著的差别。

然而在这样的评定方式中人的主观因素对酒质量的评定占主导地位,葡萄酒质量的评定结果存在较大的不确定性。

随着人们对葡萄酒消费的增加及高质量化的追求,建立合理、规范、客观的葡萄酒质量评定模型显得尤为重要。

根据题中给出的相关数据,通过解决以下问题建立葡萄酒质量评定模型。

对于问题一:首先,将题目附录1中的数据经Excel处理,得到每组评酒员对每种酒样品的总分。

然后,对每一种酒样品运用两配对样本的非参数检验(符号秩和检验)对数据进行显著性差异分析,运用MATLAB软件比较各酒样品的两组数据发现两组结果差异显著。

其次,通过Excel求出每一种酒的品酒员所打总分的方差,得到两组品酒员分别对两类葡萄酒的方差走势图(见图1.1、1.2),根据总体方差最小,方差波动较小,确定第二组品酒员的评分更可信。

最后,采用SPSS软件作进一步检验,结果相同即模型合理。

对于问题二,选取一级理化指标作为酿酒葡萄分级参考,对理化指标运用主成分分析法降维,通过MATLAB计算得到红葡萄的主成分有8个,白葡萄的主成分有11个。

综合评分得到的葡萄酒质量影响,红葡萄的影响因素有9个,白葡萄的影响因素有12个。

然后,利用折衷型模糊决策模型,考虑到由主成分分析方法得到的酿酒葡萄的的主成分值在反应酿酒葡萄质量好坏问题上会有一定的偏差,利用三角模糊的表达方式对主成分指标值进行表示,分别将红、白两类酿酒葡萄按隶属度大小排序,在运用聚类分析的方法,利用SPSS软件将葡萄划分为五个等级(见表格2.1)。

对于问题三,数据的庞杂是解决该问题的难点。

我们运用问题二中的主成分分析方法将理化指标转化为几个主成分,并运用MATLAB编程求出具体的主成分数值,然后建立线性回归模型,求解出酿酒葡萄与葡萄酒理化指标主成分之间的相关关系,从而反映出酿酒葡萄与葡萄酒理化指标之间的联系。

2012年高教杯数学建模竞赛a题

2012年高教杯数学建模竞赛a题

2012年高教杯数学建模竞赛A题文章包括以下内容:一、引言1. 对数学建模竞赛的介绍2. 2012年高教杯数学建模竞赛的背景3. A题的重要性和难度二、问题描述1. A题的具体内容和要求2. 问题背景和实际应用三、问题分析1. 对A题中涉及的数学知识和模型进行分析a. 需要运用的数学工具和方法b. 相关参数和变量的定义和意义c. 问题中存在的约束条件和假设2. 对A题中涉及的实际问题进行分析a. 现实场景的相关情况和特点b. 问题的实际意义和应用价值c. 对问题的可行性和局限性进行分析四、问题求解1. 根据问题分析确定相应的数学模型a. 求解问题所需建立的数学模型b. 模型的简化和推导过程2. 运用已知的数学方法和工具解决问题a. 使用数学软件进行模拟和计算b. 运用数学定理和理论进行证明和推演五、结果分析1. 求解结果的展示和分析2. 结果的合理性和可靠性分析3. 结果对实际问题的指导意义和应用价值六、总结与展望1. 对A题求解过程的总结和反思2. 对实际问题的展望和未来研究方向3. 对数学建模竞赛的意义和作用进行总结稿件要求:1. 语言流畅、准确,表达清晰、精炼,逻辑性强2. 论据充分,论证严谨,具有说服力3. 不得抄袭,不得侵犯他人著作权4. 投递稿件时请注明真实尊称和通信方式,以便我们及时与您取得联系注:以上为文章大纲及要求,具体内容请根据实际情况进行撰写。

2012年高教杯数学建模竞赛A题是一个具有挑战性和复杂性的问题,需要参赛者结合数学理论和实际问题进行分析和求解。

在本文中,我们将对A题进行深入的探讨,从问题描述到问题分析再到问题求解,最终得出结果分析和总结展望,全面展示对A题的理解和解决方案。

让我们来看A题的具体内容和要求。

A题涉及一个复杂的实际问题,需要参赛者运用数学工具和方法对其进行建模和求解。

这个问题背景和实际应用是一个现实场景中的情况,问题的实际意义和应用价值是非常明显的。

A题的重要性和难度也就显而易见了。

2012全国数学建模A题分析

2012全国数学建模A题分析

2012全国数学建模竞赛A题详细分析1.问题重述在设计太阳能小屋时,需在建筑物外表面(屋顶及外墙)铺设光伏电池,光伏阵列件所产生的直流电需要经过逆变器转换成220V交流电才能供家庭使用,并将剩余电量输入电网。

不同种类的光伏电池每峰瓦的价格差别很大,且每峰瓦的实际发电效率或发电量还受诸多因素的影响。

因此,在太阳能小屋的设计中,研究光伏电池在小屋外表面的优化铺设是很重要的问题。

对下列三个问题,分别给出小屋外表面光伏电池的铺设方案,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,并计算出小屋光伏电池35年寿命期内的发电总量、经济效益(当前民用电价按0.5元/kWh计算)及投资的回收年限。

在同一表面采用两种或两种以上类型的光伏阵列件时,同一型号的电池板可串联,而不同型号的电池板不可串联。

在不同表面上,即使是相同型号的电池也不能进行串、并联连接。

应注意分组连接方式及逆变器的选配。

问题1:请根据山西省大同市的气象数据,仅考虑贴附安装方式,选定光伏阵列件,对小屋(见附件2)的部分外表面进行铺设,并根据电池组件分组数量和容量,选配相应的逆变器的容量和数量。

问题2:电池板的朝向与倾角均会影响到光伏电池的工作效率,请选择架空方式安装光伏电池,重新考虑问题1。

问题3:根据附件7给出的小屋建筑要求,请为大同市重新设计一个小屋,要求画出小屋的外形图,并对所设计小屋的外表面优化铺设光伏电池,给出铺设及分组连接方式,选配逆变器,计算相应结果。

2.问题的分析2.1 问题一的分析问题一中要求根据山西省大同市的气象数据,选定光伏阵列件对小屋的部分外表面以贴附安装方式进行铺设,使小屋的全年太阳能光伏发电总量尽可能大,而单位发电量的费用尽可能小,最后给出铺设方案,包括电池组件分组数量和容量,以及相应的逆变器的容量和数量。

首先,附表中提供的大同地区的光照数据并未直接告知每个面获得的光照总量,需要根据光散射和直射的关系,建立光照模型,确定每个面的总的光照强度。

2012年数学建模A题——葡萄酒质量的评价

2012年数学建模A题——葡萄酒质量的评价

2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): A(隐去论文作者相关信息)日期: 2012 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。

通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。

2012研究生数学建模题目

2012研究生数学建模题目

A基因识别问题及其算法实现一、背景介绍DNA 是生物遗传信息的载体,其化学名称为脱氧核糖核酸(Deoxyribonucleic acid ,缩写为DNA )。

DNA 分子是一种长链聚合物,DNA 序列由腺嘌呤(Adenine, A ),鸟嘌呤(Guanine, G ),胞嘧啶(Cytosine, C ),胸腺嘧啶(Thymine, T )这四种核苷酸(nucleotide )符号按一定的顺序连接而成。

其中带有遗传讯息的DNA 片段称为基因(Gene )(见图1第一行)。

其他的DNA 序列片段,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。

在真核生物的DNA 序列中,基因通常被划分为许多间隔的片段(见图1第二行),其中编码蛋白质的部分,即编码序列(Coding Sequence )片段,称为外显子(Exon ),不编码的部分称为内含子(Intron )。

外显子在DNA 序列剪接(Splicing )后仍然会被保存下来,并可在图1真核生物DNA 序列(基因序列)结构示意图蛋白质合成过程中被转录(transcription )、复制(replication )而合成为蛋白质(见图2)。

DNA 序列通过遗传编码来储存信息,指导蛋白质的合成,把遗传信息准确无误地传递到蛋白质(protein )上去并实现各种生命功能。

图2蛋白质结构示意图对大量、复杂的基因序列的分析,传统生物学解决问题的方式是基于分子实验的方法,其代价高昂。

诺贝尔奖获得者W.吉尔伯特(Walter Gilbert ,1932—;【美】,第一个制备出混合脱氧核糖核酸的科学家)1991年曾经指出:―现在,基于全部基因序列都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。

一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设。

‖ 随着世界人类基o DNA 序列外显子(Exon ) 内含子(Intron)DNA 序列蛋白质序列因组工程计划的顺利完成,通过物理或数学的方法从大量的DNA 序列中获取丰富的生物信息,对生物学、医学、药学等诸多方面都具有重要的理论意义和实际价值,也是目前生物信息学领域的一个研究热点。

2012数学建模A题葡萄酒答案

2012数学建模A题葡萄酒答案

图一的两组红葡萄酒的平均值、和标准差第二组红葡萄酒标准差平均值标准差酒样品1 9.638465 酒样品1 68.1 9.048634 酒样品2 80.3 6.307843 酒样品2 74 4.027682 酒样品3 80.4 6.769211 酒样品3 74.6 5.541761 酒样品4 68.6 10.39444 酒样品4 71.2 6.425643 酒样品5 73.3 7.874713 酒样品5 72.1 3.695342 酒样品6 72.2 7.728734 酒样品6 66.3 4.595892 酒样品7 71.5 10.17895 酒样品7 65.3 7.91693 酒样品8 72.3 6.634087 酒样品8 66 8.069146 酒样品9 81.5 5.739725 酒样品9 78.2 5.072803 酒样品10 74.2 5.51362 酒样品10 68.8 6.014797 酒样品11 61.7 7.91693 酒样品11 61.6 6.168018 酒样品12 53.9 8.924996 酒样品12 68.3 5.012207 酒样品13 74.6 6.703233 酒样品13 68.8 3.910101 酒样品14 73 6 酒样品14 72.6 4.812022 酒样品15 58.7 9.250225 酒样品15 65.7 6.429965 酒样品16 74.9 4.254409 酒样品16 69.9 4.483302 酒样品17 79.3 9.381424 酒样品17 74.5 3.02765 酒样品18 59.9 6.871034 酒样品18 65.4 7.089899 酒样品19 69.4 6.25744 酒样品19 72.6 7.426679 酒样品20 78.6 5.103376 酒样品20 75.8 6.250333 酒样品21 77.1 10.77497 酒样品21 72.2 5.95912 酒样品22 77.2 7.11493 酒样品22 71.6 4.926121 酒样品23 85.6 5.699903 酒样品23 77.1 4.976612 酒样品24 78 8.653837 酒样品24 71.5 3.27448 酒样品25 69.2 8.038795 酒样品25 68.2 6.613118 酒样品26 73.8 5.593647 酒样品26 72 6.44636 酒样品27 73 7.055337 酒样品27 71.5 4.527693图二两组白葡萄酒的平均值、和标准差第一组白葡萄酒第二组白葡萄酒干白品种平均值标准差干白品种平均值标准差酒样品1 82 9.60324 酒样品1 77.9 5.087021 酒样品2 74.2 14.1798 酒样品2 75.8 7.00476 酒样品3 85.3 19.10817 酒样品3 75.6 11.93687 酒样品4 79.4 6.686637 酒样品4 76.9 6.488451 酒样品5 71 11.24475 酒样品5 26.1 5.126185 酒样品6 68.4 12.75583 酒样品6 75.5 4.766783 酒样品7 77.5 6.258328 酒样品7 74.2 1.212265 酒样品8 71.4 13.54991 酒样品8 72.3 5.578729 酒样品9 72.9 9.631545 酒样品9 80.4 10.30857 酒样品10 74.3 14.58348 酒样品10 79.8 8.390471酒样品11 72.3 13.30873 酒样品11 71.4 9.371351 酒样品12 63.3 10.76052 酒样品12 72.4 11.83404 酒样品13 65.9 13.06777 酒样品13 73.9 6.838616 酒样品14 72 10.68748 酒样品14 77.1 3.984693 酒样品15 72.4 11.4717 酒样品15 78.4 7.351493 酒样品16 74 13.34166 酒样品16 53.1 9.06826 酒样品17 78.8 12.00741 酒样品17 80.3 6.201254 酒样品18 73.1 12.51177 酒样品18 76.7 5.498485 酒样品19 72.2 6.811755 酒样品19 76.4 5.103376 酒样品20 77.8 8.024961 酒样品20 43.2 7.07421 酒样品21 76.4 13.14196 酒样品21 79.2 8.024961 酒样品22 71 11.77568 酒样品22 79.4 7.321202 酒样品23 75.9 6.607235 酒样品23 77.4 3.405877 酒样品24 73.3 10.54145 酒样品24 76.1 6.208417 酒样品25 77.1 5.820462 酒样品25 79.5 10.31988 酒样品26 81.3 8.53815 酒样品26 74.3 7.532168 酒样品27 64.8 12.01666 酒样品27 77 5.962848 酒样品28 81.3 8.969702 酒样品28 79.6 5.037636描述统计量N 均值标准差方差统计量统计量标准误统计量统计量VAR00003 27 68.5185 1.50722 7.83174 61.336 VAR00004 27 74.4444 2.24201 11.64980 135.718 VAR00005 27 72.7037 2.70265 14.04338 197.217 VAR00006 27 65.2963 1.44393 7.50290 56.293 VAR00007 27 74.1852 2.64469 13.74223 188.849 VAR00008 27 72.7037 2.13091 11.07254 122.601 VAR00009 27 71.2222 1.51002 7.84628 61.564 VAR00010 27 72.0741 1.95456 10.15619 103.148 VAR00011 27 78.4444 1.23035 6.39311 40.872 VAR00012 0Zscore(VAR00003) 0Zscore(VAR00004) 0Zscore(VAR00005) 0Zscore(VAR00006) 0Zscore(VAR00007) 0Zscore(VAR00008) 0Zscore(VAR00009) 0Zscore(VAR00010) 0Zscore(VAR00011) 0Zscore(VAR00012) 0描述统计量N 均值标准差方差统计量统计量标准误统计量统计量VAR00003 27 68.5185 1.50722 7.83174 61.336 VAR00004 27 74.4444 2.24201 11.64980 135.718 VAR00005 27 72.7037 2.70265 14.04338 197.217 VAR00006 27 65.2963 1.44393 7.50290 56.293 VAR00007 27 74.1852 2.64469 13.74223 188.849 VAR00008 27 72.7037 2.13091 11.07254 122.601 VAR00009 27 71.2222 1.51002 7.84628 61.564 VAR00010 27 72.0741 1.95456 10.15619 103.148 VAR00011 27 78.4444 1.23035 6.39311 40.872 VAR00012 0Zscore(VAR00003) 0Zscore(VAR00004) 0Zscore(VAR00005) 0Zscore(VAR00006) 0Zscore(VAR00007) 0Zscore(VAR00008) 0Zscore(VAR00009) 0Zscore(VAR00010) 0Zscore(VAR00011) 0Zscore(VAR00012) 0有效的 N (列表状态)0模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001个案处理摘要N变量处理摘要变量因变量自变量VAR00003 VAR00007 VAR00005 VAR00011 VAR00008 VAR00004 正值数27 27 27 27 27 27 零的个数0 0 0 0 0 0 负值数0 0 0 0 0 0 缺失值数用户自定义缺失0 0 0 0 0 0 系统缺失0 0 0 0 0 0模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001个案处理摘要N个案总数27已排除的个案a0模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001模型描述模型名称MOD_2因变量 1 VAR000032 VAR000073 VAR000054 VAR000115 VAR00008方程 1 二次自变量VAR00004常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001。

2012全国数学建模A题思路及部分方法

2012全国数学建模A题思路及部分方法

A 题葡萄酒的评价第一问:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?啊先对数据标号,标号方式参考如下:ijkl A j k l 萄酒第i 项指标的评分,用ijkl B 表示第j 组第k 位品酒师对第l 种白葡萄酒第i 项指标的评分,比如第1组第0位品酒师对第21种红葡萄酒第7项指标(口感浓度)的评分就是71021A ,第2组第5位品酒师对第8种白葡萄酒第2项指标(色调)的评分就是22508B 。

若是评价“哪一组结果更可信”的话,应该考虑一下系统误差和偶然误差,系统误差小的结果比系统误差大的结果可信,偶然误差小(数据比较集中)的结果比偶然误差大的结果可信。

比如说,第n 号红酒澄清度的实际分值(带有主观性,不过根据大数定理,无穷多个品酒师的评分的数学期望就是实际分值)为4分,那么同样是对第n 号红酒澄清度的打分,第一组打了7个4分,2个5分和1个3分,第二组打了6个4分,1个5分和3个3分,那么第一组的评分的数学期望就是4.1分,第二组的评分的数学期望就是3.8分,第二组的系统误差更大,第一组更可信;再比如说,第一组打了5个4分,3个5分和2个3分,第二组打了7个4分,2个5分和1个3分,那么两组的评分的数学期望都是4.1分,不过第一组的数据比较分散,偶然误差比较大,第二组更可信。

不同的品酒师的个人感受不可能完全一样,评分标准掌握尺度也有差异,因此难免有主观误差(系统误差的一类),不过如果品酒师是随机分配到两组的话,多数情况下可以认为不同的人的系统误差相互抵消(下文说不能相互抵消的话怎么办),因此重点考虑偶然误差。

可以通过统计学中的理论(需要用到t 分布)得出同样的置信水平(可以设05.0=α)下每一个统计量(同一组人对同一种酒同一项指标的评分)的置信区间,然后求出置信区间跨度(置信上限与置信下限的查,设为ijl a 和ijl b ,与A 和B 对应,比如7207a 就是第二组的品酒师对第七种红葡萄酒口感浓度的评分的置信区间跨度),跨度小的偶然误差小。

2012数学建模大赛a试题

2012数学建模大赛a试题

葡萄酒的评价模型摘要区分葡萄酒好坏的量化标准,主要采用百分制评分体系[1]。

该评分体系基于以下四个因素:外观,香气,风味,总体质量或潜力。

评酒员对葡萄酒进行品尝后按照酒的质量特点对其分类指标进行打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反应葡萄酒和酿酒葡萄的质量。

现对葡萄酒的评价问题进行分析研究,针对葡萄酒的各项指标数据进行统计和分析,建立起模糊综合评价模型,创建模糊关系矩阵:R=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⋯⋯⋯⋯⋯⋯⋯mn 2m 1m n 22221n 11211r r r r r r r r r 运用SPSS 软件等数学工具,来讨论出葡萄酒的评价结果。

问题一,采用求方差的方法,S 2 =()112--∑=n x x ni将各组酒样品横向求方差,纵向求和,将两组的变异系数和进行比较。

得出“第二组的变异系数和更小”的结论,即第二组结果更为可信。

继而使用t-检验,t = 1-n (X - μ)/S对于红葡萄酒,t 值小于0.05,则红葡萄酒存在显著性差异;而白葡萄酒t 值大于0.05,则白葡萄酒不存在显著性差异。

问题二,运用了SPSS 软件中因子分析功能,得到红葡萄理化指标分析(附录1)、白葡萄理化指标分析(附录2),对附件二中的海量数据进行批处理,优化出6项最重要因素简化数据,最后运用聚类分析法分别得出红葡萄与白葡萄的等级分类。

问题三,为了求得酿酒葡萄与葡萄酒的理化指标之间的联系,运用了统计学原理,结合图表,将酿酒葡萄与葡萄酒的几大决定因素提取出来,将其绘制成成分矩阵,进行详细的数据分析,并得出“酿酒葡萄酿制成葡萄酒之后主要成分中的蛋白质与VC 消失,其余理化指标在不同程度上有所改变”的结论。

问题四,通过统计对比,结合数据折线图,直观反映并论证了两种理化指标对葡萄酒质量的影响,即葡萄酒的质量与酿酒葡萄、葡萄酒的各项理化指标呈正相关的关系,也就是葡萄酒的质量随着葡萄酒和酿酒葡萄中的各理化指标的综合变化情况而变化,当产生“峰值”时,存在产生负相关的可能性。

2012年数学建模A题优秀论文

2012年数学建模A题优秀论文

基于数理分析的葡萄评价体系摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。

本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。

对于问题一,我们首先用配对样品t 检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS 软件对两组评酒员的评分的各个指标以及总评分进行了配对样本t 检验。

得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异,白葡萄、红葡萄以及整体的评价存在显著性差异。

接着我们建立了数据可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。

首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。

然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。

得到第 2 组的方差明显小于第1 组的,从而得出了第2 组评价数据的可信度更高的结论。

对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。

一方面,我们对酿酒葡萄的一级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27 种葡萄理化指标的综合得分及其排序。

另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27 种葡萄酒质量的综合得分并排序。

最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5 级。

对于问题三,首先我们将众多的葡萄理化指标用主成分分析法综合成 6 个主因子,并将葡萄等级也列为主因子之一。

对葡萄的 6 个主因子,以及葡萄酒的10 个指标用SPSS 软件进行偏相关分析,得到酒黄酮与葡萄的等级正相关性较强等结论。

2012年数学建模A题思路及方法

2012年数学建模A题思路及方法

基于BP神经网络的红葡萄酒品质鉴定方法1.引言红葡萄酒是很多人喜欢的一种酒品,其酒香甘醇,营养价值丰富。

但是红葡萄酒的品质鉴定往往需要专业的葡萄酒鉴定专家来进行,由于从业人员数量的限制和人工鉴定速度的限制,给红葡萄酒品质鉴定工作带来了一定的限制。

2.红葡萄酒鉴定红葡萄酒的人工鉴定,比较简单的方法是采用“三部曲”的方法。

第一步是观察“裙子”,指将酒倒入透明的无色玻璃酒杯以观察色泽。

看它是否清澈透明,鲜艳夺目。

好的白葡萄酒应当是金黄色的或者是浅黄色的;好的红葡萄酒应当是红宝石色,石榴红色或者琥珀色。

第二步是检验“鼻子”,主要指酒散发出的酒香。

首先要缓缓地将杯中的酒“摇醒”,使它散发香味。

如果是一、二年的新酒,因酒龄不长,能嗅出鲜果或花的清香,如玫瑰香、苹果香、樱桃香等的葡萄酒就是好酒。

如果是刺激、强烈或闭塞则酒质较差。

如果是陈酿,应当有浓香,如蜜香、榛子香、香草等。

第三步观察“嘴巴”,指试口感。

首先要对酒进行整体评价,是醇厚还是精美。

好酒的口感应当是醇厚的,浓郁的,结实的,平衡的,优美的,余味悠长的,而不是瘦弱的,平淡的,没有特点的和短暂的。

其次要鉴定是柔和还是生硬,好酒应当是圆润的,柔顺的,可口的而不是酸涩的、生硬的和辛辣的。

最后是感觉酒性:好酒应当是有力的,醉人的,丰满的,强烈的,而不是平缓的,冷淡的、无力的。

3.BP神经网络模型3.1 BP网络介绍人工神经网络(artificial neural networks,ANN)系统是20世纪40年代后出现的,它是由众多的神经元可调的连接权值连接而成,具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点,在信息处理、模式识别、智能控制及系统建模等领域得到越来越广泛的应用。

BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

2012年建模A题

2012年建模A题

摘要本篇论文,我们运用统计学的方法及原理,对2012年全国大学生数学建模竞赛 A组题的前两个小问题建模并得到好的结果。

对于第一问,我们在不知道每种类型葡萄酒的质量服从何种分布的情况下,将对两组评酒员对葡萄酒的打分存在显著性差异的检验问题分解为对各项指标的打分是否存在显著性差异的检验问题,进而构造成对比较,用1样本T检验。

我们算得两组评酒员对白葡萄酒的口感纯正度,口感浓度,口感持久性,口感质量,平衡整体五项指标的评价存在显著性差异。

对于红葡萄酒,我们算得两组评酒员对红酒的外观色调),香气浓度的打分存在显著性差异。

接着,为了检验两组评酒员对葡萄酒的打分是否存在显著性差异,我们定义了在指标集的示性函数,及各项指标对结论“两组品酒员对葡萄酒打分存在显著性差异”的贡献率,结合对各项指标存在显著性差异的检验,最终得出了两组评酒员对白酒的打分存在显著性差异,对红酒的打分不存在显著性差异。

关于两组评酒员对葡萄酒评价的可靠度的分析,我们转化为对各组内评酒员打分的稳定性的分析,从同组评酒员对同种酒的同项指标的评分的标准差入手,建立对稳定性分析的量化指标。

我们分别计算了两组评酒员对各酒样的各评价指标评分的标准差,分别记为 SSTD1 和 SSTD2,统计了SSD1>SSD2的项数,以及计算了SSD1,SSD2的数学期望,比较其大小,最终得出了第二组评酒员对酒打分更具可信度的结论。

对于第二问,我们将酿酒葡萄的理化指标进行了主成分分析,将指标简化,提取主要部分,消除信息的冗余,在此基础上,借助MATLAB,将葡萄样本进行聚类,最后,在合理的假设的基础上借助第二组评酒员对葡萄酒打分的排名对葡萄进行分级。

关键字假设检验,主成分分析,样本标准差,聚类分析1问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。

每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。

2012研究生数学建模A题

2012研究生数学建模A题
参赛密码
(由组委会填写)
第九届“华为杯”全国研究生数学建模竞赛
题 目基因识别问题及其算法的研究

在生物学、医学、药学等诸多方面,DNA的研究都具有重要的理论意义和实际价值。在面对大量、复杂的基因序列数据时,如何更好更快捷地获取准确的基因信息,如何能够在众多的基因序列中确定功率谱和信噪比,如何能够对每类基因快速地得到其阈值确定方法,如何快速实现基因识别算法,是摆在我们面前的一个具有研究意义的实际课题。
(2)傅里叶变换方法
假设给定的一段DNA序列片段为S=ATCGTACTG,则所生成的四个0-1序列分别为:
: ; : ;
: ; : 。
这样产生的四个数字序列又称为DNA序列的指示序列。为研究DNA编码序列(外显子)的特性,对指示序列分别做离散Fourier变换(DFT)
以此可得到四个长度均为N的复数序列 , 。
问题一:
(1)基于Voss映射,探求功率谱和信噪比的计算方法。
(2)基于Z-curve映射,求解频谱与信噪比并对Z-curve映射和Voss映射下的频谱和信噪比进行比较。
(3)基于实数映射,求解功率谱与信噪比的计算方法。
问题二:
对8个人类和92个鼠类的基因序列进行分析,找到每类基因研究其阈值的确定方法和阈值结果,并对所得到的结果进行评价。
: ; : ;
: ; : 。
这样产生的四个数字序列又称为DNA序列的指示序列,并通过利用MATLAB软件对Voss映射进行编程分析(见附件1),得到功率谱和信噪比的快速计算方法。
(2)根据附件1中的Z-curve映射来探求频谱与信噪比的快速计算方法。通过运行程序得到Z-curve映射下频谱和信噪比的值,然后采用100个组进行对比分析,发现在Voss映射和Z-curve映射下得到的信噪比之间呈现一定的倍数比例关系。

数学建模2012a题

数学建模2012a题

数学建模2012a题
2012年全国大学生数学建模竞赛A题《酒后驾车》
1. 问题重述
对于酒后驾车的问题,首先需要了解酒后驾车的定义。

根据相关法律法规,当驾驶员血液中的酒精含量大于或等于20mg/100ml,且小于
80mg/100ml时,被认为是酒后驾车。

现在,我们有一个具体的情境:一个驾驶员被检测到酒后驾车,并且他的血液中的酒精含量为35mg/100ml。

我们需要基于这个具体的情境,建立一个数学模型,并使用这个模型来预测在不同时间点上,他的酒精含量可能会是多少。

2. 模型假设
假设驾驶员的酒精代谢速率是恒定的,即单位时间内酒精含量的减少是线性的。

3. 变量定义
设初始酒精含量为 C_0 = 35 mg/100ml,代谢速率为 K。

4. 建立模型
基于假设和变量定义,我们可以建立如下的数学模型:
C(t) = C_0 - Kt
其中,C(t) 表示 t 时刻的酒精含量,t 表示时间(单位:小时),K 表示代谢速率(单位:mg/100ml/小时)。

5. 参数确定
为了确定代谢速率 K,我们需要查阅相关资料或进行实验研究。

假设经过研究或实验测定,发现某个驾驶员的代谢速率为 mg/100ml/小时。

将这个值代入模型中,可以得到该驾驶员在不同时间点的酒精含量预测值。

6. 求解和预测
根据已知条件和建立的模型,我们可以求解不同时间点上的酒精含量。

例如,如果我们要预测该驾驶员在2小时后的酒精含量,可以将 t=2 代入模型中
求解:
C(2) = 35 - × 2 = 32 mg/100ml。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

摘要..................................................................................................................... - 1 -一、问题的重述....................................................................................................... - 2 -二、问题分析与建模思路....................................................................................... - 2 -三、基本假设与符号说明....................................................................................... - 3 -3.1 基本假设 ........................................................................................................ - 3 -3.2 符号说明 ........................................................................................................ - 4 -四、模型的建立与求解........................................................................................... - 4 -4.1功率谱和信噪比的计算方法 ............................................................................. - 4 -4.1.1 基于Voss映射求解功率谱和信噪比方法................................................ - 4 -4.1.2 基于Z-curve映射求解功率谱与信噪比方法 ........................................... - 7 -4.1.3 基于实数映射求解功率谱与信噪比方法 ............................................... - 10 -4.2 对不同物种类型基因的阈值确定 ................................................................... - 11 -4.2.1 人类基因序列阈值的确定 .................................................................... - 11 -4.2.2鼠类基因序列阈值的确定................................................................... - 13 -4.3 基因识别算法的实现..................................................................................... - 16 -4.4 延展性研究................................................................................................... - 20 -五、模型评价与改进............................................................................................. - 21 -六、参考文献......................................................................................................... - 22 -七、附录................................................................................................................. - 23 -参赛密码(由组委会填写)第九届“华为杯”全国研究生数学建模竞赛题目基因识别问题及其算法的研究摘要在生物学、医学、药学等诸多方面,DNA的研究都具有重要的理论意义和实际价值。

在面对大量、复杂的基因序列数据时,如何更好更快捷地获取准确的基因信息,如何能够在众多的基因序列中确定功率谱和信噪比,如何能够对每类基因快速地得到其阈值确定方法,如何快速实现基因识别算法,是摆在我们面前的一个具有研究意义的实际课题。

我们运用计算机MATLAB软件,分析结果如下:对于问题一,我们根据文献中给出的Voss映射,用快速傅里叶变换方法来实现功率谱和信噪比的求解。

本文利用附件中的genes6中的数据,运行第1条DNA片段的基因数据,通过编程分析,得到功率谱和信噪比r =3.4474。

在Z-curve 映射下我们得到功率谱和信噪比r = 4.5965,并发现二者呈现一定的常数比例关系。

在实数映射下,我们得到功率谱和信噪比为r =3.1186。

对于问题二,假定运行的数据拥有足够的长度。

首先根据快速傅里叶变换方法,运行相关程序得到在不同基因片段时能够得到的信噪比,然后将得到的信噪比进行数据分析与整合;其次,把外显子和内含子的功率谱都运行出来;最后将外显子和内含子内部结构已知的8个人类和92个鼠类的信噪比进行分类,找出2者的信噪比并确定以何种信噪比作为标准。

我们预测到人类的基因序列组合信噪比为R=1.5861,鼠类的基因序列组合信噪比为R=1.7503。

对于问题三,我们假定3-周期性具有一定的普遍性。

采用相邻峰值频谱差异法确定外显子的起点和终点。

首先,画出genes6中的DNA序列功率谱图像;其次,截取总片断中呈3的倍数的小片段,逐步测验,得到不同的频谱图;第三,在基因片段N/3和2N/3处取峰值;最后,根据3-周期性,得到基因片段的两处端点。

对于问题四,我们运用的是频谱和信噪比方法探讨基因突变。

首先利用genes200数据,得到信噪比;其次做描述性统计分析,得到基因序列信噪比折线图和描述统计表;最后预测到当R值突然高于周围值时,基因失去DNA片段的对称性,这样的片段就会存在基因突变。

创新点:1. 利用快速傅里叶变换代替傅里叶变换,并用程序运行,大大提高了基因功率谱和信噪比的运算速度,对于今后研究具有现实性意义和参考价值。

2. 运用信噪比的取值探讨基因识别方法。

关键词:Voss映射Z-curve 映射MATLAB软件SPSS软件快速傅里叶变换一、问题的重述DNA是生物遗传信息的载体,DNA分子是一种长链聚合物,DNA序列由腺嘌呤(Adenine, A),鸟嘌呤(Guanine, G),胞嘧啶(Cytosine, C),胸腺嘧啶(Thymine,T)这四种核苷酸(nucl eotide)符号按一定的顺序连接而成。

其中带有遗传讯息的DNA片段称为基因(Genes)。

其他的DNA序列片段,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。

如何利用DNA这些重要的信息帮助人们在农业、工业等行业领域内实现新的突破是我们面临的一个新的实际课题。

我们就当前国内外的研究现状与成果的相关情况,建立数学模型分析研究下面的问题:问题一:(1)基于Voss映射,探求功率谱和信噪比的计算方法。

(2)基于Z-curve映射,求解频谱与信噪比并对Z-curve映射和Voss映射下的频谱和信噪比进行比较。

(3)基于实数映射,求解功率谱与信噪比的计算方法。

问题二:对8个人类和92个鼠类的基因序列进行分析,找到每类基因研究其阈值的确定方法和阈值结果,并对所得到的结果进行评价。

问题三:对设计好的基因识别算法的准确率做出适当评估,并对genes6的编码区域的预测。

问题四:利用频谱或信噪比方法去发现基因编码序列可能存在的突变。

二、问题分析与建模思路问题一:(1)根据Voss映射,采用傅里叶方法探求功率谱和信噪比的快速计算办法。

本文利用附件中的genes6中的数据,运行给定的任意一段基因数据,在给定的一段DNA序列片段为S = ATCGTACTG,则所生成的四个0-1序列分别为:{[]}A u n :{1,0,0,0,0,1,0,0,0}; {[]}G u n :{0,0,0,1,0,0,0,0,1};{[]}C u n :{0,0,1,0,0,0,1,0,0}; {[]}T u n :{0,1,0,0,1,0,0,1,0}。

这样产生的四个数字序列又称为DNA 序列的指示序列,并通过利用MATLAB 软件对Voss 映射进行编程分析(见附件1),得到功率谱和信噪比的快速计算方法。

(2)根据附件1中的Z-curve 映射来探求频谱与信噪比的快速计算方法。

通过运行程序得到Z-curve 映射下频谱和信噪比的值,然后采用100个组进行对比分析,发现在Voss 映射和Z-curve 映射下得到的信噪比之间呈现一定的倍数比例关系。

(3)根据已编好的程序在实数映射下,如:0,1,2,3A C G T →→→→,采取快速傅里叶方法得到功率谱与信噪比的快速计算方法。

问题二:假定运行的数据拥有足够的长度。

从带有编码外显因子信息的8个人和92个鼠类中找出具有代表性的基因序列,并对每类基因研究其阈值确定方法,适当地评论其有效性。

首先根据快速傅里叶变换方法,运行相关程序得到在不同基因片段时能够得到的信噪比,然后将得到的信噪比进行数据分析与整合;其次,把外显子和内含子的功率谱都运行出来;最后将外显子和内含子内部结构已知的8个人类和92个鼠类的信噪比进行分类,找出2者的信噪比并确定以何种信噪比作为标准。

我们预测到人类的基因序列组合信噪比为R=1.5861,鼠类的基因序列组合信噪比为R=1.7503。

问题三:我们假定3-周期性具有一定的普遍性。

采用相邻峰值频谱差异法确定外显子的起点和终点。

首先,画出genes6中的DNA 序列功率谱图像;其次,截取总片断中呈3的倍数的小片段,逐步测验,得到不同的频谱图;第三,在基因片段N/3和2N/3处取峰值;最后,根据3-周期性,得到基因片段的两处端点。

相关文档
最新文档