数据统计分析模型
数据科学中的统计模型与分析方法总结

数据科学中的统计模型与分析方法总结在数据科学领域,统计模型和分析方法是重要的工具,用于处理和分析数据以获取有意义的洞察。
统计模型是用来描述和解释数据背后的概率关系的数学模型,而统计分析方法则是用来对模型进行推断和预测的技术。
在数据科学中,我们经常使用的统计模型和分析方法有很多,下面我将对其中几个常用的进行总结。
首先,线性回归模型是最基础也是最常用的统计模型之一。
线性回归模型用来描述两个变量之间的线性关系。
它假设因变量和自变量之间存在一个线性的关系,并使用最小二乘法来估计回归系数。
线性回归模型可用于预测和解释变量之间的关系,例如预测房价与房屋面积之间的关系。
其次,逻辑回归模型是一种广义线性模型,用于建立二分类问题的预测模型。
逻辑回归模型假设自变量与因变量之间的关系是一个S形曲线,即是一个概率关系。
逻辑回归模型通常用来解决分类问题,例如判断患者是否患有某种疾病。
此外,决策树是一种非参数的分类与回归方法,它能够从数据中学习出一系列的规则来进行预测。
决策树的优势在于它可以处理离散和连续的特征变量,并且易于解释。
决策树模型可用于推断规则、风险评估、客户细分等应用场景。
除了上述的模型,聚类分析是另一种常用的统计分析方法。
聚类分析是一种无监督学习方法,用来将一组数据分成若干个类别,使得同一类别内的数据相似度较高,不同类别之间的数据相似度较低。
聚类分析可以帮助我们发现数据中的隐藏模式和结构,从而进行进一步的分析和预测。
此外,主成分分析(PCA)是一种常用的降维技术,它将原始高维数据映射到低维空间,从而减少数据的维度。
主成分分析基于一组无关的变量,并通过计算主成分来捕捉原始变量之间的变差信息。
主成分分析可以用于数据压缩、可视化以及特征选择等领域。
此外还有,时间序列分析是对一系列定期观测的数据进行建模和分析的技术,这些观测数据按照时间顺序排列。
时间序列分析可以帮助我们了解数据随着时间的变化趋势、季节性和周期性等。
常用的时间序列模型包括自回归移动平均模型(ARIMA)和季节性自回归移动平均模型(SARIMA)等。
金融数据分析的统计模型使用教程

金融数据分析的统计模型使用教程金融数据分析是对金融市场中各种数据进行统计、分析和建模的过程。
统计模型是其中一种常用的分析工具,通过建立数学模型,可以帮助金融从业者了解金融市场的特点和规律,并做出相应的决策。
在本教程中,我们将介绍金融数据分析中常见的统计模型,以及它们的使用方法。
一、线性回归模型线性回归模型是最简单也是最常用的统计模型之一。
它用于研究两个或多个变量之间的线性关系。
在金融数据分析中,线性回归模型可以用来预测股票价格、汇率波动等。
使用线性回归模型,需要收集相关的数据,包括自变量和因变量,然后通过最小二乘法来估计模型的参数。
例如,我们可以通过线性回归模型来分析股票价格与相关指数之间的关系。
首先,我们需要确定自变量(如收盘价、成交量等)和因变量(股票价格)之间的关系。
然后,通过收集历史数据,进行模型拟合,得到相关指数对股票价格的影响程度。
二、时间序列模型时间序列模型是一种用于分析时间序列数据的统计模型。
在金融数据分析中,时间序列模型被广泛应用于预测股票价格、汇率走势等。
常见的时间序列模型包括AR(自回归)模型、MA(移动平均)模型和ARMA(自回归移动平均)模型。
AR模型是用来描述时间序列数据与其自身过去观测值之间的关系。
MA模型则是用来描述时间序列数据与其过去观测误差之间的关系。
ARMA模型是将AR模型和MA模型相结合,用来描述时间序列数据与其自身过去观测值和过去观测误差之间的关系。
三、方差分析模型方差分析模型是用于比较两个或多个样本均值之间差异的统计模型。
在金融数据分析中,方差分析模型常用于比较不同投资组合之间的风险和收益差异。
例如,我们可以使用方差分析模型来比较不同股票组合的平均收益率是否存在显著差异。
首先,我们需要确定不同股票组合的收益率数据,并进行方差分析假设检验。
通过比较各组间的平均收益率和组内的方差,可以判断不同股票组合的收益率是否存在统计学上的显著差异。
四、Logistic回归模型Logistic回归模型是一种用于描述二分类或多分类问题的统计模型。
数据分析中的数据模型和方法

数据分析中的数据模型和方法在数据分析领域,数据模型和方法是非常重要的概念和工具。
数据模型是一种描述现实世界问题的方式,而数据分析方法则是应用这些数据模型来解决问题的技术。
本文将介绍数据分析中常用的数据模型和方法,并探讨它们在实际应用中的作用和优缺点。
一、数据模型数据模型是对现实世界中事物关系的抽象描述,它可以帮助我们理解和组织复杂的数据。
在数据分析中,常用的数据模型包括关系型模型、层次模型、网络模型和对象模型等。
1. 关系型模型关系型模型是最常用的数据模型之一,它使用表格的形式来表示数据。
表格中的每一行代表一个数据记录,而列则代表数据的属性。
通过在不同表格中建立关系,可以实现数据之间的连接和查询。
关系型模型的优点是结构清晰、易于理解和使用,但对于大规模数据的处理效率相对较低。
2. 层次模型层次模型是一种树形结构的数据模型,它通过将数据组织成层次关系来表示。
层次模型中的每个数据记录都有一个明确的父节点和零个或多个子节点。
层次模型适用于描述具有明确层次结构的数据,例如组织结构、分类体系等。
3. 网络模型网络模型是一种图形结构的数据模型,它通过节点和链接来表示数据之间的关系。
网络模型中的数据可以有多个父节点和多个子节点,这使得它更灵活地描述了数据之间的复杂关系。
网络模型适用于描述具有多对多关系的数据,例如学生和课程之间的选课关系。
4. 对象模型对象模型是一种以对象为中心的数据模型,它通过对数据进行封装、继承和多态等操作来描述数据之间的关系。
对象模型适用于面向对象编程语言和系统,它可以更加直观地表示现实世界中的问题。
二、数据分析方法数据模型只是解决问题的基础,而数据分析方法则是具体应用数据模型来解决问题的步骤和技术。
常用的数据分析方法包括统计分析、数据挖掘、机器学习和人工智能等。
1. 统计分析统计分析是数据分析中最常用的方法之一,它通过收集、整理和分析数据来揭示数据中存在的规律和趋势。
统计分析可以帮助我们理解数据的分布、相关性和差异等。
统计学中的数据模型分析

统计学中的数据模型分析引言统计学中的数据模型分析是指通过建立数学模型,对数据进行统计分析和预测。
数据模型分析是数据分析的重要组成部分,旨在通过数据模型的建立和分析,得出对实际问题的解释和预测。
本文将介绍数据模型分析的概念、数据模型的建立方法、数据模型的评价以及数据模型在实际问题中的应用。
数据模型分析的概念数据模型分析是指通过建立数理模型,对数据进行统计分析和预测。
数据模型是用来描述数据之间关系的数学函数或方程。
数据模型的建立通常包括确定模型类型、收集和处理数据、估计模型参数、验证模型等步骤。
数据模型分析在工程、经济、生物、医学、环境等领域中都有广泛的应用。
数据模型的建立方法1.确定模型类型数据模型的建立首先要确定模型类型。
常用的数据模型类型包括线性回归模型、非线性回归模型、时间序列模型、分类模型、聚类模型等。
确定模型的类型是根据实际问题和数据的特点来进行选择的。
2.收集和处理数据建立数据模型的第二步是收集和处理数据。
数据预处理包括数据清洗、数据采样、特征提取、数据变换等。
数据预处理的目的是清理噪声、去除异常值、减少数据量并提高数据的质量。
3.估计模型参数估计模型参数是指通过数据的样本计算出模型的参数。
估计模型参数的常用方法包括最小二乘估计、极大似然估计、贝叶斯估计等。
选择估计方法要根据实际问题的特点来选择。
4.验证模型验证模型是指通过一定的验证方法验证模型的准确性和可靠性。
常用的验证方法包括交叉验证、留一法等。
验证模型的目的是保证模型的可靠性和准确性。
数据模型的评价1.模型拟合度模型拟合度是指模型对数据的拟合程度。
常用的拟合度指标有拟合平方和、调整拟合平方和、标准误差、残差散点图等。
模型拟合度越高,说明模型的拟合效果越好。
2.模型在预测中的应用除了模型拟合度外,模型在实际问题中的预测能力也是模型评价的重要指标。
常用的预测指标有平均绝对误差、均方误差、平均相对误差、对称平均绝对误差等。
通过评估模型的预测能力,可以对模型的准确性和可靠性进行评价。
考研统计学掌握统计分析的五个常用模型

考研统计学掌握统计分析的五个常用模型统计学是一门应用广泛的学科,其研究对象是数据和变异性。
在考研统计学中,学生需要掌握各种统计分析方法,以便能够准确分析和解释数据,为决策提供依据。
本文将介绍考研统计学中五个常用的统计分析模型。
一、回归分析模型回归分析是研究数据间关系的一种常用方法。
它通过建立变量之间的数学函数关系,来分析自变量对因变量的影响程度。
回归分析可以帮助我们预测和控制变量,进而做出合理的决策。
在考研统计学中,回归分析被广泛应用于解决实际问题,如经济学、企业管理、市场营销等。
二、方差分析模型方差分析是比较两个或多个组之间差异的一种统计方法。
它通过比较组内的差异和组间的差异,来判断因素之间是否存在显著差异。
方差分析在考研统计学中经常用于实验设计和质量控制等领域中,可以帮助我们评估因素对结果的影响程度,从而做出相应的调整和改进。
三、因子分析模型因子分析是一种通过降维技术来简化数据的方法。
它可以将大量变量归纳为少数几个隐含因子,从而减少数据的复杂性。
因子分析在考研统计学中被广泛应用于心理学、社会学、教育学等领域,可以帮助我们识别出潜在的变量,并得出相应的结论。
四、时间序列分析模型时间序列分析是一种研究时间序列数据的方法。
它通过分析过去的数据,来推断未来的趋势和模式。
时间序列分析在考研统计学中被广泛应用于经济学、金融学、气象学等领域,可以帮助我们做出准确的预测和决策。
五、生存分析模型生存分析是一种处理生存时间数据的方法。
它可以分析个体在给定时间段内的生存情况,并推断其生存函数和风险函数。
生存分析在考研统计学中主要应用于医学、生物学、社会科学等领域,可以帮助我们评估治疗效果、预测风险和制定干预策略。
以上,我们简要介绍了考研统计学中五个常用的统计分析模型:回归分析、方差分析、因子分析、时间序列分析和生存分析。
掌握这些模型,可以帮助我们更好地理解和解释数据,从而做出准确和可靠的决策。
希望本文对你在考研统计学中的学习有所帮助。
统计学多模型

在统计学中,有多种模型可以用于分析和处理数据。
以下是一些常见的统计学模型:
1. 线性回归模型:用于研究自变量与因变量之间的线性关系。
2. 逻辑回归模型:常用于分类问题,预测二分类或多分类的结果。
3. 方差分析(ANOVA):用于比较多个组之间的差异。
4. 聚类分析:将数据对象分组或聚类,使相似的对象归为一组。
5. 时间序列模型:用于分析随时间变化的数据趋势和周期性。
6. 面板数据模型:适用于处理具有多个时间点和多个个体的数据。
7. 主成分分析(PCA):用于降低数据维度和提取主要特征。
8. 因子分析:探索变量之间的潜在结构和因子。
9. 生存分析:用于研究事件发生时间的数据,如病人的生存时间。
10. 混合效应模型:考虑到数据中的层次结构或随机效应。
11. 贝叶斯模型:基于贝叶斯定理进行概率推断和预测。
12. 机器学习模型:如决策树、随机森林、支持向量机等,用于分类、回归和预测。
这只是一小部分常见的统计学模型,实际应用中根据问题的性质和数据的特点,可以选择合适的模型进行分析。
不同的模型有其适用的场景和限制,模型的选择和应用需要结合具体问题和数据进行判断。
同时,在使用模型时,还需要进行模型评估和验证,以确保模型的准确性和可靠性。
数据分析中的统计模型选择与应用

数据分析中的统计模型选择与应用在数据分析中,选择合适的统计模型是非常重要的,它能够帮助我们理解数据背后的规律,并作出合理的预测和决策。
本文将从统计模型的选择和其在数据分析中的应用两个方面进行探讨。
首先,统计模型选择是数据分析的关键一步。
在选择统计模型时,我们需要考虑以下几个因素:1. 数据类型:数据可以分为连续型和离散型。
对于连续型数据,我们可以使用线性回归等模型进行分析;对于离散型数据,我们可以采用逻辑回归等模型。
2. 目标变量:我们需要明确研究的目标是预测性还是解释性。
如果目标是预测性,我们可以选择机器学习算法,如支持向量机(SVM)或随机森林;如果目标是解释性,我们可以选择线性模型,如岭回归或Lasso回归。
3. 数据分布:我们需要了解数据的分布情况,例如正态分布、偏态分布等。
对于符合正态分布的数据,线性回归模型是一个不错的选择,而对于偏态分布的数据,我们可以尝试进行数据变换或使用非参数模型。
4. 样本容量:样本量对于模型的选择也有一定的影响。
当我们的样本容量较小时,我们应该选择较为简单的模型,以避免过拟合;当我们的样本容量较大时,我们可以尝试更为复杂的模型,以提高准确性。
其次,统计模型在数据分析中有广泛的应用。
下面将介绍几个常见的统计模型及其应用场景:1. 线性回归模型:线性回归模型是最常见的统计模型之一,它可以用于分析两个或多个连续型变量之间的关系。
例如,我们可以使用线性回归模型来研究广告投入与销售额之间的关系,或者研究气温与冰淇淋销量之间的关系。
2. 逻辑回归模型:逻辑回归模型广泛应用于分类问题。
通过逻辑回归模型,我们可以预测二分类或多分类的概率。
例如,我们可以使用逻辑回归模型来预测客户是否会购买某个产品,或者预测疾病的发生概率。
3. 随机森林模型:随机森林是一种集成学习算法,它由多个决策树组成。
随机森林可以用于分类和回归问题,并且对于处理高维度数据和特征选择具有较强的鲁棒性。
例如,我们可以使用随机森林模型来预测房价或者预测信用违约风险。
数据统计模型

数据统计模型数据统计模型是数据分析和预测的基础工具,它能够帮助我们理解数据背后的规律、趋势和关联性。
在各个领域中,数据统计模型被广泛应用于市场研究、经济分析、生物医学、社会科学等各个领域,为决策提供依据。
一、数据统计模型的基本概念1.1 数据统计模型的定义数据统计模型是基于统计学原理和方法,通过对数据进行建模和分析,以揭示数据背后的规律和趋势的数学描述。
它可以用来描述数据的分布、关联性、预测和推断等问题。
1.2 数据统计模型的分类数据统计模型可以分为描述性模型和推断性模型两类。
描述性模型旨在通过对已有数据进行总结、整理和描述,以便更好地理解数据的特征和规律。
常见的描述性模型有均值、方差、标准差等。
推断性模型则是通过对已有数据进行建模和分析,以从样本中推断总体的特征和规律。
推断性模型包括回归分析、时间序列分析、假设检验、方差分析等。
二、数据统计模型的应用领域2.1 市场研究在市场研究中,数据统计模型被广泛应用于市场需求分析、市场规模预测、市场细分等问题。
通过对历史销售数据和市场调研数据的建模和分析,可以帮助企业了解市场的需求趋势、消费者偏好和竞争态势,为企业的市场定位和营销策略提供依据。
2.2 经济分析经济分析是数据统计模型的重要应用领域之一。
在经济领域中,数据统计模型被用于预测经济增长、通货膨胀率、利率等指标,以及分析经济政策的效果和影响。
通过对历史经济数据的建模和分析,可以帮助政府和企业做出合理的决策和预测。
2.3 生物医学在生物医学领域,数据统计模型被广泛应用于疾病预测、药物研发、临床试验等问题。
通过对病人的病史、生理指标和基因数据的建模和分析,可以帮助医生和科研人员更好地理解疾病的发生机制、预测病情发展和制定治疗方案。
2.4 社会科学在社会科学领域,数据统计模型被广泛应用于人口统计学、社会调查、心理学等问题。
通过对调查数据和样本数据的建模和分析,可以帮助社会科学研究者了解社会现象的变化趋势、影响因素和相互关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高剂量
4.8 4.5 4.4 4.6 9.1 9.3 8.7 9.4 13.5 13.0 13.3 13.2
低剂量 2.4 2.7 2.3 2.5 低剂量 5.8 5.2 5.5 5.3 低剂量 6.1 5.7 5.9 6.2
8.9 9.1 8.7 9.0 9.9 10.5 10.6 10.1
数据统计分析常用模型
• • • • • • • • • 方差分析 回归分析 判别分析 聚类分析 主成分分析 相关分析(典型相关分析) 因子分析 列联表分析 时间序列分析
例子
例1:为了比较同一类型的三种不同食谱的营养 效果,将19只幼鼠随机地分为三组,每只分 为8只、4只、7只,各采用这三种食谱喂养。 假定其他条件均保持相同,12周后测得其体 重增加量如下表所示,是比较这三种食谱的 营养效果是否有显著差异 食谱 体重增加量 甲 164 190 203 205 206 214 228 257 乙 185 197 201 231 丙 187 212 215 220 248 265 281
例子
例4:2000年全国大学生数学建模竞赛A题 DNA序列分类 2000年6月,人类基因组计划中DNA全序列草图完成,预计2001年可以完成精确的 全序列图,此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的“天 书”。这本大自然写成的“天书”是由4个字符A,T,C,G按一定顺序排成的长约30 亿的序列,其中没有“断句”也没有标点符号,除了这4个字符表示4种碱基以外,人 们对它包含的“内容”知之甚少,难以读懂。破译这部世界上最巨量信息的“天书” 是二十一世纪最重要的任务之一。在这个目标中,研究DNA全序列具有什么结构,由 这4个字符排成的看似随机的序列中隐藏着什么规律,又是解读这部天书的基础,是生 物信息学(Bioinformatics)最重要的课题之一。 虽然人类对这部“天书”知之甚少,但也发现了DNA序列中的一些规律性和结构。 例如,在全序列中有一些是用于编码蛋白质的序列片段,即由这4个字符组成的64种不 同的3字符串,其中大多数用于编码构成蛋白质的20种氨基酸。又例如,在不用于编码 蛋白质的序列片段中,A和T的含量特别多些,于是以某些碱基特别丰富作为特征去研 究DNA序列的结构也取得了一些结果。此外,利用统计的方法还发现序列的某些片段 之间具有相关性,等等。这些发现让人们相信,DNA序列中存在着局部的和全局性的 结构,充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最 普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。这 种被称为粗粒化和模型化的方法往往有助于研究规律性和结构。
例子
例2:为了研制一种治疗枯草热病的药物,将 两种成分(A和B)各按三种不同剂量(低、 中、高)混合,将36位自愿受试患者随机 分为9组,每组4人服用各种剂量回合下的 药物,记录其病情缓解的时间(单位:小 时)如下表所示,试分析两种成分及交互 作用对病情缓解的时间是否有显著影响。
例子
A B 低剂量 中剂量
例子
例3: 费希尔(Fisher)于1936年发表了关 于鸢尾花(Iris)的数据。数据是对3种鸢尾花: 刚毛鸢尾花(第1组)、变色鸢尾花(第2 组)和费吉尼亚鸢尾花(第3组)各抽取一 个容量为50的样本,测量其花萼长x1,花萼 宽x2,花瓣长x3,花瓣宽x4,单位为mm, 数据如下表所示。假定有新样品 (x1,x2,x3,x4)=(62.35,58,18),试判别该 样品属于哪种鸢尾花。
例子
Art-model-data 1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg 2.cggaggacaaacgggatggcggtattggaggtggcggactgttcggggaattattcggtttaaacgggacaaggaaggcggctggaacaaccggacggtggcagcaaagga 3.gggacggatacggattctggccacggacggaaaggaggacacggcggacatacacggcggcaacggacggaacggaggaaggagggcggcaatcggtacggaggcggcgga 4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagcttagatgcatatgttttttaaataaaatttgtattattatggtatcataaaaaaaggttgcga 5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggctacaccaccgtttcggcggaaaggcggagggctggcaggaggctcattacggggag 6.atggaaaattttcggaaaggcggcaggcaggaggcaaaggcggaaaggaaggaaacggcggatatttcggaagtggatattaggagggcggaataaaggaacggcggcaca 7.atgggattattgaatggcggaggaagatccggaataaaatatggcggaaagaacttgttttcggaaatggaaaaaggactaggaatcggcggcaggaaggatatggaggcg 8.atggccgatcggcttaggctggaaggaacaaataggcggaattaaggaaggcgttctcgcttttcgacaaggaggcggaccataggaggcggattaggaacggttatgagg 9.atggcggaaaaaggaaatgtttggcatcggcgggctccggcaactggaggttcggccatggaggcgaaaatcgtgggcggcggcagcgctggccggagtttgaggagcgcg 10.tggccgcggaggggcccgtcgggcgcggatttctacaagggcttcctgttaaggaggtggcatccaggcgtcgcacgctcggcgcggcaggaggcacgcgggaaaaaacg 11.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaattaaatatttatt 12.gtttaattactttatcatttaatttaggttttaattttaaatttaatttaggtaagatgaatttggttttttttaaggtagttatttaattatcgttaaggaaagttaaa 13.gtattacaggcagaccttatttaggttattattattatttggattttttttttttttttttttaagttaaccgaattattttctttaaagacgttacttaatgtcaatgc 14.gttagtcttttttagattaaattattagattatgcagtttttttacataagaaaatttttttttcggagttcatattctaatctgtctttattaaatcttagagatatta 15.gtattatatttttttatttttattattttagaatataatttgaggtatgtgtttaaaaaaaatttttttttttttttttttttttttttttttaaaatttataaatttaa 16.gttatttttaaatttaattttaattttaaaatacaaaatttttactttctaaaattggtctctggatcgataatgtaaacttattgaatctatagaattacattattgat 17.gtatgtctatttcacggaagaatgcaccactatatgatttgaaattatctatggctaaaaaccctcagtaaaatcaatccctaaacccttaaaaaacggcggcctatccc 18.gttaattatttattccttacgggcaattaattatttattacggttttatttacaattttttttttttgtcctatagagaaattacttacaaaacgttattttacatactt 19.gttacattatttattattatccgttatcgataattttttacctcttttttcgctgagtttttattcttactttttttcttctttatataggatctcatttaatatcttaa 20.gtatttaactctctttactttttttttcactctctacattttcatcttctaaaactgtttgatttaaacttttgtttctttaaggattttttttacttatcctctgttat 21.tttagctcagtccagctagctagtttacaatttcgacaccagtttcgcaccatcttaaatttcgatccgtaccgtaatttagcttagatttggatttaaaggatttagattga 22.tttagtacagtagctcagtccaagaacgatgtttaccgtaacgtqacgtaccgtacgctaccgttaccggattccggaaagccgattaaggaccgatcgaaaggg 23.cgggcggatttaggccgacggggacccgggattcgggacccgaggaaattcccggattaaggtttagcttcccgggatttagggcccggatggctgggaccc24.tttagctagctactttagctatttttagtagctagccagcctttaaggcta gctttagctagcattgttctttattgggacccaagttcgacttttacgatttagttttgaccgt 25.gaccaaaggtgggctttagggacccgatgctttagtcgcagctggaccagttccccagggtattaggcaaaagctgacgggcaattgcaatttaggcttaggcca 26.gatttactttagcatttttagctgacgttagcaagcattagctttagccaatttcgcatttgccagtttcgcagctcagttttaacgcgggatctttagcttcaagctttttac 27.ggattcggatttacccggggattggcggaacgggacctttaggtcgggacccattaggagtaaatgccaaaggacgctggtttagccagtccgttaaggcttag 28.tccttagatttcagttactatatttgacttacagtctttgagatttcccttacgattttgacttaaaatttagacgttagggcttatcagttatggattaatttagcttattttcga 29.ggccaattccggtaggaaggtgatggcccgggggttcccgggaggatttaggctgacgggccggccatttcggtttagggagggccgggacgcgttagggc30.cgctaagcagctcaagctcagtcagtcacgtttgccaagtcagtaatt tgccaaagttaaccgttagctgacgctgaacgctaaacagtattagctgatgactcgta 31.ttaaggacttaggctttagcagttactttagtttagttccaagctacgtttacgggaccagatgctagctagcaatttattatccgtattaggcttaccgtaggtttagcgt32.gctaccgggcagtctttaacgtagctaccgtttagtttgggcccagcc ttgcggtgtttcggattaaattcgttgtcagtcgctctrtgggtttagtcattcccaaaagg 33.cagttagctgaatcgtttagccatttgacgtaaacatgattttacgtacgtaaattttagccctgacgtttagctaggaatttatgctgacgtagcgatcgactttagcac 34.cggttagggcaaaggttggatttcgacccagggggaaagcccgggacccgaacccagggctttagcgtaggctgacgctaggcttaggttggaacccggaaa 35.gcggaagggcgtaggtttgggatgcttagccgtaggctagctttcgacacgatcgattcgcaccacaggataaaagttaagggaccggtaagtcgcggtagcc 36.ctagctacgaacgctttaggcgcccccgggagtagtcgttaccgttagtatagcagtcgcagtcgcaattcgcaaaagtccccagctttagccccagagtcgacg 37.gggatgctgacgctggttagctttaggcttagcgtagctttagggccccagtctgcaggaaatgcccaaaggaggcccaccgggtagatgccasagtgcaccgt 38.aacttttagggcatttccagttttacgggttattttcccagttaaactttgcaccattttacgtgttacgatttacgtataatttgaccttattttggacactttagtttgggttac 39.ttagggccaagtcccgaggcaaggaattctgatccaagtccaatcacgtacagtccaagtcaccgtttgcagctaccgtttaccgtacgttgcaagtcaaatccat attagggtttatttacctgtttattttttcccgagaccttaggtttaccgtactttttaacggtttacctttgaaatttttggactagcttaccctggatttaacggccagtt