山东大学生物信息学期末作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
山东大学生命科学学院2011~2012学年第一学期期末考试试卷(研究实践性)
考试科目: 《生物信息学》
适用类别: 本科
院系:生命科学学院
专业:生物技术
年级:09级
姓名:余振洋
学号:200900140156
第 1 页共28 页
第 2 页 共 28 页
考试说明和要求
1.试卷的格式包括七部分:目录、引言、实践资源(使用的软件和数据库)、
实践方法、实践结果和讨论、参考文献、心得与致谢。
(要求使用此论文模板创建规范统一的答卷,详见模板使用说明,请从此模板的第3页开始答卷;参考文献要求使用专业软件中《微生物学报》样式统一进行参考文献格式化;请于16周课程结束后,一周内提交电子版和纸质版答卷;团队讨论或受他人帮助的请在致谢中说明体现)
2.考试内容:请从以下三题中任选一题进行期末考试实践(实践部分请提供说
明问题的截图),鼓励同学们拓展思考与发挥。
2.1任选题第一题:以人体DNA 时代科教片视频资料为素材,选择一个片段进行生物信息学之旅。
(要求遵循以下解析求证线路)
2.2 任选题第二题:以提供的序列文件为素材,从采集序列基本处理开始,
利用软件包和各种数据库注释、解析数据(包括数据的注释分析、功能结构分析和进化分析)
2.3任选题第三题:自己选定文献来源或其它来源的生物问题素材,利用一套或一个生物信息学软件或数据库,进行一次生物数据的信息学之旅。
(要求实践过程中涉及课堂讲授以外的生物信息学软件或数据库资源)
第 3 页共28 页
目录
1.引言 (5)
1.1 镰状血球贫血症简介 (5)
1.2 镰状血球贫血症病因及病理 (5)
2.实践资源 (6)
2.1 数据库 (6)
2.2 实践软件 (6)
3.实践方法 (6)
3.1 问题来源 (6)
3.1.1 视频《DNA时代06——打开潘多拉的盒子》画面资料剪辑 (7)
3.1.2 视频资料分析 (7)
3.1.3 镰状血球贫血症分子生物学机制探究 (8)
3.2 NCBI数据库分析 (8)
3.2.1 主题词的确定 (8)
3.2.2 镰状血球细胞相关基因的查找与序列分析 (10)
3.2.2.1 镰状血球细胞相关基因的查找 (10)
3.2.2.2 镰状血球细胞相关基因的序列分析 (11)
3.2.3 核酸序列对比 (14)
3.2.4 用BioEdit分析 (16)
3.2.5 氨基酸序列查找 (17)
3.2.6 氨基酸序列对比信息 (20)
3.2.7 用Swiss Model数据库进行hemoglobin s的三维结构预测 (23)
4.实践结果和讨论 (27)
5.参考文献 (27)
6.心得与致谢 (28)
第 4 页共28 页
镰状血球贫血症分子生物学特征的信息学分析
1.引言
1.1 镰状血球贫血症简介
镰刀状血球贫血症(视频中说法,大陆说法为镰刀形细胞贫血症(sickle-cell anemia)),是一种潜在的人类致死遗传病。
患病者的血液红细胞表现为镰刀状,其携带氧的功能只有正常红细胞的一半。
现在医生可以用regular blood transfusion避开伤害患者的大脑来阻止这类疾病的发病,但是,迄今为止还没有能真正治愈的药物。
1949年,美国著名化学家鲍林便在《科学》杂志上发表了题为《镰刀型细胞贫血症——一种分子病》的研究报告,报告中指出,有证据表明红细胞镰变的过程可能是与红细胞内血红蛋白的状态和性质密切相关的。
据悉,非洲有的地区高达40%的人携带该病基因.
1.2 镰状血球贫血症病因及病理
镰状血球贫血症是血红蛋白分子遗传缺陷造成的一种疾病,病人的大部分红细胞呈镰刀状,许多红血球还会因此而破裂造成严重贫血,甚至引起病人死亡。
其特点是病人的血红蛋白β—亚基N端的第六个氨基酸残基是缬氨酸(val),而不是下正常的谷氨酸残基(Glu)。
血红蛋白是个四聚体蛋白,也是个别构蛋白,
第 5 页共28 页
因此镰刀型细胞贫血病是一种由基因突变产生的血红蛋白质分子结构改变的一种分子病。
2.实践资源
2.1 数据库
NCBI 的MeSH、Gene、Protein和Nucleotide 数据库,Swiss Model蛋白分析库
2.2 实践软件
BioEdit: BioEdit是一个序列列编辑器与分析工具软件。
功能包括:序列编辑、外挂分析程序、RNA分析、寻找特征序列、支持超过20000个序列的多序列文件、基本序列处理功能、质粒图绘制等等。
RasMol:观看生物分子3D微观立体结构的软件,可以旋转,可以以多种模式观看,并可以存成普通图形文件。
3.实践方法
3.1 问题来源
第 6 页共28 页
第 7 页 共 28 页
3.1.1 视频《DNA 时代06——打开潘多拉的盒子》画面资料剪辑
3.1.2 视频资料分析
镰状血球疾病是由第11
对染色体基因突变引起的疾病,它的发生是因为在
正常情况下呈圆盘状柔软的红血球僵化而变成镰刀状,因此无法顺利输送氧气,造成患者呼吸困难,肝脏和肾脏的负荷加重,免疫系统也出现缺陷,可能会致人于死。
该病往往出现在非洲后裔身上,因为非洲某些地方的生活环境中多为沼泽地带,加上蚊子丛生和人口密集等因素,为疟疾的传染提供了最理想的环境。
居民被带有疟疾原虫的疟蚊叮咬后便会感染疾病,原虫进入人体,破坏血球、肝脏、脾脏等细胞。
医学界认为,镰状血球病患者由于红血球的含氧量过低,疟疾原虫无法增生。
因此,带有镰状红血球基因的人抵抗疟疾感染及感染疟疾重症后的存活率较普通人要高,也是由此,非洲热带和中、东部地区有镰状血球基因的人非常多。
患者要同时遗传父母亲的这一基因才会发病,在美国,即使只遗传一个镰状血球基因的人也会受到歧视,由此看来,基因已经超越了人类社会的期望。
3.1.3 镰状血球贫血症分子生物学机制探究
镰状血球贫血症是一种家族型隐性遗传疾病,为了更好地了解此病,我们应该从核酸、蛋白质水平上来进一步探究镰状血球病的分子发病机理。
3.2 NCBI数据库分析
3.2.1 主题词的确定
根据生物学大辞典的翻译,确定镰刀形细胞贫血症——sickle-cell anemia为
第8 页共28 页
第 9 页 共 28 页
初选关键词,然后利用NCBI MeSH 主题词确定标准主题词为——Anemia, Sickle Cell ,并且确定其相关蛋白为hemoglobin S (血红蛋白S ),即HbS 。
如图一。
图一 主题词的确定
3.2.2 镰状血球细胞相关基因的查找与序列分析
3.2.2.1 镰状血球细胞相关基因的查找
将MeSH库换为Gene库,输入Sickle Cell Anemia,得到其相关基因为HBB。
点击“HBB”进入详细页面介绍,根据Summary可以得知:α(HBA)和β(HBB)基因的结构决定了成人体内两种类型的多肽链,正常人血红蛋白四聚物由两条α链和两条β链组成,而突变β血球蛋白能导致镰状血球贫血。
因此可以确定是突变的HBB基因导致了人类的镰状血球贫血症。
见图二。
第10 页共28 页
图二镰状血球细胞相关基因的确定
3.2.2.2 镰状血球细胞相关基因的序列分析
1)HBB基因序列分析
从此前得到的页面中可以查找到HBB基因在物理图谱中的位置,从图三中可以看到,HBB基因位于第11条染色体上,与视频资料中得到的信息一致。
基
因序列为5246696——5248301,总长1605bp。
第11 页共28 页
第 12 页 共 28 页
图三 HBB 基因序列物理图谱分析
点击“FASTA ”,得到HBB 基因的FASTA 序列,见图四。
图四 HBB 基因的FASTA 序列
2)HBB 突变基因(HbS 基因)序列分析
回到“Mucleotide ”库,输入“hemoglobin S ”,搜索结果出来第一条便是HBB 突变基因(HbS )的标题,点击进入后,可以得到突变基因的基因序列号和片段大小,见图五。
图五HbS基因序列号和片段大小
点击左上方的“FASTA”,得到突变基因的FASTA序列,见图六。
第13 页共28 页
图六HbS基因FASTA序列
3.2.3 核酸序列对比
进入Blast,选择“Human”,在“blastn”下的“Enter Query Sequence”框内输入从上一步找到的突变基因序列号:AY027800,得出对比结果。
见图七。
第14 页共28 页
图七核酸序列对比
由比对结果可知,镰状血球贫血症基因和人类第11对染色体基因匹配度极高,完美验证了视频中“位于第11对染色体”的说法。
点击页面上方的“Human genome view”,出现突变基因在染色体上的具体位置图。
从图中可看到突变基因在11号染色体的短臂上,且靠近端点。
见图八。
图八突变基因在染色体中的位置
第15 页共28 页
3.2.4 用BioEdit分析
将正常和突变基因的FASTA序列互不干扰顺序地放在新建的TXT文档中,用BioEdit打开,见图九。
图九BioEdit界面
点击窗口上方的“Accessory application”菜单,再点击“clustelW multiple alignment”,弹出一个窗口,直接选择“Run clustalW”,又弹出一个窗口,选择ok,得到比对结果。
可以看到,突变基因有大量的缺失。
见图十。
第16 页共28 页
缺失序列
同源序列
图十BioEdit比对结果
3.2.5 氨基酸序列查找
在“Nucleotide”库中输入“hemoglobin s”,点击第三条目录,进入页面后可得到hemoglobin s的氨基酸序列号和蛋白质ID。
见图十一。
第17 页共28 页
第18 页共28 页
图十一hemoglobin s氨基酸序列的查找
在Protein库,输入上一步搜索到的蛋白质ID:AAK15811.1,得到了同样的但更为详细的氨基酸序列。
见图十二。
图十二蛋白库中氨基酸序列
第19 页共28 页
3.2.6 氨基酸序列对比信息
在得到hemoglobin s的氨基酸序列号和蛋白质ID的页面右侧点击“Run BLAST”,运行,BLAST得到102个BLAST结果。
见图十二。
图十二氨基酸序列对比信息
第20 页共28 页
图十三序列比对情况
通过对结果的分析,可知hemoglobin s(血红蛋白s)为人体内一种突变型致病性蛋白。
但是这种蛋白不仅出现在人类上,还在其他物种如Pongo abelii(黑猩猩)等中出现,因此可通过进化树来分析次序列的相关进化情况。
在上一步打开的页面上方点击“Distance tree of results”,得到hemoglobin s 的进化树,如图十四。
第21 页共28 页
第 22 页 共 28 页
图十四 hemoglobin s 的进化树
3.2.7 用Swiss Model数据库进行hemoglobin s的三维结构预测
进入“Swiss Model”网站主页,点击“Automared Mode”进入,输入要查的基因的FASTA序列以及自己的邮箱,提交后,在邮箱收到自己的password,在几个小时以后,便可以用此登录“my Workspace”,进行结果的查看。
如图十五。
第23 页共28 页
图十五Swiss Model中操作步骤
第24 页共28 页
第 25 页 共 28 页
图十六蛋白结构详细信息
点击“download models:as [pbd]”,蛋白结构即以pbd格式保存,可以用RasMol软件打开,点击“colour”下的“Shapely”(定型),使每一种氨基酸与核酸的残基用一个特定的颜色来表示,如图十七。
从文献资料得知,镰状血球贫血症是因为β链上从N末端开始的第6位的氨基酸残基,由正常的谷氨酸被
缬氨酸所代替,由此可分析出图中各氨基酸种类。
第26 页共28 页
图十七三维蛋白结构
4.实践结果和讨论
本文利用NCBI对镰状血球贫血症的发病机制在分子生物学层面进行了分析,了解了它的基因和蛋白结构,并验证了其突变基因在11号染色体上的说法。
除此之外,还利用HbS基因的序列进行了物种间进化树的分析,得到了新的结果。
5.参考文献
百度百科:/view/1257542.htm(镰刀形细胞贫血症)
第六章——期末考试实例(课件),黎志凤.
第27 页共28 页
期末参考——李汉增
6.心得与致谢
第28 页共28 页。