生物信息学第四次作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
BLAST数据库相似性搜索
1.以人血红蛋白beta亚基(HBB_HUMAN)为检测序列,搜索Swiss-Prot数据库中所有
哺乳动物的血红蛋白,找出前10个高分匹配,列表说明搜索结果。
由结果看出,匹配度较高的大多数都是血红蛋白beta亚基,匹配度最高的当然是人血红蛋白beta亚基本身的蛋白序列,第二最相似的是西部低地大猩猩,依次为长臂猿、长尾叶猴、王疣猴、红脸蜘蛛猴、黑掌蛛猴、日本猕猴、白脸狐尾猴、棕色绒毛猴。前10个高分匹配都是灵长目的,与人类亲缘关系最近,因而血红蛋白beta亚基相似度较高。
2.以大鼠血红蛋白alpha亚基(HBA_RAT)为检测序列,用BlastP、PSI-Blast和DELAT-Blast
分别搜索RefSeq数据库中大鼠珠蛋白家族成员(注意选择适当的计分矩阵、设置适当的E值)。
BlsatP结果:
PSI-Blast结果(PSI blast Iteration 2):
DELAT-Blast结果:
3.以大鼠血红蛋白alpha亚基(HBA_RAT)为检测序列,用tBlastN搜索RefSeq数据库
中大鼠珠蛋白基因家族mRNA序列。参考Hardison论文和大鼠基因组数据库RGD中相关信息,下载非预测序列,提取其编码区序列,进行多序列比对,并构建系统发育树,分析结果。
将下载的序列用Mega进行比对,构建系统发育树如下图:
由图可以看出,共提取了14条珠蛋白家族编码区序列。4个beta亚基在一个分支,它们结构上比较相似;随机对比了100次,gamma A与epsilon 2这两个亚基始终在一起,说明这两个亚基极为相似,差异位点很少,而这两个亚基又与epsilon 1对比了100次有98次是在一起的,说明它们之间也很相似;这7个亚基无论对比多少次,总是在一起,说明它们的序列上有很相似的结构,使它们能够比对到一起。alpha 1和alpha 2总是在一起,它们之间的差异位点很少,序列基本相同;三个alpha亚基始终在一起,它们与zeta的相似度较高,对比100次有75次是和zeta亚基在一起。Cytoglobin、myoglobin、neuroglobin这三个亚基与其他亚基相似度低一些。
大鼠基因组数据库RGD中大鼠珠蛋白家族有17个,但本次只提取出14个。Hardison 论文中类β珠蛋白包含βγε亚基,类α珠蛋白中包括αζθ亚基,所建系统发育树与此结果一致。
4.搜索RefSeq数据库中人、小鼠和大鼠三个物种珠蛋白家族mRNA序列,下载非预测序
列,提取其编码区序列;对上述三个物种所有珠蛋白基因编码区序列进行多序列比对,并构建系统发育树,分析结果。
对这三个物种的所有珠蛋白家族进行基因编码区序列进行多序列比对,并构建系统发育树如图,可以看出这三个物种的neuroglobin和人的mu亚基与其他亚基的序列相似性是最低的。三个物种的myoglobin在一个分支,cytoglobin在一个分支,说明它们各自在分化上很相似。alpha亚基、theta亚基、zeta亚基在一个大分枝上,gamma、epsilon、beta、delta亚基这几个在一个大分支,说明它们之间的同源性很高,可能是由alpha或者beta亚基复制变异而来,因而相似性高。由图也可看出这三个物种的血红蛋白相似性很高、珠蛋白家族的亚基种类也相似,三个物种的相似相同亚基基本在一个大分支上,同源性高。
Mm beta adult t chain (Hbb-bt)
Mm beta adult s chain (Hbb-bs)
Mm beta adult major chain (Hbb-b1)
Mm beta adult minor chain (Hbb-b2)
Rn beta (Hbb)
Rn beta adult major chain (Hbb-b1)
Rn beta globin minor gene (LOC100134871)
Rn beta-globin (LOC689064)
Hs beta (HBB)
Hs delta (HBD)
Mm beta bh2 (Hbb-bh2)
Mm Y beta-like embryonic chain (Hbb-y)
Rn epsilon 1 (Hbe1)
Hs epsilon 1 (HBE1)
Hs gamma G (HBG2)
Hs gamma A (HBG1)
Rn epsilon 2 (Hbe2)
Mm Z beta-like embryonic chain (Hbb-bh1)
Rn gamma A (Hbg1)
Mm cytoglobin (Cygb)
Rn cytoglobin (Cygb)
Hs cytoglobin (CYGB)
Hs myoglobin (MB) transcript variant 3
Hs myoglobin (MB) transcript variant 1
Hs myoglobin (MB) transcript variant 2
Rn myoglobin (Mb)
Mm myoglobin (Mb) transcript variant 3
Mm myoglobin (Mb) transcript variant 1
Mm myoglobin (Mb) transcript variant 2
Mm X alpha-like embryonic chain in Hba complex (Hba-x)
Rn zeta (Hbz)
Hs zeta (HBZ)
Mm theta 1B (Hbq1b)
Mm theta 1A (Hbq1a)
Hs theta 1 (HBQ1)
Hs alpha 2 (HBA2)
Hs alpha 1 (HBA1)
Mm alpha adult chain 1 (Hba-a1)
Mm alpha adult chain 2 (Hba-a2)
Rn alpha (LOC287167)
Rn alpha 1 (Hba1)
Rn alpha 2 (Hba2)
Hs mu (HBM)
Hs neuroglobin (NGB)
Mm neuroglobin (Ngb)
Rn neuroglobin (Ngb)