基因组学总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、前言
继20世纪50年代Watson和Crick揭示了遗传信息携带者DNA的双螺旋结构后,近50年来分子生物学的发展势如破竹。60年代中期遗传信息传递的中心法则的初步确定;70年代基因重组理论和技术的崛起;以及近二三十年来基因的表达和调控及相关的发育分子生物学的进展;蛋白质翻译后加工、折叠、组装、转运,生物大分子相互识别、信号转导的深入研究等;一个个里程碑工作接踵而来。人类基因组计划业已完成,不久完整的人类基因组序列将呈现在人们面前。一个崭新的时代——后基因组时代已经来临。
基因即DNA分子上有遗传效应的特定核苷酸序列的总称,基因组即细胞或生物组的全部遗传物质,遗传物质即基因的编码序列,大量的非编码序列同样含有遗传物质。1985年美国科学家率先提出了人类基因组计划(HGP:Human Genome Plan),1990年正式启动。这是一项规模宏大的跨国跨学科的科学探索工程,其宗旨在于测定人类染色体中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨认其载有的基因及其序列,从而达到破译人类遗传信息的目的。该项计划是继曼哈顿计划和阿波罗登月计划之后人类历史上的一个伟大工程。2001年人类基因组工作草图的发表被认为是人类基因组计划成功的里程碑,2005年人类基因组计划的测序工作已经基本完成,同时制作出了遗传图谱、物理图谱、序列图谱和基因图谱四张图谱。
二、人类基因组计划的成功完成对人类的意义
1、对人类各个领域的贡献
a 对人类疾病基因研究的贡献:人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。对于单基因病,采用“定位克隆”和“定位候选克隆”的全新思路,导致了亨廷顿氏舞蹈症、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。对于心血管疾病、肿瘤、糖尿病、神经精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重点。健康相关研究是HGP的重要组成部分,1997年相继提出:“肿瘤基因组解剖计划”“环境基因组学计划”。
b 对医学的贡献:基因诊断、基因治疗和基于基因组知识的治疗、基于基因组信息的疾病预防、疾病易感基因的识别、风险人群生活方式、环境因子的干预。
c 对生物技术的贡献:对研发基因工程药物和诊断研究试剂产业有巨大推动。
d 对细胞、胚胎、组织工程的贡献:胚胎和成年期干细胞、克隆技术、器官再造。
f 人类基因组计划的完成,在社会经济、生物进化等方面都有重要影响。
2、基因检测在个体化医学方面的应用
人类基因组计划和一系列的实验完成之后积累的大量的数据资料,科学家们面临的挑战就是如何利用这些数据的巨大潜力去改善人类的健康状况并使人类更好的生存,探索出一条造福人类健康的崭新途径。
大部分表型都是由遗传因素(基因及其产物)和非遗传因素(环境因素)交互作用,HGP的研究成果以及基因组学的研究,有助于我们了解遗传因素在人类健康和疾病中的角色,精确确定非遗传因素,并迅速将新发现用于疾病的预防、诊断和治疗。例如鉴定基因及其路径在健康和疾病中的角色,测定它们与环境因素之间的关系,预测药物反应,疾病的早期诊断,疾病在分子水平上的精确分类等。因此基因组学的进展将推动人们发展相应基因组研究方法,对人类基因组可遗传变异进行更为深入细致全面描述和分析。目前科学家们建立起一套人类基因常见差异的细目,包括核苷酸多态性(SNPs),小的缺失和插入,以及其它结构上的
不同,并致力于寻找不同表型与DNA序列变异之间的关联。HapMap和SNPs 将会揭示基因差异与疾病的关系,架起连结人类健康与疾病差异的桥梁,也将极大程度推动对一般疾病的遗传机制和药物基因组学的研究。
3、复杂疾病与遗传分析
复杂疾病的发生是由多种遗传因素和多种内外界环境因素的共同作用,对复杂疾病进行遗传分析的主要目标之一就是找出其易感基因。复杂疾病在遗传学上具有某些独特的复杂特点,致使各种遗传分析的效力不够高,还需要一定深度的研究。
三、基因命名的方法
2、基因的命名
人类基因的命名一半由基因符号和基因名称组成,如CTP2C9 “cytochrome P450, family 2,subfamily C,polypeptide 9”。基因命名时一般要遵循简明、独特和能够表达基因的特征或功能三个基本原则,基因名称一般使用美式英语拼写,且为小写,不能在名称中对组织特异性、分子量等信息进行详细描述。当使用到人名时首字母要大写,对基因名称进行限定时,限定词放在名称后面并用“,”隔开。使用替代名称作为基因名称的一部分时,替代名称放在括号内,与其它种属同源的基因,应使用已获得批准的基因名称和符号,在名称后面加注“homolog”并在括号内标明种属。基因符号的命名要遵循简短独特、不含任何标点符号、仅含拉丁字母和阿拉伯数字三个基本原则。
3、基因变异位点的命名
基因突变的类型主要有点突变,移码突变,缺失突变和插入突变。所有变异发生的最终都是DNA水平的变异引起相应RNA或蛋白质水平的变化。DNA变异涉及的四种碱基AGCT需大写,RNA中则小写,蛋白质水平氨基酸的变异使用前三个字母的缩写。
变异序列的类型:g代表基因组序列,c代表编码DNA,P代表蛋白序列。
突变表示方法:置换突变(“>”):如241T>G代表序列的第241位核苷酸T被G 替换。缺失突变(“del”):如692-694del代表692,693,694位三个核苷酸连续缺失。插入突变(“ins”):如451-452insT,代表451位与452位核苷酸之间插入了一个胸腺嘧啶脱氧核苷酸。内含子突变(“IVS”):当全基因组序列未知时,供体位置GT的G位用+1表示,受体位置AG的G位开始用-1表示。如IVS4+1G>T 代表在第四个内含子的+1核苷酸处G突变为T;IVS4-2A>C代表在第四个内含子的-2核苷酸处A突变为C。cDNA核苷酸的编号可以用来指示内含子附近的突变位点。如c.1997+1G>T,cDNA第1997位核苷酸下游+1处G替换为T。重复突变(“dup”):如序列ACTTTGTGCC突变为ACTTTGTGGCC不能描述为18_19insG,而应描述为18dupG。倒位(“inv”):如76_83inv表示第76到83位氨基酸之间的片段发生倒位。
四、生物信息学的重要性
1、生物信息学及相关生物信息的查询
随着生物实验技术及检测手段的发展、人类基因组计划的完成、及基因组学的发展,产生了成千上万的数据,这些数据也覆盖了生命科学的各个领域。基因组数据库、(核酸、蛋白质)序列数据库、生物大分子(主要是Pr)结构数据库、及文献数据库应运而生。而对于这些信息的查询和使用则依赖于一系列相关的数据库。
NCBI, 是一个综合数据库,包括GeneBank 数据库、Pupmed 文献数据库、人类孟德尔遗传数据库OMIM、3D蛋白结构分子模型数据库、分类学浏览器等。搜