基因组学考试答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因组学
一、名词解释
1.gene:基因是有遗传效应的DNA片段,是控制生物性状的基本遗传单位。Gene一词于1909年由丹麦植物学家Wilhelm Johannsen首次提出,以取代孟德尔的factor等用语。
2.肿瘤标志物:反应肿瘤存在的化学类物质。它们或不存在于正常成人组织而仅见于胚胎组织,或在肿瘤组织中的含量大大超过在正常组织里的含量,它们的存在或量变可以提示肿瘤的性质,借以了解肿瘤的组织发生、细胞分化、细胞功能,以帮助肿瘤的诊断、分类、预后判断以及治疗指导。
3.基因组编辑:genome editing,一种在基因组水平上对DNA序列进行改造的遗传操作技术。技术的原理是构建一个人工内切酶,在预定的基因组位置切断DNA,切断的DNA在被细胞内的DNA修复系统修复过程中会产生突变,从而达到定点改造基因组的目的。
4.BLAST:Basic Local Alignment Search Tool,一套在蛋白质数据库或者DNA数据库中进行相似性比较的分析工具。
5.微生物组群:微生物组群是指在多细胞生物体中发现的一组共生的病原微生物菌群,包括细菌、古细菌、原生生物、真菌和病毒等。微生物组群在免疫、体内激素代谢平衡方面有至关重要的作用。
6.组蛋白修饰:组蛋白修饰是指组蛋白在相关酶作用下发生甲基化、乙酰化、磷酸化、腺苷酸化、泛素化、ADP核糖基化等修饰的过程。
7.L-W曲线:Lander-Waterman模型是1988年美国Eric Lander以及Michael Waterman提出的一个数学模型,广泛用于基因组大小评估,还能够推算出覆盖度和reads的关系,在测序和序列组装中起到关键的指导意义。对于已知待测基因组大小的G和测序长度L都是常数,使用Lander-Waterman模型绘制L-W曲线,可以得到contig数与基因组大小(G)和测序reads数(N)的关系图。
8.液体活检:Liquid Biopsy,是一种利用高通量测序技术来检测血液中的小DNA碎片的技术。可用于癌症早期临床诊断。
9.miRNA:miRNA 是一类进化上保守的非编码小分子RNA,具有在翻译水平调控基因表达的功能。
10.N50:contigs或scaffolds从大到小排列,当其累计长度刚刚超过全部不组装序列的总长度的50%是,最后一个contig或scaffold的大小即为N50的大小,N50对评价基因测序的完整性有重要意义。
11.STR:微卫星DNA,重复单位序列最短,只有2~6bp,串联成簇,长度50~100bp,又称为短串联重复序列(Short Tandem Repeat STR)。广泛分布于基因组中。其中富含A-T碱基对,是在研究DNA多态性标记过程中发现的。
12.HLA:HLA系统是具有代表性的序列多态性遗传标记。HLA基因是位于6p21.31、全长3.6Mb的由一系列紧密连锁的位点所组成的具有高度多态性的复合体。
13.SNP:single nucleotide polymorphism,单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。
14.痕量DNA: 痕量DNA又称低拷贝模板(low copy number,LCN)。
15.Alignment:序列比对是基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,检测序列之间的相似性,发现生物序列中的功能、结构和进化的信息。
16.SBS:SBS法是一种基于DNA合成反应的测序技术,又称Sanger法。其使用双脱氧核算-ddNTP作为链终止剂。
17.KEGG: KEGG(京都基因与基因组百科全书) 是了解高级功能和生物系统(如细胞、生物和生态系统),从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实
验技术的实用程序数据库资源,由日本京都大学生物信息学中心的Kanehisa实验室于1995年建立。是国际最常用的生物信息数据库之一,以"理解生物系统的高级功能和实用程序资源库"著称。
18.iPS:诱导多能干细胞,是由动物体细胞,经四种或者多种诱导因子(oct4,c-myc,sox2,klf4等)感染,在一定条件下转化为与ES(embryo stem ,胚胎干细胞)形态,功能类似的ips细胞,ips具有分化潜能,在体外能分化为EB(胚体),在动物体内能形成畸胎瘤或者嵌合体。
19.遗传标记:遗传标记是指在遗传分析上用作标记的基因,具有遗传上的可遗传性、个体性和可识别性,以及方便取样和快速分析等特点。主要特点为多态性、高频性、共显性、规律性。
20.e-PCR:electronic PCR,e-PCR 技术是利用生物信息学数据库作为平台, 借助相应的分析运算软件, 搜索所查询的DNA 序列(query sequence) 是否含有序列标记位点(Sequence Tagged Sit , STS) , 根据STS 在已知基因组图谱的位置将所查询的DNA 序列在基因组图谱上进行定位。
21.免疫组测序:(Immune Repertoire sequencing(IR-SEQ))是以T/B 淋巴细胞为研究目标,以多重PCR或5’RACE技术目的扩增决定B细胞受体(BCR)或T细胞受体(TCR)多样性的互补决定区(CDR区),再结合高通量测序技术,全面评估免疫系统的多样性,深入挖掘免疫组库与疾病的关系。
22.靶区域测序:是指对一个较大的区域或几个不同的基因组区域同时进行测序。DNA捕获是靶区域测序制备模板的主要方法。
23.基因电路:是一种将基因网络和电子网络电路做类比的研究方法,在这种类比下,成熟的电路分析可以被用来分析基因网络的功能和结构。
24.连锁不平衡:(linkage disequilibrium)在某一群体中,不同座位上某两个等位基因出现在同一条单元型上的频率与预期的随机频率之间存在明显差异的现象,称连锁不平衡。
25.后随基因:在DNA复制过程中,以亲代链(5’→ 3’)为模板时,子代链的合成不能以3’→5’方向进行,而是按5’→ 3’方向合成出许多小片段,因为是冈崎等人研究发现,因此称冈崎片段。由许多冈崎片段连接而成的子代链称为后随链。在后随链上的基因称为后随基因。26. Synthia:第一个人工合成的基因组,由美国生物学家文特尔领导的研究团队,重塑"丝状支原体丝状亚种"(Mycoplasma mycoides)这种微生物的DNA,并将新DNA片段"黏"在一起,植入另一种山羊支原体中。新生命1个月前诞生,昵称Synthia"Synthia"(合成体),这种微生物由蓝色细胞组成,能够生长、繁殖,细胞分裂了逾10亿次。
27.PGT:Preimplantation Genetic Testing,植入前检测是指通过显微操作技术取出早期胚胎(体外受精后、植入前)的一个或少数几个细胞及囊胚期的胚胎滋养层,应用DNA分析技术进行特定基因和染色体畸变的检测。
28.CRISPR:CRISPR是基因组中自然存在的成簇的规律间隔的短回文重复序列。CRISPR序列广泛分布于细菌和古菌基因组中。
29.RFLP:(Restriction Fragment Length Polymorphism,限制性片段长度多态性)第一代DNA 标记是RFLP,是一种“单位点双等位”的遗传标记。
30.Genome:基因组,在生物学中,一个生物体的基因组是指包含在该生物的DNA中的全部遗传信息。一个生物体的基因组是指一套染色体中的完整的DNA序列。
31.假基因:(pseudogene),是基因组中与编码基因序列非常相似的非功能性基因组DNA 拷贝,一般情况都不被转录,且没有明确生理意义。
32.K-mer:K-mer就是一个基因长度为K的DNA序列,K为整数。K-mer大小选取取决于它的主要使用目的:拼接和比对。所以,一般来说K-mer的唯一性越高越好。
33.C值悖论:目前C值得概念已推广到所有生物的基因组大小。原先的研究认为,物种基