疾病的遗传学基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假基因
• 与功能基因序列同源性高,但是不具有任
何功能
A
A
gene duplication
Mutational constraint
A
Mutational flexibility
ψA
Transcription and processing
Reverse transcriptase
mRNA cDNA
Chromosome integration
Human protein
Size of protein (no. of amino acid)
SRY β-Globin p16 Serum albumin Type VII collagen p53 Complement C3 Apolipoprotein B Phenylalanine Hydroxylase Factor VIII Huntingtin RB1 retinoblastoma protein CFTR Tltin Utrophin Dystrophin
From 张学老师
遗传病分类
• 单基因病 (Monogenic or Single Gene Disorders) • 多基因病 (Polygenic or Multifactorial Diseases) • 染色体病 (Chromosomal Disorders ) • 体细胞遗传病 (Somatic Cell Genetic Disorders)
CNV(拷贝数变异)
• 拷贝数变异:大片段非重复DNA序列的缺 失或插入
• 长度至少1 Kb,平均长度250 Kb • ~5-10% 人类基因组
CNV(拷贝数变异)
* Sebat et al, Science 305: 525, 2004
CNV和表型的关系
• 剂量效应 • 基因结构被破坏 • 基因与其远端调控序列被打断
D21S1414
21三体
D21S1412
Electrophoretogram of QF-PCR amplification: X-軸 – PCR 产物长度 (length of PCR products) ( base pairs,bp)
Y-軸 –螢光強度 (fluorescence intensity)
• 转座子重复Transposon repeats:
✓ 人类基因组中广泛地散在DNA 序列(LINE-1和Alu) ✓ 来源于复制转座 ✓ >40% 的全基因组 DNAs ✓ 位于基因外,内含子,UTR甚至编码区
异染色质Heterochromatin
• 主要由长的成串排列的高度重复DNA序列 组成,又称为卫星DNA
➢ 单倍体(haploid) 正常人配子的染色体组(基因组)含有22条常染色体 和一条性染色体(X或Y)即22+X或22+Y,称单倍体。
➢ 二倍体(diploid): 精子、卵子结合后形成的受精卵含有二个染色体组, 称二倍体。
➢ 姐妹染色单体(sister chromatids)
2017/10/17
• 蛋白质编码基因 • RNA基因 • 高度重复DNA
– 异染色质heterochromatin – 转座子重复transposon repeats
高度重复DNA序列
• 异染色质Heterochromatin:
✓ 染色体特定区域存在的串联重复DNA序列 ✓ 整个细胞周期一直保持高度浓缩 ✓ 一般不包含基因
16.4/1000
600/1000
240/1000
终生 患病率 3.8/1000
20/1000
646.4/1000
240/1000
2
人类基因组的结构
Human Molecular Genetics (4th Edition) by Tom Strachan and Andrew Read
2017/10/17
• 拷贝数变异Copy number variation (CNVs)
VNTR(可变数目的串联重复)
• 又称为小卫星DNA重复 • 5 -50 个等位基因: 信息量高 • 杂合度: 50-90% • 通常位于基因外
STR(短串联重复 )
• 又称为微卫星标记 • 2-6 bp重复 • 在连锁分析中非常有用 • 又被称为标记“Markers”,由于其在染色体
剂量效应 位置效应 基因断裂 基因融合
基因表达剂量敏感 编码错误蛋白
7
CNV与表型-远端调控的改变
2017/10/17
基因结构Gene Structure
基因 (Gene)
• 位于染色体上由DNA组成的遗传功能单位,由调控序列、转录序 列和/或其它功能序列组成。其产物为蛋白质或RNA分子。
• 遗传信息的载体: DNA/RNA sequences • 功能单元: product (protein or RNA)
LINE-1 和Alu重复广泛存在
5
2017/10/17
遗传变异Genetic Variations
Human Molecular Genetics (4th Edition) by Tom Strachan and Andrew Read
多态性种类
• 小卫星DNA (Minisatellites)或可变数目的串联重复 VNTRs (Variable Numbers of Tandem Repeats)
– ~21,000 蛋白质编码基因 – 至少 6,000 RNA 基因 – 对RNA基因数目有很大的不确定性
3
2017/10/17
核基因组
• 人类基因不均一地分布于染色体上
Constitutive heterochromatin region: gene-poor (green) Euchromatin region: gene-rich (red)
上的位置非常精确可用于标记基因的位置 • 如果基因与标记足够近则会在家系中共同传递
多态性的用途--连锁分析
• 基因定位 • 疾病诊断 • 个体识别 • 亲子鉴定
STR分析-个体识别、亲子鉴定
6
2017/10/17
STR分析-三体性诊断
D18S535
D13S631
D21S1411
D18S386
D13S258 D18S51
减数分裂中染色体行为
➢ 同源染色体(homologous chromosome): 大小、形态结构相同,一条来自父方,一条来自母方 的一对 染色体。
➢ 联会复合体(synaptonemal complex): 同源染色体在相同部位上准确配对的过程称联会 (synapsis)。在联会的过程中,配对的同源染色体 之间形成一种蛋白质的复合结构,称联会复合体。
1 3 3 14 118 10 29 29 26 26 67
27
27 363 74 79
Coding DNA(%)
94 38 17 12 29 6 8.6 31 3 3 8
2.4
2.4 40 2.2 0.6
Average size of exon (bp)
850 150 406 137 77 236 122 487 375 96 201
• 微卫星DNA(Microsatellites )或简单序列重复 SSRs (Simple Sequence Repeats) 或短串联重复 STRs (Short Tandem Repeats)
• 单核苷酸多态性Single Nucleotide Polymorphisms (SNPs) 和限制性片段长度多态性 Restriction Fragment Length Polymorphisms (RFLPs)
204 146 156 609 2928 393 1641 4563 452 2351 3144
928
1480 34350 3433 3685
Size of gene (Kb)
0.9 1.6 7.4 18 31 39 41 45 90 186 189
198
250 283 567 2400
No. of exons
~2 of 12 million fall in such type; typically one or two nonrepeated nucleotides
✓ CCAAGCCTGGAGCTA/GGCCGTGGGCCAGGCAAG
~10% of all nucleotides fall in such palindromic sequences
mutation
ψA
纲要
• 人类基因组总的结构 – 线粒体基因组(mitochondrial genome) – 核基因组(nuclear genome)
• 蛋白质编码基因 • RNA基因 • 高度重复DNA
– 异染色质heterochromatin – 转座子重复transposon repeats
179
227 315 168 180
Average size of intron (bp)
490 3064 1100 190 3076 900 1103 7100 3500 2361
6668
9100 466 7464 30770
Independent Of gene size
dependent Of gene size
纲要
• 人类基因组总的结构 – 线粒体基因组(mitochondrial genome) – 核基因组(nuclear genome)
• 蛋白质编码基因 • RNA基因 • 高度重复DNA
– 异染色质heterochromatin – 转座子重复transposon repeats
基因组总结构
线粒体基因组
SNP(单核苷酸多态性)
• 数目最大的遗传变异,100-300 bp即有一个SNP 总数 ~12 million (http://www.ncbi.nlm.nih.gov/projects/SNP)
✓ GCCTGTTTTATATTAC/TGATCCAATTTTTTCA
✓ GAGACAGAGTTTCGC(T)TCTTGTTGCCCAGGCT
RNA基因
• 过去十年对RNA的认识有革命性的变化 • 基于芯片和高通量转录组测序的结果显示
至少85%的人类基因组都被转录 • 产物是非编码RNA分子的基因有非常广泛
的作用
4
人类基因被广泛转录
RNA功能多样性
2017/10/17
纲要
• 人类基因组总的结构 – 线粒体基因组(mitochondrial genome) – 核基因组(nuclear genome)
减数分裂中染色体行为
两点之间随机互换 非重组体=重组体
两点之间紧密连锁 只有非重组体
两点之间可能连锁 非重组体>重组体
什么是遗传病?
• 由遗传物质改变所导致的疾病统称为遗传病 • 所有遗传病发生都是遗传和环境因素共同作用的结果 • 遗传病与先天性疾病 • 遗传病与家族性疾病
舟
一家四口患地中海贫血
舟
村妇丈夫儿孙三代 相继患怪病 瘫痪
基因的种类
基因
蛋白质编码基因
RNA编码基因 调控序列
结构基因
调控基因 tRNA 基因 rRNA 基因 microRNA
2017/10/17
46
真核基因的结构
一个典型基因的结构
转录起始位点 起始密码子
终止密码子
10 + ~ >10000bp
< 20bp
5’端剪接位点
分枝点
3’端剪接位点
8
启动子 外显子内含子交界处
• 包含 37 基因,紧密排列,没有内 含子 • 24/37非编码RNA基因 • 13/37蛋白质编码基因
核基因组
• 全长3.1 Gb
– ~2.9 Gb 常染色质DNA – ~200 MbFra Baidu bibliotek染色质DNA
• 24 不同的线性DNA分子
核基因组
• 至少包含26,000个基因, 但是基因的确切数 目很难估计
2017/10/17
外显子 & 内含子
• 外显子Exon: DNA编码序列出现于成熟信 使RNA分子中
• 内含子Intron: DNA非编码序列,翻译之前 从成熟信使RNA分子中移除
纲要
• 人类基因组总的结构 – 线粒体基因组(mitochondrial genome) – 核基因组(nuclear genome)
• 蛋白质编码基因 • RNA基因 • 高度重复DNA
– 异染色质heterochromatin – 转座子重复transposon repeats
蛋白质编码基因
• 在基因大小和内部组成都有很大的变异
经典遗传病
基因
基因组
突变
重排
+ 单基因病
基因组病
孟德尔病(Mendelian Disorder)
染色体 异倍体 结构畸变
染色体病
From 张学老师
各类遗传病发病率
种类 染色体病 单基因病 多基因病 体细胞遗传病
25岁之前 发病率 1.8/1000
3.6/1000
46.4/1000
25岁之后 发病率 2/1000