生物信息学研究进展之人类基因组拷贝数变异与复杂疾病
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究人员还确定了染色体中一些基因复制和基因缺失 特别活跃的区域。表明,这些复制和缺失是一把双刃剑, 它能为进化提供多种可供选择的变异,但也很容易导致疾 病。
What makes humans unique?
美国科学家对比研究了人类和其它灵 长类动物的基因组,发现这可能是因为 人类某些基因的拷贝数与其它动物有很 大不同。
这一发现将有助于人们对疾病、寿命 等展开更深入的研究。相关论文发表于 2007年7月31日的Genome Research上。
以前的报道认为,CNVs之所以普遍存在是因为它对人 类的健康和进化有益。
2006 年 研 究 人 员 又 进 行 了 更 高 分 辨 度 的 CNVs 研 究 , 对 270个人的DNA分析发现,平均每人有47个拷贝数变化。而 且,研究人员在2007年对遗传学的先驱克雷格·文特尔的基因 组测序发现有62个拷贝数变化。显然,“所谓的完美基因组并 不是常态” 。
科学家仍在试图破译这些变异,大部分是遗传的,究 竟如何影响身体?
“毛女”朱莉娅-帕斯特罗娜 (1834-1860年)是历史上 最著名的“大胡子女士”。被世界医学界最权威的学术刊 物之一的《柳叶刀》称为一个“诡异的人”。
中国的许震寰被吉尼斯纪录收为 “世界上毛发覆盖最多的人”,全 身 毛 发 覆 盖 率 达 96% ! 他 的 名 字 也 是因为其出生“来自百度文库惊寰宇”而取的。 目前,许震寰是一位摇滚歌星,并 在歌坛小有成就。
典型地,假如一个基因组含有某个基因的三份拷贝, 而不是正常的两份(分别来自父母),那么细胞就会用三 份拷贝都来生产、从而很可能产生超过需要的蛋白质。
但是,这样的基因表达并非总是如此,细胞不管怎样 还是维持正确的量;CNVs对调控另外的基因表达的DNA 区域有影响,使问题更加复杂。
尽管如此,科学家们已经将CNVs和一些复杂的疾病联 系起来。
生物信息学研究进展
拷贝数变异(CNVs)
(1860-1902年)
安妮-琼斯是美国一位长 有大胡子的女子,她是巴尔 努穆杂技团的亮点人物。
成年之后,她成为美国 最著名的“胡须女子”,并 作为杂技团“畸形人”的代 言人。她曾在俄罗斯进行巡 回表演,并以耶稣形象作为 绘画模特。
后期琼斯成为一位音乐家, 1902年,琼斯死于肺结核。
目前研究表明:有大量的DNA片段在拷贝数上有很大 的变异,这些DNA片段的大小从数千到数百碱基不等。这 些CNVs包含拷贝数改变的基因。
例如,那些过去认为 每对染色体上存在2 个拷贝数的基因,现 在发现是1个拷贝,有 时是3个甚至3个以上, 在少数罕见的情况下 这些基因还会一起缺 失。
根 据 CNVs 的 遗 传 和 组 成 形 式将CNVs分为5类: 1、 缺失; 2、扩增; 3、同一位点并发的缺失与
2008年8月的一项研究发现,克罗恩病和IRGM基因 (与对抗侵入性细菌有关)上游区域20,000碱基对的缺 失之间存在相关。
2008年9月的一项研究证实了早先的发现,表明在 22号染色体的一个区域有长度为3百万碱基对缺失的人三 成患有精神疾病,像自闭症和精神分裂症。
2009 年 1 月 另 有 研 究 发 现 , 体 重 指 数 和 一 个 称 为 NEGR1的基因中45,000个碱基对缺失具有很高的相关性, 这个基因影响调节饥饿感和代谢的下丘脑的神经生长。
扩增; 4、多等位基因位点; 5、复杂难以描述的位点。
一般来说,在人类基因组中,扩增比缺失更为常见,而且覆 盖的范围更加广泛,这主要是由于大片段的染色体缺失通常会 造成十分严重的表型后果,甚至可能会导致携带该变异的胎儿 致死,因此很难在进化中保留下来。
1936年美国遗传学家卡尔文·布里奇斯(Calvin Bridges ) 发现遗传了双份的Bar基因的果蝇会发育出非常小的眼睛,他 因此发现了CNVs对性状的影响。
目前,经北京协和医科大学遗传学家张学研究发现,造
成“毛人”现象的原因很可能是DNA染色体的拷贝数变 异。
什么是拷贝数变异?
拷贝数变异(Copy Number Variation,CNV) 是由基因组 发生重排而导致的,一般指长度为1 kb以上的基因组大片段 的拷贝数增加或者减少,主要表现为亚显微水平的缺失和重 复,是基因组结构变异的重要组成部分。
现在更多的分析研究则认为,CNVs之所以持续存在是 因为它在基因组进化中无法被淘汰。
了解CNVs是如何产生,并且知道如何选择作用于它的 方式,有助于我们理解CNVs在基因组进化和人类疾病发生 中的作用。
图:与人类的相比,不同灵长类动 物的特定基因拷贝数有的增加(红 色),有的减少(绿色)。
( 图 片 来 源 : Dumas et al., Genome Research。)
20年后,一个法国研究人员在显微镜下研究人类染色体, 发现CNVs是21-三体综合征的病因:患者多了一份21号染色体。 显然,CNVs是罕见的且往往是疾病的直接原因。
然而在2004年,情况发生了变化。两个研究小组发表了首 个全基因组CNVs图。表明基因数量变异实际上是相当常见的: 两个小组均发现,平均每个人就有约12个拷贝数不平衡。这些 文章出来后,一切都倒了过来。
“毛人”们
现代医学已经证明,“毛 男”“毛女”并不诡异,他们只 是患上了一种叫做“先天性全身 多 毛 症 ” ( congenital generalized hypertrichosis , CGHT),也称“狼人综合症”。
患狼人症的印度三姐妹
CGHT是一种极其罕见的身体机能失调病种,其遗传率 也很高。虽然科学家们并不确定目前世界上有多少这样的 “毛人”,但在中国就至少有30个这样的案例。
也称:拷贝数多态性(copy number polymorphisms, CNPs) 。
人类基因组是由包括60亿个化学碱基(或者称为核苷 酸)的DNA组成的,并被包装到23对染色体中,每对染色 体都是一条来自父代,一条来自母代。这些DNA编码大约 3万个基因。
希尔伯特曲线
首张人类基因组立体结构图
过去通常认为基因在基因组 中是以2个拷贝的形式存在,,,