找一个基因的启动子
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、UCSC
(1)网址:/cgi-bin/hgNear
在Genome里选择物种,比如human,search里输入你的基因名PTEN,点击Go
(2)出现新的页面,看到“Known Gene Names”下面的PTEN了吧,点它
(3)又回到了和(1)类似的页面,此时,点击sequence
(4)出现一个新的页面,选中promoter,同时可以输入数值修改具体的序列区域,比如Promoter including 2000 bases upstream and 100 downstream,即表示启动子-2000~+100区域
(5)点击“get sequence”,出现页面中最上面的序列“>uc001kfb.1 (promoter 2000 100) PTEN - phosphatase and tensin homolog”就是你要的人PTEN启动子-2000~+100区域的序列了
2、Ensembl
(1)网址:/index.html
在“Search Ensembl“标题下search后的下拉框中选中物种名homo sapiens(人),for框中输入基因名PTEN,点击Go
(2)出现的新页面中比较乱,但不要管它,直接寻找“Ensembl protein coding gene ”字样的,对,也就是第二个,点击它
(3)新出现的页面也很乱,不过依然不用管它,看到左侧有点肉色(实在不知道怎么描述了)的那些选项了吗,对,就是“Your Ensembl”下面那一堆,在里面找“Genomic sequence”,点它
(4)现在的界面就一目了然了,在“5' Flanking sequence”中输入数值确定启动子长度(默认为600),比如1000,点击update;
(5)出现的序列中,标为红色的就是基因的外显子,红色之间黑色的序列就是内含子,而第一个红色自然就是第一外显子了,那么从开始的碱基一直到第一个红色的碱基间自然就是启动子-1000~+1的序列啦
这样,你不仅查到了启动子,连它的外显子、内含子序列也全部搞定了
我以前回的贴,总结一下
共享】如何查找一个基因的启动子序列[BCL-2为例]
定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。
区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。
screen.width-333)this.width=screen.width-333" width=461 height=144 title="Click to view full EukPromoter.gif (461 X 144)" border=0 align=absmiddle>
下面以BCL-2基因为例,查找查找该基因的启动子区域,首先要找到该基因的基因组序列。去NCBI吧,在Search的下拉菜单里找到Gene,在检索项里输入Bcl-2,检索第一项就是bcl-2 for human,点进去看看啥样。。。
(缩略图,点击图片链接看原图)
首先你可以看到该基因的参考序列(reference sequence),然后看到bcl-2的位置和基因组背景。bcl-2上游是PHLPP,下游是FVT1基因。在这个长长的网页的最后是已经注册的Bcl-2基因的信息。
(缩略图,点击图片链接看原图)
看到基因组序列了么,点进去,根据序列信息自己就能定位转录起始位点,上游就是promoter 了,简单吧。不!我觉得麻烦。有更简单的方法么?有!注意到在网页的开头有这么个链接么?HGNC:990
(缩略图,点击图片链接看原图)
点进去,看看吧。原来是BCL-2的symbol report,各种各样的连接。注意到左下角的Ensembl GeneView 了么,很有用的,点击。
(缩略图,点击图片链接看原图)
呵呵,原来到了Ensemble了,是Ensemble的report。列出了一堆令人兴奋的信息,太全了,只要是和这个基因相关的信息都能找到,包括SNP,Isoforms,等等等。我们感兴趣的是,这个连接“View genomic sequence for this gene with exons highlighted”
(缩略图,点击图片链接看原图)
点击,看看,原来是bcl-2的基因组结构,红底色碱基是exon,绿底色碱基是SNP,太牛了。别光高兴,忘了找promoter,默认的这个report只是显示bcl-2,上游600bp,下游600bp。想想,短了一点。怎么样让5'端多显示几百个碱基呢?秘密在这里。。。
(缩略图,点击图片链接看原图)
把“5' Flanking sequence”的值改成5000bp,哼!小样!!不行?10000,20000,。。。,靠,上一个基因的exon都露出来,算了吧(最大值99999)。
如果保守估计可以做起始位点上游2000bp内的区域,如果最大化估计,可以用起始位点上游至上有基因的最后一个exon结尾处,算你狠!!!
screen.width-333)this.width=screen.width-333" width=457 height=220 title="Click to view full bcl-2-7.jpg (457 X 220)" border=0 align=absmiddle>
然后就分析吧,先到MA TCH分析一下转录因子结合位点