计算机的计算能力
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键是先要从一个个序列片段中得到这本天书
My god!好 好 多数据啊!! 多数据啊!!
CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCC CGCGCTCCTGCCCTGGGGCCTCGTCTTTCTCCAGGAAAACGTG GACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCT TCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGAT ACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGG CAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCC CTCTGTGAAAGGGCGGGGCATGCAAATTCGAAATGAAAGCCCGG GAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGC GGGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGC GCTGTGGACGAGACAGAGGGAATGGGGCAAGGAGCGAGGCTG GGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGTG ACGGCGGGCGCGAAGGCGAGCGCATCGCTTCTCGGCCTTTTGG CTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGATAC GTCCTCTATCCGAGGACAATATATTAAATGGATTGATCAATCCGCT TCAGCCTCCCGAGTAGCTGGGACTACAGACGGTGCCATCACGCC CAGCTCATTGTTGATTCCCGCCCCCTTGGTAGAGACGGGATTCC GCTATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCC TCCCTCCTGGGCCTGGGCGTGGGCTCGCAAAACGCTGGGATTC CCGGATTACAGGCGGGCGCACCACACCAGGAGCAAACACTTCC GGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCT AATTAAGCATGCCCGGTTTTAAACCTCTTAAAACAACTTTTAAAATT ACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGATAATATTCGA CAAGCTGTTATTGCCAAACTATTTTCCTATTTGTTTCCTAATGGCAT CGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGGCA GATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAGACTAT ACTTTCAGGGATCATTTCTATAGTGTGTTACTAGAGAAGTTTCTCT GAACGTGTAGAGCACCGAAAACCACGAGGAAGAGAGGTAGCGT TTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATT GGGAACCCCACACGCGGTGTAGAAATATATTTTAAGGGCGCG
破译人类遗传密码就要读懂由30 破译人类遗传密码就要读懂由30 亿符号组成的100万页的“天书” 亿符号组成的100万页的“天书” 3*10
9
10,000 books 1 book 100 pages 1 page 3,000 characters
CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGT CTTTCTCCAGGAAAACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCTTCGCCC CCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCC GGCTCCCCCAGGCAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGG GCGGGGCATGCAAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTT CAAAGGCGGGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGCGCTGTGGACGAGACAGA GGGAATGGGGCAAGGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGT GACGGCGGGCGCGAAGGCGAGCGCATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTT CTTATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGATTGATCAATCCGCTTC AGCCTCCCGAGTAGCTGGGACTACAGACGGTGCCATCACGCCCAGCTCATTGTTGATTCCCGCCCCCTT GGTAGAGACGGGATTCCGCTATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCCTCCCTCC TGGGCCTGGGCGTGGGCTCGCAAAACGCTGGGATTCCCGGATTACAGGCGGGCGCACCACACCAGGA GCAAACACTTCCGGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCTAATTAAGCATGC CCGGTTTTAAACCTCTTAAAACAACTTTTAAAATTACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGAT AATATTCGACAAGCTGTTATTGCCAAACTATTTTCCTATTTGTTTCCTAATGGCATCGGAACTAGCGAAAG TTTCTCGCCATCAGTTAAAAGTTTGCGGCAGATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAG ACTATACTTTCAGGGATCATTTCTATAGTGTGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGCACCGAAA ACCACGAGGAAGAGAGGTAGCGTTTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATT GGGAACCCCACACGCGGTGTAGAAATATATTTTAAGGGCGCG (1250 characters)
通过对生物数据的分析可以获得基因序列中所 包含的有机体的大量重要信息
ຫໍສະໝຸດ Baidu
生物信息的海量性
近20 年来,分子生物学发展的一个显著特点是生 物信息的剧烈膨胀,且迅速形成了巨量的生物信息 库。
近年来GenBank中的DNA碱基数目呈指数增加,大约每 14个月增加一倍。到1999年12月其数目已达30亿,它 们来自47000种生物。2000年4月DNA碱基数目是60亿。 2001年初这一数目已达110亿。预计2005年达到300亿。 各种生物的EST序列已达600多万条,其中人类的EST 序列已超过300 万条,估计覆盖人类基因90%以上; UniGene的数目约达7万个;自1999年初单核苷酸多态 性( SNPs SNPs,Single Nucleotide Polymorphisms )数据 库出现以来,到2000年3月20日SNP的总数是26569, 现在已超过350万
计算机的计算能力---计算机的计算能力---以生物信息学为例
信息学院计算机科学与技术系
20世纪三个重大的科技工程: 世纪三个重大的科技工程: 世纪三个重大的科技工程 1.曼哈顿计划(原子弹研制) 2.阿波罗登月计划 3.人类基因组计划(HGP):美英法德日中六国 Human Gene Program的目的:
ccgtacgtacgtagagtgctagtctagtc gtagcgccgtagtcgatcgtgtgggtagt agctgatatgatgcgaggtaggggatag gatagcaacagatgagcggatgctgag tgcagtggcatgcgatgtcgatgatagcg gtaggtagacttcgcgcataaagctgcg cgagatgattgcaaagragttagatgag ctgatgctagaggtcagtgactgatgatc gatgcatgcatggatgatgcagctgatcg atgtagatgcaataagtcgatgatcgatg atgatgctagatgatagctagatgtgatc gatggtaggtaggatggtaggtaaattga tagatgctagatcgtaggtagtagctaga tgcagggataaacacacggaggcgagt gatcggtaccgggctgaggtgttagctaa tgatgagtacgtatgaggcaggatgagt gacccgatgaggctagatgcgatggatg gatcgatgatcgatgcatggtgatgcgat gctagatgatgtgtgtcagtaagtaagcg atgcggctgctgagagcgtaggcccga gaggagagatgtaggaggaaggtttgat ggtagttgtagatgattgtgtagttgtagct gatagtgatgatcgtag …………… ……………………
完成人基因组24条染色体上5万左右基因的作图和30亿碱 基的DNA全序列的测定。 得到以下数据:遗传图、物理图、全序列图。 可定位与疾病有关的基因 新药设计和疫苗制备。
基因中包含了人类的遗传密码;基因测序的完成, 基因中包含了人类的遗传密码;基因测序的完成, 意味着密码已“偷到”, 意味着密码已“偷到 ,可这个密码里写的是什么 呢?
生物信息学 研究热点 计算问题 研究思路
分子生物学是一门信息科学 。。。 -- Leroy Hood, ISB 基因序列中包含着有机体的大量信息
gcgtacgtacgtagagtgctagtctagtcgtagcgccgtagtcgatcgtgtgg gtagtagctgatatgatgcgaggtaggggataggatagcaacagatgagc ggatgctgagtgcagtggcatgcgatgtcgatgatagcggtaggtagacttc gcgcataaagctgcgcgagatgattgcaaagragttagatgagctgatgcta gaggtcagtgactgatgatcgatgcatgcatggatgatgcagctgatcgatgt agatgcaataagtcgatgatcgatgatgatgctagatgatagctagatgtgat cgatggtaggtaggatggtaggtaaattgatagatgctagatcgtaggtagta gctagatgcagggataaacacacggaggcgagtgatcggtaccgggctg aggtgttagctaatgatgagtacgtatgaggcaggatgagtgacccgatga ggctagatgcgatggatggatcgatgatcgatgcatggtgatgcgatgctag atgatgtgtgtcagtaagtaagcgatgcggctgctgagagcgtaggcccga gaggagagatgtaggaggaaggtttgatggtagttgtagatgattgtgtagtt gtagctgatagtgatgatcgtag …….
计算机运算速度: 18个月增长一倍 计算机运算速度: 18个月增长一倍; 个月增长一倍; DNA序列数据 14个月增长一倍 DNA序列数据: 14个月增长一倍; 序列数据: 个月增长一倍;
生物数据库的增长
遍布世界各地研究实验室的高通量大型 测序仪在日夜不停地运转,每天都有成 千上万的数据被源源不断地输入相应的 生物信息库中。同时,由这些原始数据 分析加工而来的蛋白质结构等数据信息 也被世界各地的分子生物学、生物信息 学等学科领域专家输入二级数据库中。