NCBI数据库检索
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Financial
Int’l Legal & Regulatory
Tax & Accounting
Scientific
Healthcare
11,500 Employees
9,900 Employees
4,400 Employees
3,100 Employees
2,600 Employees
2,800 Employees
supplied by publisher]的标记
。
以下是几条PubMed的记录,标记不同,其出自的分库也不同
图1
三、PubMed文献检索
PubMed页面的结构
PubMed Central页面的结构
三、PubMed页面的结构 执行检索
基本检索输入框
侧栏提供其他检索如 期刊数据库检索、规 范词数据库检索、特 定文献检索
Taxonomy:微生物类别数据库
OMIM:人类孟德尔遗传学在线数据库。
一. Nucleotide(GenBank)
该数据库由国际核苷酸序列数据库成 员美国国立卫生研究院 GenBank 、日本 DNA 数据库 (DDBJ) 和英国 Hinxton Hall 的 欧洲分子生物学实验室数据库(EMBL)三 部分数据组成。
[PubMed--Indexed for MEDLINE] 标志。
MEDLINE
PreM edline
PreMedline:收集未正式给予MeSH词、
出版类型等深度标引信息的一个临时库。 NLM 每天把最新记录加入到 PreMedline
库 中 , 每 条 记 录 均 带 有 [PubMed--in
三、PubMed页面的结构 执行检索
基本检索输入框
侧栏提供其他检索如 期刊数据库检索、规 范词数据库检索、特 定文献检索
•Related Resources :
MeSH Database-主题词数据库 •Journal Database-杂志数据库 •Clinical Trials-对公众提供临床科研的当前信息
Process] 标志。工作人员在一周内将这
些记录标引,然后转入 MEDLINE ,同时
从PreMedline中删去。
New Data
PubMed
Collect
Pre-Medline
Process
Medline
PubMed
出版商提供的书目信息:出版商
提供的是整本期刊的信息,若有
部分没有被MEDLINE收录,PubMed 仍保存,在记录中做[PubMed--as
Library of
Medicine)
NIH是美国国立卫生研究院
(National Institutes of
Health)
NCBI中通过Entrez可互查的数据库
NCBI数据库
Nucleotide:DNA序列数据库
Protein:蛋白质序列数据库 Genome:基因组序列数据库 Structure:分子结构模型数据库 Popset:种群、种系发生或突变序列数据库
即生物学门类数据库,可以按
生物学门类进行检索或浏览其核苷 酸序列、蛋白质序列、结构等。
五. PopSet
包含研究一个人群、一个种系发生 或描述人群变化的一组组联合序列。
PopSet既包含核酸序列数据又包含蛋白
质序列数据。
六. OMIM
孟德尔遗传学(OMIM)数据库是人类 基因和基因疾病的目录数据库。该数据 库包括原文信息、图片和参考信息,同 时还可以链接到Entrez系统MEDLINE数
BIOSIS 与 MEDLINE的覆盖范围
MEDLINE 2919 独有 2043 shared BIOSIS 3071 BIOSIS (Biosciences Information Service, 美国生物科学信息服务社)
MEDLINE:联机医学 文献分析和检索系统
North American Legal
六、检索结果的保存 1
六、检索结果的保存 2
文章数目
七、检索结果的链接(Links)
链接(Links) 链接外部资源——LinkOut
LinkOut 是链接到本站点外部信息的出口。可以与出版商
、信息集成者、图书馆、生物学数据库、序列中心等链接 来获取更多的相关信息。
链接带星号的LinkOut 是表明提供者需要订阅、会员资格
National Center of Biotechnology Information
NCBI简介
http://www.ncbi.nlm.nih.gov
NCBI就是美国国家生物技术信息中心(National
Center of Biotechnology Information)
NLM是美国国家医学图书馆(National
•PubMed Tools:
Citation Matcher-引文匹配器 在表格输入刊物的 引文信息来定位特定文章。 Clinical Queries-与临床相关的疗法,诊断,病因, 预后咨询。
四、PubMed的基本检索功能
1、词语检索及自动词语匹配
四、PubMed的基本检索功能(二)
2、作者姓名检索
或需要交费进入。 链接相关图书——Books
为帮助用户解决对检索结果中不熟悉的要领提供背景资料
文摘中的期刊图标链接
Linkout链接
三大基因数据库
Genbank Genbank库包含ห้องสมุดไป่ตู้所有已知的核酸序列和蛋白质序列。它是由 美国国立生物技术信息中心(NCBI)建立和维护的。
NCBI的网址是:http://www.ncbi.nlm.nih.gov。
来,即强迫PubMed进行词组检索。如“single cell”。
当用双引号括起词语时,PubMed将不执行自动词语匹配
功能。
五、显示检索结果(Display):
text1
Summary——作者姓名、文章题目、出处、记录状态、 语种、出版物类型、PMID。
Abstract——出处、记录状态、文章题目、作者姓名、 作者单位、文摘、出版物类型、缩写、注释、PMID等。
9
10
file BJAS0701.sqn:
file BJGPAT0701.sqn
BJAS0701
BJGPAT0701
EU049887
EU049888
举例:序列数据的查询
某天,Prof.
Gene发现人的Hela细胞中,有丝分裂 期间有异常情况:细胞不再分裂,而是开始凋亡( 表型,phenotype),通过实验的方法,发现了与有 丝分裂期间某个蛋白可能相互作用的一个基因, 测序结果如下(genotype):
据库中相关文献和序列信息。
一、PubMed数据库简介
PubMed 是美国国家医学图书馆 (NLM)下属的国家
生物技术信息中心 (NCBI) 开发的、基于 WWW 的医
学数据库查询系统。
PubMed的网址:
http://www.ncbi.nlm.nih.gov/pubmed
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi
2005 营业收入 87亿美元 为全球2千万用户提供服务 市值260亿美元,福布斯全球500强之一
二、通过PubMed可检索 到如下的信息
MEDLINE
PreMedline
出版商提供的书目信息
MEDLINE:是美国国立医学图书馆
MEDLARS系统中最大的生物医学数 据库,收录1966年以来70多个国家近 4300种生物医学期刊的书目信息和著 者文摘,每周更新。每条记录均带有
在检索框内按照姓+名缩写(不用标点)的 格式键入作者姓名,如Liu C,系统会自动 在作者字段内进行检索。
如果想进行更精确的检索,可以用双引 号 将 作 者 名 引 起 来 , 再 加 [au] , 如 “ Liu C”[au]
四、PubMed的基本检索功能(三)
3、杂志名检索
在检索框中键入杂志全名molecular biology of the cell 也可以直接键入Medline的期刊标准缩写形式,如 :mol boil cell, 键入刊物的ISSN(国际标准出版物代码)进行检 索,如1059-1524。
每页显示数目
显示格式 符合条件的记录 数
mRNA数量
不同物种记录数
在线获取序列方法 2
显示格式 符合条件的记录 数
mRNA数量 不同物种记录数
在线获取序列 方法3
Accession number
序列长度 数据类型
Definition: 标题
物种名称
GI number
基因名称 编码蛋白名称
三大基因数据库之间的关系
GenBank
EMBL Data Library
Public free Available via Internet
DDBJ (DNA Data Bank of Japan)
在线获取序列( entrez)方法1
1.进入entrez
3.查询关键词 2.选择数据库 4.开始查询
CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGA ACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGA GGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGT GTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCC ATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGA AGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTGGACAGAGAAAG AGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAG GAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGA TTGAGGCCTCTGGC
GenBank数据格式
该序列发表在哪篇论文中
基因序列提交Genbank
方法 1 在线提交
基因序列提交Genbank
方法 2 Sequin软件提交
共克隆、测序了北京油鸡风味特性基因43个,五指山小 型猪3个,虎源犬瘟热病毒基因4个,提交GenBank 50个。
序列 1 2 3 4 5 6 7 8 文件名 file BJIFNA0701.sqn file BJcCRABP.sqn file BJIL-18.sqn file BJPurh0701.sqn: file BJmusclin0701.sqn file BJTBP0701.sqn file BJIL-15.sqn file BJADSL0701.sqn: 提交编号 DBJASL0701 BJcCRABP-I0701 BJIL-180701 BJPurH0701 BJmusclin0701 BJTBP0701 BJIL-150701 BJADSL0701 收录号 EU334503 EU334504 EU334505 EU334506 EU334507 EU334508 EU334509 EU049886
PubMed
数据类型:期刊论文、综述、以及
与其他数据资源链接。
特点:
1.免费提供题录和文摘
2.可与提供原文的网址链接 (部分免费获取) 3. 操作简便、快捷
期刊来源地理分布
北美 (31%)
ASIAN, Australia (14%) 中南美洲 (2%) 非洲 (1%) 欧洲和中东 (52%)
四、PubMed的基本检索功能(五)
5、短语检索
PubMed 首先将键入的检索词(词组)视为合理的短语在
短语索引中进行查找。如: single cell ,PubMed将其视为 词组进行查找。当 PubMed 没有找到该词组时,系统将自 动把两个词分开进行检索;
如果不希望系统将两词分开,则需要用“”把检索词括起
EMBL核酸序列数据库 由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成。
数据库网址是:http://www.ebi.ac.uk/embl/。
DDBJ数据库 日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库。 DDBJ的网址是:http://www.ddbj.nig.ac.jp/。
二 . Genome
即基因组数据库,提供了多种
基因组、完全染色体、临近序列图 谱以及一体化基因物理图谱。
三. Structures
即结构数据库或称分子模型数据
库( MMDB ),包含来自 X 线晶体学
和三维结构的实验数据。 MMDB 的数
据从PDB(Protein Data Bank)获得。
四. Taxonomy
Cell transplantation [ta]
四、PubMed的基本检索功能(四)
4、截词检索
可利用系统的截词功能获取更多的相关文献
,截词符“*”可代表多个字符,将*加在检 索词后可以表示对所有以该词开头的词进行 检 索 ; 如 : bacter* , 可 以 检 出 bacter, bacteria, bacterium, bacteriophage等词。