国外生物医学文本语料库分类及特点研究

国内外文摘数据库信息检索综述

国内外文摘数据库信息检索综述1MEDLINE数据库MEDLINE是美国国立医学图书馆（TheU.S.NationalLibraryofMedicine，簡称NLM）最早的书目数据库，其包含生命科学领域，特别是生物医学方面的超过2200万期刊文献的题录及文摘信息。

MEDLINE的一个显著特点是记录了NLM编制的医学主题词表（MeSH）的索引。

MEDLINE是联机的医学文献分析与检索系统（MEDicalLiteratureAnalysisandRetrievalSystem），起源于1964年。

是PubMed的主要部分，部分Entrez在线检索数据库是由美国国家生物技术信息中心（NCBI）来提供的。

1.1数据库介绍起始年限：1946年-至今，还包含一些旧的资源。

来源：大约40种语言5600多种学术期刊的引文及60种语言的旧版期刊，MEDLINE引文由NLM，国际合作伙伴和一些合作组织共同创建。

更新：自2005年起，每天增加2000-4000条完整的题录信息。

更新在11月至12月的几周内暂停主要是因为NLM要将医学主题词表添加进索引中。

学科范围：MEDLINE的主体范围是生物医药与健康，此外还包括生命科学，行为科学，化学、生物工程，公共卫生，临床护理以及植物和动物科学领域。

其中，生命科学覆盖率增加始于2000年。

MEDLINE数据库挂靠在WebofScience平台上，包含各生命科学领域的期刊文章，记录超过1200万条，尤其偏重于生物医学领域。

MEDLINE记录由NLM和协作伙伴创建。

MEDLINE的来源出版物涵盖基本生物学研究和临床科学。

学科类别包括护理学、牙科学、兽医学、药理学、健康相关学科和临床前科学。

MEDLINE还包括对生物医学从业者、研究人员和教育工作者至关重要的生命科学方面的内容，包括生物学、环境科学、海洋生物学、植物和动物科学以及生物物理学和化学的某些方面内容。

从2000年开始，生命科学的涵盖范围得到增加。

西文生物医学数据库使用说明

根据初步检索结果调整关键词，添加同义词、近义词、相关词等，以扩大检索范围。
布尔逻辑运算符应用
逻辑“与”（AND）
用于缩小检索范围，提高查准率，如同时包含两个或多个关键词的文献。
逻辑“或”（OR）
用于扩大检索范围，提高查全率，如包含任意一个关键词的文献。
逻辑“非”（NOT）
用于排除某些不需要的文献，如排除某个作者或某个机构的文献。
拓展了学术视野
通过接触大量的生物医学文献，学员们对学科前沿和热点有了更深入的了解和认识。
增强了科研能力
通过学习和实践，学员们提高了自己的信息获取、分析和利用能力，为今后的科研
工作打下了坚实的基础。
未来发展趋势预测
数据库整合与共享
未来西文生物医学数据库将更加注重资源的整合和共享，打破数据库之间的壁垒，实现资源的互通有无。
开放共享
数据库的开放共享程度将更高，促进学术交流和合作。同时，数据库的安全性和隐私保护也将得到更加重视。
02
检索方法与技巧
关键词选择及优化
01
医学主题词表（MeSH）应用
使用医学主题词表进行关键词规范化和扩展，提高检索准确性和查全率。
关键词类型
02
03
关键词优化
选择具有代表性和专指性的关键词，如疾病名称、药物名称、基因名称等。
截词符与通配符使用
截词符（*）
用于替代词干后的部分字母，以检索具有相同词干的词，如“cancer*”可检索出“cancer”、 “cancers”、“cancerous”等。
通配符（?）
用于替代单词中的任意一个字母，以检索拼写相近的词，如“p?tient”可检索出“patient”、 “potient”等。

语料库的分类

语料库的分类一、介绍语料库是指用于语言学研究的大规模文本数据集合，是自然语言处理（NLP）领域的重要资源之一。

通过对语料库的分类和应用，可以帮助我们更好地理解和分析自然语言现象，提高机器对语言的理解能力和处理效果。

本文将介绍几种常见的语料库分类及其应用。

二、基于文本来源的分类1. 平衡语料库平衡语料库是指从各个领域、不同类型的文本中均匀采样得到的语料库。

这类语料库可以用于构建通用的语言模型，对各种领域的文本进行处理和分析。

2. 领域特定语料库领域特定语料库是指针对某一特定领域的语言样本进行收集和整理的语料库。

比如医学领域的语料库可以用于医学文本的分类、信息抽取和实体识别等任务。

3. 实时语料库实时语料库是指根据实时产生的文本数据构建的语料库，例如社交媒体上的实时文本。

这类语料库可以用于情感分析、事件检测和舆情分析等任务。

三、基于语言类型的分类1. 单语语料库单语语料库是指只包含一种语言的文本数据集合，例如中文语料库、英文语料库等。

这类语料库可以用于机器翻译、语言模型训练等任务。

2. 双语对照语料库双语对照语料库是指包含两种语言的文本数据集合，例如中英文对照语料库。

这类语料库可以用于机器翻译、跨语言信息检索等任务。

3. 多语语料库多语语料库是指包含多种语言的文本数据集合，例如欧洲各国的语料库。

这类语料库可以用于跨语言信息检索、语言联系研究等任务。

四、基于文本属性的分类1. 口语语料库口语语料库是指包含口语化文本的语料库，例如电话对话、社交媒体文本等。

这类语料库可以用于语音识别、对话系统等任务。

2. 书面语语料库书面语语料库是指包含书面语文本的语料库，例如新闻报道、学术论文等。

这类语料库可以用于文本分类、信息抽取等任务。

3. 平行语料库平行语料库是指包含相同内容但使用不同语言表达的文本对，例如中英文平行语料库。

这类语料库可以用于机器翻译、句子对齐等任务。

五、应用领域1. 机器翻译语料库是机器翻译系统的重要训练数据来源，通过对平行语料库的分析和建模，可以提高机器翻译的准确性和流畅度。

浅谈语料库分类及用途

浅谈语料库分类及用途一、语料库的定义在语言学中，语料库是指大量文本的集合。

在语料库语言学中，他们是主要用来进行统计分析与假设检定，在某一领域中，测试语言规律的出现或有效性。

语料库可以是某一单独语种的文本（单语语料库），又或者是多种语言中的文本数据。

二、语料库的分类1.多语种语料库多语种语料（Multilingual corpora）经常经过格式特殊处理进行比对研究，也被称作平行语料库。

它是由大量的平行文本（parallel text）组成。

平行文本通常是几种语言放在一起，有原文有译文，对齐放置。

较为著名的平行文本有洛布古典丛书和克莱梵语丛书。

平行文本不仅仅是两种语言的平行，有时会有多种语言集合。

如圣经研究中，关于圣经的译文可以有多种版本。

较为著名的便是俄利根的《圣经六国译文合璧》，其中为旧约提供了六个版本。

在多語种语料库中，一定要注意多语种语义的平行对齐，这是保障语言学研究的前提条件。

一般情况下，双语平行语料库中，主要有两种类型，翻译语料库（translation corpus）和对比语料库（comparable corpus）。

在翻译语料库中，一种语言的文本会是另外语种语言文本的翻译。

在翻译过程中，翻译人员可以对句子进行拆分、合并、删除、插入或重新排列。

翻译语料库现如今广泛运用于机器翻译中，机器翻译实际属于计算机语言学中的一类，其方法是通过某种程序将一种语言翻译成另外一种语言。

借助语料库，便可以提供大量准确而地道的目标语言文本，从而使计算机可以生成更加复杂的自动翻译，处理更复杂的语言翻译。

在对比语料库中，文本都是同种类型，覆盖同种内容，但是他们并不是互相翻译的关系。

为开发平行语料库，有些文本需以一个短语或句子组成的语块进行匹配。

其中，经常会运用由两种语言语料库组成的平行语块对双语的机器翻译进行训练。

为使语料库能够对语言学研究更能有用，他们通常会运用到注释程序，比如，对演讲的部分内容进行注释或是词性标注。

语料库的分类、创建和检索简述

语料库的分类
语料库的分类
根据不同的标准，语料库可以分为多种类型。常见的语料库类型包括： 1、通用语料库：包含来自不同领域、不同语言的语料，适用于广泛的研究和应用领域。
语料库的分类
2、专业语料库：针对特定领域或专业构建的语料库，例如医学、法律、金融等。
3、口语语料库：包含口头语言材料，如录音、口语表达等。
二、图像分类技术
另外，降维技术也可以用于图像分类。降维技术可以将高维的图像特征降维到低维的空间，从而使得分类更加简单和高效。常用的降维技术有PCA、t-SNE和 autoencoder等。
三、图像语义检索与分类技术的研究现状
三、图像语义检索与分类技术的研究现状
近年来，图像语义检索和分类技术的研究取得了显著的进展。在图像语义检索方面，研究者们提出了多种基于内容、语义相似度和向量空间模型等方法。在图像分类方面，SVM、神经网络和降维技术等算法的应用取得了重要突破。
一、图像语义检索技术
图像语义检索是指通过自然语言描述或者用户提交的查询关键词，从图像库中检索出与查询相关的图像。近年来，研究者们提出了多种图像语义检索的方法。
一、图像语义检索技术
基于内容的图像语义检索是通过分析图像的内容，提取出图像的特征，然后根据这些特征进行检索。例如，可以通过提取图像的颜色、纹理、形状等特征进行检索。另外，还可以利用深度学习技术，如卷积神经网络（CNN）来提取图像的特征，提高检索的准确性。
语料库的创建
此外，为了便于语料库的管理和检索，需要构建语料库的索引和词典。索引可以记录每个单词在语料库中出现的位置和频率，而词典则包含了单词的语义信息和语法信息等。最后，语料库的创建还需要注意保证数据的安全性和隐私保护。

生物信息学数据库的分类和注释要求

KEYWORDS
KEYWORDS (关键词)字段：由该序列的提交者提供，包括
• 该序列的基因产物 • 其它相关信息
SOURCE
SOURCE (数据来源)字段：说明该序列是从什么生物体、什么组织得到的次关键字ORGANISM (种属)：指出该生物体的分类学地位
REFERENCE
REFERENCE(文献)字段：说明该序列中的相关文献，包括
FASTA格式特点：
• 只存储了最少量的信息 • 它将所存储的信息转化为简单的字符串 • 人和计算机对其存储的信息都具有极大的可读性
FASTA格式在许多分子生物学软件包中得到广泛应用。
GenBank数据库—数据库格式(2)
GenBank纯文本文件格式(GenBank flatfile, GBFF): GenBank、EMBL、DDBJ每天都相互同步更新各自的数据库，它们是怎样交换数据的呢？
GenBank数据库结构
GenBank中最常用的是序列文件。序列文件的基本单位：是序列条目，包括核苷酸碱基排列顺序和注释两部分。生物信息资源中心通过计算机网络提供该数据库文件。注释条目：文章的格式
(
Genbank
Genbank 查找页面
D31716
描述部分
CDs are recurring units in polypeptide chains (sequence and structure motifs), the extents of which can be determined
TITLE Cloning and sequence of REV7, a gene whose function is required for
DNA damage-induced mutagenesis in Saccharomyces cerevisiae

第十二讲美国医学文献数据库介绍

版权拥有者
题录提供机构的识别号病史相关与原始记录
其他关键词
提供其他关键词的机构数据提供者机构文章总页数出版商提供数据时间期刊出版国数据库文献编号
2018/10/21
复旦大学图书馆文献检索教研室
25
作为主题词的个人姓名
出版状态文献类型出版模式（纸张或电子）参考文献数已撤回的文献酶或化学物质代码
12
2018/10/21
复旦大学图书馆文献检索教研室
（三） PubMed收录数据

MEDLINE Inprocess
最新的MEDLINE处理中数据，未标引，无MeSH字段。每条记录标有： [PubMed-in process]。

Publisher-Supplied
出版商提供的电子文献题录，每条记录标有:

2018/10/21 复旦大学图书馆文献检索教研室
3
二、 MEDLINE的检索平台

广域网免费平台：

NCBI-PubMed（含非MEDLINE数据）
2018/10/21
复旦大学图书馆文献检索教研室
4
二、 MEDLINE的检索平台

校园网内可用平台（IP控制）：

Ovid SP Web of Knowledge EBSCO OCLC First Search
2018/10/21
复旦大学图书馆文献检索教研室
29
结果显示页右侧Details 显示系统自动匹配转换的检索词
2018/10/21
复旦大学图书馆文献检索教研室
30
三、PubMed 基本检索规则

自动转换匹配检索词：如：hypertension therapy Details: ("hypertension"[MeSH Terms] OR "hypertension"[All Fields]) AND ("therapy"[Subheading] OR "therapy"[All Fields] OR "therapeutics"[MeSH Terms] OR "therapeutics"[All Fields])

英文命名体识别语料

英文命名体识别语料英文命名体识别语料是指用于训练和测试命名实体识别（Named Entity Recognition，简称NER）模型的语料库。

命名实体识别是自然语言处理中的一个重要任务，它旨在从文本中识别出具有特定意义的实体，如人名、地名、机构名等，并将它们分类为预定义的类别。

以下是几个常用的英文命名体识别语料：1. CoNLL 2003语料库：该语料库是命名实体识别领域最常用的语料库之一，由英国语言技术与计算语言学会（Association for Computational Linguistics and Language Technology，简称ACL）主办的CoNLL-2003共享任务提供。

该语料库包含英文新闻文章，其中包含4个命名实体类别：人名、地名、组织机构名和其他实体。

2. OntoNotes语料库：该语料库由美国国家科学基金会（National Science Foundation，简称NSF）资助，由多个机构合作建立。

该语料库包含多种类型的文本，如新闻、广播、采访等，其中包含12个命名实体类别，包括人名、地名、组织机构名、时间、日期等。

3. ACE语料库：该语料库由美国国防部高级研究计划署（Defense Advanced Research Projects Agency，简称DARPA）资助，旨在为情报分析和反恐任务提供命名实体识别和关系抽取的支持。

该语料库包含英文新闻文章，其中包含9个命名实体类别，包括人名、地名、组织机构名、武器、货币等。

4. GENIA语料库：该语料库由日本生物信息学研究所（Institute for Genome Research，简称TIGR）和英国国家物理实验室（National Physical Laboratory，简称NPL）合作建立，旨在为生物医学领域的命名实体识别提供支持。

该语料库包含生物医学文献，其中包含7个命名实体类别，包括基因、蛋白质、细胞类型等。

英文医学数据库检索解析

9
EMTREE
Drug Link Terms
17个药物关联词
Adverse drug reaction Clinical trial Drug administration Drug analysis Drug combination Drug comparison Drug concentration Drug development Drug dose Drug interaction
37
文摘格式：提供期刊信息
38
第三节 SciFinder Scholar
一、概况
Chemical Abstracts（CA，美国《化学文摘》）由美国化学会化学文摘服务社(Chemical Abstracts Service, CAS)编辑出版，是当今世界享有盛誉的大型文摘型检索工具。收录期刊论文、专利文献、技术报告、会议文献、学位论文、专著和视听资料等。
Drug therapy
Drug toxicity Endogenous compound Pharmaceutics Pharmacoeconomics Pharmacokinetics Pharmacology
47个给药途径关联词
Buccal drug administration Epidural drug administration Inhalational drug administration……
第二节 EMBase
一、数据库概述荷兰Elsevier Science 出版社建立的生物医学与药学方面的文摘型数据库，收录来自70个国家的5,000多种期刊，其中欧洲期刊占54%。
1
1.印刷型检索工具
➢ Excerpta Medica ：EM ➢ 按分册出版 ➢ 最早1947年

关于国外英文医学期刊中典型词块研究——基于自建小型语料库的研究

关于国外英文医学期刊中典型词块研究——基于自建小型语料库的研究国外英文医学期刊中典型词块研究—基于自建小型语料库的研究蔡美兰（延边大学外国语学院吉林延吉133002）[摘要] 通过自建小型语料库，研究并分析了国外英文医学期刊中的典型词块。

发现在国外医学期刊论文中名词性词块最多，其次是介词性词块和动词性词块。

分析结果可以对医学英语教学尤其是写作教学提供有益的参考。

[关键词] 医学期刊；词块；医学英语教学一、研究词块的意义词块是近年来的一个研究热点。

词块又称多词序列、复现词组、词簇、预制语块、套语、N 元组等。

词块是指在语料中高频出现的连续词语组合。

各种语言中都存在着大量的词块，以英语为本族语的人能够掌握数以万计的词块，因而中国的英语学习者如果要达到本族语的熟练程度，就必须掌握大量的此类结构。

在心理学、心理语言学、神经语言学和二语习得等研究领域，研究者发现，本族语者能够准确、流利地说出较为复杂的语句，并非因为他们的心理词库中储存了大量孤立的单词，而是因为他们大脑中储存了大量的词块。

在产出话语时，他们从大脑中提取出来的也并非单个的词，而是整块地提取预先存放在大脑中的词块，从而把更多的认知资源用于内容整合、句法加工等方面[1]。

记忆的容量很有限，大概是7个信息单位左右。

这可以是7个词，也可以是7个词块。

以词块作为储存的信息单位，既可以增加记忆的储存容量，也可以减轻记忆的负担。

由于词块是一种现成的并作为整体保存在记忆中的特殊词汇现象，它在即时交际中不必临时组合就可以迅速提取和使用，因而不需要太多的计算资源，也不需要交际者有意识地注意语法结构，可以大大减缓即时交际的压力，从而保证即时交际的流利性。

本文通过自建小型语料库分析了国外英文医学期刊论文中的典型词块。

分析结果可以对医学英语教学尤其是医学英语写作教学提供有益的参考。

二、研究设计1.研究问题国外英文医学期刊论文中，有哪些高频词块？在词块的使用上有什么典型特点？在国外英文医学期刊论文中方法、结果、讨论三部分，词块的使用有什么区别？2.语料来源The New England Journal of Medicine ( ) 2010年全年所有的原创论文（original articles），共计208篇。

pubmed生物医学信息资源及其检索

这两个概念之间是AND的关系

主题检索举例：长春新碱（Vincristine ）治疗白血病（leukemia）的文献
第1步：检索长春新碱/治疗应用
主题检索举例：长春新碱（Vincristine ）治疗白血病（leukemia）的文献
第1步：检索长春新碱/治疗应用
主题检索举例：长春新碱（Vincristine ）治疗白血病（leukemia）的文献
第2步：检索白血病/药物疗法
主题检索举例：长春新碱（Vincristine ）治疗白血病（leukemia）的文献
第2步：检索白血病/药物疗法
主题检索举例：长春新碱（Vincristine ）治疗白血病（leukemia）的文献
第2步：检索白血病/药物疗法
主题检索举例：长春新碱（Vincristine ）治疗白血病（leukemia）的文献
医学信息检索
PubMed主要内容

PubMed概况 PubMed数据来源 PubMed检索机制 PubMed检索运算符 PubMed检索方法结果的显示、保存其他辅助功能
PubMed概况

创建机构：美国国家医学图书馆下设的美国生物技术信息中心(NCBI)

1997年6月开始向全球开放
PubMed检索机制

短语检索(Phrase Searching)

也可称为强迫词组检索，即，如果要将短语作为一个词组进行检索，可用双引号“ ” 将其引起来。如：“drug therapy”作为词组进行检索的词，系统不进行自动转换匹配，也不进行MeSH词的扩检。
PubMed检索运算符

逻辑运算符：
高级检索举例：原文为英文的肝癌治疗方面的综述文献

语料库研究

语料库研究语料库研究引言语料库是语言学研究中的一个重要工具，它包含了大量的实际语言使用数据。

语料库研究可以帮助我们更好地理解语言的构建和使用规律。

本文将介绍语料库的基本概念、类型分类以及在语言学研究中的应用。

一、语料库的概念和分类语料库（corpus）指的是收集了大量的实际语言文本的数据库。

在语料库中，文本被按照一定的方式组织和分析，并且可以通过计算机进行访问和处理。

语料库有不同的分类方式，主要可以分为以下几种：1. 经典语料库：这类语料库在早期语料库研究中非常常见，包括了大量的书籍、报纸和杂志等出版物。

这些语料库的特点是内容丰富多样，反映了一段时间内的语言使用情况。

2. 专门语料库：这类语料库是为特定研究目的而创建的，比如医学语料库、法律语料库等。

专门语料库的特点是包含了特定领域的文本，能够支持对该领域词汇和语言使用特点的研究。

3. 平行语料库：这类语料库一般用于翻译研究中，包含了同一内容的不同语言版本。

平行语料库对于翻译质量评估、翻译记忆等方面的研究有着重要的作用。

4. 多模态语料库：这类语料库包含了不同形式的语言数据，比如文本、图片、音频和视频等。

多模态语料库可以帮助我们研究不同语言形式之间的关系，更全面地理解语言的使用情况。

二、语料库在语言学研究中的应用语料库的出现和应用给语言学研究带来了重要的变革，它为语言学家提供了更多的实证数据，并且可以用来验证理论假设。

以下是语料库在语言学研究中的几个主要应用方向：1. 词汇研究：语料库可以帮助我们更加准确地了解和研究词汇的使用情况。

我们可以通过查看语料库中某个词汇的出现频率、共现关系以及上下文语境等信息，来推断该词汇的含义和用法规律。

2. 句法和语法研究：语料库可以用来验证句法和语法理论的假设。

我们可以通过对语料库中句子结构和语法现象的分析，来验证或者调整句法和语法理论的规则和假设。

3. 语言变异和变化研究：语料库可以帮助我们观察和分析语言的变异和变化。

语料库的分类及其依据

语料库的分类及其依据语料库（corpus）是指用于语言学研究的大规模文本集合。

在自然语言处理（NLP）和机器学习领域，语料库起着重要的作用。

语料库的分类及其依据多种多样，下面将介绍一些常见的分类及其依据。

1. 根据语料库的来源分类语料库可以根据其来源进行分类。

常见的来源包括书面语料库、口语语料库、网络语料库等。

书面语料库是指搜集和整理的书面文本，如报纸、杂志、书籍等。

口语语料库则是指口头语言的记录，如录音、对话等。

网络语料库则是指从互联网上搜集和整理的文本，如网页、论坛帖子等。

根据来源的不同，语料库的特点和应用也会有所差异。

2. 根据语料库的用途分类语料库可以根据其用途进行分类。

常见的用途包括语言学研究、机器翻译、情感分析等。

语言学研究是指利用语料库来探索语言的结构、规律和演化等。

机器翻译是指利用语料库来训练机器翻译模型，实现自动翻译的任务。

情感分析则是指利用语料库来分析文本中的情感倾向，如判断一篇文章是正面还是负面情感。

3. 根据语料库的语言分类语料库可以根据所涉及的语言进行分类。

常见的语言包括英语、中文、法语等。

根据不同的语言，语料库的建立和应用也会有所差异。

例如，对于英语语料库，可以用于英语教学、英语学习者语言分析等方面。

4. 根据语料库的领域分类语料库可以根据所涉及的领域进行分类。

常见的领域包括新闻、医学、法律等。

根据不同的领域，语料库中的文本内容也会有所差异。

例如，医学语料库中的文本主要涉及医学知识和术语，可以用于医学研究和医学文本自动化处理等方面。

5. 根据语料库的规模分类语料库可以根据其规模进行分类。

常见的规模包括小型语料库、中型语料库、大型语料库等。

根据语料库的规模不同，可以应用于不同的研究需求和任务。

大型语料库通常包含数百万或数十亿个文本，可以用于训练深度学习模型和进行大规模文本分析。

总结起来，语料库的分类及其依据包括来源、用途、语言、领域和规模等方面。

不同的分类方式适用于不同的应用场景和研究需求。

外文医学数据库

收录范围：来源于美国和世界上70多个国家和地区、50种语言的7395种权威生物医学及相关学科期刊，内容涉及生物医学各个领域；85%以上原文为英语，80%记录有文摘，5%免费全文。目前记录已达约2200万条，约40万篇/年。回溯时间：1966年至今。记录中有[indexed for MEDLIEN]标记
Mesh界面
Go
kidney transplantation
点击MeSH Database
输入检索词
第二步：
选定该主题词
点击该主题词
主题词轮排表
主题词细节屏
他克莫司
第三步：
主题词细节屏（主题词词义注释、副主题词、
加权或不扩展、入口词、曾用词、树状结构）选择合适的副主题词选择加权或不扩展 send to
期刊检索
专用检索
Pubmed 主页界面/pubmed/
基本检索输入框高级检索检索限制常用工具使用帮助
个人空间
其他资源：
检索运算符
1、逻辑运算符：OR、AND、NOT 运算顺序：OR<AND<NOT，可用（）改变检索词的处理顺序。 2、截词符：* eg: cell*：cell、cells、celliferous、cellophane和cellular等词的文献。 3、利用字段标识符进行限定检索：检索式格式：检索词A[字段标识B]，检索在字段中含有检索词A的文献。如： hepatitis[TI]，smith [AU] 。 4、“ ”，将短语做为不可分割的整体进行检索。如：“OXYGEN FREE RADICALS ” 注意： [ ]和“ ”必须为英文或中文半角。
标记。
Collect
Process
出版商提供的书目信息

第一讲医学中外文献数据库介绍 2

INTERNET 时代的文献获取
刘兴荣教授
兰州大学公共卫生学院
INTERNET时代的文献检索
1
2 3
引言——文献检索与数据库
重要中文全文数据库
重要外文全文数据库
4
兰州大学公共卫生学院
引言
文献类型（按内容性质分）：一次文献 Primary literature 也称原始文献，一般指以知识的直接生产者记录
技能和经验。
兰州大学公共卫生学院
引言
要掌握一定的网上信息检索方法要选择适当的检索起点 ,以确保其中检索出来的信
息的质量和权威性
要熟悉网上重要的医学信息资源
兰州大学公共卫生学院
引言
数据库定义：计算机信息检索系统中的数据库是指一定专业范围内的信息记录及其索引的集合体，是计算机信息检索系统的重要组成部分，是信息
引言
文献类型（按出版形式分）：图书 Books 期刊 Journal、Periodicals、Magazine
特种文献 Special literature
专利文献、会议录、科技报告、政府出版物、学位论文、标准文献、技术档案、产品资料
兰州大学公共卫生学院
引言
Internet 上的资源具有数量庞大、内容丰富、形式多样、高度分散等特点，因此想及时、准确、全面地获取自己所需的医药学信息应具有一定的
兰州大学公共卫生学院
引言
文摘索引型数据库（Abstracts & Indexs） 8、CANCER 《肿瘤综合信息数据库》1989 9、CANCERLIT 《肿瘤文献数据库》1996 10、AIDSLINE 《艾滋病文献数据库》1980 11、IPA《国际药学文摘》1970 12、Drug Information F据库》1966 14、Inpharma Database 《新药信息全》 1996-

第七节-pubmed剖析.

4. 是NCBI的生物医学信息检索系统Entrez 的一个组成部分。
2019/1/15
7
5.PubMed的数据构成
（1）MEDLINE数据:Pubmed数据的主体部分 [PubMed-index for medline] （2）PreMEDLINE ：NLM正在加工、评审和标引的数据 [PubMed-in process] （3）Publisher Supplied Citations: 出版商直接提供、超出MEDLINE收录范围的数据
14
2. 高级检索（Advanced Search）
（1）构建检索式（Search Builder）
（2）检索历史（Search History）
15
（2）检索历史（Search History）
检索历史的回顾
逻辑组合检索表达式，删除检索式，查看
Details，获将检索式保存到My NCBI。
常用外文医学文献数据库
书目型
数据库
MEDLINE（PubMed/OVID）
ScienceDirect（部分免费）
全文型
MEDLINE With Full text@Ebscohost SpringerLink（部分免费，医学及生物类15万篇） OVID full-text database
1
数据库
No Mapping
作者姓名书写格式
西方人姓名书写格式：first name、Middle Name、last name（名＋姓）美国总统名为： John Frank Kenedy Kenedy为 last name、surname （姓） Frank为 middle name John为first name （名）输入格式：姓在前用全称，名在后取首字母，中间留空格例： Kenedy JF 或 Kenedy J Zhong NS

生物医学文献数据库

PubMed基本检索
bacter*[TI]
截词检索可以扩大检索范围提高查全率。
PubMed基本检索
字段限制检索
采用字段限制方式进行检索，其规则是：检索词1[字段标识] 逻辑运算符检索词2[字段标识] 如：查找作者为crick在1993年发表的有关DNA方面的文献. 检索式： crick[au] AND 1993[dp] AND DNA
需要注意的是：限制了出版物类型、年龄、人或动物、性别中的任何一项，检索将只在
Medline中进行检索（因为这些特征限制只有Medline中才有）。
认识PubMed——让它融入您的科研
PubMed高级检索
认识PubMed——让它融入您的科研
PubMed高级检索
出版物类型选择
人或动物实验选择
性别选择
PubMed基本检索
强制检索
"single cell"
普通检索
single cell
PubMed基本检索
PubMed基本检索演示
检索课题一
维生素C对于普通感冒的防治作用
1．明确所要检索的内容。先分析这一问题中的关键词语，主要由"维生素C"，和"普通感冒"构成。即"VITAMIN C"和"COMMON COLD"。 2．分析所要检索的两个相关词语的关系。根据我们的日常生活经验，可以将两个关键词之间的关系定义为 “AND”, 在检索框内键入“VITAMIN C” AND COMMON COLD
PubMed基本检索强制检索功能
PubMed允许使用双引号来强制系统进行短语检索。如：在PubMed主页的检索提问框中键入“single cell”，并用双引号引起来。点击“GO”按钮，系统会将其作为一个不可分割的词组在数据库的全部字段中进行检索。如果不使用双引号进行强制检索，系统就会将其分成2个词： single和cell检索，其检索表达式为：single AND cell. 很明显这样的检索结果是不符号要求的。

中文生物医学文献信息检索

上一页下一页
上一页下一页
2、主题词检索
点击 “主题检索”按钮，即进入主题检索页面。选择“ 中文主题词 ”或“英文主题词”检索入口，键入检索词，点击“查找”按钮。在主题词轮排表中，浏览选择主题词。在主题词注释表中，浏览主题词注释信息和树形表，选择是否扩展检索、加权检索，以及副主题词和副主题词扩展检索选项，点上一页下一页击“主题检索”按钮。
(医情所会议、汇编内部编码) (国内期刊代码)
上一页下一页
ID 资助编号 IS ISSN JC 内部代码 LA 语种 MA 会议地点 MH 主题词 (MMH) MMH NI 团体著者 PA 分册 PG 页码 IP 期 PP 出版地
(国际期刊代码) (医情所期刊内部代码) (缺省值为中文)
(主要概念主题词)
3、分类检索
点击 “分类检索”按钮，即进入分类检索页面。选择检索入口“类名”或“分类号”, 输入检索词，点“查找”按钮。进入在分类表列表选择合适的类名。选择在分类检索页面选择扩展检索、复分组配检索，点“分类检索”按钮。
4、期刊检索
点击 “期刊检索”按钮，即进入期刊检索页面。选择检索入口“刊名”、“出版单位”、“出版地” 或“期刊主题词”，输入检索词，点“查找”按钮。从含有该检索词的期刊列表中选择合适的期刊名。设置年代及刊期（默认为全部），选择期刊刊名或期刊代码检索，屏幕下方还提供该刊的基本信息。点击“期刊检索”按钮。
上一页下一页
上一页
下一页
上一页下一页
上一页
下一页
上一页下一页
上一页下一页
三、中国学术期刊数据库
1、数据库简介由清华大学主办，《中国学术期刊》电子杂志社编辑出版。收录1979年至今的7400余种核心与专业特色期刊全文，至2005年10月止，累积全文1550多万篇。分为理工A（数理科学）、理工B（化学化工能源与材料）、理工C（工业技术）、农业、医药卫生、文史哲、经济政治与法律、教育与社会科学综合、电子技术与信息科学9大专辑，126个专题数据库，网上数据每日更新。