数据库检索方式
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5)PQDD W/n (两词间距小于n个单词,且前后位置任意), Pre/n (两词间距小于n个单词,且前后位置一定) 6)ProQuest W/n(表示连接两个词之间可以插入n个词 ,前后位 置可颠倒) 如:Education w/5 intenet 表示education和internet 之间可以插入5个词 ,并且前后位置可以颠倒。
检索中计算机会将所有含有相同部分 标识的记录全部检索出来。
常用“?”、“*”符号表示。
(1)有限截词。
即在检索词后后截几个有限的字母,如名词的 单复数,动词的词尾变化等。
如输入computer??表示有0-1个字母变化,可检出computer和 computers. 输入stud???表示截断处有0-3个字母变化,可检出 study,studies,studied,studing.
(4) 同句检索A(S)B,S是sentence的缩写。
特点:A、B出现在同一自然句中(子字段),其 词序与词量不受限制。
如:electric (S)plant可检出electric power plants 如:EI中的NEAR;PQDD中的W/n (两词间ห้องสมุดไป่ตู้小于n 个单词,且前后位置任意),Pre/n (两词间距小于n 个单词,且前后位置一定)
如:输入wom?n可检出woman,women
各种算符在数据库中的实际应用位置算符 1)EINEARBridge NEAR Piling*表示这两个词要彼此接近,前后顺序不限。
W/n Pig*W/2pine*表示两个词的距离不能超过n个单词 Adj Channel adj tunnel表示含有这两个词,两个词相邻, 位置一定 2)ISI Proceedings 用同句算符(SAME):如Channel same tunnel,表示channel 和tunnel 出现在同一句子中才 符合检索条件。
1布尔逻辑检索(Boolean Logic Retrieval) 逻辑检索的基础是逻辑运算,逻辑运算中最常用的 是布尔逻辑运算符(Boolean Logic Operators),即与、 或、非三种运算符号,用它们可以表示概念之间的逻辑 关系。
检 索 要 逻辑检 求 索 概念相 交、限 定 AND与 *课题表达式检 索 结 果计算机用于制图AB概念平 行、并 列某一主题去 掉一部分相 关主题OR 或+土地管理与土地利用 A BNOT非 -除光电测距以外的 A 电磁波测距 BA AND B 缩小检 A*B 索范围 提高查 准率 A OR B 扩大检 索范围 A+B 提高查 全率 B NOT A 提高查 准率 B-A
nN词序不限,中间可插入N 个词。
如:econom?? (2N)recovery可能检出economic recovery,recovery of the economy,
(3)同字段检索A(F)B,F是field的缩写。
特点:A、B两词必须出现在同一字段中,词序与 词量不限。
如:environment (F)impact/DE,表示两个词必须 同时出现在叙词字段内。
Pre/n(表示前后两词之间最多插入n个词,前后位 置一定 ) 如:U.S pre/n economic policy可检出U.S aideconomic policy,or U.S wartime economic policy 。
3)CSA: within "X“ 表示两词之间不得多于x个词,前后位置任意 如“women within 8 movement” (顺序不定) 4)Elsevier:ADJ表示两词相邻,前后顺序固定,与"词检 索"的结果相同;NEAR或NEAR(N),表 示两词相邻,中间可插入少于或等于n个单 词,前后顺序可以发生变化,如果不使用 (N),系统默认值为10
数据库检索方式
第四章计算机信息检索的 基本技术与方法
一、计算机信息检索的基本技术: 布尔逻辑、截词检索、加权检索,位置算符等。
在进行计算机检索时,有时有一些比较复杂的课题, 如:“GPS在建筑中的应用”,既涉及GPS,又涉及 建筑,还有“应用”,这时候就要编制出满足要求的计 算机检索式,它是机检的基础。
(2)无限截断:在检索词后加一个“?“,表 示该词后可加任意个字符。
使用无限截词,所截 词根不能太短,否则会输出许多无关文献,造成 误检。
如:computer?可检出 computers,computering,computered,compu terization. (3)中间截断:在检索词中间加一个或几个? 号,主要解决一些英美拼写不同,单复数形式的 不同的词的输入,可简化输入。
2 位置算符(Proximity Operators) 位置算符是表示检索词之间位置关系的一种运 算符。
由于英文对一句话有多种表达方法,写法可 能不同。
如:“GPS在铁路桥研究中的应用”这个 课题,用英文表达可能是“Using of GPS in Railway Bridge”, 也可能是“Using of GPS in Bridge of Railway”,因而可能编制出这样的检索 式,GPS AND (Railway (2N)Bridge) 我们可以通过位置检索提高检索的准确率
3截词算符(Truncating operators)原因:在英语词汇中,一个词可能有多种形态,如词的单、复 数形式的不同,英美拼写方法不同、词性不同等。
如果检索时将 这类词全部输入进去,会增加检索时间和费用,采用截词法可解 决这一问题。
所谓截词检索,是指在检索标识中保留相同的部分,用相应 的截词符代替可变化部分。
(1) (W)算符与(nW)算符 W 是word与 with的缩写。
特点:W词序不变,中间不可插词,但两词间可有 一个标点,连字符或空格。
nW词序不变,中间可插入N 个词。
如:potential (w) energy可能检出potential energy and function 又如:gone (2w)wind 可能检出gone with the wind (2) (N)与(nN)算符 N是near的缩写 特点:N词序不限,中间不可插词,但两词间可有一 个标点,连字符或空格。
检索中计算机会将所有含有相同部分 标识的记录全部检索出来。
常用“?”、“*”符号表示。
(1)有限截词。
即在检索词后后截几个有限的字母,如名词的 单复数,动词的词尾变化等。
如输入computer??表示有0-1个字母变化,可检出computer和 computers. 输入stud???表示截断处有0-3个字母变化,可检出 study,studies,studied,studing.
(4) 同句检索A(S)B,S是sentence的缩写。
特点:A、B出现在同一自然句中(子字段),其 词序与词量不受限制。
如:electric (S)plant可检出electric power plants 如:EI中的NEAR;PQDD中的W/n (两词间ห้องสมุดไป่ตู้小于n 个单词,且前后位置任意),Pre/n (两词间距小于n 个单词,且前后位置一定)
如:输入wom?n可检出woman,women
各种算符在数据库中的实际应用位置算符 1)EINEARBridge NEAR Piling*表示这两个词要彼此接近,前后顺序不限。
W/n Pig*W/2pine*表示两个词的距离不能超过n个单词 Adj Channel adj tunnel表示含有这两个词,两个词相邻, 位置一定 2)ISI Proceedings 用同句算符(SAME):如Channel same tunnel,表示channel 和tunnel 出现在同一句子中才 符合检索条件。
1布尔逻辑检索(Boolean Logic Retrieval) 逻辑检索的基础是逻辑运算,逻辑运算中最常用的 是布尔逻辑运算符(Boolean Logic Operators),即与、 或、非三种运算符号,用它们可以表示概念之间的逻辑 关系。
检 索 要 逻辑检 求 索 概念相 交、限 定 AND与 *课题表达式检 索 结 果计算机用于制图AB概念平 行、并 列某一主题去 掉一部分相 关主题OR 或+土地管理与土地利用 A BNOT非 -除光电测距以外的 A 电磁波测距 BA AND B 缩小检 A*B 索范围 提高查 准率 A OR B 扩大检 索范围 A+B 提高查 全率 B NOT A 提高查 准率 B-A
nN词序不限,中间可插入N 个词。
如:econom?? (2N)recovery可能检出economic recovery,recovery of the economy,
(3)同字段检索A(F)B,F是field的缩写。
特点:A、B两词必须出现在同一字段中,词序与 词量不限。
如:environment (F)impact/DE,表示两个词必须 同时出现在叙词字段内。
Pre/n(表示前后两词之间最多插入n个词,前后位 置一定 ) 如:U.S pre/n economic policy可检出U.S aideconomic policy,or U.S wartime economic policy 。
3)CSA: within "X“ 表示两词之间不得多于x个词,前后位置任意 如“women within 8 movement” (顺序不定) 4)Elsevier:ADJ表示两词相邻,前后顺序固定,与"词检 索"的结果相同;NEAR或NEAR(N),表 示两词相邻,中间可插入少于或等于n个单 词,前后顺序可以发生变化,如果不使用 (N),系统默认值为10
数据库检索方式
第四章计算机信息检索的 基本技术与方法
一、计算机信息检索的基本技术: 布尔逻辑、截词检索、加权检索,位置算符等。
在进行计算机检索时,有时有一些比较复杂的课题, 如:“GPS在建筑中的应用”,既涉及GPS,又涉及 建筑,还有“应用”,这时候就要编制出满足要求的计 算机检索式,它是机检的基础。
(2)无限截断:在检索词后加一个“?“,表 示该词后可加任意个字符。
使用无限截词,所截 词根不能太短,否则会输出许多无关文献,造成 误检。
如:computer?可检出 computers,computering,computered,compu terization. (3)中间截断:在检索词中间加一个或几个? 号,主要解决一些英美拼写不同,单复数形式的 不同的词的输入,可简化输入。
2 位置算符(Proximity Operators) 位置算符是表示检索词之间位置关系的一种运 算符。
由于英文对一句话有多种表达方法,写法可 能不同。
如:“GPS在铁路桥研究中的应用”这个 课题,用英文表达可能是“Using of GPS in Railway Bridge”, 也可能是“Using of GPS in Bridge of Railway”,因而可能编制出这样的检索 式,GPS AND (Railway (2N)Bridge) 我们可以通过位置检索提高检索的准确率
3截词算符(Truncating operators)原因:在英语词汇中,一个词可能有多种形态,如词的单、复 数形式的不同,英美拼写方法不同、词性不同等。
如果检索时将 这类词全部输入进去,会增加检索时间和费用,采用截词法可解 决这一问题。
所谓截词检索,是指在检索标识中保留相同的部分,用相应 的截词符代替可变化部分。
(1) (W)算符与(nW)算符 W 是word与 with的缩写。
特点:W词序不变,中间不可插词,但两词间可有 一个标点,连字符或空格。
nW词序不变,中间可插入N 个词。
如:potential (w) energy可能检出potential energy and function 又如:gone (2w)wind 可能检出gone with the wind (2) (N)与(nN)算符 N是near的缩写 特点:N词序不限,中间不可插词,但两词间可有一 个标点,连字符或空格。