信息检索中文版41-45

合集下载

《信息检索》实验报告1111

《信息检索》实验报告1111

《信息检索》实验报告一、OPAC检索1.利用“中图分类法”查找自己所在专业的分类号,并记录。

再使用书目查询系统查找该分类下的一本图书,写出该书的书名、作者、出版社、出版年、索书号、馆藏复本数、ISBN号、馆藏地(写一个即可)。

TU新农村景观设计艺术顾小玲东南大学出版社2011年索引号:TU982/14 2本ISBN号:2011002852 馆藏地:样本二库[4楼西,借期20天]2.查找作者姓“李”、索书号为“H31”的图书,记录下检索的结果数量,再在结果中检索由中山大学出版社出版的图书,记录下检索结果的数量,并写下任一检索结果的作者、书名、出版社、索书号、馆藏复本数、可借复本数。

1337 7疯狂英语.听力高级飞跃李俊青中山大学出版社H319.9/1322:3馆藏复本:24 可借复本:223.分类号是“TP311.1”的是关于哪方面内容的图书?写出此类书其中一种图书的书名、作者、出版社和索书号。

程序设计、软件工程中文版Access 2007数据库应用实用教程冯先锋秦小英清华大学出版社TP311.13/13024.自行熟悉OPAC中“我的图书馆”各项功能,并写出已借阅图书数量和今年所借阅的两本书的书名,如果可能请进行续借。

7 小高层住宅设计图集新型住宅平面设计方案二、电子图书检索1.利用“读秀学术搜索”打开并阅读书名包含“竞争情报”,作者为“王知津”的图书,写出该书的书名、出版社、出版日期,并从书中查阅竞争情报的概念。

书名:《竞争情报》出版社:科学技术文献出版社出版日期:2005.02竞争情报的概念:为达到竞争目标,合法而合乎职业伦理的搜集竞争对手和竞争环境的信息,并转变为情报的连续的系统化过程。

2.利用“读秀学术搜索”检索二本有关美国前总统的图书,写出图书的书名、著者、出版社。

书名:《改变世界历史的七天美国前总统尼克松1972年七天访华揭秘》作者:梁建增,赵微主编出版社:高等教育出版社书名:冷战后的美国外交政策从老布什到小布什作者:潘锐出版社:时事出版社3.利用“读秀学术搜索”找出与自己专业相关的图书,写出其中2本图书的书名、作者和出版社。

信息检索考试模拟题1

信息检索考试模拟题1

一、A型题(单项选择题:每题只有一个最佳答案。

每题1分,共20分)1、以下对信息、知识、情报与文献的描述,不正确的是:A. 知识是信息的源泉,知识是系统化、理论化的信息。

B. 知识是情报的本质,情报是激活的知识和信息。

C. 信息是知识的源泉,情报是活化的知识和信息。

D. 文献是被物化的知识记录,是人们获取信息、知识和情报的重要来源。

2、关于“信息检索”的描述,错误的是:A. 有序的存储才能实现有效的检索。

B. 广义的信息检索既包括检索,也包括存储。

C. 存储是检索的基础,检索是存储的目的。

D. 信息检索的主要依据是对象的内容特征。

3、在国际上,一般认为被三大索引收录的期刊即为核心期刊,以下不属于三大索引的是:A. 美国科学引文索引SCI系列B. 工程索引(EI)C.荷兰医学文摘EMBASED. 国际会议录文献索引(CPCI-S)4、下列检索平台中,不提供MeSH检索的是:KIB. Cochrane LibraryC. HONSelectD. Ovid SP5、以下关于检索策略的描述,不正确的是:A.检索提问表达式=检索词+运算符,计算机系统通过检索提问表达式来完成查询任务。

B. 为科研立项或开题报告而检索时,应以查准为主。

C. 阅读综述文献可大致了解该领域研究历史、背景和现状,并从中发现新的隐含概念,不断调整检索式。

D.在立项检索时,可先确定一个较大的、范围较广的初始文献集,然后逐步提高检索式的专指度,从而逐步缩小命中文献集,直到得到数量适宜、最满意的文献集合为止。

6、利用MeSH检索某疾病基因疗法方面的文献,副主题词的最佳选择是:A.选择与治疗有关的副主题词,包括饮食疗法、药物疗法、放射疗法、治疗、外科学。

B.选择治疗的下位副主题词:治疗C.选择该疾病主题词下的全部副主题词D.选择无副主题题词7、关于副主题词的描述,不正确的是:A.副主题词一般不单独检索,仅与主题词组配使用。

B.副主题词与主题词的组配,目的在于提高对文献信息主题标引及检索的专指度。

现代信息检索教程第三章(中文10春)

现代信息检索教程第三章(中文10春)
返回目 录
检索方法 全国报刊索引》编排方式是按类编排, 《全国报刊索引》编排方式是按类编排,同时每期后 面附有著者索引, 面附有著者索引,因此该检索工具的检索途径主要有分 类途径和著者途径。 类途径和著者途径。 检索有关国内“音乐事业”的文献。 例:检索有关国内“音乐事业”的文献。 检索工具《全国报刊索引》哲社版2008 12期 2008第 ①检索工具《全国报刊索引》哲社版2008第12期 检索途径: ②检索途径:分类途径 检索过程:查分类目录,一级类艺术J ③检索过程:查分类目录,一级类艺术J,二级类为 J6音乐,其下又有三级类J69音乐事业,页码P295,翻 J6音乐 其下又有三级类J69音乐事业 页码P295, 音乐, 音乐事业, 到该处浏览, P295得 篇文献是切题的。 到该处浏览,在P295得3篇文献是切题的。 检索结果: 篇相关文献,顺序号为:081217152、 ④检索结果:得3篇相关文献,顺序号为:081217152、 081217153、 081217154。 081217153、 081217154。
返回目 录
4.其它重要百科全书 钱伯斯百科全书》 《钱伯斯百科全书》、《美国学术百科全 世界图书百科全书》 书》、《世界图书百科全书》、《计算机 科学与技术百科全书》、《柯克-奥斯莫化 科学与技术百科全书》 柯克工大全》)、《布罗克豪斯百科全书》 工大全》)、《布罗克豪斯百科全书》、 拉鲁斯大百科全书》 《拉鲁斯大百科全书》、《苏联大百科全 书 》 等。
返回目 录
百科全书(Encyclopedia) 二、百科全书(Encyclopedia) 百科全书是汇总浓缩人类所有知识门类或某一知 识门类的全部知识、 识门类的全部知识、按辞典形式编排的大型参考 工具书。以其知识广博、资料精确、释文严谨、 工具书。以其知识广博、资料精确、释文严谨、 文字简明、体例严密, 文字简明、体例严密,以及兼具多种参考工具书 功能的特质,被称为“工具书之王” 功能的特质,被称为“工具书之王”、“精简的 没有围墙的大学” 图书馆” 图书馆”、“没有围墙的大学”,是参考工具书 中最重要的类型, 中最重要的类型,已成为衡量一个国家科学文化 发展的尺度之一。 发展的尺度之一。

高级信息检索题目及方法

高级信息检索题目及方法

⏹在中国学术期刊全文数据库中检索关于“物流专业人才培养”方面的2篇文章,并写出论文作者和题目。

1.《创新性物流人才培养体系研究》王颖, 2003 - 北方交通大学:管理科学与工程2.构建高职高专物流专业的KAO人才培养模式研究郭义祥, 2008 - 中南大学:工商管理⏹在中国学术期刊全文数据库中,检索现任上海复旦大学教授黄丽华教授发表过的所有文章,并写出论文题目。

期刊论文:王刚,黄丽华,张成洪. 混合智能系统研究综述,系统工程学报 vol.25(4), 2010, 中文:569-578傅翠晓,黄丽华,曾庆丰. 企业的B2B电子商务转型分析——基于能力理论视角,科学学与科学技术管理 Vol.31(7) , 2010, 中文: 123-129Pejian Song, Cheng Zhang, Yunjie(Calvin) Xu, Lihua Huang. Brand Extension of Online Technology Products: Evidence from Search Engine to Virtual Communities and Online News , Decision Support Systems Vol.49(1), 2010, 英文: 91-99Lihua Huang, Ganglan Hu, Xianghua Lu. E-business Ecosystem and its Evolutionary Path: The Case of the Alibaba Group in China , Pacific Asia Journal of the Association for Information Systems vol.1(4), 2009, in English: 25-36何永刚,黄丽华. 案例研究方法在信息系统领域的应用,计算机工程与应用 Vol.45(32), 2009, 中文: 233-236胡岗岚,卢向华,黄丽华. 电子商务生态系统及其协调机制研究——以阿里巴巴集团为例,软科学 Vol.23(9), 2009, 中文: 5-10Peijian Song ,Cheng Zhang ,Wenbo Chen , Lihua Huang. Understanding Usage-Transfer Behavior Between Nonsubstitutable Technologies:Evidence From Instant Messenger and Portal , IEEE Transactions on Engineering Management Vol.56(3), 2009, 英文: 412-424Sijie Li,Zhanbei Zhu,Lihua Huang. Supply Chain Coordination and Decision Making Under Consignment Contract with Revenue Sharing , International Journal of Production胡岗岚,卢向华,黄丽华. 电子商务生态系统及其演化路径,经济管理 Vol.31(6), 2009, 中文: 110-116胡安安,黄丽华,凌鸿 . 基于文化视角的信息技术应用研究述评,研究与发展管理 Vol.21(3), 2009, 中文: 98-104耿华,陈文波,黄丽华. 面向电子政务的公共服务流程优化方法研究,软科学 Vol.23(5), 2009, 中文: 37-41卢向华,冯俊,黄丽华. 中国信息系统的国际研究分析及对比,信息系统学报 Vol.3(1), 2009, 中文: 75-84胡岗岚卢向华黄丽华. 中国软件产品开发的价值导向,上海管理科学 Vol.31(2), 2009, 中文: 38-44王刚,黄丽华,高阳. 基于方法集的农业产业化综合评价模型,系统工程理论与实践 Vol.29(4), 2009, 中文: 161-168王刚,张成洪,黄丽华. 基于方法集的企业知识管理评价研究,科技进步与对策 Vol.26(7), 2009, 中文: 115-118YANG Qing,HUANG Lihua,XU Yunjie. Role of Trust Transfer in E-CommerceAcceptance , Tsinghua Science and Technology (清华大学学报) Vol.13(3), 2008, 英文: 279-286Chu Yan, Huang Lihua. Mobile Technologies Adoption:An Exploratory CaseStudy , Tsinghua Science and Technology(清华大学学报(英文版)) Vol.13(3), 2008, 英文: 300-305胡安安,姜江,黄丽华. ERP系统实施的用户接受模型及实证研究,研究与发展管理 vol.20(3), 2008, 中文: 46-52,112何永刚,黄丽华. 信息系统开发中的知识转移研究综述,计算机工程与应用 vol.44(25), 2008, 中文: 75-77,114Cui, L.L; Zhang, C.; Zhang, C.H.;Huang, L.H.. Exploring IT Adoption Process in Shanghai Firms: An Empirical Study , Journal of Global InformationManagement vol.16(2), 2008, 英文: 1-17褚燕,黄丽华. 影响员工接受移动商务应用因素研究,研究与发展管理 vol.19(1), 2007, 中文: 72-78何永刚,黄丽华. 我国钢铁企业信息系统应用研究,情报杂志 (7), 2007, 中文: 52-54王刚,黄丽华,张成洪. 混合智能系统R-FC-DENN及其实现,科技导报 vol.25(11), 2007, 中文: 69-73胡安安,姜江,黄丽华. 基于信息技术用户接受理论的ERP系统实施模型研究,科学学与科学技术管理 , 2007, 中文: 20-26宋培建,陈文波,曾庆丰,黄丽华. 基于目标导向行为视角的信息技术使用习惯形成研究,软科学 vol.21(4), 2007, 中文: 9-12罗钢,黄丽华 . 电子商务交易平台的网络外部性初探,商场现代化 (511), 2007, 中文: 123-124何永刚,黄丽华. 信息管理与信息系统专业课程体系研究综述,情报杂志 (8), 2007, 中文: 128-131黄丽华. CIO角色动态变化,每周电脑报 (24), 2007, 中文: 22胡安安,黄丽华. 浅谈信息技术(IT)在服务创新中的作用,中国科技产业 , 2007, 中文: 86-89胡安安,黄丽华. 基于信息系统的企业绩效管理体系--以某石化企业为例,物流科技 vol.30(5), 2007, 中文: 176-182杨青,陈忠民,黄丽华. 基于能力的公司规划与信息系统规划战略关系实证研究,管理工程学报 Vol.21(3), 2007, 中文: 141-145胡安安,黄丽华. 建立中国企业信息化交易公平性监管机制的探索性研究,世界经济情况 (4), 2007, 中文: 56-59罗钢,黄丽华. 网络外部性条件下电子商务平台双边定价策略,企业经济 (4), 2007, 中文: 135-137罗钢,黄丽华. 网络外部性条件下的连锁企业渐进式信息化,科学学与科学技术管理 (4), 2007, 中文: 153-155董亮,卢向华,黄丽华. ASP平台运营的原模型分析,管理学报 vol.4(1), 2007, 中文: 57-60.66Cheng Zhang,Lili Cui,Lihua Huang,Chenghong Zhang. Exploring the Role of government in information technology Diffusion: An Empirical Study of IT Usage in Shanghai Firms , IFIP Dynamics of Technology-Based Innovation: Diversifying the Research Agenda, eds. McMaster, T., Ferneley, E., and DeGross, J. (Boston: Springer) Vol.235, 2007, 英文: 393-408Jin Chen, Cheng Zhang, Yufei Yuan and Lihua Huang. Understanding the Emerging C2C Electronic Market in China: An Experience-Seeking Social Marketplace , Electronic Markets vol.17(2), 2007, 英文: 86-100王刚,黄丽华,张成洪. 基于模糊聚类的神经网络在数据挖掘分类中的应用研究,科技导报 vol.25(15), 2007, 中文: 58-61陈晋,周永佳,张诚,黄丽华. 透视中国C2C电子商务市场——记对eBay、淘宝的案例分析,市场营销导刊 (6), 2006, 中文: 19-22王刚,黄丽华,张成洪,夏洁. 数据挖掘分类算法研究综述,科技导报 vol.24(12), 2006, 中文: 73-76Xiang-Hua Lu,Li-Hua Huang,Michael S.H.Heng. Critical success factors of inter-organizational information systems—A case study of Cisco and Xiao Tong in China , Information & Management vol.43(3), 2006, 英文: 395–408 陈文波,黄丽华. 组织复杂信息技术吸收的探索性案例研究,清华学报(自然科学版) 2006(46:S1), 2006, 中文: 902-908LILI CUI,CHENG ZHANG,CHENGHONG ZHANG,LIHUA HUANG. Exploring E-Government Impact on Shanghai Firms' Informatization Process , Electronic Markets vol.16(4), 2006, 英文: 312-328郑大庆,何永刚,褚燕,黄丽华. 中国大陆与国际信息系统发展状况对比研究,复旦学报(自然科学版) vol.45(5), 2006, 中文: 577-584陈文波,黄丽华,曾庆丰. 基于间断平衡理论的企业复杂信息技术接受分析框架研究,科技导报 vol.24(7), 2006, 中文: 64-67张嵩,黄丽华. 信息技术竞争价值两种观点的比较研究,研究与发展管理vol.18(3), 2006, 中文: 85-92何永刚,黄丽华,戴伟辉. CISC2005的学科贡献,现代大学教育 , 2006, 中文: 11-16王刚,黄丽华,夏洁,高阳. 新的混合智能系统R-FC-DENN ,系统工程与电子技术vol.28(3), 2006, 中文: 448-453陈文波,黄丽华. 组织信息技术采纳的影响因素研究述评,软科学 vol.20(3), 2006, 中文: 1-4郑大庆,黄丽华. 动态能力理论在信息系统领域的应用,科技导报 vol.24(9), 2006, 中文:何永刚,黄丽华,戴伟辉. 基于生态理论的信息系统进化研究,科技导报 vol.24(1), 2006, 中文: 41-43赵昆,黄丽华,孙海. 基于战略竞争优势的信息系统项目选择模型,系统工程学报vol.20(6), 2005, 中文: 661-665俞东慧,方针,黄丽华. 企业实施流程变革管理的模型研究,科技导报 vol.23(3), 2005, 中文: 60-63方针,俞东慧,黄丽华. 用户接受:企业信息技术实施的新视角,科技导报vol.23(2), 2005, 中文: 55-57Chen, Y., Okoli, C., and Lihua Huang. Strategic Growth of Firms in the Digital Economy: A Simonian Research Agenda , Journal of Information Technology Theory & Application Vol.7(2), 2005, 英文: 37-52张嵩,李文立,黄丽华. 电子商务环境下企业IT基础设施能力的构成研究,计算机集成制造系统 vol.10(11), 2004, 中文: 1459-1465李文立,黄丽华,孙海,张嵩. 基于电子商务的制造业销售服务模型研究,计算机集成制造系统 vol.10(10), 2004, 中文: 1278-1283卢向华,黄丽华. 基于评价的信息系统价值促生模式研究,计算机集成制造系统Vol.10(10), 2004, 中文: 1284-1289曾庆丰,王欢,黄丽华. 制造企业的电子商务模式识别研究,计算机集成制造系统vol.10(8), 2004, 中文: 1008-1014赵昆,赵明剑,黄丽华. 战略对应--企业信息化管理的新思路,科技导报 , 2004, 中文: 39-41姚卫新,黄丽华. 智能数据分析中的异常数据管理,科技导报 , 2004, 中文: 54-56张嵩,李文立,黄丽华. 基于结构的企业IT基础设施能力分类研究,中国工业经济vol.6(6), 2004, 中文: 79-84姚卫新,黄丽华. 事件驱动式商务智能——商业竞争的新利器,科技导报 , 2004, 中文: 59-61俞东慧,黄丽华,方针. 企业变革管理模型框架及其实证研究,系统工程理论方法应用 Vol.13(2), 2004, 中文: 106-111赵卫东,黄丽华. 面向角色的多agent工作流模型研究,管理科学学报 vol.7(2), 2004, 中文: 55-62洪丹毅,黄丽华. 制造业电子商务模式决策支持系统研究,计算机工程与应用(28), 2004, 中文: 182-194杨青,黄丽华,何崑. 企业规划与信息系统规划战略一致性实证研究,管理科学学报vol.6(4), 2003, 中文: 43-54庞川,冯叶,黄丽华. 全面质量管理在电子商务中的实施,经济管理 (7), 2003, 中文: 34-37陈风霄,黄丽华. 信息技术基础设施能力及其规划策略,复旦大学学报 vol.42(2), 2003, 中文:俞东慧,黄丽华,石光华. BPR项目的实施:革命性变革和渐进性变革,中国管理科学vol.11(2), 2003, 中文: 55-60陈丽娟,黄丽华,张国春. BPR在电信企业投资项目管理流程创新中的应用研究,复旦学报(自然科学版) vol.42(2), 2003, 中文: 220-225赵卫东,黄丽华,蔡斌. 基于角色的工作流研究,管理工程学报 vol.17(4), 2003, 中文: 9-13赵卫东,黄丽华. 流程的协调管理研究,科学学与科学技术管理 (2), 2003, 中文: 41-45卢向华,黄丽华. The Firm Capability Analysis in Large Information System Project Implementation Process ,中华管理资讯系统CMIS Quarterly vol.1(1), 2003, 中文:卢向华,黄丽华. 信息化项目建设中的全过程评价研究,计算机集成制造系统-CIMS Vol.8(12), 2002, 中文: 931-935赵卫东,黄丽华,蔡斌. 工作流过程模型研究,系统工程理论方法应用 vol.11(3), 2002, 中文: 212-217杨青,乔志刚,黄丽华,薛华成. 动态联盟中企业建模的M e ta-M odel ,管理科学学报 vol.4(6), 2001, 中文: 31-38董超, 黄丽华,项保华. 基于企业资源的视角: IT 与持续竞争优势,科学学与科学技术管理 , 2001, 中文: 36-39俞东慧,黄丽华. 任务不对称对企业流程重组(BPR)的影响,复旦学报(自然科学版) vol.40(2), 2001, 中文: 171-176朱锋英,叶文超,黄丽华. 活动合并对企业流程成本的影响,系统工程理论方法应用vol.10(3), 2001, 中文: 217-220黄丽华,何辉,薛华城. 基于规则和方法的企业过程优化,系统工程学报 Vol.15(3), 2000, 中文: 209-216,266黄丽华,何辉,薛华成. 基于规划和方法的企业过程优化,系统工程学报 vol.15(3), 2000, 中文:郑大兵,黄丽华,李勇. QFD在企业过程优化中的应用,管理科学学报 vol.2(4), 1999, 中文: 8-15彭俊松,黄丽华,薛华成. BPR决策支持系统分布式求解模型的研究,管理科学学报vol.2(4), 1999, 中文: 44-52黄丽华,葛永利,富小丽,薛华成. 企业过程柔性的概念框架,系统工程理论与实践vol.19(10), 1999, 中文: 63-68潘自强,黄丽华,熊伟,薛华成. 信息系统战略规划方法及其组合策略的研究,管理科学学报 vol.2(3), 1999, 中文: 43-50薛华成,黄丽华. 企业持续发展与信息战略,管理科学学报 Vol.2(2), 1999, 中文: 90-92彭俊松,黄丽华,薛华成. 基于知识共享重用的分布式DSS开发平台,管理科学学报Vol.2(1), 1999, 中文: 72-78熊伟,黄丽华,潘自强,薛华成. 基于BPR的信息系统规划方法,系统工程理论方法应用 vol.8(1), 1999, 中文: 27-32潘自强,刘杰,黄丽华,薛华成. 企业过程到企业对象类转换规则及其应用,系统工程理论方法应用 Vol.8(2), 1999, 中文: 5-23黄丽华,黄岳,熊伟,李芳芸. 基与规则的企业过程的简化和集成方法,计算机集成制造系统-CIMS vol.6(3), 1998, 中文:黄丽华,黄岳,熊伟,李芳芸. 基于规则的企业过程简化和集成的方法,计算机集成制造系统 Vol.4(3), 1998, 中文: 10-15Hu Jian,Huang Lihua,Xue Huacheng. Comparative Study on Selecteel BPR Tools ,Journal of china Textile Universiy (中国纺织大学学报(英文版)) Vol.14(2), 1998, 英文: 63-68陈蓉,钱宇,黄丽华. 面向个人的信息系统:经理支持系统,管理信息系统 (sum24), 1998, 中文: 7-10刘伟,杜昌勇,黄丽华. 面向过程的系统分析,管理信息系统 , 1998, 中文:28-31李芳芸,黄丽华. 企业经营过程重组与现代企业管理,计算机集成制造系统——CMS (6), 1997, 中文: 3-8黄丽华.钱宇.葛永利.胡健. 企业过程优化的规则和方法,高技术通讯 vol.7(11), 1997, 中文: 26-32黄丽华,钱宇,薛华成. 企业过程的定义及辩识方法,系统工程学报 Vol.12(3), 1997, 中文: 70-81黄丽华,胡健,陈蓉,李芳芸,杨吉江,李美莺. 企业过程再设计的概念及其实现途径,计算机集成制造系统-CIMS Vol.3(4), 1997, 中文: 8-12徐云杰,黄丽华,薛华成. 企业过程优化决策支持系统概念框架,管理科学学报vol.7(4), 1997, 中文: 35-42唐晓云,黄丽华,薛华成. 面向企业过程重组的信息系统策略,管理信息系统Vol.2(3), 1997, 中文: 11-18徐云杰,黄丽华,周文越,薛华成. 企业过程优化决策支持系统概念框架,决策与决策支持系统 Vol.7(4), 1997, 中文:刘杰,黄丽华,胡建. 建设企业信息管理系统的计划与组织,计算机周刊 (15),1996, 中文: 16-17黄丽华,方晓,胡健. CIMS企业全局信息模型的建模技术,高技术通讯 vol.6(2), 1996, 中文: 38-42黄丽华,方晓,胡健. CIMS企业全局信息模型及信息模式的研究,计算机集成制造系统 (2), 1995, 中文: 5-9胡健,黄丽华,徐至旭,薛华成. 面向对象的分析与设计方法的比较研究,计算机工程与应用 (11、12), 1994, 中文: 4-9会议/研讨会论文:Barney Tan,Shan L Pan,Xianghua Lu,Lihua Huang Leveraging Digital Business Ecosystems for Enterprise Agility: The Tri-Logic Development Strategy of Thirtieth International Conference on Information Systems(ICIS2009) USA,Phoenix: 2009 1-18Peijian Song,Cheng Zhang,Heng Xu,Lihua Huang Product Integration Formats and Consumers' Evaluations of the Online Extended Product: A Product Integration Perspective Proceedings of the Ninth International Conference on Electronic Business(ICEB2009) Macau: 2009 325-334王有为,徐云杰,彭志伟,黄丽华社会网络与网商竞争力关系的实证研究第二届网商及电子商务生态学术研讨会论文集中国,杭州: 2009 3-7曾庆丰,黄丽华中小企业电子商务转型的过程模型研究第二届网商及电子商务生态学术研讨会论文集中国,杭州: 2009 24-29胡岗岚,黄丽华,卢向华网商竞合关系研究第二届网商及电子商务生态学术研讨会论文集中国,杭州: 2009 37-41Ganglan Hu,Xianghua Lu,Lihua Huang E-business Ecosystem and its Evolutionary Path: Exploring the Phenomenon of E-business Industrial Cluster in China with a Case Study of Alibab Group Proceedings of the 3rd International Conference on Risk Management & Global e-Business Incheon,Korea: 2009 902-908Gang Wang,Chenghong Zhang,Lihua Huang A Study of Classification Algorithm for Data Mining Based on Hybrid Intelligent Systems Roger Lee,Central Michigan University,USA 9th ACIS International Conference on Software Enginerring,Artificial Intelligence,Networking and Parallel/Distributed Computing(SNPD 2008) In conjunction with 2nd International Workshop on Advanced Internet Technology andApplication(AITA2008) Phuket,Thailand: IEEE computer society, 2008 371-375 Chen Jin,Zhang Cheng,Huang Lihua Determinants of Customer Loyalty in China C2C E-Commerce: From a Social Network Perspective [A] Proceedings of the Fifteenth European Conference on Information Systems(Osterle H, Schelp J, Winter Reds.)University of St. Gallen, St. Gallen [C] : , 2007 24-35Song Peijian,Chen Wenbo,Zhang Cheng,Huang Lihua Determinants of Information Technology Usage Habit Peijian Song Proceedings of the 11th Pacific-Asia Conference on Information Systems : the 11th Pacific Asia Conference on Information Systems, 2007 226-237Chen Jin, Zhang Cheng, Yuan Yufei, Huang Lihua THE NATURE OF THE EMERGING C2C ELECTRONIC MARKET IN CHINA: A CASE STUDY FROM SOCIAL NETWORK THEORY AND CRM PERSPECTIVES [A] Proceedings of the 9th International Conference on Social Implications of Computers in Developing Countries, Sao Paulo, Brazil [C] : , 2007 Peijian Song,Cheng Zhang,Wenbo Chen and 黄丽华 Post-Adoption Transferring between Non-Substitutable Technologies:The Case of Instant Messenger and Portal Peijian Song Post-Adoption Transferring between Non-Substitutable Technologies:The Case of Instant Messenger and Portal : the 28th International Conference on Information Systems, 2007郑大庆,黄丽华动态能力理论研究现状及其在信息系统领域的发展前景 [A] 郑大庆动态能力理论研究现状及其在信息系统领域的发展前景 [C] : 《知识及资讯资源管理》第十二届海峡两岸资讯管理发展策略研讨会论文集, 2006褚燕,黄丽华工作任务与移动应用匹配模型研究 [A] 知识及资讯资源管理,第十二届海峡两岸资讯管理发展策略研讨会论文集 [C] : , 2006胡安安,黄丽华中国企业信息化过程中交易公平性监管机制的探索性研究 [A]知识及资讯资源管理》第十二届海峡两岸资讯管理发展策略研讨会论文集 [C] : , 2006 曾庆丰,黄丽华企业电子商务转型研究:一个基于能力视角的分析框架 [A] 《知识及资讯资源管理》第十二届海峡两岸资讯管理发展策略研讨会论文集 [C] : , 2006 Daqing Zheng, Lihua Huang, Michael S H Heng, Yonggang He, Songping Chu The Comparison of Information Systems Develop Trends between the Chinese Mainland and International [A] Proceeding of the 10th Pacific Asia Conference on Information Systems (PACIS2006) [C] : , 2006Tianjiao Chen, Cheng Zhang and Lihua Huang Technological and Community Factors that Influence Online Trust and Knowledge Sharing-A Model Based on Virtual Community [A] 10th Pacific Asia Conference on Information Systems [C] : , 2006Cui,L.L.,Zhang,C,Lihua Huang,Zhang,C.H Examining Drivers and Impacts of Informatization in Shanghai Manufacturing Firms Cui,L.L. Examining Drivers and Impacts of Informatization in Shanghai Manufacturing Firms : Proceedings of the 10th Pacific Asia Conference Information Systems(PACIS2006), 2006崔丽丽,张诚,黄丽华,张成洪基于资源视角的企业信息化影响因素实证研究 [A]第十二届海峡两岸信息管理发展策略研讨会论文集 [C] : , 2006WANG Gang, HUANG Lihua, ZHANG Chenghong Study of Artificial Neural Network Model Based on Fuzzy Clustering The 6th World Congress on Intelligent Control and Automation 2006 : 2006 2713-2717褚燕,黄丽华基于任务技术匹配理论的移动技术采纳案例研究信息技术采纳:理论发展与中国实践》,信息系统协会中国分会2006年学术研讨会 : 2006 113-116 方针,黄丽华,俞东慧企业信息安全的影响因素及实现方法的研究 [A] 第十届海峡两岸资讯管理发展策略研讨会 [C] : , 2005Lei DAI,Yuandong Yi,黄丽华 An Empirical Study of B2C Service Quality affecting Website Continuance Lei DAI An Empirical Study of B2C Service Quality affecting Website Continuance : Proceedings of IEEE International Conference on Service Operations and Logistics and Informatics, 2005Wenbo Chen,Lihua Huang,Qing Zhang The Adoption of Inter-OrganizationalSystems in Chinese Local Retail Enterprises [A] Proceeding of the 9th Pacific Asia Conference on Information Systems [C] : , 2005ZHANG Song,HUANG Li-hua Comparative Study of Obtaining Competitive Advantagefrom Information Technology ZHANG Song 2005 IEEE International Conference on Services Systems and Services Management (Proceedings of ICSSSM’05),June, 2005,Chong Qing, China : 2005 IEEE Internatioanl Conference on Services Systems and Services Management (Proceedings of ICSSSM'05), 2005 19-23CHU Yan,HUANG Lihua Mobile Business Applications Adoption Model Based on the Concepts of Task/Technology Fit [A] Jian Chen 2005 International Conference on Services Systems and Services Management vol.1/中国.重庆: Proceedings ofICSSSM'05, 2005 p1346-1350Qingfeng ZENG,Weidong ZHAO,黄丽华 A Framework for the Evolution of E-business based on Information Technology [A] Qingfeng ZENG A Framework for the Evolution ofE-business based on Information Technology [C] : 2005 IEEE InternatioanlConference on Services Systems and Services Management (Proceedings of ICSSSM'05), 2005Wenbo CHEN,黄丽华,Xianghua LU The B2B Adoption in Retail Firms in China:An Empirical Study [A] Wenbo CHEN The B2B Adoption in Retail Firms in China:AnEmpirical Study [C] : P2005 IEEE International Conference on Services Systems and Services Management(Proceedings of ICSSSM'05), 2005Xianghua Lu,Lihua Huang The Development of IT Evalution Theoretical Studies Proceedings of ICSSSM'05 Vol.2: 2005Lei DAI,Lihua Huang,Yuandong Yi How B2C Service Quality Influences Website Continuance Lei DAI How B2C Service Quality Influences Website Continuance : Proceeding of the 9th Pacific Asia Conference on Information Systems, 2005 Qing YANG,Lihua HUANG The Acceptance Model of MLS on the basis of"Risk-Value"Analysis Qing YANG The Acceptance Model of MLS on the basis of"Risk-Value"Analysis : Proceedings of 3rd Workshop on e-Business(WEB2004), 2004407-417Qingfeng Zeng,黄丽华 A New Theoretical Framework for Identifying E-Business Models Qingfeng Zeng A New Theoretical Framework for Identifying E-Business Models : Proceeding of the 8th Pacific Asia Conference Information Systems (PACIS2004), 2004 1940-1946Kun Zhao,Zhongmin Chen,黄丽华 SAM/ANP Based Approach for Strategic Information System Project Selection Kun Zhao SAM/ANP Based Approach for Strategic Information System Project Selection : Proceeding of the 8th Pacific Asia Conference Information Systems (PACIS2004), 2004Huan Wang,Lihua Huang Case-Based Study of Interorganizational Information Systems Implementation Critical Success Factors Huan Wang Case-Based Study of Interorganizational Information Systems Implementation Critical Success Factors : Proceedings of the 8th Pacific Asia Conference Information Systems (PACIS2004), 2004 1389-1399⏹利用“期刊导航”功能,找出“管理”类核心期刊有几种?其中排名第一的期刊是什么?复制该刊2009年最后一期中的第一篇文章的篇名。

信息检索名词解释

信息检索名词解释

1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。

狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。

相当于我们所说的信息查询(information search)。

2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。

如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。

其主要特点是内容新颖,但不成熟,不公开交流,难以获得。

3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。

如期刊论文、科技报告、专利说明书、会议论文、学位论文等。

体现创作性。

其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。

4)二次文献(Secondary Document):就是检索工具。

是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。

如文摘,目录、索引等。

它有存贮、检索、报道的功能。

体现高度的浓缩性。

其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。

二次文献具有汇集性、工具性、综合性、交流性等特点。

5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。

三次文献是情报研究的产物和成果。

具有很强的的综合性。

总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。

6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。

信息检索之课件文稿演示

信息检索之课件文稿演示

省图馆藏 书目查询 系统
2021年3月6日星期六
湖北民族学院《信息检索》(Information Retrieval )系列课件
3-16
检索方法
2021年3月6日星期六
湖北民族学院《信息检索》(Information Retrieval )系列课件
3-17
普通检索界面
2021年3月6日星期六 北京交通大学出版社《信息检索教程》(Information Retrieval Textbook)系列课件 3-18
随着现代计算机技术的发展,大多数图书馆都已 建成馆藏书目数据库,并进而发展成基于计算机网络 的联机公共目录检索系统(OPAC)。读者利用OPAC系 统,在任何地方都可以方便地查询图书馆的书刊信息, 使馆藏书目走出图书馆,实现了更广泛地服务于公众 的目的。
3-2
OPAC系统一般设置题名、责任者、主题词、分 类号、索取号、ISBN/ISSN号、出版社等字段,输入 检索词即可检索。系统执行后将逐条显示命中书刊的 基本信息,单击某个题名则进一步显示详细的书目信 息和馆藏及流通信息,读者可据此前往图书馆借阅。
由于图书馆的藏书数量相当庞大,而读者不可能 尽知每本图书的准确书名,因此在使用OPAC时,可 先通过题名、责任者、主题词等途径找出若干所需图 书,然后从这些图书的分类号入手,通过分类途径浏 览、查寻,最终找到自己最需要的图书。
2021年3月6日星期六
湖北民族学院《信息检索》(Information Retrieval )系列课件
湖北民族学院《信息检索》(Information Retrieval )系列课件
ห้องสมุดไป่ตู้
3-2
1 书刊目录检索系统
书目即书刊目录的简称。它是将图书、期刊按一 定规则著录、并有序编排而成的检索工具,它记载书 刊的题名、著(译)者、版本、出版地、出版者、出版 年、文献内容等信息。

《文献信息检索》习题解答 文献信息检索(解答)

《文献信息检索》习题解答  文献信息检索(解答)

《文献信息检索》习题答案一、单选题1、文献是记录有知识的(A)A.载体 B.纸张 C.光盘 D.磁盘2、如果需要检索某位作者的文献被引用的情况,应该使用(C)检索。

A.分类索引 B.作者索引 C.引文索引 D.主题索引3、下列哪种文献属于二次文献( D.)A.专利文献B.学位论文C.会议文献D.目录4、纸质信息源的载体是(D)A.光盘B.缩微平片C.感光材料D.纸张5、《中国图书馆分类法》(简称《中图法》)将图书分成( A.)A.5大部分22个大类B.5大部分26个大类C.6大部分22个大类D.6大部分26个大类6、利用文献末尾所附参考文献进行检索的方法是(C)A.倒查法B.顺查法C.引文追溯法D.抽查法7、广义的信息检索包含两个过程(B)A.检索与利用B.存储与检索C.存储与利用D.检索与报道8、中国国家标准的代码是(A)A.GB. B.CB.C.ZGD.CG9、( D )是报道文献出版或收藏信息为主要功能的工具。

A.题录B.索引C.文摘D.目录10、逻辑运算符包括(D)A.逻辑与B.逻辑或C.逻辑非D.A,B与C11、记录是对某一实体的全部属性进行描述的结果,在全文数据库中一条记录相当于(C),在书目数据库中,一条记录相当于()A.一条文摘,一篇完整的文献B.一条文摘,一条题录C.一篇完整的文献,一条题录或文摘D.一条题录,一条文摘12、《中国学术期刊全文数据库》提供的文献内容特征检索途径有(B)A.机构B.篇名/关键词/摘要C.中文刊名D.作者13、根据反映新内容的程度从大到小,下列文献类型的排序正确的是:(A)A.会议论文,科技期刊,科技报告,科技图书B.科技图书,科技期刊,科技报告,会议论文C.科技报告,会议论文,科技图书,科技期刊D.以上都不对14、《中国科研机构数据库》、《中国科技名人数据库》属于:(B)A.书目数据库B.指南数据库C.全文数据库D.数值数据库15、下列检索工具中,主要收录化学与化工类文献的是:(D)A.SCIB.OCLCC.EID.CA16、国内的专利可以通过哪个数据库检索?(B)A.超星数字图书馆B.万方数据C.学术期刊网D.EI17、提供检索式/命令行检索的好处在于:(C)A.容易记忆,容易编写B.文本形式,容易理解C.可以保存成功的检索,以便再次检索D.以上都不对18、逻辑“与”算符是用来组配( D.)。

信息检索电子课件

信息检索电子课件

信息检索语言 主题 语言 描写文献 内容特征 分类 语言
单元词语言 标题词语言 关键词语言 叙词语言 体系分类语言 组配分类语言 混合分类语言 Return
表2-1 《中图法》结构示意图
基本大类 简表 详表
A 马克思主义、列宁主义 毛泽东思想、 邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 U1 综合运输 S 农业科学 U2 铁路运输 T 工业技术 U4 公路运输 U 交通运输 U6 水路运输 V 航空、航天 [U8] 航空运输 X 环境科学、安全科学 Z 综合性图书
工具书概述
第二节
第三节
中文工具书举要
网络工具书
Return
第一节
工具书概述
一、工具书的定义与性质
工具书的定义 工具书的性质
二、工具书的类型
三、工具书综合利用要领
Return
第二节
一、中文检索工具书
目录
中文工具书举要
索引
文摘
二 、中文参考工具书
词语与学科知识检索工具——辞书与百科全书 年度统计资料与统计数据的检索工具——年鉴 数据规格、技术方法的检索工具——手册 人物、机构和地域信息检索工具——名录 实、历法和历史沿革信息的检索工具——表谱 图像信息检索工具——图录 Return
J-D J-E J-F
J-G
经济政治与法律辑
经济、商贸、金融、保险、政论、党建、外交、军事、法律
J-H
教育与社会科学综合辑

信息检索(大全)

信息检索(大全)

」» MMUT」m 丄lit+ULU_i'=u中壯UM.--EF吐叶□ P甘学有人文科孚习话社曲Jt T構.3 口社制■学31権」® ii Tq®SN7¥电n辟曲甘电neBR侶脾与牛上鼻闻曲匪:(KHi 轴沖主目寸I P斟粗H■ih*丄程阳I 0IM iiSH^CI w门f?农LT科再耳刁西T詐氐3 孫J P丘訓字i・dF It台将口IB/h |s« Jj *N |9M1 X 靈鼻密鼻巳“M 孔床血HI V 曲J載U利1 M fgcifrM1.“ cssni■ •4I iSftHtcX 廿Jfl•粧严主ZE JLi莎主=庆1*也空20iii5-aiHO am 詔2(H&aw? :醐冃巧K El fift Sd; T*T l Miff 半dilU.W!吊QU晴疋训絢T-S剧宫年則佛I TR处三ri着IB料出环境丽框爾电祂律息与电肚盘1星“卫回2计封罔蛤■N-专土和井沖;x兀!»;■tt Z«inirini130i®zs aj回rs flnlt计尊此二理詢£01V0E77±M51 r^JS朗叫*;::4HAH学耳£X4t 工哥煖芒■柿厲阿《|炸H苛应I 別們+■/甜悼严' E叶1: 知曲f907 巧X H斥冲| :+丈裂幅1HI l.ft iWffiff 绷论’ ra.H ■0):哥r 电出JF 皿瘫111J射?电居忻下_Fr 篇名trs年书F.r^i Ttt 锹为帀m芹.:升巒.帰亏卡锣I®*社对韭则:主梯血壹宾兰与控*测sn 1 ± *» CD L*jr 9 it R理丄吏HI讯与踌咒序竝的揮i!MIVIJ i» 4 ta>CD S乩皿•信息检索实习题一、中文数据库检索1.在中国知网CNKI期刊全文数据库中检索2006-2011年关键词为“计算机网络”的文献有多少篇?在结果中以关键词为“安全”进行二次检索,结果有多少篇?flip干科站* st*ew 帕I m 口阿踊1珂药時*:训輒M答:共2961篇H/的爭枠 _____________ , ” _____ , ,,F P] 匸忡■耶特]2宣*|| ■丽”启窗邮泻音也资菲金曲帶社胡恥転幸硏楝舟叩肝Hi霉回□] 哥冠栢■榔a・>丛[巫己年到艺屁二年熨退吏导:P*笛車牛円扌垃啊刚J 曰H3PU肝L庚按・耳刖臣CSSQ&±flmLhi£2.利用《中国学术期刊网络出版总库》检索摘要、关键词中出现食品安全的文献?答:•丽”K im [ is9ri-fe^T L itKPW7Z'期奇P咖I 彌Fe-r"科itSL1S7 lEMSr 宮卷话杆用・出鵡片 sjf-fcT sfft(fitr邮宇★倔■££■ IS#-«i 入辨 QfTi__________________ ____________________________________13 P 峯吶亨廿芒溯il”||角丽:1帚-1J'^6-1鮭商-1 n KEMSitK [tfF "|晞呼咱忖・打*,J 朋- 岳润-1QFTffiUentftMprt0 _^J * fl |^E _d 年拆入E MH-辰~ZjEl P •祝弘畦«订轴磁: [S3tf. nd 勺可恤工二0寸 區灼三主料技 隔 tWfrHF 滇彌Bl 利PE 儘曹U 刊屏R.iWH 丽CSSCIFlVTifSi ; 卧趾之lt?m t1 *配鋤寧I V EJ □_L 1冲叶啊 | Wt *1 7址砂爭UH r 阿债.取g 版r>mxmir,庄3 P ■iBUK甘歸1£ ' r 界&**唯¥E F^Er ■ IF 盂n 啊世嗣电||±j * •匚赤目*no I.-/»U ! maiwaa iM1i2 2011 i 2D1t 「 曲 im^--GF4290H :»JX匐盘i .101 辿此-21KH2M31 凯H \\ 慟1卉 »>At£ijE 刊 MR照弓1 TKfinsiras>中衣社希佯刖対£11"如SHfi 应删7 Z3Q 彌■ 謂旦1E3 T —予 icssai> 口n :曰・廉呂埠雋1 晒丨下犠M 宅r 寥3. 在中国知网CNKI 期刊全文数据库中检索以“齐齐哈尔大学”为单位并且发表在2012年的核心期刊、El 、SCI 的论文分别有多少篇? 答: 74 篇GrX ・T 團蛛rinmtUiCiE审即期冃闿岸MX 赫利H 日C IffiU也罚 1】二卑氧|汕口二隼 r xMfij l soiim. r 日事JU »H “ 恤_删1 r ca^i沾 nLiin叮I?亠x-ij^ieiLS-im.i*siiii#徉m 忙幸Hi^fixtd^ 硏潇IF 两©4腔话纵曲#卡非 回EJ]椅掲I 创卜加让上乍 墓見型g# r ^mm r KMdMW P 刑r 叙翩」r cera■iJfL^S 学二 姑土尽 TH 火 ft* KB if-滴 | illlitr!H Rft 宰M3!七刃右卅用FU UK PFt +去咅対同 植引Tfls厂菇孕踊菲曲L 记鵲JV 11助Wl mtfiX'^Tt 时碗軒期血|Tft •临匀h八5.•审上吉牡#肛辖(0> EH壽h ' $杆園隘g 吟 53*厂1E« 刊E VVTtt fix◎rxif 躲貿‘亦"口4请在CNKI 《中国优秀硕士学位论文全文数据库》 中查找2000年以 来浙江大学本专业的硕士学位论文,请记录其中一篇硕士论文的篇名、 作者姓名、导师姓名和学科专业名称;该导师指导完成的学位论文有 多少篇?列举其中两篇学位论文的题目和作者。

计算机信息检索

计算机信息检索

2022/9/5
第4章 计算机信息检索
15
常见辅 助 字 段
段码名称 英文段码全称
作者
Author
作者单位 Author Affiliation
期刊名称 Serials Title
语种
Language
英文段码简称
AU AF ST LA
2022/9/5
第4章 计算机信息检索
16
3.2.4 文献信息数据库-检索原理
2022/9/5
第4章 计算机信息检索
4
机检与手检的比较
计算机情报检索的优点在于速度快,耗时少,查 阅范围广,查到的信息新, 专指性强。计算机检索 适用于最近20年内文献以及动态性信息的检索。
计算机情报检索的缺点是追溯时间有一定限制, 检索费用比较昂贵。
手工检索的优点是检索时间和检索范围都不受限 制,且费用低廉。手工检索尤其适用于学术性和 文科文献的检索。
文献.
概念分析:硬件 软件 逻辑关系:相互排斥关系
检索策略:硬件不包含 软件
hardware NOT software
2022/9/5
第4章 计算机信息检索
26
3.3.1 检 索 技 术
2 、优先算符:括号()
计算机优先执行括号内的检索式; A OR B (检索结果即集合号为S1) C OR D (检索结果即集合号为S2) S1 AND S2
2
计算机信息检索的定义
计算机信息检索,简称机检,是
指利用计算机查找文献信息的 过程。
2022/9/5
第4章 计算机信息检索
3
计算机信息检索的发展历史
四个主要的发展阶段 第一阶段:50年~ 电子管 第二阶段:65年~ IC,联机检索 第三阶段:85年~ DOS,光盘网络 第四阶段:93年~ WINDOW,互联网

文献检索课作业

文献检索课作业

文献检索课作业要求:按照以下要求完成作业,交打印稿给班长。

请各班班长收齐后,在6月3日交送到图书馆新馆六楼文献中心周老师处。

一、简述“中国知网”新版平台的学术资源总库的检索方式及其功能(十种)。

答:1.简单检索。

简单检索是一框式检索,用户先选择数据库和科学分类,在检索框内输入检索词后单击“简单检索”即可检索相关文献。

2.标准检索。

标准检索是一种限制级检索,便于准确控制检索目标范围和结果。

3.高级检索。

高级检索是一种比初级检索、标准检索更复杂一些的检索方式。

4.专业检索。

在检索界面单击“专业检索”进入专业检索框,利用检索项符和布尔逻辑将检索词连起来组建布尔逻辑式。

5.引文检索。

引文检索以检索参考文献为出发点,根据文献的引用关系,找到引用文章。

6.学者检索。

学者检索是通过学者姓名、单位、研究方向关键词等信息。

查找学者发表的全部文献及被引用情况。

7.科研基金检索。

用于检索各种国家和各级科研项目下发表的科技论文情况。

8.句子检索。

句子检索是全文检索,在检索界面单击“句子检索”即进入检索框,在检索框中,首先可输入检索的时间控制条件,选择文献发表时间的起止。

9.工具书及知识元搜索。

工具书及知识元搜索提供了事实检索途径。

10.文献出版来源。

与其他检索方式中的文献出版社来源检索项检索不同,文献出版来源检索可查看某一文献出版来源。

二、自拟一个和专业相关的检索课题(包含三个或三个以上的检索词),使用中国知网新版、万方、维普检索出该课题相关的期刊论文的题录信息。

具体要求:写出检索式、总记录数、列出最前面5条记录的题录信息(按自定义格式“题名、作者、刊名、年【卷】期、页码、摘要”来输出)、检索界面截屏。

(请注意:这三种数据库的论文题录信息的显示格式略有不同,请按照自定义后实际显示的格式来输出。

)1、检索课题(比如:信息检索与信息分析中的数据挖掘):概率论与数理统计的研究_________________________________________________________________2、检索式(如:TI=(信息检索+ 信息分析) * 数据挖掘):TI=( 概率论+ 数理统计) * 研究__________________________________________________________________________3、检索结果:CNKI检出946 条;万方检出374 条;维普检出29 条。

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量

信息检索 题库

信息检索 题库

信息检索题库【单选:1分,多选:2分,名词解释:3分,填空:1分,简答:5分,综合:10分】[1] 文献答案:文献就是用文字、图形、符号或声像、视频等技术手段记录知识信息的物质载体,或曰固化在物质载体上的知识信息。

[2] 关于网络信息的特点,正确的说法有哪些A 丰富、涵盖范围广泛B 体组合,形式多样C 来源分散、无序,缺乏统一管理D 缺乏管制,无国界E 信息来源广泛答案:ABCD[3] 简述文献的特点。

答案:文献数量大,增长速度快;文献分布集中又分散;文献时效性增强;文献内容交叉重复;文献载体及语种增多[4] 网络检索系统答案:网络信息检索是指利用计算机设备和国际互联网(Internet)检索网上各服务器站点的信息。

[5] 专利说明书答案:它是专利申请人向专利局递交的说明发明创造内容及指明专利权利要求的书面文件,既是技术性文献,又是法律性文件。

[6] 下面属于专利检索工具的有()A 《分类年度索引》B 《外观设计专利公报》C 专利说明书D 专利文摘E 中国专利信息检索系统答案:ABDE[7] 信息检索的特性A 相关性答案:查全率[14] 布尔逻辑检索中检索符号“OR”的主要作用在于A 提高查准率B 提高查全率C 排除不必要信息D 减少文献输出量答案:B[15] 计算机信息检索始于()A 上世纪40年代B 上世纪50年代C 上世纪60年代D 上世纪70年代答案:B[16] 信息资源检索中,在已获得所需文献基础上再利用文献末尾所附参考文献等作为检索入口查找更多文献的方法称为A 顺查法B 倒查法C 追溯法D 循环法答案:C[17] 按国际上通用的以数据类型分类的方法,光盘数据库通常划分为源数据库和混合型数据库。

答案:参考数据库[18] 专利有三层含义:、创造性和实用性。

答案:新颖性[19] 申请号为02269117.0 的多功能防盗防丢手机套的IPC号是A D44C19/08B A42B23/08C D44E19/24D A45C13/24 答案:D[20] 如果检索有关多媒体网络传播方面的文献,检索式为A 多媒体and 网络传播B 多媒体+网络传播C 多媒体or 网络传播D 多媒体—网络传播答案:A[21] 请论述用CA工具检索课题“萘在气态时与四氯乙烯的反应”的检索策略。

《信息检索》中文数据库上机实习题目及要求

《信息检索》中文数据库上机实习题目及要求

《信息检索》中文数据库上机实习题目及要求一、CNKI数据库1.利用《中国学术期刊网络出版总库》“期刊导航”中的“核心期刊导航”,查找本专业学科的核心期刊。

并请回答以下问题:①该类期刊的种数是多少?②请举一种期刊,说明该刊的综合影响因子数是多少?2. 利用《中国学术期刊网络出版总库》检索安徽工业大学经济学院“李致平”老师的文章收录数目是多少?其中是第一作者的文章数目是多少?并请指出其中被引频次最高的文献的篇名.3。

利用《中国学术期刊网络出版总库》检索主题为“美国金融危机”,且题名包含“次贷危机"的文章检索结果。

①检索结果是多少篇;②以题录的形式列出其中2011年度的文章结果。

二、万方数据库在万方数据库期刊全文库中利用高级检索模块下的“经典检索”,检索安徽工业大学的作者在《安徽工业大学学报》上发表的有关“高等教育”方面的文章,请指出检索结果是多少篇,并列出最新1篇文章的题录信息(包含标题、作者、期刊名称、年卷期).☆☆实习报告要求:(1)、封面格式:中文数据库检索实习报告、姓名、学号、班级、完成日期。

(2)、内容:每道题目请写出检索表达式和主要的检索步骤;并标注题号. (3)、对本次检索方法和结果的自我评价。

(4)、实习报告请于12月18日前提交,逾期视为不合格.(5)、邮箱地址:1579631622@.邮件的标题:“姓名+学号+信息检索实习报告”.2011—2012《信息检索》公选课总复习题一、单选题(共50题选30题,每题1分共30分)1.下列属于布尔逻辑算符的是()。

A、与B、或C、非D、以上都是2、信息素养的核心是()。

A、信息意识;B、信息知识;C、信息能力;D、信息道德3、20世纪70年代,联合国教科文组织提出:人类要向着( )发展。

A、终身学习;B、学习型社会;C、创新发展;D、信息素质4.参考文献的标准著录格式是()。

A、著者篇名来源出处;B、篇名著者来源出处5.请标出文献:马品仲. 大型天文望远镜研究。

信息检索题目(含答案)

信息检索题目(含答案)
正确答案:C
A.与运算
B.或运算
C.非运算
D.异或运算
15.ISBN中最后一个数字代表(C)。
正确答案:D
A.地区码
B.出版社代码
C.书序号
D.校验码
16.(B)属于文献的外表特征。
正确答案:A
A.题名
B.主题词
C.关键词
D.分类号
17.广义的信息检索的全过程包括文献信息的(B)两个过程。
正确答案:A
D.追溯法
12.一个截词符代表多个字符指的是(D)
正确答案:C
A.后截词
B.中截词
C.无限截词
D.有限截词
13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。
正确答案:D
A. A not B
B. A and B
C. A - B
D. A or B
14.(B)之前,必须输入一个空格。
C.机器信息
D.人类信息
2.以下(B)不是信息的基本要素。
A.载体
B.数据库
C.信源
D.信宿
3.国际标准书号中地区号为7,代表其是(B)出版社出版的图书。
A.美国
B.中国大陆
C.俄语系国家
D.法语系
4.以下(D)不是信息的特征。
A.共享性
B.价值型
C.时效性
D.不可扩充性
5.(A)使用的是http协议。
正确
68.可以通过热门推荐来了解当前我校图书馆中哪些图书较受欢迎。(对)
正确
69.我校图书馆馆的OPAC中可以进行读者荐购。(对)
正确
70.登录我校图书馆的“我的图书馆”中可以进行借阅证挂失。(错)
正确答案:对

信息检索考题及答案

信息检索考题及答案

信息检索考题及答案一、单选1、报道范围主要为能源方面的科技报告为( D、DOE)。

2、(C报纸)是出版周期最短的定期连续出版物。

3、( A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。

4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物)5、年鉴属于下列哪一类别(D三次信息)6、下列哪种文献属于一次文献(A图书)。

7、下列文献中属于一次信息的是( A专利说明书) 8、以下各项属于二次信息的是( A索引)21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。

22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。

23、布尔逻辑表达式:在职人员NOT(中年AND 教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据)24、布尔逻辑检索中检索符号“OR”的主要作用在于( B提高查全率)。

25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。

26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索)27、截词检索中,“?”和“*”的主要区别在于(A 字符数量的不同)。

28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。

29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A?)表示有限检索。

30、利用截词技术检索“?ake”,以下检索结果正确的是(D take)31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。

32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。

33、我国最早的分类法是(B 《七略》)34、要查找吴敬琏所发表的文章,首选途径为(C 责任者途径)。

对于中国期刊全文数据库(CNKI)的使用权限的说法,(A从任何公网终端都可访问其全文信息)是不正确的。

信息检索

信息检索

《中国图书分类法》(台湾) 中国图书分类法》 台湾)
000 100 200 300 400 600 700 800 900 310 总论 320 哲学 330 宗教 340 自然科学 350 应用科学 360 历史、地理 370 历史、地理 380 语文 390 美术 数学 天文 物理 化学 地质 410 生物、博物 420 植物 430 动物 440 人类学 450 460 470 480 490 441 442 443 444 445 446 447 448 449 土木工程 道路工程 水利工程 船舶工程 市政工程 机械工程 陆空交通 电气工程 核子工程
《中图法》等级分类体系
H11 H12 H111 H112 H113 H121 H122 H123 H124 下位类
H1 H2 H3 R1
H13 H14
上位类
等级体系分类法
《中图法》结构示意图
基本大类 简表 详表
A 马克思主义、列宁主义 毛泽东思想、 邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 U1 综合运输 S 农业科学 U2 铁路运输 T 工业技术 U4 公路运输 U 交通运输 U6 水路运输 V 航空、航天 [U8] 航空运输 X 环境科学、安全科学 Z 综合性图书
手工检索
数据信息和事实信息检索是确定性的检索, 检索结果可以直接利用,一般通过三次信息 源来完成。 文献信息检索是一种相关性检索,检索结果 是文献信息的线索,一般通过二次信息来实 现。 全文数据库是一次信息和二次信息的综合体 。在检索结果中,有直接的全文链接。

第四章 维普数据库检索方法

第四章 维普数据库检索方法

66
有关电子商务的文献
67
在此基础上检索关于网络安全的 文献
68
查找关于“晶体生长”方面的文章且作者是“刘 英才”,就可以采用二次检索的方式或者逻辑表 达式的方式来实现。
69
也可直接在任意字段中输入“K=晶体生长*A=刘英 才”来得到检索结果,如图示:
70
检索实例:
检索“玻璃钢/聚丙烯(FRP-PP)复合增 强的研究”的文献

87
最多勾选数据不超 过5个。
88
89
90
二、直接输入检索式检索

可在检索框中直接输入逻辑运算符、检 索代码等,点击“扩展检索条件”并对 相关检索条件进行限制后点击“检索” 按钮即可。
91
92

在以下字段用到匹配关系 关键词、作者、第一作者、分类号、栏目信息、基金 资助 作者简介

49
模糊匹配
50
精确匹配
51
52
53
3 同名作者的使用
维普数据库提供这样一个不同于其他数据库的 功能,就是用作者字段进行检索的时候,为了防 止重名重姓的作者混淆文献结果,可以先根据作 者单位进行作者的筛选,然后再继续检索,这样 可以防止误检。
54
检索华东理工大学胡英教授发表的 文献
55
对姓名进行精确检索
56
同名作者的筛选
57
58
59
4 同义词的使用
同义词库功能的使用类似于同名作者的使用,只 有在选择了关键词、题名或关键词检索入口时才 生效。 例如:输入关键词“土豆”检索时会提示“马铃 薯、洋芋、洋蕃芋 ”等是否同时选中作为检索条 件,就可以有选择的扩大检索范围。
7
独特功能介绍

信息检索知识

信息检索知识

tumor(瘤)or carcinoma(癌) or neoplasm (新生物)。
A OR B
8
逻辑“非” NOT/检索式“A not B”表示包含检索词A同时不包 含检索词B的文献为命中文献。 如:查“动物的乙肝病毒(不要人的)”的文献 的检索式为hepatitis B virus(乙肝病毒)
not human(人类)。
A NOT B
9
邻近度算符 With 检索式“A with B”表示检索词A和检索词B 不仅要同时出现在一条记录中,还要同时出现 在一个字段里的文献才是命中文献. 如:“drug with abuse”检索出的是同一个字 段中同时出现这两个词的记录。
10
邻近度算符Near
Willian Henry Harrison →Harrison W H 姓前有前缀M’、Mc、Mac,在索引中一律按Mac的字顺排 在一起 姓前带 冠词 De、Della、Des、La、Van、Vanden、Von 与姓名字顺一起排列; 有等级制称号的著者排在无等级制称号的著者之后,先排 Johs W 后排Johs W jr 音译中国人著者-按汉语拼音著录;俄国人-按英俄文音译 对照表;日本人-按黑本氏英日文音译对照表对译。 学术团体,企业单位等名称按原名著录,并加国名以示区 别。
33
主题词检索
34
检索步骤: 1、点击[主题词]按钮 2、输入检索词(中文或外文),点击[浏览]按钮 3、选中所要检索的主题词,点击[主题词注释]按钮之后, 可对该词进行不扩展、扩展、加权检索及树状结构选择 4、点击[检索]按钮,选择相应的副主题词与主题词进行组 配检索
35
索引词检索
36
检索步骤: 1、点击索引词[浏览] 2、输入检索词,点击[浏览]按钮 3、通过浏览选择检索词,点击[检索]按钮 备注: 检索多个索引词时,使用[加入列表]、 [浏览列 表]和[检索列表] 按钮

wordcollocations中文版(信息检索)

wordcollocations中文版(信息检索)

wordcollocations中⽂版(信息检索)虽然说是⼤作业,也做了好⼏天,但是完全没有什么实际价值...就是把现有的东西东拼西凑⼀下,发现跑的特别慢还搞了个多核写这篇blog纯属是我吃饱了没事⼲,记录⼀下装env的蛋疼⾸先我们是在python下进⾏的,虽然python本⾝有点慢,⽽且多线程8太⾏,但是架不住他在处理dictionary的时候简单同时我们需要的库有lucene(建⽴索引),pyltp(依存句法粉细),wx(画⼀个很丑的GUI界⾯,作业要求的)我惊奇的发现,只有python3.6才能满⾜这三个库同时存在...配置环境:我在阿⾥云上⽤竞价⽅式买了⼀个计算性ecs.ic5.3xlarge,12核12GB,虽然看起来很贵,但是实际竞价的话⼀天也就10多块钱(结果硬盘⽐机器贵...)⾸先在tuna源上下载anaconda3-5.2,bash安装更新pip以后就可以直接pip install pyltp了,但是pyltp还有模型数据要单独下载,百度⼀下就好了接下来下载pylucene-8.1.1,解压以后按照安装到python⾥⾯最后 conda install wxpython=4.0.4=py36hc99224d_0 安装wxpython,不指定build的话anaconda⾃动给升级成python3.7就爆了....到此环境终于搞定了⾸先word collocation,也就是常⽤词搭配,可以⽤⼀句话来解释:“元芳你怎么看”显然“元芳”,”你“,“怎”么都是修饰看的,也就是说虽然”元芳“和“你”在同⼀句话⾥⾯,⽽且甚⾄连在⼀起,但是他们之间其实是没有什么“搭配”的关系的这时候可以⽤到⼀个叫做依存句法分析的东西,也就是可以把⼀句话⾥每个词修饰的到底是另外哪⼀个词给找出来,这样我们就可以得到⼀句话⾥的所有“词语搭配”了这个东西并不需要我来写,使⽤哈⼯⼤写的极烂但是仅此⼀家的LTP⼯具可以简单地分析⼀下,但是有⼀说⼀,确实很慢现在查询⼀个词“服务”和它搭配最多的词,我们只要找到所有包含“服务”的句⼦,然后把这些句⼦给⽤ltp分析⼀下,这样就能找到所有修饰“服务”的词了我们再把它们统计⼀下个数,出现越多的说明这种搭配越常见,于是就完事了但是我们发现实际上运算速度⾮常的慢,因为需要在线依存句法分析,⼀分钟⼤约只能处理10000条句⼦所以我⼜使⽤了python⾥的mulitprocessing,⽤满了所有的12个核⼼,这样⼦速度⼤概提升了10倍左右(因为有⼤量内存拷贝,占⽤了很多时间)同时因为我要在两个process⾥传递dictionary,然⽽我经过查找发现mulitprocessing.Queue的⼤⼩只有65536Byte(⼤概),所以我只能传递词典的前150个词左右回去,剩下的词出现次数也并不多,所以去掉了也没有关系,最终结果如下:暂时先写到这⾥,有空再补。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

241元搜索引擎(4)为元搜索引擎增加复杂细节1)有时对于给定的一个搜索,元搜索引擎只需要调用部分搜索引擎,而不是其连接的所有搜索引擎。

(数据库可选性)2)可控制元搜索引擎其下每个搜索引擎检索文档的数量(文档可选性)3)排序所有返回文档时,相关文档排在非相关文档之前。

4)自动构造和维护元搜索引擎242元搜索引擎(5)数据库选择问题当本地数据库数量庞大时可以必要的选择少数潜在有效的数据库代替全部数据库,这样做可以:降低网络传输消耗避免本地资源浪费提高检索效率243元搜索引擎(6)潜在可用数据库:包含可用文档的数据库潜在可用文档:其与搜索内容的整体相似性高于边界值其与搜索内容的整体相似性低于某个极大值m为执行数据库可选性需预先搜集每个数据库相关知识以上称为数据库代理244元搜索引擎(7)文档选择性的问题对于每个可选本地数据库,有效选择潜在可用文档。

检索全部潜在可用文档同时极小化对无用文档的检索。

从整体相似性边界值到局部相似性边界值设d为全体文档:Gsim(q,d)>GTGsim为整体相似性函数,GT为整体边界值设在本地数据库DB k中搜索d,则有Lsim(q,d)>LT kLT k是最大的局部边界值由Gsim(q,d)>GT ->Lsim(q,d)>LT k245元搜索引擎(8)结果排序问题将从多个数据源返回的文档整合进一个序列表里难点:本地文档相关性不可用或文档无法比较。

、解决方案:生成全局相似性,然后再进行排序。

246元搜索引擎(9)一个好的元搜索引擎应具备如下条件:检索效率:达到按不同数据源检索和相同数据源检索效率接近。

效果:最优化检索过程结论:仅选择有效搜索引擎仅检索和传递有效文档根据文档相关度排序247元搜索引擎(10)主要资源问题:局部搜索引擎分治设计自主化:自行设计决定局部搜索引擎-接口,排序算法维护自动化自行决定何时升级系统,针对哪个组件进行升级,如何升级。

自行决定何时更新数据库索引。

248元搜索引擎(11)分治性可以导致多样性多样性存在于局部搜索引擎中索引方法:去掉停顿词—保留停顿词执行去词干化-不执行使用全文本索引—使用局部文本索引使用锚文本-不使用249元搜索引擎(12)文档/检索词权重方案仅使用tf使用tf*idf使用或不使用标签信息(将词放入标签尤为重要)相似性函数点乘或余弦函数扩展启发函数合并从链接中导出的重要信息250元搜索引擎(13)文档数据库不同的范围级别不同的文档集合等级文档版本:同一文档的不同版本会被不同的搜索引擎建立索引结果报告:可提供或不提供关于大量返回文档的排序。

251元搜索引擎(14)分治性与相异性带来的影响对于数据库:相异性文档数据库造成了数据库需求增巨。

方法选择取决于中央代理数据库的可用性。

对于文档选择性:选择局部文档需要整体测量方法。

结果排序:计算局部文档相似度需客服不可比性及不可用性。

252数据库可选性:基本思想目标:针对每个用户检索指出潜在可用数据库一般方法:使用用户代理指定内容近似的相关数据库针对每个查询使用这些代理选择数据库253多样化的解决方案:不同类型的代理程序通过不同算法执行代理程序原始方法:选择全部搜索引擎。

(举例:元爬虫)粗加工样本:搜索引擎的内容被描绘成一些词或短语。

这些词或短语是与检索词相匹配的关键字。

搜索引擎内容相关的的每个词都是用精密统计信息表述,同时具有许多方法使用信息以选择搜索引擎。

基于学习的方法:通过训练和用户查询学习搜索引擎相关知识。

、254粗加工样本方法(1)标准样本:一些词或短语应使用正确格式经常需要手工结构一般备注:可以适当为特殊需求数据库工作在存储需求中可升级当需求描述粗糙时可能导致结果不准确255粗加工样本方法(2)例子一:ALTWEB样本具有固定格式:地址包含PerI语言的文件模板类型:文档标题:PerI描述:涉及PerI程序语言,包括本地化超文本,PerI手册,关于超文本的问答。

关键字:PerI,PerI问答,PerI程序语言用户检索可以匹配一个或多个部分。

256粗加工样本方法(3)例子2样本具有文字网络基本结构:地址包含由国家组成的目录主题:国家信息类型:元素用户检索在匹配前先转化成相似结构257粗加工样本方法(4)一个搜索引擎的样本是从搜索引擎网页接口和网页接口回溯链接的网页相关文本中提取的。

每个用户检索被扩展到许多个检索,每个符合主题的扩展检索都与原始检索相关。

一个现存的正常搜索引擎即被使用针对每个新的搜索,指出并显示三个最好的搜索引擎用户选择已经显示的搜索引擎进行使用260统计样本方法(1)对包含在搜索引擎文档中的每个词进行一种或多种统计所构成的集合。

一些统计方法:文档频率:搜索引擎中有多少文档包含词t集合频率:元搜索引擎中有多少个搜索引擎包含词t平均正规化权重:搜索引擎中所有文档包含t的权重的平均值最大正规化权重:搜索引擎中所有文档包含t的最大的权重261统计样本方法(2)1.局部搜索引擎之间合作-每个局部搜索引擎提供其自身的数据库样本2.局部搜索引擎之间半合作(遵循某些标准协议)-每个局部搜索引擎可以为其样本提供足够信息。

3.局部搜索引擎之间不合作-抽取局部文本制作近似样本。

262统计样本方法(3)如何取得搜索引擎样本识别出搜索引擎搜索的主题对应的文本的词汇表将词汇表中每个词单独提交到搜索引擎中,从返回排序文档中得到需求统计数据。

263统计样本方法(4)例子一:gGioss(普化服务器难词服务器)样本:对于一个t i有(df i,W i)df i 对于词t i的文档频率W i对于词t i在全部文档中的加权和数据库有效性:所有高相似度的和其中D是数据库,T是边界值264gGioss(1)假设查询为q,设265gGioss(2)有效性评估建立在两种情况下高相互关系情况:如果df i<=df j,,则每个文档既包含t i也包含t j266gGioss(3)两个文档包含所有查询词他们的预期相似度为一个文档包含t2,t3并且预期相似度为一个文档包含t3的预期相似度为267gGioss(4)分散情况:对任意两个查询词ti与tj,没有一个文档同时他们。

268gGioss(5)评论:有效性取决于边界值每个词拥有两个样本有效性评估使用较牢固的假说高相关联性趋向于过高估测分离趋向于过低估测两种估测对于大于边界值相似度之和具有越界倾向269统计样本方法(10)例子2:CORI Net样本:对于一个词t i(df i,cf i)df i -关于词t i的文档频率cf i –关于词t i的集合频率cf i可以被全部数据库分享数据库有效性有效性(q,D)=sim(q,D的样本)270CORI Net一些评论:估测不依赖边界值每个词少于两个样本相似度计算基于推理网络数据库排序与文档排序使用同一方法278. 文件在数据库D中的数字与相似性大于阈值T较高者:NoDoc(D,Q,T)=|{D:D∈D和sim(Q,D)> T】|•这项措施表示数据库的用处对于一个查询的很清楚。

•这样的措施可以是收费可能有用基于搜索服务(费用取决于有多少可能有用的文件可以找到)。

279. 基本方法•代表:(圆周率,WI)的术语tPI:TI出现在文档的概率wi:TI在文档之间的平均重量有Ti例如:TI的10份文件标准化权重为(0,0,0,0,0.2,0.2,0.4,0.4,0.6,0.6)。

PI=0.6,WI=0.4280. 基本方法(续)例如:考虑查询Q=(1,1)。

设P1 =0.2时,w1= 2,P2 =0.4,W 2= 1。

生成函数:(0.2 X 2 +0.8)(0.4 x +0.6)=0.08×3+0.12 X 2 +0.32 X +0.48aX b:a是在D中文档出现的概率与q有相似度bNoDoc(Q,D,1)= 10*(0.08+0.12)=2281查询的生成函数此查询的精度函数282. 基本方法(续)考虑查询Q=(Q1,...,QR)。

命题。

如果条款是独立的,权重术语t i存在于一个文件的时候是wi(平均权重),1≤i≤r,则该系数第X于该下生成函数是概率是在D中文档具有相似性s的Q值。

283. 基本方法(续)假设扩展生成函数是:A1X B1 + B2 A2X+ ... + ACX BC,B1> B2>...> BC对于一个给定的阈值T,令v为的最大整数满足BV> T。

然后NoDoc(Q,D,T)可以通过估算:N(A1 + A2 +...+ AV)其中n是文件D中的数.284基本的方法不是很准确的因为两个假设:1,长期有文档之间均匀权重拥有它。

2单词是独立的。

•为了克服均匀项的权重的假设。

•附加信息术语t:ΣI:TI的权重,在所有的标准偏差文件mnwi:TI的最大权重归285. 例如:4,4,1,1,1,1,0,0,0,0:单词t i的权重使用平均重量生成函数(因子)0.6* X 2 +0.4使用权重的子范围的更准确的函数0.2* X 4+0.4* X +0.4一般情况下,权重被划分为k子范围:PI1* X MI1X MIK+(1 - PI)概率PIJ和中位数MIJ可估计用σi和Ti中的权重的平均值。

一个特殊的实现:使用最大归权重(mnwi)作为自身的第一子范围。

286. 统计样本方法(23)•尝试优化每个排名的搜索引擎查询并使用唯一排名靠前的搜索引擎。

用户:为查询Q,找m个类似的文件。

定义:资料库[D1,D2,...,压差]是最佳排名就到q如果对于每m,存在一个k,使得每个数据库的D1,...,DK包含一种米最类似的文件,并所有这些m文件都包含在这k 数据库。

287. WebScales(续)命题:资料库[D1,D2,...,]是最佳排相对于查询Q,当且仅当它们都排在的相似性降序在每一个最相似的文档288. 数据库的选择:如果数据库的优化排名可以得到,我们可以选择数据库根据级别从最高开始排名。

•在实践中,最相似的相似相对于一个查询需要在数据库中的文件要估计和数据库的排名为基础的估计相似之处。

•让MSIM(Q,D)是最相似的相似性在数据库D中就记录到查询Q。

289. 如何找到MSIM(Q,D)为每个数据库D中?1,使用子区域为基础的方法来估计MSIM(Q,D)。

例如:假设在一个数据库中100个文件。

对于查询Q,生成功能是:0.002 X4+ X30.009+...自100 *(0.002+0.009)≥1的全局相似性估计最相似的文档是3。

•这种方法的缺点:- 需要大量的存储数据库的代表- 具有指数的计算复杂度290. 2,更有效的方法•全局数据库代表人:长期TI全球DFI•本地数据库的代表:anwi:TI的平均权重正常化mnwi:TI的最大权重归291. 更有效的方法(续)长期权重方案查询条件:TF* gidf文档词:TF查询Q=(Q1,Q2,...,QK)修改后的查询:Q'=(Q1 * gidf1,...,QK* gidfk)MSIM(Q,D)=最大{补气* gidfi* mnwi+ΣQJ* gidfj* anwj}/| Q'|1≤≤k均Ĵ≠我•| Q'|可以在不影响相对排名丢弃。

相关文档
最新文档