搜索引擎的使用(百度)google

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

– 不必注册,进出十分自由。
准备知识
–3. Telnet信息资源
• Telnet是Internet的远程登录协议。允许用户将自己的计算机作为某一 个互联网主机的远程终端与该主机相联,从而使用该主机的硬件、软件 和信息资源。如,各种办公系统,图书馆信息管理系统。 • 使用:需要安装特殊的远程终端(或称客户端)。
大多数搜索引擎并不真正搜索互联网,它搜索的
实际上是预先整理好的网页索引数据库。
搜索引擎也不能真正理解网页上的内容,它只能
机械的匹配网页上的文字。
WWW信息资源 搜索引擎 用 户 系 统 网络 用 户 接 口 FTP信息资源
采集标引机制
数据组织机制 用户检索机制
网络
Telent信息资源 Ghopher信息资源 WAIS信息资源 新闻组信息资源
• 垂直搜索引擎
– 垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。 不同于通用的网页搜索引擎,垂直搜索专注于特定的 搜索领域和搜索需求(例如:机票搜索、旅游搜索、 生活搜索、小说搜索、视频搜索等等),在其特定的 搜索领域有更好的用户体验。相比通用搜索动辄数千 台检索服务器,垂直搜索需求的硬件成本低、用户需 求特定、查询的方式多样。
45.4% 39.1% 15.5%
47.3% 39.0% 13.7%
50.0% 34.8% 15.2%
51.2% 31.4% 17.4%
58.1% 25.7% 16.2%
• 各搜索引擎在学生用户中所占市场份额比较
学生中的市场 份额 百度 Google 初中 高中 大专 大学本科 硕士 博士
– 搜索引擎其实也是一个网站,这种网站专门为你提供信息检索服 务。它使用特有的程序把因特网上的所有信息归类,以帮助人们 在浩如烟海的信息海洋中搜寻到自己所需要的信息。 – 搜索引擎是通过建立引擎的WEB 页上输入我们所查询信息的关键 词,经过引擎的检索服务器在内部数据库找到相关资料并按一定 的规则整理后再输送出来,通过网络传到本地主机的一种在线服 务方式。 • 搜索引擎 是一种用于帮助Internet用户查询信息的搜索工具,是 Internet网络上的信息检索系统,它以一定的策略在Internet中搜集、 发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索 服务,从而起到信息导航的目的。
准备知识
– 2. Usenet/Newsgroup信息资源
• Usenet是User Network(新闻组)的缩写,新闻组是个人向新闻服务器所张 贴邮件的集合。 • 每个新闻组都有一个主题,用户针对这一主题进行讨论、交流观点、录 求帮助,并以E-mail的方式发表文章。找到喜爱的新闻组时,您可以
– 搜索引擎正在彻底改变我们获得信息和知识的习惯, 翻书本,看报纸,跑图书馆等等。 – 有了搜索引擎,差不多就把我的脑袋和60亿人的脑袋 焊在了一起(如果不懂英文的话,这个数字降为13 亿)。如果我愿意,我可以称为研究匈奴史的专家, 也可以了解唐代衣服扣子的18种结法 – 很长一段时间里,搜索让我惊恐:怎么凡事我能想到 的,就一定有人早想到了,凡事我想知道的,肯定有 人知道答案了。
Google Vs. Baidu
• 关于统计口径:
• 1、网民访问次数份额; • 2、网民搜索关键词请求量份额;
• 3、搜索引擎运营商收入份额。
• 根据单位划分市场份额
搜索引擎在企业的市场份额 比例 搜索引擎在学校的市场份额 比例 搜索引擎在机关的市场份额 比例 Google 44.7% Google 25.7% Google 45.7% 百度 39.5% 百度 65.5% 百度 44.3% 其他 15.8% 其他 8.8% 其他 9.9%
的集合,通过它可以存取世界各地的超媒体文件。
• 格式:http://www.swjtu.edu.cn http://202.115.64.146
1.2 搜索引擎原理
搜索引擎的工作原理,可以看做以下三步:
1、由搜索器从互联网上抓取网页(信息的采集)
2、由索引器建立索引数据库(信息的组织)
3、由检索器在索引数据库中搜索并将结果排序(信息 的输出)
“收藏”它,这样它会显示在新闻组阅读器[如OutLook]的文件夹列表中。
– 常用访问组:
• 1.新凡:news://news.newsfan.net
• 2.济南万千:news://news.webking.com.cn/
• 3.宁波:news://news.cnnb.net • 4.奔腾新闻组news://news.cn99.com/ • 5. 微软:news://msnews.microsoft.com • 6. 前线:news://freenews.netfront.net
目录式搜索引擎
通过用户浏览层次类型目录来寻找所需信息。 分类一般按主题分类,并辅之以年代、地区等分类。 网站多以此方式组织。例如:新浪>分类目录>计算机与互 联网> 硬件>行情报价。 优点:使用户清晰方便地查找到某一大类信息,尤其适合 那些希望了解某一范围内信息,并不严格限于查询关键字 的用户。 缺点:搜索范围较全文搜索引擎要小许多,尤其是当用户 选择类型不当时,可能遗漏某些重要的信息源。 代表性的目录式搜索引擎是Yahoo、搜狐、新浪网站
搜索引擎:采集标引机制、数据组织机制、 用户检索机制
1.3搜索引擎的类型
按检索机制划分
全文搜索引擎 目录式搜索引擎 元搜索引擎
按检索内容划分
通用型 专题型
全文搜索引擎
从互联网上提取的各个网站的信息而建立的数据库中,检 索与用户查询条件匹配的相关记录,然后按一定的排列顺 序将结果返回给用户。 优点:是查询全面、充分,用户能够对各网站的每篇文章 中的每个词进行搜索,检索直接、方便,而且可使用布尔 逻辑检索、短语检索等高级功能。 缺点:繁多而杂乱的感觉。 代表性的全文搜索引擎是Google、百度。
• 根据年龄分段市场份额
25岁以下年龄 百度 段的市场份额 比例 25岁以上年龄 百度 段的市场份额 比例 39.5% 42.7% 17.8% 62.7% 23.7% 13.6%
Google
其他
Google
其他
• 高端用户搜索引擎使用
– 搜索引擎高端用户的定义是:年龄在25岁以上、大学本科 学历以上、个人月收入3000元以上,满足这三个条件的非
7.4%
• 根据收入情况分段市场份额
不同收 入非学 生用户 1000元 1000元 1500元 2000元 2500元 以下 以上 以上 以上 以上 3000元 以上 4000元 5000元 以上 以上
Google 百度 其他
20.8% 56.3% 22.9%
40.6% 42.4% 17.0%
43.0% 40.9% 16.1%
–国内比较大的邮件列表:
• 希网(http://www.cn99.com) • 通易(http://www.exp.com.cn) • 博达(http://www.bodachina.com)等。
–提示:
• 需要手续,一旦订阅就必须每天接收列表中的所有新邮件,不管你是否需要.
• 可建设自己的新闻组。
搜索引擎小测试
– 1、当别人向你请教一个问题,你10秒内无法想出答案时,你是否 会去网上搜索一下? – 2、当你再写一篇文档,需要斟酌某个字句时,你是否会打开搜索 引擎寻找答案? – 3、当你挂在网上无所事事时,你是否会打开一个搜索引擎的界面 ,随便在里面输入一个想到的词搜索? – 4、当你看到一个网站时,你是否基本不去留意网站的网址,而只 是记住网站的名称留待以后需要的时候搜索一下 – 5、当你需要编写一个格式报告(例如年终总结,毕业论文,会议 论文)时,你是否会先搜索一些范例并参照编写? – 6、当你的头脑里冒出一个可能让你发财的新想法时,你是否赶紧 上网搜索一下看看是否已被别人捷足先登了? – 7、如果你马上要和别人就一个你并不熟悉的领域进行讨论时,你 是否会赶紧先搜索一把,储备足够的背景知识.然后出动? – 8、当你即将奔赴一个陌生得地方。你是否会先打开搜索引擎页面 ,查阅当地的地理人文,风俗习惯。然后在启程? – 9、当你被突然问道一个复杂的问题时,你的头脑中是否会冒出若 干个关键词,而非连续的句子? – 10、你是否经常有这样的感觉:凡是我想到的东西,别人都想到 了;凡是我想知道的,一定有人知道答案了!
准备知识
• Internet网络信息资源的主要类型及其分布
–1. Mailing List/Listserv信息资源
• Mailing List(邮件列表)是一种基于E-mail方式的讨论组、聊天室。
• 特点:在每个邮件列表内,都有一个共用的小组信箱,组内任何一个成员向 小组发送/答复的邮件,全组在成员都可以收到。 “多对多”。
好的元搜索引擎
含盖较多的搜索资源,可随意选择和调用源搜索引擎; 具备尽可能多的可选择功能,如资源类型、返回结果数量 控制、结果时段选择、过滤功能选择等 强大的检索请求处理功能(如支持逻辑匹配检索、短语检 索、自然语言检索等)和不同搜索引擎间检索语法规则、 字符的转换功能。 详尽全面的检索结果信息描述(如网页名称、URL、文摘 、源搜索引擎、结果与用户检索需求的相关度等) 支持多种语言检索。
元搜索引擎
同时在其他多个引擎上进行搜索,并将结果返回给用户。 没有自己的数据库,利用一个统一的界面,查询其他独立 的搜索引擎。 优点:快捷,信息覆盖面更加广泛 缺点:高级检索功能不完善,检索结果没有经过处理 著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等( 元搜索引擎列表),中文元搜索引擎中具代表性的有北斗 、等。
• 图片搜索引擎
– 图片搜索引擎是全新的搜索引擎,目前国外有按图搜 。给予图像形式特征的抽取:由图像分析软件自动抽 取图像的颜色、形状、纹理
2.1中文搜索引擎的概况
• 根据艾瑞咨询研究显示,2010年中国搜索引擎市场规模达 到109.8亿元(约合16.5亿美元),年同比增长57.7%;搜 索引擎占总体网络广告市场规模比重达30.8%。 • 根据艾瑞咨询研究显示,中国搜索引擎用户量,截至到 2010年底,2010年中国搜索引擎用户达3.8亿人,用户覆 盖率为82.3%。 • MORI,对中国网名民意调查结果显示只有18%的用户表 示总能在网上搜索到需要的信息.68%的用户说他们对搜 索引擎很失望,28%表示还可以,其余4%为不知道。
搜索引擎
3.1 搜索引擎的基本原理和方法
3.2 常用搜索引擎分析
3.3 常用搜索个案
3.4 学术搜索引擎
关于搜索引擎的思考
搜索引擎是什么? 为什么会出现搜索引擎? 搜索引擎有什么作用? 搜索引擎能带给我们什么?
盲目 信息用户 网络信息资源
更快、更准确
搜索引擎
1.1关于搜索引擎
搜索引擎
搜 商
• 人们总是在疑惑:
– 是什么样的能力使我们人类能够超越其他物种 而成为万物之灵? – 是什么样的差异让一些人收获成功,一些人品 尝痛苦? – 除了不断地积累知识以外,我们有没有成功的 捷径?
• 是智商吗?
• 是情商吗?
你的搜商够高吗?
成功=智商+情商+搜商
SQ=K/T(C)(SQ=搜商,其中K=knowledge 知识,T=time时间,C=搜商指数(社会 平均知识获取能力))。
学生用户。
高端用户使用的 百度 搜索引擎 13.4% Google 其它
Βιβλιοθήκη Baidu比例
27.9%
58.7%
• 根据学历情况分段市场份额
大专以下 Google 百度 17.7% 52.1% 大专 27.6% 52.6% 大本 49.4% 39.1% 大本以上 72.2% 20.4%
其它
30.2%
9.8%
21.5%
–4. FTP信息资源
• 一种实时的联机服务,在工作时先要登录到对方的计算机上,然后进行 与文件搜索和文件传输的有关操作。
• 格式:ftp://210.41.95.34
ftp://library.em.swjtu.edu.cn
–5. 万维网(www)信息资源
• WWW是Internet上支持WWW协议和超文本传输协议HTTP的客户机与服务器
相关文档
最新文档