实训二搜索引擎技能实训
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实训二搜索引擎技能实训
【教学目标】
通过本章实训内容,使学生掌握搜索引擎收录的概念,了解搜索引擎是如何抓取网页的。
【技能要求】
网站在各搜索引擎的收录数量,反向链接数量,PR值及Alexa 排名。
1、收录数量
推荐两个工具,一种是手动查询,site:网址,就OK了;第二个是站长工具。
2、反向链接数量
反向链接其实就是在目标文档内部进行声明。
换言之,常规链接在文档 A 中标明“指向文档B”,而反向链接则在文档 B 中要求“使文档A 指向我”。
3、PR值
PR值全称为PageRank(网页级别),用来表现网页等级的一个标准,级别分别是0到10,是Google用于评测一个网页“重要性”的一种方法。
PR值越高说明该网页越受欢迎(越重要)。
4、Alexa排名
Alexa排名是指网站的世界排名,主要分两种:综合排名和分类排名,Alexa提供了包括综合排名、到访量排名、页面访问量排名等多个评价指标信息,大多数人把它当作当前较为权威的网站访问量评价指标。
【常用搜索技巧】
google搜索命令: Google不推荐使用的命令语法,但我们这次抽查可能要用到几个。
1、allinanchor: anchor是一处说明性的文字,它标注说明了这个链接可能跳转到其它的网页或跳转到当前网页的不同地方。
当我们用allinanchor提交查询的时候,Google会限制搜索结果必须是那些在anchor文字里包含了我们所有查询关键词的网页。
例[ allinanchor: best museums Sydney ] ,提交这个查询,Google仅仅会返回在网页anchor说明文字里边包含了关键词”best” “museums” 和”Sydney”的网面。
2、allintext:当我们用allintext提交查询的时候,Google会限制搜索结果仅仅是在网页正文里边包含了我们所有查询关键词的网页。
例[allintext: travel packing list],提交这个查询,Google 仅仅会返回在一个网页包含了三个关键词”travel” “packing”和”list”的网页。
3、allintitle:当我们用allintitle提交查询的时候,Google会限制搜索结果仅是那些在网页标题里边包含了我们所有查询关键词的网页。
例[allintitle: detect plagiarism],提交这个查询,Google仅会返回在网页标题里边包含了”detect”和”plagiarism”这两个关键词的网页。
4、allinurl:当我们用allinurl提交查询的时候,Google会限制搜索结果仅是那些在URL(网址)里边包含了我们所有查询关键词的网页。
例[allinurl: google faq],提交这个查询,Google仅会返回在URL里边包含了关键词”google”和”faq”的网页,象/help/faq.html等的网页。
5、author:当我们用author进行查询的时候,Google会限制返回结果仅仅是那些在Google论坛里边,包含了特定作者的新闻文章。
在这里,作者名可以是全名,也可以是一部分或邮件地址。
例[children author:john author:doe]或[children author:doe@]返回结果将是作者John Doe 或是doe@写的,关于包含关键词children的文章。
6、bphonebook:用bphonebook进行查询的时候,返回结果将是那些商务电话资料。
7、cache:提交cache:url ,Google会显示当前网页的快照信息,从而替换网页的当前信息。
例[cache:],提交这个查询,Google会返回所有抓取的关于的网页快照信息。
在显
示的网页快照信息里边,Google会高亮显示查询关键词。
(在cache:和URL之间不能有空格)
8、define:当我们用define进行查询的时候,Google会返回包含查询关键词定义的网面。
例[define: blog],这个查询将会返回Blog 的定义。
9、filetype: 当我们在查询里边包含filetype:扩展名的时候,Google 会限制查询结果仅返回特定文件类型的网页。
例[资产评估filetype:pdf],这个查询将会返回所有文件类型为pdf的资产评估信息。
其它可用的特定文件类型格式查询还有doc ,txt,ppt,xls.rtf,swf,ps 等。
10、group: 当我们用group查询的时候,Google会限制我们的论坛查询结果仅是某几个固定的论坛组或是某些特定主题组的新闻文章。
例[sleep group:misc.kids.moderated],提交这个查询,Google 仅会返回在用户组misc.kids.moderated里边包含了查询关键字”sleep”的文章。
11、inanchor: 当我们用inanchor提交查询的时候,Google会限制结果是那些在网页anchor链接里边包含了查询关键词的网页。
例[restaurants inanchor:gourmet],提交这个查询,Google会查询那些在anchor信息里包含了关键词”restaurants”和关键词”gourmet”的网页。
12、info: 提交info:url,将会显示需要查询网站的一些信息。
例[
info:],提交这个查询,将会返回网站的所有信息。
13、insubject:当我们用insubject进行查询的时候,Google会限制论坛搜索结果仅是那些在主题里边包含了查询关键词的网面。
[insubject:"falling asleep"],提交这个查询,Google会返回在文章主题里边包含了”falling asleep”的文章。
14、intext:当我们用intext进行查询的时候,Google会返回那些在文本正文里边包含了我们查询关键词的网页。
[Hamish Reid intext:pandemonia],提交这个查询的时候,Google会返回在文本正文包含查询关键字pandemonia,在其它任何地方包含关键词”Hamish”和”Reid”的网页。
(intext:后面直接跟查询关键字,不能有空格)
15、intitle:当我们用intitle进行查询的时候,Google会返回那些在网页标题里边包含了我们查询关键词的网页。
例[flu shot intitle:help],提交这个查询,Google会返回在网页标题包含了查询关键字”help”,而在其它任何地文包含了查询关键字”flu”和”shot”的网页。
(intitle:后面也不能有空格)
16、inurl:当我们用inurl进行查询的时候,Google会返回那些在URL(网址)里边包含了我们查询关键词的网页。
例[inurl:print site:],提交这个查询,Google会查找这个网站下面网址里边包含了查询关键词”print”的
网页。
17、link:当我们使用link:URL提交查询的时候,Google会返回跟此URL做了链接的网站。
例[link:],提交这个查询,我们将得到所有跟这个网站做了链接的网站。
(link是个单独的语法,只能单独使用,且后面不能跟查询关键词,跟能跟URL)
18、 location:当我们提交location进行Google新闻查询的时候,Google仅会返回你当前指定区的跟查询关键词相关的网页。
例[ queen location:canada ],提交这个查询,Google会返回加拿大的跟查询关键词”queen”相匹配的网站。
19、site:当我们用site提交查询的时候,Google会限制查询仅在某个网站,或是某个域下面进行。
例[admissions site:],提交这个查询仅仅会搜索网站 下面关于admissions的信息。
我们还可以限制搜索仅在域下面进行,例[javascript site:],提交这个查询,仅仅在教育网查询关于javascript的信息。
(site:后面不能跟空格,且site命令可以配合其它命令进行)
20、tq:如果想查某个地方的天气如何,我们只要在Google搜索框中输入"城市名称Tq"就可以查询到这个城市的天状况.例"北京tq",当然tq也可以用汉字的天气代替。
百度搜索命令:
1、blog:百度的blog命令,它可以查询你发表在百度空间的文章被百度收录的数量。
但这条命令只对百度博客搜索起作用。
用法:blog:/要查询空间名
2、Domain:用domain命令可以查找跟某一网站相关的信息。
例提交“domain:”就可以查询到在网站内容里面包含了信息的网站。
3、Filetype:限制查找文件的格式类型。
目前可以查找的文件类型有.pdf/.doc/.xls/.ppt/.rtf 用法:搜索关键字+ filetype:ppt
4、inurl:限定查询匹配只搜索URL链接。
用法:inurl:搜索关键字。
注,在用inurl用法的时候,尽量使用英文,因为中文会被进行URL 编码。
5、link:搜索与被查询网站做了链接的网站。
用法:link:,这样就可以看到谁跟做了交换链接
6、Site:限制查询在某一个特定站点内或网域内进行。
用法:搜索关键字+ site:或是在网域内搜索如搜索关键字+ site:
7、mp3:在百度网页搜索中直接搜索mp3资源。
用法:mp3:歌手名(注,一定要加上冒号)
雅虎搜索命令:
1、title:用于针对标题进行搜索。
例如:搜索title:张学友,搜索引擎会搜索到所有标题中包含“张学友”的网页。
2、ink:用于查找所有链接到某个网址的网页。
例如:搜索link:/ ,会搜索到所有链接到“”的网页;备注:搜索时不能缺少“http://”。
3、site:用于限定搜索结果的来源。
您如果知道某个站点中有自己需要找的内容,就可以把搜索范围限定在这个站点中,提高查询效率。
使用的方式,是在查询内容的后面,加上“site:站点域名”。
例如:想查询雅虎网站中报导的姚明信息,可以有以下两种方法:、在搜索框中输入姚明site:(注意中间使用空格隔开)。
2、在搜索框中输入site: 姚明也可以得到相同的搜索结果。
备注:“site:”后面跟的站点域名,不要带“http://”;另外,“site:”和站点名之间,不要加空格。
4、url:用于精确搜索url。
例如:搜索url: ,搜索引擎只会搜索到一个结果——雅虎中国。
【操作方法】
1、最简单的方法:到“站长工具”等一些工具网站上查询
/
2、背相应的命令,炫本事。
百度/谷歌/YAHOO :SITE 、LINK
link: 当我们使用link:URL 提交查询的时候,Google 会返回跟此URL 做了链接的网站。
搜索引擎的收录数量: site:www.****.com
搜索引擎的反向链接数量:www.****.com - ****.com
【实训内容】
1、查看网站的收录情况 网站名称 Google (收录情况/反向链接数) baidu (收录情况/反向链接数) yahoo (收录情况/反向链接数) PR 值
Alexa 排名
太平洋电脑
网
天极网
中关村在线
电脑之家
2、在搜索引擎谷歌和百度中输入关键词“电脑报价”,分析表中各网站在搜索结果中的排名。
表2 指定关键词(电脑报价)查询
网站名称 Google baidu
太平洋电脑网天极网
中关村在线。