Goole最全搜索语法规则
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Goole检索语法规则
(一)规则
1、Google不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
2、Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
3、Google的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
4、Google对一些网络上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“+”。
5、Google在搜索中的所有符号(+ - "" :等)都必须是英文字符
6、Google会忽略掉检索词之间的大多数标点符号,但有两种情况例外!单引号和连字符,它们不能被省略,当输入了带有连字符的检索词后!即可检索带有连字符的检索词!也可检索不带连字符的检索词!因此如果不能肯定使用的词是否带有连字符!则应该总是使用连字符"
7、Google 首先匹配按检索式相同词序含有这些检索词的网页!所以应该按照检索词在句子中出现的词序输入检索词,Google 还优先匹配检索词相互邻接的网页
(二)语法:+、-、OR、filetype
1、Google无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。
2、Google用减号“-”表示逻辑“非”操作。
示例:搜索所有包含“专题讲座”而不含“计算机”的中文网页
搜索式:专题讲座 -计算机
3、Google用大写的“OR”表示逻辑“或”操作
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询)。
但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果
4、搜索某一类型文件,可用“filetype”来搜索。
示例:搜索文献综述的PDF文件
搜索式:文献综述 filetype:pdf
(三)高级搜索语法:site,link,inurl,allinurl,intitle,allintitle
1、site:表示搜索结果局限于某个具体网站或者网站频道(如site:),或者是某个域名(如site:com)。
如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”(如 site:-com)。
示例:搜索中文教育科研网站()上所有包含“文献综述”的页面。
搜索式:"文献综述 site:"
注意:冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。
此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
诸如“文献综述site:/1/”的语法是错误的。
2、link:搜索所有链接到某个URL地址的网页。
示例:搜索所有含指向华军软件园“”链接的网页。
搜索式:"link:"
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略
3、inurl:返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。
有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。
INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索式:"inurl:midi 沧海一声笑"
注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。
Google对“cgi-bin/phf”中的“/”当成空格处理。
4、allinurl:返回的网页链接中包含所有查询关键字,这个查询的对象只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。
通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
搜索式:“allinurl:“cgi-bin“ phf +com”
5、allintitle、intitle:用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。
网页标题,就是HTML标记语言title中之间的部分。
网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。
因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:苏东坡作品集
搜索式:"intitle : 苏东坡作品"
(四)Google的罕用高级搜索语法:related,cache,info
1、related:用来搜索结构内容方面相似的网页。
示例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等)
搜索式:"related:/index.shtml"
2、cache:用来搜索Google服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
3、info:用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索式:"info:"
(五)google查询外文期刊PDF技巧
当给goole输入要查的关键词时,会出现海量的资料,大部分是没用的,如果查找具体的文章,跟着再输入"pdf",但一般情况下还是多的没法看完。
如果用"pii"代替“pdf",得到了理想的效果,查到的基本都是期刊文献,”pii"是期刊文献编号。
示例:搜Camellia
搜索式:Camellia pii(代替Camellia PDF)
(六)Google 给信息安全带来的隐患
Google 的强大检索功能给我们带来方便的同时,也给网络安全带来了极大的隐患—Google Hacking,它利用Google 的搜索引擎快速查找存在脆弱性的主机以及包含敏感数据的信息。
利用Google 超强的搜索能力,即使是一个初等的黑客也可以轻易获取安装了后门或有漏洞的主机、INC 文件、用户名和密码等敏感信息。
要防范Google Hacking,我们只需要在所要保护的网页中加入以下代码便可以达到目的:
<META. NAME="ROBOTS" CONTENT="NOINDEX,
NOFOLLOW">
<META. NAME="ROBOTS" CONTENT="NOSNIPPET">
以上代码的含义是阻止把本页面的特定内容和U R L连接记录到搜索引擎数据库中。
不过,加入代码后,站点的信息不会马上在搜索引擎的数据库中消失,数据更新需要一个月的周期。
另外,我们可以在服务器上安装过滤工具,如在IIS 服务上加载urlscan。
还可以利用相关工具在互联网上进行搜索,如果发现站点的有关信息被滥用,就通过http://www .google.
com /remove.html提交希望删除的信息。
同样地Google 的更新也需要一段时间。
(七)查找软件注册码
goolge 或baidu 输入: 94fbr 软件名称
例如:94fbr XX软件
原理:94fbr 是微软winxp 的注册码中的一项,凡是有注册码的网页都会有winxp的注册码,你要找的软件注册码一般也会在里面!
(八)快速获取代理服务器
在搜索栏输入 +":8080" +":80" +":3128" ,回车后,就能得到很多端口为8080、80、3128的代理服务器名称。
Google
上面介绍的是一些Google 的综合搜索使用方法方面的内容。
随着Google 的不断发展,它也逐渐开始提供更多的垂直搜索的功能。
比如目录服务、新闻组检索、PDF 文档搜索、地图搜索、电话搜索、图像搜索,还有工具条、搜索结果翻译、搜索结果过滤等更多的功能。
/
工具条/新闻组/ PDF搜索语法规则:inurl:pdf 搜索内容图像搜索 / 搜索结果翻译/preferences更多搜索内容/
百度
百度搜索使用了高性能的“网络蜘蛛”程序(Spider)自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。
百度搜索在中国和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门、新加坡等华语地区以及北美、欧洲的部分站点。
百度搜索引擎目前已经拥有世界上最大的中文信息库,总量达到6000万页以上,并且还在以每天超过30万页的速度不断增长。
基本搜索
百度搜索引擎简单方便。
仅需输入查询内容并敲一下回车键(Enter),即可得到相关资料。
或者输入查询内容后,用鼠标点击“百度搜索”按钮,也可得到相关资料。
输入的查询内容可以是一个词语、多个词语、一句话。
例如:可以输入[李白]、[mp3 下载]、[蓦然回首,那人却在,灯火阑珊处。
]
百度搜索引擎严谨认真,要求“一字不差”。
例如:分别搜索 [舒淇] 和 [舒琪] ,会得到不同的结果。
因此在搜索时,您可以试用不同的词语。
输入多个词语搜索
输入多个词语搜索(不同字词之间用一个空格隔开),可以获得更精确的搜索结果。
例如:想了解北京暂住证相关信息,在搜索框中输入
获得的搜索效果会比输入 [北京暂住证] 得到的结果更好。
在百度查询时不需要使用符号"AND"或"+",百度会在
多个以空格隔开的词语之间自动添加"+"。
百度提供符合您全部查询条件的资料,并把最相关的网页排在前列。
减除无关资料
有时候,排除含有某些词语的资料有利于缩小查询范围。
百度支持“-”功能,用于有目的地删除某些无关网页,但减号之前必须留一空格。
例如,要搜寻关于“武侠小说”,但不含“古龙”的资料,可使用如下查询:
并行搜索
使用“A|B”来搜索“或者包含词语A,或者包含词语B”的网页。
例如:您要查询“图片”或“写真”相关资料,无须分两
次查询,只要输入 [图片|写真] 搜索即可。
百度会提供跟“|”前后任何字词相关的资料,并把最相关的网页排在前列。
相关检索
如果您无法确定输入什么词语才能找到满意的资料,可以试用百度相关检索。
您可以先输入一个简单词语搜索,然后,百度搜索引擎会为您提供“其它用户搜索过的相关搜索词语”作参考。
您点击其中一个相关搜索词,都能得到那个相关搜索词的搜索结果百度快照
百度搜索引擎已先预览各网站,拍下网页的快照,为用户贮存大量的应急网页。
点击每条搜索结果后的“百度快照”,可查看该网页的快照内容。
百度快照不仅下载速度极快,而且您搜索用的词语均已用不同颜色在网页中标明。
原网页随时可能更新,跟百度快照内容不同,请注意查看新版。
百度和网页作者无关,不对网页的内容负责
为什么我找不到资料?
百度的统计表明,用户找不到资料的两个最常见原因,一是输入的词语中含有错别字,二是未使用多个词语搜索。
搜索引擎并不理解网页上的内容,只会找出跟您输入的词语相关的网页。
所以,输入[斑竹]、[以德制国]搜索,是找不到跟“版主”、“以德治国”相关资料的;
输入[现代爱情故事歌词]、[铃羊车的各种图案]、[上海到成都列车时刻表],也是找不到相关资料的。
使用多个词语搜索才能获得
更多跟好的资料,所以您搜索时应该输入的是[现代爱情故事歌词]、[铃羊车图案]、[上海成都列车时刻表]。
百度搜索引擎不区分英文字母大小写。
所有的字母均当做小写处理。
例如:输入"oicq",或"OICQ",或"oIcQ",结果都是一样的。