各种搜索引擎技巧
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.html
.asp/.aspx .php .jsp
Html语言变量、函数、组建、流程、循环、结构
代码结构进行优化
URL 统一资源定位符号universal resources locator 网络地址
Filetype
Intitle
Inurl 美萍点播系统VOD down:43
Site: 在站内进行检索
Intext:
Seo搜索引擎优化-》sem搜索引擎营销-》网络营销
【项目背景介绍】
信息社会,信息以爆炸式的方式增长,网络环境下,搜索引擎是我们通往目的地的必备武器,但是在浩如烟海的网络信息里面,很多网友都只会简单的搜索,往往不能够很好的达到搜索的目的,因此也无法完成对海量信息的综合处理。
作为电子商务专业学生,如何高效的完成信息检索,无论是对个人依托网络进行的学习还是今后的网络商务工作,都十分重要。
【项目工具简介和环境要求】
互联网机房
能正常访问互联网、IE插件正常
【项目延伸思考题】
搜索引擎的商用价值
各类搜索引擎通用的高级搜索命令
提高网站被检索可能性的建议
【项目教学难点】
网站备案机制
网站支付流程的合理性
网站联系信息的真实性判断
【项目实施步骤】
项目简介—快速测试—软件包传送—学生自我摸索(安装、调试、搜索等)—手把手—应用场合分析—新模式联想
随着网络技术尤其是WWW站点的快速发展和普及,人们通过Internet获取全球信息的可能性越来越大。
可以说,我们所需要的信息,绝大部分都可以通过因特网获取。
但是网络信息内容庞杂、分散无序,各种有价值、所需的信息资源淹没在信息的“汪洋大海”中,给人们查询和利用网络信息资源带来了极大的不便。
为了更有效地开发和利用网络信息资源,人们研制了许多网络信息检索工具,其中WWW是Internet上增长最快、使用最方便灵活的多媒体信息传输与检索系统,越来越多的用户将自己的信息以WWW的方式在网上发布。
WWW服务器已称为互联网上数量最大和增长最快的信息系统,因而可以检索WWW网址网页以及新闻论坛、BBS文章的检索工具——搜索引擎称为查询网络信息的最主要的检索工具。
有人说,会搜索才叫会上网,搜索引擎在我们日常生活中的地位已是举足轻重。
你也许是个刚买了“猫”兴冲冲地要上网冲浪,也许已经在互联网上蛰伏了好几年,无论怎样,要想在浩如烟海的互联网信息中找到自己所需的信息,都需要一点点技巧。
对于企业而言,学习搜索,提高技巧,就能找到更多的潜在客户。
(一)什么是搜索引擎
搜索引擎是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。
搜索引擎有广义和狭义之分。
广义的搜索引擎泛指网络上提供信息检索服务的工具或系统。
在网络环境下,搜索引擎所扮演的角色与传统的手工检索工具在印刷版时代所扮演的角色很近似,因此,搜索引擎又被称为网络检索工具。
搜索引擎主要是用于检索网络信息资源,并通过Internet来提供服务。
狭义的搜索引擎主要指利用网络自动搜索技术软件对Internet(主要是Web)网络资源进行收集、组织并提供检索服务的一类信息服务系统。
搜索引擎通过因特网接收用户的查询请求,在其索引库进行检索,然后向用户反馈其感兴趣的信息所在的网址列表。
搜索引擎一般包含四个部分:信息搜集模块、建立索引模块、检索模块和用户交互模块。
(二)搜索引擎的优缺点
1、优点
(1)信息新颖,数量巨大
搜索引擎的最大的优点是在WWW上的综合覆盖面大,信息新颖。
(2)可检索到部分高质量、专指性强的信息
利用搜索引擎还可以检索到部分高质量的学术期刊和论文,其中有些刊物和论文仅以电子版发行。
搜索引擎最擅长检索那些处于“灰色地带”、不易归类的主题以及一些专指性很强的词汇。
(3)可检索到相关性高的信息
搜索引擎能够将其认为相关性高的检索结果排列在前。
此外,不同的搜索引擎具有不同的检索功能和特色。
总体来说,在用户需要进行范围广泛的查询,而且有时间筛选检索到的大量信息的情况下,搜索引擎具有极高的价值。
2、缺点
(1)信息质量不高
这是搜索引擎的主要缺点。
由于搜索引擎通常依赖于自动编写的摘要,这种摘要常常取自页面正文的头几行,而且并不一定较好地表达了页面的内容,因而检索结果可能与检索要求毫无关联。
检索到的资料缺乏权威性,缺乏像书刊出版社一样的审查录用机构对资料的质量把关,资料不准确,过时等,搜索引擎对检索到的资料不提供任何解释,也不提供任何质量方面的标识。
(2)信息内容重复
搜索引擎的检索结果中还经常重复出现同一信息资源的不同部分。
产生该问题的原因是搜索引擎在各独立页面的层次上编制索引,所以,来自同一站点或同一资源的不同的页面被独立地编入索引,并分散出现在检索结果中。
(3)费时费力
与商业性联机检索数据库相比较,利用搜索引擎检索常常要花费大量时间进行搜索、浏览、筛选,因此比较费时费力。
此外,搜索引擎通常仅限于检索WWW上的信息,检索其他信息则需要考虑使用其他检索工具。
二、搜索引擎的类型
按照不同的分类方式,搜索引擎可分为以下几种类型。
1、按照索引方式划分
分类搜索引擎是采用人工或机器搜索WWW信息,依靠专业人员对信息进行区别和分类而建立的以分类导航或分类摘要查询为主的一类搜索引擎,又称“主题指南”。
“主题指南”依靠人工创建索引数据库,各网站的创建者要向“主题指南”提供关于自己网站简短的描述或综述,用户检索时检索词的匹配只是在这些网站的描述或综述中进行。
由于搜索引擎及网页创建者双方人工的介入,使得信息分类准确清晰、条理性强,类目设置基本能反映当前人们关注的主要问题,检索到的信息相关度和精确度比较高,克服了机器人搜索引擎完全自动标引而造成的误差。
按照Search IQ最新的评价,Open Directory和Yahoo是目前最好的“主题指南”。
分类搜索引擎比较适合于对自身信息需求不很明确而且网络检索经验不足的用户使用。
(2)机器人搜索引擎
机器人搜索引擎(或称为“关键词搜索引擎”)是指由网上搜索软件自动收集网页建库,又以全文检索为主的搜索引擎。
这种搜索引擎自动在网上搜索,将信息带回来自动标引并创建索引数据库,用户则对通过它找到的信息进行检索。
利用自动化技术,这类引擎可以快速定期地收集分布于世界各地网站的信息,并能及时发现新的网站以及剔除已被废弃的网站,及时更新自身数据库,数据的时效性强,大大提高了用户对网络信息的查全率、及时性及有效性。
机器人搜索引擎可以使用布尔逻辑检索、限制检索等进行检索,因而查准率较高。
改搜索引擎适合于那些对所查信息专指度要求较高、能够明确表达自身信息需求概念且要求快速完成检索的用户使用。
2、按照检索内容划分
(1)综合型搜索引擎
综合型搜索引擎就是可以提供对网上多类型信息、多主题信息内容进行集成检索的搜索引擎。
综合型搜索引擎在采集标引信息资源时不限制资源的主题范围和数据类型,人们可利用其检索任何类型、任何内容的信息。
(2)专题型搜索引擎
专题型搜索引擎是专门用来检索网上某一类型或某一主题信息的检索工具,采集的信息针对某一主题范围的信息资源,并用详细的和专业的方法对信息资源进行标引描述。
由于专题型搜索引擎是针对某一类型或某一主题的信息进行加工、处理,因此搜索结果会更精确,相关性更高,对专业人员使用非常有效。
专题型搜索引擎的出现和发展是网络搜索引擎未来的发展方向。
3、按照检索方式划分
(1)独立型搜索引擎
独立型搜索引擎是Internet上最常见的一类搜索引擎。
它拥有自己的索引数据库,检索在自身数据库进行,并根据数据库的内容提供查询信息或链接站点。
(2)多元型搜索引擎
多元型搜索引擎允许一次检索多个搜索引擎,检索的覆盖面非常广。
这种搜索引擎通常自身不对WWW进行访问和索引,它自己可以有、也可以没有索引数据库,检索时它只是向用户提供一个查询界面,实际则将用户的查询转送给其他多个搜索引擎去检索,然后它收集检索结果进行筛选和排列,送交用户。
三、搜索引擎的工作原理
1、抓取网页
每个独立的搜索引擎都有自己的网页抓取程序(spider)。
Spider顺着网页中的超链接,连续地抓取网页。
由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就
能搜集到绝大多数的网页。
2、处理网页
搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。
其中,最重要的就是提取关键词,建立索引文件。
其他还包括去除重复网页、分析超链接、计算网页的重要度。
3、提供检索服务
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
搜索引擎的代表以及各自特点
Google的使用方法
1、Google的基本界面
Google搜索引擎的检索界面非常干净,没有广告的链接,整个界面简洁清晰,如下图所示。
2、Google的网页检索功能
Google的网页检索可以通过两种方式来实现,一种是普通的“Go ogle搜索”,检索结果在新页面中列表显示;另一种为“手气不错”,返回的是符合检索要求的第一个检索结果所在的页面。
示例:查检与“苏州市职业大学”相关的信息。
如下图所示进行检索式构造,并点击“Google搜索”进行检索。
返回结果如下图所示,在这个检索结果界面中,页面上部依然是一个检索区域,如果检索结果与检索要求不符合,可以直接在这个区域重新检索而不需要返回主检索界面。
结果显示部分按照相关度的大小列出了所有符合检索要求的网页标题(热链接),并在链接下显示该网站的提要信息,最后给出完整的网页地址。
同样在检索文本框内输入“苏州市职业大学”,但选择“手气不错”。
页面直接跳转到最符合检索要求的第一条记录所在的网页,即苏州市职业大学的主页。
3、Google高级检索
主界面只提供了一个检索文本框,如果需要同时对多个条件进行限制就需要使用到“高级检索”。
在主界面上点击“高级检索”即可将界面转入高级检索界面。
在高级检索中,除了可以利用系统编制检索式外,还可以对检索结果的语种、文件格式、更新时间、网域以及使用权限等进行设定,使得检索结果更加地准确。
4、对Google进行个性化设置
每个人在使用搜索引擎的时候都会有自己的习惯,Google为每一个使用者提供了个性化设置的可能,使Google能够适应每个用户的习惯。
如果需要进行个性化设置,只需要点击“使用偏好”即可。
在偏好设定界面中,可以设置Google的界面语言,搜索语言,结果显示的方式等等内容。
5、将Google作为翻译工具
Google可以提供各种语言之间的翻译,如需要使用这个功能,点击“语言工具”即可。
在语言工具中,输入需要翻译的文字内容,选择将要翻译成的语种,点击翻译即可。
6、利用Google查找图片资料
在主界面上点击“图片”,进入Google图片搜索。
检索方法与网页检索相同,但返回结果为图片。
示例:查找有关“苏州市职业大学”的图片资料。
在文本框中输入“苏州市职业大学”,点击“搜索图片”。
所有符合检索条件的图片以缩略图的形式列表显示。
图片下方是这张图片的出处,即这张图片出自哪个网站。
除此之外,还有图片大小以及图片格式等信息。
最后是图片所在网站
的完整的链接地址。
如需要查看某一图片的详细信息,点击缩略图,即可。
片搜索功能。
在高级搜索界面中,还可以设置图片大小、类型以及颜色等限制条件。
7、利用Google查看最新资讯
主界面上点击“资讯”即可。
内容。
8、网页目录
网络目录中将所有的网页按照一定的规则进行归类,类似于数据库中的导航系统。
9、Google除了提供普通的网页、图片搜索之外,还有其他的一些功能,这些内容在“更
多”中有所体现。
第三节:网络信息检索的策略与技巧
3.1 搜索引擎的选择
(1)明确检索内容和检索目的
在检索之前必须弄清楚检索的主题,对所给出的检索课题进行分析,根据它的主题结构类型、专业范围、性质等加以分析,使之形成若干能代表信息需求而且有检索意义的主题概念。
包括所需信息的主题概念有几个,概念的专指度是否合适,哪些是主要的,哪些是次要的,力求分析的主题概念能准确反映检索的需要,明确所需文献信息的文献数量、语种、年代范围、类型及其他外表特征,明确检索内容和目的是选择搜索引擎及实施检索和限定检索的第一步。
(2)要注意对专业搜索引擎的使用
查多媒体信息:
VisualSEEK-WebSEEK (/webseek)
QBIC ()
Virage ()
查地图等相关信息:
Map blast ()
图行天下()
查询新闻资源:
Yahoo、新浪、搜狐
查询新闻组资源:
Talk way ()
(3)注意搜索引擎的比较研究结果
研究人员对搜索引擎进行了很多对比性的研究,这些研究结果对于我们选择搜索引擎会有很好的指导作用。
(4)注意搜索引擎的发展
在关注搜索引擎比较性研究的同时,要关注搜索引擎的一些最新动向。
关注搜索引擎的发展,及时选用一些优秀的搜索引擎,将使我们在网络上检索信息事半功倍。
(5)注意元搜索引擎的使用
这一方式比较适用于返回结果比较少的搜索任务。
3.2 布尔逻辑检索
1、布尔逻辑运算符
•I:“与”(AND *)
例如:A*B(A AND B)表示提问要求命中的结果同时包含A、B两个关键词。
•II:“或”(OR +)
例如:A+B(A OR B)表示提问要求命中的结果包含A、B两个关键词中的任何一个即可。
•III:“非”(NOT -)
例如:A-B(A NOT B)表示提问要求命中的结果要包含关键词A,但不能包含关键词B。
2、示例:
i:邻接矩阵在情报检索与情报分析中的应用
提问式:邻接矩阵*(情报检索+ 情报分析)
ii:印刷本汉字识别方法的探讨
提问式:印刷本*汉字
iii:人工智能以及专家系统的研究情况
提问式:人工智能+ 专家系统
3、进行布尔检索时应注意的问题:
•i:全面准确选词,即全面准确反映提问的实际内容,而不仅仅只反映提问的形式。
•ii:当用户提问中的主题在主题词表中找不到准确的主题词时,可以先用自由词检索,必要时用上位主题词或相关词检索。
•iii:在检索式中,将必需的主题词以及用“+”连接的比较容易命中的词提前。
•iv:提问式尽量简化
3.3 搜索引擎的使用技巧
1、用逻辑条件加以限制(即布尔逻辑检索)
用多个检索词,加上适当的逻辑字符来缩小检索范围,可显著提高检索的准确度。
A:“+”:逻辑与(AND),用加号将两个关键词连成一对时,只有同时满足这两个关键词的匹配才有效,而只满足其中一项的将被排除。
B:“-”:逻辑非(NOT),如果两个关键词之间用减号连接,那么其含义为包含第一个关键词,但结果中不能含有第二个关键词。
C:“()”:当两个关键词用另外一种操作符连在一起,而又想把它们列为一组,就可以对这两个词加上圆括号。
示例:查询“天龙八部”指哪佛教中哪八位神?
使用Google来查询,输入检索条件“天龙八部”,检索结果共计3870000条,并且大部分检索结果都与课题要求不符合。
由于天龙八部中有一位神名为阿修罗,因此,可以构造如下的布尔检索式“天龙八部阿修罗”,检索结果缩小为158000条,且符合题目要求的检索结果在第一位出现。
分析第一个检索结果可以发现,结果中大量的内容都与金庸有关,如果需要除去这些与金庸有关的信息,可以构造如下的检索式“天龙八部佛教-金庸”,检索后可以发现与金庸有关的内容被去除了。
2、利用模糊查询
模糊查询,又称为智能查询,是最常用的方法。
当我们输入一个关键词的时候,搜索引擎就把包括关键词的地址和与关键词意义相近的网址一起反馈给我们。
所反馈的网址的排列,一般是完全符合关键词的在左边,其次是相近的。
3、使用双引号进行精确检索
精确查找一般是在文字框中输入关键词时,加一对半角的“双引号”(即英文输入状态下的双引号)。
用双引号括起来的词表示要精确匹配,不包括演变形式。
示例:查询与网络信息检索有关的内容,注意比较精确检索与模糊检索在检索结果上的区别。
模糊检索:在文本框内输入“网络信息检索”,点击检索
与检索关键词并不精确匹配。
号,点击检索
检索结果显示符合条件的信息约有10900条,且检索结果中反色显示的字符串与关键词精确匹配。
4、多用短语、特定词汇及专业术语
短语检索比单词检索得出的检索结果相关性要大的多,所以使用搜索引擎检索时能用短语就尽量使用短语进行检索。
此外,用于检索的关键词越具体,专指度准确率就越高。
所以,
使用搜索引擎检索时,还应尽量使用特定词汇和专业术语。
5、限制查询范围
范围限制的能力越强,就越能准确地找到需要的信息。
搜索引擎提供的范围限制类型大体有分类范围、地域范围、网站类型范围及其他特殊范围。
6、利用选项界定查询
目前越来越多的搜索引擎开始提供更多的查询选项,利用这些选项人们可以轻松地构造比较复杂的搜索模式,进行更为精确的查询,并且能更好地控制查询结果的显示。
7、减少不必要的空格
在输入汉字做关键词的时候,不要在汉字后面追加不必要的空格,因为空格将被认作特殊的操作符,所起的作用与“AND”一样。
8、注意细节
在Internet上进行检索时,如果能注意一些细节问题,常常能够增加搜索结果的准确性。
如许多搜索引擎都区分大小写,因此,在以公司名或地名等关键词进行搜索时,应正确使用他们的大小写字母形式。
9、分类细化,逐步接近查询
如果想查找某一类信息但又找不到合适的关键词,就可以使用分类式搜索逐步细化,这样得到的结果也是令人满意的。
实训作业题
实验五:搜索引擎注册方法简介
一、实验目的:
掌握搜索引擎注册的一般方法及注意事项
二、实验步骤
1、将你的在网站在Google中注册
普通的Google搜索引擎注册(登陆)办法就是通过Google登录页面向Google搜索引擎提交即可。
登录页面地址:/intl/zh-CN/add_url.html
搜索引擎注册
l虽然一般而言,只要提交了一个页面,Google会自动搜索到你其他的页面,但是如果你的页面连接是图片或者FLASH按钮等,你最好还是将主要页面都向GOOGLE提交一下。
就算你的是文字连接,也可以多次向GOOGLE提交的,反正没有什么坏处。
l这个方法登陆Google一般没有你想想的那么快,短了三五天,长了就难说了。
那么如何最快的让Google收录你的网站呢?最简单的办法就是在流量非常大,Google天天光顾的网站或者网页上做超连接,文字连接效果最好!这招虽然比普通的登陆办法麻烦些,但是效果是非常明显的。
这种连接越多越好,不光可以让你快速的被GOOGLE收录,而且还可以快速的在Google中提升你网站的的排名。
2、将你的在网站在百度搜索引擎中注册
普通的百度搜索引擎注册(登陆)办法就是通过百度登录页面向百度搜索引擎提交即可。
登录页面地址:/search/url_submit.html
l百度会经常自动检测您网站的连接状况,如果百度检测时您的网站遇到无法连接的情况,就可能从百度中被删除。
l百度会自动阅读被百度找到的每一个网页,并且会顺着网页上的每一个链接找到下一个网页。
因此,如果被百度找到的某个网页上有链接指向您的网站,那么您的网站也会被百
度找到。
l百度尊重和遵守中国法律法规,不符合中国法律法规的网站不能登录。
百度是中文搜索引擎,主要收录中文网站,外文网站一般不能登录,只有少数在中文用户中比较知名的外文网站才能登录。
3、其他搜索引擎注册(登录)页面地址
搜狐:/
网易:/cgi-bin/search/add_url.cgi
新浪:/newbizsite/docc/index-2jifu-09.htm
一搜:/search_submit.html?source=yisou_www_hp
雅虎中国目录:/docs/info/suggest.html (分类目录)
4、主要搜索引擎(搜索引擎推广——中文)
新浪.爱问/guest/add_url.php
google /intl/zh-CN/add_url.html
百度/search/url_submit.html
天网/url_submit.html
中国搜索/NetSearch/user
_register/user_register.jsp
搜狐/搜狗/regurl/regform.asp?Step=REGFORM&class=
一搜登录口:/search_submit.html?source=yisou_www_hp成功收录时间在1个月内
google 登录口:/intl/zh-CN/add_url.html成功收录在1个月内新浪.爱问登录口:/guest/add_url.php成功收录时间不定
中国搜索登录口:/NetSearch/frontEnd/free_protocol.htm 成功收录时间一周以内
孙悟空登录口:/add.php成功收录时间收录时间不定
5、登录注册——加入关键字练习(要求,根据前面所选的企业为背景选择关键词。
并将操作过程写在博客中。
企业主题:包装
产品主题食品包装
服务主题
按类目选择
酒类包装
香烟包装
饮料包装
保健品包装
茶叶包装
糖果包装
休闲食品包装
月饼包装
水产包装
调料包装
实训6 利用搜索引擎检索商务信息
【实验目标】
(1)掌握一种网络检索工具的操作方法。
(2)掌握利用网络检索工具检索商务信息的基本方法。
【实训条件】
操作系统
支持Windows 98、Windows ME、Windows NT、Windows 2000、Windows XP。
应用软件
需要安装的软件包括Microsoft Office2000或以上版本产品,推荐OFFICE2000。
、、实验平台
硬件环境
主频要求800MHz以上,内存128MB以上,显卡的颜色配置需要设置为24位增强色或32位真彩色。
【实验要求】
通过本次的实训,掌握网络营销前台模块的搜索引擎实现网络商务信息的采集。
实验要求包括:
(1)利用搜索引擎检索有关手机的信息。
(2)在搜索结果中继续搜索TCL品牌。
(3)通过分类检索在商品类中搜索手机有关的信息。
【搜索使用技巧】
第一:明确搜索词
首先要明确搜索词,即关键词,在将关键词输入到相关的门户网站或搜索网站的搜索框中,然后点击“回车”,或单击“搜索”按钮即可得到相关资料。
注意高级搜索和详细搜索。
使用确切的词语、详细的描述方式,可以适当缩小搜索范围哦。
第二:用好分类
不知道您是否注意到,许多搜索框的后面都有下拉菜单,有宝贝的分类啦、限定的时间等等,用鼠标轻轻一点,就不会混淆分类了。
比如:您搜索“火柴盒”,会发现有很多汽车模型,原来它们都是“火柴盒”牌的。
当您搜索时选择了“居家日用”分类,就会发现真正色彩斑斓的火柴盒在这里。
第三:妙用空格
想用多个词语搜索?在词语间加上空格,就这么简单!如,手机TCL
第四:精确搜索
1)使用双引号:比如搜索”佳能相机”,它只会返回网页中有”佳能相机”这四个字连在一起的商品,而不会返回诸如“佳能IXUSI5专用数码相机包”之类的商品。
(注:此处引号为英文的引号)
2)使用+/-号:在两个词语间用+号,意味着准确搜索包含着这两个词的内容;相反,使用-号,意味着避免搜索减号后面的那个词。
如搜索“佳能打印机-喷墨”,查找出来的商品就是佳能打印机,而其中的喷墨打印机就不会来麻烦你了。
第五:不必担心大小写
搜索功能不区分英文字母大小写。
无论您输入大写还是小写字母都可以得到相同的搜索结果。
输入“nike”,或“NIKE”,结果都是一样的,因此你可以放心搜索。
【实验程序及内容】
以下是一种产品的搜索过程,请参考以下的搜索过程和以上的搜索技巧,根据第一份作业(选择一家企业),现根据该的公司产品(或是经营信息),利用搜索工具收集相关于该公司产品信息或同行信息,给出一份合理的产品市场定位报告书。
(即产品的包装、价格、数量、经销地。
)。