基于PageRank算法的搜索引擎优化策略探析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于PageRank算法的搜索引擎优化策略探析
作者:徐新阳郜攀攀
来源:《速读·中旬》2014年第08期
摘要:PageRank算法是由谷歌公司创始人拉里·佩奇于1998年提出的,它以“从优质网页链接过来的网页必然是优质网页”为基本依据,以此来判断网页的重要程度。
如今,PageRank 算法已成为一种非常重要的搜索引擎技术,网站专业人员可以以PageRank算法为基础进行搜索引擎优化,以提高网站的PR值,提升网站的排名和点击率。
关键词:PageRank算法;搜索引擎;优化策略
据有关机构统计,截止2014年9月中旬,全球互联网站数量已突破十亿大关,仍以前所未有的速度增长。
爆炸式的信息增长为人们带来了无穷无尽的信息量,同时也给信息检索提出了许多新挑战。
如今,搜索引擎是仅次于电子邮件的网络工具,也是网民获取网络信息的基本手段。
对于企业而言,如何将企业网站推销出去,如何让网民能通过搜索引擎找到企业网站,成了企业不得不面对的问题。
因而,许多企业会针对搜索引擎的数据采集、标引算法进行网页设计优化,以求企业网页能处于搜索引擎关键词检索的前列。
但是,搜索结果排序算法与组织技术是搜索引擎的关键技术,也是搜索引擎企业的商业秘密,外人很难知晓。
一般情况下,搜索引擎会根据关键字词频、位置等进行搜索结果排序,网络专业人员可以通过将关键字放于页面title中、提高页面正文关键字词频等方式进行页面优化,实现提高企业网页排名的目的。
网页间链接流行度属于页面外优化,它也直接影响着网页在搜索结果中的排名,这种搜索结果排名技术建立于web文档之上的PageRank算法,本文就以PageRank算法为例,探究搜索引擎优化策略。
一、简述PageRank算法
PageRank算法是由谷歌公司创始人拉里·佩奇于1998年提出的,它是谷歌公司用来标识网页等级、重要性的基本方法,也是衡量网页好坏的基本标准。
谷歌公司依靠PageRank算法在引擎行业独占鳌头,成为搜索引擎行业的代表。
PageRank算法以“从优质网页链接过来的网页必然是优质网页”为基本依据,以此来判断网页的重要程度,网页得票越多,重要程度就越高。
PageRank算法按照网页的重要程度对检索结果排序,将网页分为十个等级,PR等级越高说明网页越重要,这样用户就可以搜索到满意的网页。
从运算思路看,PR值使用庞大的链接关系特性,以网页之间的链接质量与数量作为评价网页的标准,从网页A链接到网页B,就意味着给网页B的重要性投一票。
网站获得的反向链接越多,PR值就越高;若网页获得优质网页链接,就会获得更高的PR值。
具体运算方
法为:用网页的PageRank除以页面的正向链接,在将所得的值与正向链接所指页面的PageRank加在一起,这样就是所链接页面的PageRank值。
运算公式为:
PR(A)=(1- d)+d(PR(T1)/C(T1)+L+PR(Tn)/C(Tn))
若网页安装了Google工具栏时,用户可以看到PageRank显示条,该PR值始终处于0至10之间,但该值并非页面的PR值,而是PR值的对数指标。
二、基于PageRank算法的搜索引擎优化策略
搜索引擎优化是依据搜索引擎工作原理对网站内容进行优化的方法策略,通过搜索引擎优化可以使网站获得更高的PR值,从而提高网站的点击率与知名度。
iCrossing公司调查表明,网上购物时搜索引擎是人们最常用的服务工具,有74%的用户会通过搜索引擎选择购物网站。
因而,如何被搜索引擎收录并获得靠前的排名,对商业网站具有重要意义,也成为网站专业人员必须认真面临的重要问题。
近年来,我国的搜索引擎优化迅猛发展,呈现出产业化发展的趋势,但仍存在许多问题,例如,优化技术落后,缺乏整体规划,服务品质差等。
本节试图以Google搜索引擎排序算法PR值,探讨搜索引擎优化的方法策略,因为Google排序结果具有权威性,在Google排序靠前的网站,在雅虎、百度等搜索引擎中也会靠前。
首先,应优化入站链接。
分析搜索引擎的运算方式可知,页面PageRank是影响网站在搜索引擎中排名的重要指标,当网站拥有的入站链接越多,网页的PageRank值就会越高。
因而,网络专业人员应增加网站的入站链接,以此提高网站主页的PR值。
具体而言:一是把网站主页提交到搜索引擎上,这样才有可能被搜索到;二是提供有实用价值、新颖独特的网站内容,就可能会有外部网站主动与本网站进行友情链接,这样就可以提高网站的外部链接值;三是将网站添加到行业门户网站、留言簿、qq空间、微博、网上论坛等可以添加网址链接的地方;四是要与PageRank值高的网站进行链接,这样也可以提高网站的PR值。
以上搜索引擎优化策略不过是人为制造一些拥有入站链接的页面,前提是这些入站链接网站必须存在搜索引擎的数据库中,否则难以提高网站的PR值。
其次,应优化出站链接。
PR值算法以web拓扑结构为理论基础,出站链接会消耗网站的PR值,因此,应从出站链接上优化搜索引擎。
具体而言:一是在交换链接时应特别小心,不进行单方向的正向链接,以减少网站的PR值损失。
二是尽量提供与网页主题相关的网页链接,这样可以不泄露主题网页集合内的PR值。
最后,应优化网站内部链接。
网站内部链接与出入站链接不同,内部链接PR值在网页内部循环,整个网站的PR值是各个网页PR值之和。
通常可以用以下方式优化:一是将网页都纳入网站的PR值循环之中,即保证内部网页之间与主页、其他网页都有链接;二是尽量减少网页内其他页面之间的链接。
PageRank数值与网站内容无关,是由网址的链接结构所决定,这种算法优于先前的HITS 算法,但仍存在一些缺陷,例如,PageRank算法的检索无关性导致一些专业词汇的PR排名效果并不合理;由于SP算法是纯超链接分析算法,会不可避免地产生“主题漂移”现象。
在进行搜索引擎优化时,可以从网页链接角度进行分析,优化网站的入站链接、出站链接、站内链接等,提高网站的PR值,提升网站的点击率和知名度。
参考文献:
[1]黄志栋,员巧云.基于PageRangk算法的搜索引擎优化策略[J].情报探索,2011.
[2]徐永川.Internet 搜索引擎的探讨[J].图书馆学刊,2003.
[3]李晓明,刘建国.搜索引擎技术及趋势[J].大学图书馆学报,2000
[4]张巍,李志蜀.基于PageRank算法的搜索引擎优化策略[J].计算机应用,2005.
作者简介:
徐新阳(1984~),男,汉族,河南省新乡市人,本科,新乡医学院三全学院教师,研究方向:计算机技术与应用。
郜攀攀(1986~),男,汉族,河南省沁阳市人,本科,新乡医学院三全学院教师,研究方向:计算机技术与应用。