优化的日常工作
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1:竞争研究(网站优化工作内容之首)
1.1:研究关键词
1.1.1:预估关键词流量
通过百度指数,谷歌趋势,百度推广等工具得到评估流量。
1.1.2:扩展相关词
依据目标关键词扩展相关词,使用百度推广,相关搜索,下拉提示,第三方工具得到相关词。
1.1.3:组合关键词
形式:同义词,相关词,简写,错字,地名,品牌,限定和形容词,结合组成新的关键词。
1.1.4:降低优化难度
将所有关键词整体出来,分析搜索量大,竞争程度小的词进行优化。判断一个词的竞争程度,通过以下几点:
1:搜索结果数。此项页面中包含目标关键词也会计算。
2:intitle结果数。此项只有title中包含目标关键词才会计算。
3:竞价结果数。
4:竞争对手情况。
5:内页排名数量。
1.1.5:扩展长尾词
利用百度推广,第三方工具扩展长尾词,备用优化。
2:关键词布局(网站优化工作之核心)
1.2:金字塔形结构
1.2.1:关键词分组
将研究好的关键词进行分组,竞争程度高的放在首页,程度中的放在栏目页,长尾关键词是根据栏目页扩展得到的,栏目页关键词是根据首页关键词扩展得到的,将长尾关键词植入到文章中,在对应的栏目进行发布,当前栏目和首页显示的新闻相关性都非常高。
1.2.2:关键词布局
(1)每个页面只针对两三个关键词,不能过多,这样才能在写作时有针对性,使页面主题突出。
(2)每个页面的关键词不要重复出现,避免内部竞争,权重及锚文字的分散。
3:网站结构优化(网站优化工作的骨架)
1.3:搜索引擎友好的网站设计
1.3.1:避免蜘蛛陷阱
(1)Flash
(2)SeeionID
(3)各种跳转
(4)框架结构
(5)动态URL
(6)JAVAScript链接
(7)要求登录
(8)强制使用cookies
1.3.2:物理结构
(1)扁平结构:适合小型网站,即将栏目页和新闻页也放到根目录下,缺点不易于维护。
(2)树形结构:适合大型网站,将各个栏目页和新闻页保存在指定文件夹下,易于维护。
1.3.3:链接结构
(1)首页链接向所有分类首页
(2)首页一般不直接链接向产品页,除了几个需要特殊推广的产品。
(3)所有分类首页连向其他分类首页,一般以网站导航形式体现。
(4)分类首页都链接回网站首页。
(5)分类首页链接向本分类下的产品页。
(6)分类首页一般不链接向其他分类的产品页。
(7)产品页都链接向网站首页,一般以网站导航形式体现。
(8)产品页链接向所有分类首页,一般以网站导航形式体现。
(9)产品页可以链接向同一个分类的其他产品页。
(10)产品页一般不链接向其他分类的产品页。
(11)在某些情况下,产品页可以用适当的关键词链接向其他分类的产品页。
1.3.4:清晰导航
(1)文字导航:尽量使用文字导航,不要使用图片,javascript,flash。Css设计也可以设计出漂亮的导航,包括隐藏的下拉菜单。
(2)点击距离及扁平化:导航的目的之一是使所有页面点击距离越近越好,权重普通的网站,内页离首页不要超过4~5次点击。要做到这一点,通常应该在链接结构
上使网站尽量扁平化。
(3)锚文字包含关键词:导航系统中的链接通常是分类页面获得内部链接的最主要来源,数量巨大,其锚文字对目标页面相关性有相当大的影响,因此分类名称应尽量使用目标关键词。
(4)面包屑导航:面包屑对用户和搜索引擎来说,是判断页面在网站整个结构中的位子的最好方法。
(5)避免页脚堆积:常常造成某种形式的惩罚。
1.3.5:URL设计
文件夹名应按造栏目页及新闻页的中文全拼进行命名。提高目标页面的相关性。1.3.6:robots.txt文件
(1)将不想被抓取的页面或没必要抓取的页面使用robots禁止掉。
(2)语法:
百度蜘蛛:Baiduspider 谷歌蜘蛛:Googlebot
禁止所有搜索引擎抓取任何内容。
User-agent:*
Disallow:/
禁止所有搜索引擎抓取根目录下的404页面
User-agent:*
Disallow:/404.html
禁止所有搜索引擎抓取根目录文件夹tmp下的内容
User-agent:*
Disallow:/tmp/
只允许搜索引擎抓取ab文件夹下的cd文件夹下的内容,其他不允许抓取
User-agent:*
Disallow:/ab/
Allow:/ab/cd/
$通配符:匹配URL结尾的字符。下面将允许蜘蛛抓取以.htm为后缀的URL,禁止抓取.jpg文件
User-agent:*
Disallow:.jpg$
Allow:.htm$
告诉蜘蛛匹配任意一段字符,下面将禁止抓取所有htm文件
User-agent:*
Disallow:/*.htm
告诉蜘蛛XML地图在哪里
Sitemap:网站地图位子
1.3.7:meta robots标签
使用robots.txt只对本站有效,如果网站URL出现在其他网站,则URL会出现在搜索结果中,要想使URL完全不出现在搜索结果中,需要使用meta robots标签。语法:”robots” content=”noindex,nofollow”>
上面的标签的意义是禁止所有搜索引擎索引本页面,禁止跟踪本页面上的链接。谷歌,必应,雅虎都支持如下标签:
noindex:告诉蜘蛛不要索引本页面。
nofollow:告诉蜘蛛不要跟踪本页面上的链接。
nosnippet:告诉蜘蛛不要在搜索结果中显示说明文字。
noarchive:告诉蜘蛛不要显示快照。
noodp:告诉蜘蛛不要使用开放目录中的标题和说明。
百度官方说法是目前只支持noindex,noarchive。
标签内容可以写在一起,以逗号分隔,中间可以有空格,也可以没有。也可以写成多个meta robots标签。
1.3.8:URL静态化
将需要被抓取的页面URL静态化,可以是伪静态,也可以是纯静态。目的是避免多参数的URL出现,以及提供用户体验便于记忆。URL越短越好,有助于提高点击率。目录层次尽量少,生成的URL目录层次可以自行控制。
1.3.9:字母全部小写
有的服务器区分大小写,如Linux服务器。
1.3.10:连词符使用
“-”首选,不要使用下划线或其他奇怪的字母,搜索引擎把URL中的短横线当作空格处理。下划线则被忽略。
1.3.11:目录形式还是文件形式
例如:和选择目录形式优点是,以后如果网站更换编程语言,URL可以不必变化。也不用经过特殊处理。文件形式的URL可能文件扩展名会变化,除非做URL重写。
1.3.12:网址规范化
(1)使用301转向,把不规范化URL全部转向到规范化URL。
(2)提交给搜索引擎的XML网站地图全部使用规范化网址。
(3)页面全部使用绝对URL地址。
1.3.13:复制内容
(1)网址规范化问题会产生复制内容。