SEO基础知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
容,就叫“去重”!
搜索引擎如何去重!技术我们不需要掌握,但是我们得注意几个关键点: A:简单的增加“的”“地”“得”,是很容易的被识别的,一定要慎重使用! B:复制别人的文章,简单的交换一下段落结构!这种伪原创也一定要慎重使 用! 这是因为:这样的操作无法改变文章的特定关键词,上面的那些做法始终逃不过 搜索引擎的去重算法。
(1)提取文字;(2)中文分词;(3)去停止词;
(4)去除噪声;(5)去重(读chong)
(1)提取文字: 蜘蛛抓取的是全部HTML代码,这里面其实包含:文字,HTML格式标签, javascript程序! 但是HTML格式标签、javascript程序是无法参与到排名内容中来的,提取文字的 过程就是从HTML代码中取出标签和程序提取出可以用于排名处理的页面文字内容!
是否搜索过相关信息,如果有就从缓存中调取,如果没有再从百度数据库中
调去。
搜索引擎的工作三阶段
搜索引擎的工作过程分三个阶段:
第一阶段: 爬行和抓取
第二阶段: 预处理
第三阶段: 排名
ຫໍສະໝຸດ Baidu
阶段一:爬行和抓取
爬行和抓取是搜索引擎工作的第一步,完成数据收集任务。 1、蜘蛛
搜索引擎用来爬行和访问页面的承训被称为蜘蛛(spider)或机器人
SEOER具备的技能-做一个标题党
利用诱惑式标题来做软文推广的人们,我们称其为“标题党”。因为 其标题有很强的诱惑力,让人看了就忍不住的想点击看看里面的内容, 因此这类文章的点击率很高,传播效果也很好。 如果用户看了标题,根本没有点击的欲望,那内容写的再好也是徒劳。
那些年我们曾被忽悠的标题
1
沙滩美女走光图
百 度 指 数
关键词的搜索指数
太阳的后裔、宋仲基是什么时候火的
宋仲基、太阳的后裔到底有多火
宋仲基的需求图谱
如何利用宋仲基赚钱-推广化妆品
http://www.yoka.com/beauty/face/2016/0324/47249301029698.sht
ml
Seoer必备技能-了解网络热点事件
什么是搜索引擎?
官方定义:
搜索引擎是指:根据一定的策略、运用特定的计算机程序从互联网上
搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户
检索相关的信息展示给用户的系统。
我的理解是:
可以帮助用户从互联网繁杂的信息中找到他需要的信息的工具。
搜索引擎的工作原理
百度在很短的时间0.04秒内找到了49,100,000个结果 我们复制一下关键词重新搜索发现这回只用了0.001秒。 它是怎么做到的??
陈晓华(58同城CSO首席战略官)
学SEO能做什么
1
个人站长
www.51bbw.cn
2 3
SEO培训
SEO培训非常火,潭州学院、达内、北大青鸟,都有专门的seo培 训课程
SEO服务
成立个人工作室,为企业提供SEO服务,网络营销策划
4
企业上班
从SEO专员做起,以陈晓华为偶像,以CSO为目标
如何做SEO
美女真的走光了
别乱想了
好好工作吧
那些年我们曾被忽悠的标题
那对情侣在阳台做了什么?全程被房东偷拍 白头鹎居民家中筑巢 实情:有对白头鹎(bēi,一种鸟)在一居民楼阳台筑巢、生子、哺 养,市民看到后,用相机拍下来了。
那些年我们曾被忽悠的标题
韩女团禁播mv
韩女团最新mv 实情:韩国女团最新的mv
那些年我们曾被忽悠的标题
2
3
长期有效
SEO只要不作弊,排名一旦上去,可 以维持相当长的时间,流量源源不 断。
“58同城”收购“赶集”竟然是因为他!
“58同城”和“赶集”不为人知的恩怨情仇
陈晓华——“SEO骨灰级高手”。2007年6月,陈晓华入职赶集网,负责SEO。用半
年时间让赶集网的流量从10万提升到40万,远远超过58同城。这件事引起了姚劲波的 注意,并下定决心要把陈晓华挖到58同城。 陈晓华到了58同城后采用人海战术,投入之前三四倍的人力,用8个月的时间将58
另一个是:检测你的网站内容是否和数据库中其他的内容大量的重复。 在这里需要提醒各位的是:以后不要随便在网上复制一篇文章加上几个停止词就
粘到自己的网站上去了,学完上边的,你应该懂什么意思了!
(4)去除噪声: 绝大部分页面上有一部分内容对页面主题没有任何贡献,比如版权声
明文字、导航条、广告等。这些区块都属于噪声,对于页面主题只能起
(3)去停止词 什么是停止词?就是在页面中出现次数比较多的,对内容没有实质性影响的那些 词;比如:“的”,“得”“地”这些助词,“啊”“哈”“呀”等感叹词,“从 而”“以”“却”等副词或者介词,这些词就被称之为停止词!英文里有:the,a, an,to,of等等 搜索引擎去停止词主要有两个目的:
一个是:使索引数据主题更为突出,减少无谓的计算量;
它是怎么做到的??
1、是百度在0.04秒的时间内从互联网中抓去了所有的内容??? 2、是百度提前就已经抓好了内容,然后从自己的数据库中调去的??? 答案: 搜索引擎平时就已经开始在互联网中抓取网页信息并建立自己的网页数 据库。当网民搜索的时候,百度会直接从数据库中调去数据经过处理后呈现 在网民面前。 注意:为什么第二次用的时间只有0.001秒比第一次还快?? 答:百度在处理网民搜索信息时,先从本地浏览器缓存中寻找网民以前
讲师:Lucy
一、SEO是什么
SEO
汉译为搜索引擎优化。 SEO是一种利用搜索引擎的搜 索规则来提高目标网站在搜索引擎 内的自然排名的技术。 简单理解: SEO是对网站的优化,使网站 符合搜索引擎的喜好,从而给网站 一个好的排名的技术。
认识搜索引擎
国内搜索引擎市场份额
百度 360
搜狗 其他
认识百度搜索结果页
万事不决问百度
网站建设
认识搜索结果页
认识搜索结果页
一、SEO是个什么鬼?
SEO
简而言之:
SEO是一种通过搜索引擎给网
站免费带来客户的技术。
为什么做SEO
1
搜索引擎客户转化率高 搜索引擎的用户是主动寻找网站上 的产品,目的比较明确,转化率高。 性价比高 当站长掌握SEO技术时,SEO可以说 是免费的。
等因素。
这个时候无数站长都在疯狂大量的在页面里堆积关键词,光是meta keyword标签都要写上好几百关键词。 在SEO1.0时代更加注重的是网站的内容,认为内容相关度越高的页面就 越应该靠前展示给用户。简而言之就是SEO1.0时代,内容为王。
出现的弊端,网站站长在页面大量重复堆积关键词,很多网站没有实际 内容排名也不错,导致用户体验不好。
注意:搜索引擎除了提取出可见的文字外,还可以提出以下不可见的文字内容; 比如:METa标签中的文字内容,图片 ALT属性文字,链接锚文字等!
(2)中文分词 英文:单词之间有空格作为天然分隔,因此不需要进行切词。
中文:字和字没有之间没有分隔符,一个句子中的词都是连在一起
的!所以,这时候搜索引擎就必须先分辨一下哪几个字组成一个词,哪 几个字本身就是一个词! 比如:“波司登羽绒服”就将其分为“波司登”和“羽绒服”两个 词;
经过上面的五个步骤后,搜索引擎就能得到独特的,能反映页面主要 内容的,以词为单位的内容。 把每一个网站页面都转化为一个关键词组成的集合!同时记录下每一 个关键词在该页面上出现的频率、次数、格式(比如:标题标签、黑 体、H标签、锚文本等)位置(第几段),这些都已权重的形式记录在下 来!然后放到一个地方,这个地方就是专门放置这些组合词的词表结 构——索引库! (6)正向索引: 每一个文件夹都对应一个ID,文件内容被表示为一串关键词的集合! 这样的数据结构叫正向索引!
SEO的发展史
SEO的发展史:
• SEO 1.0 大约是1995-1998年,内容为王的时代; • SEO 2.0 大约是1999-2010年,外链为皇的时代;
• SEO 3.0 大约是2011-?年,用户是上帝的时代;
• SEO 3.0S刚开始?
……
SEO 1.0
1995-1998年,排名依据是网站的内容匹配,搜索引擎蜘蛛识别能力较 弱,是否有内容成了排名的主要因素之一。 排名的规则更加注重于页面关键词密度、title、keyword、description
站内优化
站外优化
SEO
怎么做SEO—站内优化
一、关键词布局 二、TDK撰写 三、页面优化 四、内链建设 五、robots.txt 六、Sitemap
站内优化
七、404页面
怎么做SEO—站外优化
数量 质量
站外优化
外 链
SEOER常用工具-百度指数
网民的搜索意图
探索关键词背后的秘密
倒排索引
(7)倒排索引 在倒排索引中关键词变成了主键,每个关键词对应一系列文件,每一
个文件都出现了要搜索的关键词,这样用户在搜索某一个关键词的的时
候,排序程序就能在倒排列表中找到这个关键词对应的文件! 详细请看图:
关键词
排名
初始子集确定后需要对子集中的页面内容进 行相关性计算,链接权重计算、用户点击行 为计算,从而确定页面的排名。 影响排名的因素主要有以下几个方面 一、页面内容相关性 二、链接权重 三、用户行为
拿什么来唤醒你啊,我的爱人 沉睡的少女啊!痴心等待终遇有情郎! 一根纺针引发悲剧,痴情哥哥披荆斩棘唤醒妹妹 安然入睡的容顔,是百年不变的等待 百年不变的守候,只为你那淡定的一吻!
小结
看一个人漂不漂亮,要看她的脸,而看一个人的脸,最重要的是看她 的眼睛。一篇软文好看不好看,首先我们看的就是标题,标题有没有吸 引力,能不能抓住读者的眼球至关重要,标题没有吸引力,就没有点击 率。所以标题的撰写是软文写作至关重要的一个环节,也是seoer必须具 备的能力。
同城的流量从20万突破到100万,这不仅拉大了58同城和赶集网的差距,还改变了58同
城的地位——58同城在此之前只能算是小网站,经过用SEO导入流量后,奠定了行业领 先地位。 如今,58同城成为国内生活分类网站的代表,用户每天上传的信息达数百万条,月
独立用户数突破4亿。SEO给58同城带来了持续的业务和流量增长。
SEO 2.0
是1999-2010年,排名依据是站内优化,站外优化。 同时搜素结果的地区性差异,以及多媒体结果的出现(搜索结果中出现图片等结 果)。 网站是否有高的权重,是否有高质量的内容成了排名的主要因素。 搜索引擎算法改进,页面的想要排名靠前更加注重内链结构以及高质量外部链接的导 入。 所以这个时候的站长每天都忙碌着发外链、发外链、发外链,甚至有些公司在招聘SEO
人员的时候,都只是叫做外链专员,他们认为只要外链做好了,SEO也就成功了。
虽然这种观点是错误的,可是也在某种程度反映出SEO2.0时代的特点 从搜索引擎的角度出发,在SEO2.0时代,以链接投票的方式,通过获得票数的多少来 决定页面排名顺序。
SEO2.0时代,外链为皇。
SEO 3.0
是2011-至今, 是否满足用户的需求, 是否有高的权重, 是否有好的内容 成了排名的主要因素。 产品设计优化、用户满意度优化、资源整合优化在此阶段显得尤为重 要。 SEO的英文定义也可从Search Engine Optimization演变为Searcher Experience 【ɪkˈspɪriəns】 Optimization,中文翻译为搜索体验优化。 搜索引擎越来越人性化,搜索引擎考虑的是为搜索者提供高质量的用户体 验。
到分散作用。 搜索引擎需要识别并消除这些噪声,排名是不使用噪声内容。消噪的 方法是根据HTML标签对页面分块,区分出页头、导航、正文、页脚、广 告等区域,在网站上大量重复出现的区块往往属于噪声。对页面进行消
噪后,剩下的才是页面的主体内容。
(5)去重(chong) 一篇同样的文章出现在不同的网站上,搜索引擎就会认为它是一个文件,它并不 喜欢这样的重复内容,在进行索引之前就需要对这些内容进行识别和删除重复的内
(bot) 搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛发
出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入
原始页面数据库。搜索引擎为了提高爬行和抓取的速度,都使用多个蜘 蛛并发分布爬行。
阶段二:预处理
搜索引擎蜘蛛抓取的原始页面,并不能直接用户查询排名处理,因为 搜索引擎数据库中的页面数都是数万亿级别以上的,用户输入搜索词 后,靠排名程序立即对这么多页面进行分析排序工作量太大,不可能在 一两秒内返回排名结果。因此抓取过来的页面必须经过预处理,为最后 查询排名做准备。 在索引之前有五个工作需要做