淘宝搜索排序算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
淘宝搜索排序算法
注:作者--鬼脚七(淘宝搜索技术团队负责人)
我想这篇文章对很多人有用处,所以转来与大伙共享
前言:
目前网上有很多介绍淘宝搜索排序的文章,大多是淘宝卖家们根据自己经验摸索整理出来的,里面提到的很多办法也很正确。只是搜索排序算法不是固定不变的,几乎每天都在变化,与时俱进。所以想详细的介绍每个排序的细节,其实没有任何意义。
很多卖家抱怨为什么不公开排序算法?排序算法无法公开。不知道有谁知道百度的排序算法是怎么样的?Google的排序算法是怎么样的?排序算法之所以无法公开,有很多原因。其中一个原因正是因为公平才不公开。算法是死的,人是活的。一旦算法公开,很多卖家估计就不专心去服务买家,而把精力放在如何找这些算法的漏洞来提高自己的搜索排名了。这对其他卖家来说,就很不公平。
我虽不能告诉大家排序具体算法,但可以告诉大家排序的主要原则,告诉大家如何去针对自己的店铺做一些优化。这篇文章也是希望给大家介绍一下目前淘宝搜索排序的主要原则。而且这个介绍只是适应于现有的排序算法(2010年4月),以后有大的变化,在搜索blog上也会及时给大家更新。
淘宝搜索现状
淘宝搜索产品有很多,如果数一数,应该有几十个。当然这不是什么值得炫耀的事情,理想情况下,如果做好了,一个搜索入口搞定了用户所有需求。几个比较大的搜索有:店铺搜索、商城搜索、宝贝搜索。顾名思义,店铺搜索主要是搜索店铺,可以搜索店铺名称、店铺主营宝贝等。商城搜索主要是搜索商城内的商品。宝贝搜索则可以搜索所有商品,包括商城内的商品。本文讲的主要内容也是针对宝贝搜索的。
宝贝搜索又包含了不少tab:所有宝贝、人气、二手等。大家最熟悉的莫过于人气和所有宝贝了,有一段时间,搜索默认结果有一部分是直接到人气排序的。但现在搜索上默认结果都是所有宝贝排序了(从2010年3月4日开始到今天)。宝贝搜索中有两种搜索需求,一种是按照类目浏览的,基本上没有关键词,都是在浏览某个类目。url是以开头的;另外一种是带关键词搜索的,url一般以开头。大家最近在论坛上问的比较多的问题说新版搜索和旧版搜索的问题,旧版搜索的url是以开头,新版搜索是以开头。不要再琢磨回到旧版搜索了,因为以后不会支持旧版了。旧版搜索的功能大都已经迁移到了新版搜索,算法也基本一致。
还有一个搜索,叫search8的搜索,即淘宝
客搜索。这个搜索结果的URL是以开头的,主要搜索内容是参加淘宝客的商品。结果数比全网的要小一些。有些非法淘宝客会采用一些手段串改用户浏览器的淘宝搜索请求,把所有淘宝搜索的流量直接跳转到淘宝客搜索,从而来获利。所以大家一定要警惕。 淘宝客搜索的排序也很有意思的,不过不在本文的讨论放范围之内。
几个常见的错误观点
最近我一直在关注搜索官方论坛,论坛中看到有很多人在提一些问题,也有很多观点。在这里觉得有必要跟大家澄清一下。
* 淘宝直通车和淘宝搜索排名
每次搜索改版或者排序规则变化的时候,无论改得好还是改得坏,都会有人反对。因为变化会造成搜索流量的重新分配,得到更多流量的卖家,基本不会啃声,一部分卖家的既得的利益受到损失时,就开始在论坛里叫起来的。这时候大家最容易看见的一个观点就是:这是在逼卖家,做直通车,做了直通车排序才能排序靠前。其实这是最大的误区。大家千万不要为了提高搜索排名而去做直通车,因为二者之间没有关系。搜索的任务是帮助用户快速找到想要的商品,排序算法中没有任何信息是这个商品是否参加了淘宝直通车。过去几年和将来几年,赚钱都不是淘宝的目的,更不会是淘宝搜索的目的。
* 淘宝搜索和中小卖家的利益
淘宝上有几百万的卖家,根据二八原则,20%的卖家占了80%的交易,可能在淘宝搜索的比例比这个还要高,15%的卖家,占了80%的交易。在论坛上,经常有人在说,我们中小卖家生意没法做了,淘宝不关心我们。其实这个理解完全错了。大卖家之所有得到更多的流量,就是因为他们更熟悉搜索的一些规则,做了更多的优化。而中小卖家,商品数,经验相对少一些,自然得到的流量也少一些。在淘宝内部,大家非常关注如何保护中小卖家的利益,在每个项目开始的时候,内部都会讨论,是否会对中小卖家有帮助?比如说,人气搜索不太适合中小卖家成长,后来就直接不放到默认了。在排序中也一直在找一些参数来帮助中小卖家成长。但淘宝是大家的淘宝,不只是有中小卖家,大卖家也是淘宝的客户,同时还有消费者的利益是更不能损害的。因此,对于咱们中小卖家,建议还是静下心来研究一下自己的店铺,研究一下搜索,看如何能提高排名。
* 新版搜索和旧版搜索
自从切换到新版搜索以后,很多人在论坛上提出要求回到旧版搜索。理由是很多东西搜索不到。其实绝大部分时候只是一个误会!新版搜索和旧版搜索在改版的时候,算法都是一致的。后台系统也是同一套系统
,只是结果页展现不一样。如果在新版搜索上有问题,那么在旧版搜索上一样有问题。而新版上增加了一些新的功能,例如:销量排序、减去关键词、自定义筛选区等。淘宝的产品经理和工程师也不会都是傻子,肯定新版搜索有更多的好处才做修改的。这个时候,建议大家不要拘泥于新版还是旧版了,仔细研究一下新版的功能,看看哪些功能点你是可以利用到的。
说了这么多,想必大家有点等不及了:到底淘宝宝贝搜索排序的原则是什么呢?
宝贝搜索的排序
宝贝搜索上,有两种主要的排序方式,人气排序和所有宝贝排序。人气排序目前不是默认的排序方式,这里也不作为本文主要的介绍对象。所有排序中还有按照价格从低到高、从高到低排序、销量排序、信用从高到低排序的选项,这些排序的原则也很明确,基本上是按照选 项来的,从名字上就可以知道其规则。这里需要另外说明的是,这些特定排序中,会有一些宝贝会被过滤掉。也就是说,默认排序中的宝贝数目,和特定排序中的宝贝数目可能会不一样。哪些会被过滤掉呢?包含两种宝贝:一种是被处罚的商品(本文后面搜索降权会详细解释),另一种是相关性不好的商品。
默认的排序,目前的参考原则很明确:相关性、作弊降权、橱窗推荐、下架时间、消保。用一段描述来说就是:如果你的宝贝没有作弊,相关性好,是在橱窗推荐里的,参加过消保,那么就会按照下架时间来排序。
相关性:技术上对相关性有比较复杂的计算。但简单理解就是你的宝贝和搜索的关键词是否相关。相关和不相关也不是绝对的。例如:搜索”篮球”, 最相关的应该就是”篮球”的商品,其次才会是篮球鞋、篮球服等商品。因为现在算的相关性主要是关键词和标题的相关性,所以大家一定要重视标题。标题如何描述一方面会影响相关性,另一方面也会影响用户体验。有些卖家为了让宝贝被找到,标题堆砌一堆关键词,其实这是会被降权的。这就叫过犹不及。
作弊降权:如果你发现你的商品在默认宝贝排序上无论怎么搜索,都排序排在最后几个,那么肯定是有一些作弊行为被处罚了。接下来“搜索降权”部分会做详细解释。
橱窗推荐:卖家要珍惜你的橱窗推荐位。在搜索结果中,卖家橱窗宝贝是会被优先排序的。
下架时间:这一直是排序中比较重要的因素,用来保证每个商品都有机会展现。因此你的商品上架时间也很重要,如何让你的商品在一天不同时间段都有展现,这个有很多技巧。最好在宝贝展现的时候,卖家能在线服务,否则买
家想买也联系不到卖家。淘宝的交易高峰时间,或者是说购买人群最多的时段在一天之内有三个:早上10:00-12:00, 下午3:00-5:00, 晚上8:00-10:00. 正常情况下,周一到周五的人群比周末要多。所以如何安排你的宝贝下架时间,也成了一个有用的工具。
消保:消费者保护的简称,在淘宝上有很多消保的认证。现在默认排序,大部分类目对是否参加消保,是很依赖的。如果没有参加消保,这些商品肯定会排在参加消保商品的后面。淘宝搜索最直接的用户是消费者,为了保证消费者的利益,淘宝鼓励卖家参加消保。这不是对淘宝的承诺,是对消费者的承诺。
有些卖家说我的商品怎么在搜索结果中看不见?搜索结果目前每页只展现40条,总共可以查看100页,也就是说,通过点击可以查看的搜索结果数是40*100=4000个。如果搜索一个商品,结果数大于4000,肯定有些商品是看不见的。但搜索结果实时在变化,只要你的宝贝符合上述因素,就有机会排在第一页。
搜索降权
淘宝搜索基本上是实时的,也就是说,你修改了宝贝,上传了宝贝或者宝贝下架了,会很快在搜索中反映出来。目前来看,最晚不会超过15分钟(凌晨的时候除外)。 是否能在淘宝搜索中搜被找到,有个很简单的检验方法:把你的宝贝标题全部copy输入到搜索框,如果发现在所有结果中都找不到你的宝贝,那估计是有问题了。
没有进入淘宝搜索有一种情况是因为“滞销商品”。滞销商品目前的定义是:半年前发布的,而且最近3个月没有卖出过任何一件的商品。这一类商品是不会进入搜索库的,也就是说你用所有的标题去搜索,肯定找不到你的宝贝。如果希望让其进入索引,目前的方式是建议重新修改一下标题、价格后重新发布。
搜索中还有一些处罚措施叫降权。意思宝贝就是也能被找到,但是排序肯定是靠后的。如果有100条结果,被降权的商品,估计就排序在99位或者100位。如果有10000条结果,那估计你怎么浏览也找不到你的被降权的宝贝了,因为排序已经排在最后,而从搜索结果上点击只能查看前4000条。
检测宝贝是否被降权,还有种办法,在销量排序中是会被过滤掉的。也就是说,如果你按照销量排序,发现你的宝贝找不到,说明你的宝贝被降权了。
被降权有很多原因:基本上所有不规范的操作,都会被降权。例如:炒作信用、刷销量、故意堆砌关键词、广告商品、价格作弊、重复铺货、邮费虚假等。详细参看 /?p=244。惩罚力度也各有不一样,目前最长的是从最后一次不规范的操作开始计算,30天左右
结束。被降权还有一种是连带惩罚。如果你整个店铺中被识别为作弊的商品过多,那么对整个店铺的商品都有影响,基本上你所有的商品都会被降权。例如:炒作信用严重的。
最近很多人在论坛上问为什么别人的商品也有类似的操作,没有被惩罚,而自己的宝贝被惩罚了。其实这个问题没有意义,我经常说的一句话:“出来混,迟早要还得!” 既然你违规了,就做好被处罚的准备,不要眼红其他人。就像社会上被抓的小偷抱怨说为什么别的小偷没被抓一样没有意义。
有人在论坛上说,你看我用直通车,花了不少钱,好不容易把这个宝贝搞得比较畅销,偶尔一次刷销量就被降权了,你们忍心么?这是个误区。越是你好不容易培养出来的宝贝,你越要小心谨慎,不要有污点。搜索降权与不降权,与你做不做直通车广告没有任何关系。
在论坛上还存在一些现象,很多卖家把问题列出来,有小二回答了原因,但卖家自己始终说没有人给他解答。例如:小二告诉你说宝贝有些是重复铺货的,有些是有虚假交易的。这已经是解答了,这个时候你就自己去查啊,不要存在侥幸心理。这时候在论坛上大发脾气也没有用,解决不了问题。大发脾气只会让整个过程变得很不和谐,而且肯定不会加快处理的进度。
降权规则,是一视同仁的,不会针对某个卖家来具体惩罚。如果你的宝贝被降权了,想想为什么自己被降权,而别人没事?肯定有一些地方你的做法和别人是不一样的。那就尽量把这些问题改过来。如果你实在不知道原因,就在论坛上问,小二会尽力给大家回复。不要总是加小二的旺旺了,这样让小二也很为难,很多在论坛中回复问题的小二,都是搜索技术部门的小二,不是专业的客服人员,还有很多其他的工作。
一旦被降权,你可以把你的有问题的宝贝删除。这样的话不会因为这些宝贝造成对其他宝贝的影响。如果舍不得删除的话,那就等着降权结束,目前最长的时间是30天左右。
很多人问我说不知道某些操作是否会被识别成作弊。这些操作是否会被识别成作弊,就看你的行为是否是正常行为。注意,有时候普遍行为不一定是正常行为。例如,别人都是这么做的啊?如果别人都是在炒作信用,或者把价格搞得很低然后说只做批发不做零售等,这些可能是普遍现象,但不是正常现象,都是要被处罚的。如果是正常行为,那就放心的去做,所谓为人不做亏心事,半夜不怕鬼敲门。
未来的方向
淘宝排序算法一直在优化,搜索降权也是希望能规范市场,让诚信的卖家能有更多的回报,
让买家有更好的体验。相信绝大多数卖家都是支持的。
目前搜索正在做的事情是,对卖家的服务质量作为排序的参考,如果卖家对客服服务质量好,那么我们会让这些卖家的宝贝优先的。如果卖家一直很诚信,行为很规范,他的宝贝也是会排序靠前的。
另外,和卖家的沟通机制也在陆续建立,以后会有更多的渠道来跟卖家沟通,让大家清楚的知道搜索的一些规则和变化。
淘宝搜索,我们会秉着公正公开的原则,跟卖家沟通交流。因为技术原因,可能不一定能做到那么公平,但只要你是诚信经营,衷心为客户服务的,肯定会有好的回报。
淘宝搜索用户体验好了,用的人会更多,那么卖家的生意也才会更好。如果都是垃圾商品,骗子商品,淘宝搜索用的人就会越来越少,卖家的日子会越来越难过。相信这些循环大家都很清楚。
相信有了各位卖家买家的支持,淘宝搜索越来越好,大家的生意也会越来越好!