大数据时代智能识别、数据分析让假货无处遁形
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据时代智能识别、数据分析让假货无处遁形
12月23日,阿里巴巴集团在杭州向外界披露了最新的打假成果,这是阿里巴巴成立15年来,首次向社会全方位揭秘其打假的工作机制。
先来看看阿里巴巴方面本次披露的打假详情:
1、从2013年1月1日至2014年11月30日,阿里集团在消费者保障及打假方面的投入已经超10亿元人民币。仅2014年前三季度,阿里配合品牌权利人年处理600万条侵权商品链接,配合各级行政执法部门,办理侵犯知识产权案件1000余起,抓获犯罪嫌疑人近400人,涉案金额近6亿元。
2、阿里正在考虑,未来定期公布基于淘宝打假数据得出的“全国线下假货分布及流通地图”,阿里目前投入在消费者保障及打假方面的员工超过2000人。
3、2013年开始,阿里巴巴逐步建立了全球最专业的图片侵权假货识别系统,通过图片算法技术实时扫描,识别能力超过国外同类图片侦测软件Google
goggles和orcam。商标识别算法可以通过检测图片中的局部Logo,来识别图片中商品的品牌,进而判断该商品是否为假货。目前淘宝收集的各类违规假货样本的图库在100万左右,系统每天调用超过3亿次。
尽管阿里在打击假货问题上不遗余力,但是假货问题却并未根绝。工商总局此前的一份报告就曝光了多家电商涉嫌售假的报告,其中包括淘宝网。
一边在全力打假,一边却受到工商总局的指责。究竟电商售假问题是谁的过失?一份中国电子商务协会发布的《2014年网络交易平台打假报告》中披露,打假必须要从源头打起,而打击假货最有效、最核心的手段,就是电子商务。
中国社科院信息化研究中心秘书长姜奇平表强调,当前,假冒伪劣商品的主要源头在网下,要抓住源头进行治理。要一追到底,不能象割韭菜那样,在网上割了一茬又一茬,(1蜗牛旅行)但任由网下的假冒伪劣源头不受触动。
姜奇平认为,网上购物平台应该能够比网下购物平台更好解决假冒伪劣问题,假冒伪劣不是因为断网而减少,而是因为更多人上网购物,环境越来越透明,假的东西无处藏身而减少。
海关总署官员李群英则直言,可能淘宝背负了很多骂名,一点就像北京秀水街,作为一个房东,作为一个电商平台,它本身不具备执法责任,而是提供规范服务。但是阿里在这方面做了很多超出自己职责范围的事。
质检总局官员余政表示,电商涉及多区域、多环节、多部门,以电商打假为突破口,阿里巴巴和国家质检总局进行了很好的合作,通过电商能够有效的打击假冒伪劣。
值得注意的是,阿里的大数据打假模式及成效受到了来自国家最高打假机构的充分肯定。全国打击侵犯知识产权和制售假冒伪劣商品工作领导小组办公室(国务院“双打办”)副主任柴海涛就此表示,“非常赞赏阿里巴巴每年发布的打假报告,正面回应社会关切。非常赞成阿里提出“打假社会共治理念”,体现了互联网的共享、开放、平等精神。
由此可见,追根溯源通过借助线上的数据分析能力对加大对线下制假窝点的打击力度才是杜绝电商售假的有效方式。而不是因为电商存在售假行为,就将假货的存在脱卸给电商平台,并将其作为工商部门不作为的替罪羔羊。
处理如此海量的假货数据,仅依靠阿里2000多人的消费者保障和打假团队人工操作,是不可能完成的任务。阿里巴巴首席风险官邵晓锋称,经过多年与制假售假者的“暗战”,阿里巴巴已经构建起一套全球领先的基于互联网大数据的打假模式,1蜗牛旅行既包含智能识别和追踪系统、庞大的商品样本库和数据库、精确复杂的算法、强劲的云计算能力等大数据技术手段,也包括账号认证溯源、神秘抽检等完善的管理保障体系,以及与消费者、商家、权利人和政府部门等生态体系参与者的联动机制。
“我们的打假模式是向社会开放的,欢迎更多的平台、商家、权利人等利用这套模式,从源头打击假货,还给消费者一个安全、透明的购物环境。”邵晓锋表示。
智能识别数据分析大数据打假有迹可循
信息时代的到来,使发现、追踪和打击假货拥有更强大的信息和技术手段。阿里巴巴在十几年和不法分子的斗争中,逐渐打磨出一套自成体系的打假模式,其中最核心的部分是大数据打假。简言之,就是通过智能识别、数据抓取与交叉
分析、智能追踪、大数据建模等技术手段,将假货从10亿量级的在线商品中捞取出来。
以前,排查假货信息是靠搜索关键词来确定的,这么做工程量大,准确率低。这两年,阿里巴巴安全技术人员开发的文本识别引擎已经升级为语法语义分析,在引入了机器学习算法后,能够取代之前小二辛辛苦苦的人工排查,做到全网数据监控和检索。这套信息排查平台,对全网10亿级的商品数据进行全量检索和处置,支持多达60个维度的组合条件筛选,每天消息处理量2亿以上。
2013年开始,阿里巴巴逐步建立了全球最专业的图片侵权假货识别系统,通过图片算法技术实时扫描,识别能力超过国外同类图片侦测软件Google goggles和orcam。商标识别算法可以通过检测图片中的局部Logo,来识别图片中商品的品牌,进而判断该商品是否为假货。目前淘宝收集的各类违规假货样本的图库在100万左右,系统每天调用超过3亿次。一旦发现新的假货图片,可以支持在30分钟内检索出淘宝上所有与此相似的图片,进而下架所有引用该类图片的商品。
但是随着技术排查能力的升级,售假者也在不断变换手法。一个真实的案例:某淘宝卖家在发布宝贝描述的时候,既没有使用盗用的品牌名称,也没有上传带有明显Logo的照片。在这种情况下,阿里巴巴如何排查呢?通过用户上传的评价截图,大数据系统照样能发现商家忧售假的异常行为。也就是说,即使卖家在店铺和商品描述中不出现品牌信息,淘宝大数据系统仍然能够从消费者评价中的蛛丝马迹,锁定可疑假货。
“大数据打假系统是在不断进化的,随着数据的丰富变得越来越聪明。”阿里巴巴安全部自身总监倪良表示,发退货、登陆IP、商品文字、图片描述,交易,消费者评价、维权,权利人投诉,甚至是社交媒体数据等16个维度和特征的数据在被提取和交叉分析后,从中剥离出涉假信息……当一切都被能被记录和对比分析时,售假者的行为就会被追踪,变得无处可藏。