大数据背景下的图像检索在服装电商中的研究及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1.1背景
我们都已被反复的告知:随着科技技术不断发展和完善,一个属于大数据的信息时代将会来临,而这个事实我们无法改变只有在这次变革中不断创新和学习,才不会被时代所抛弃。
随着现代科技技术不断更新网络以及信息技术的不断发展和普及,人类在日常生活中所产生的数据量正在呈爆炸式的增长。每年以惊人的速度持续增长着,海量的数据就如同火山爆发,无法阻挡。这意味着人类在最近几年所产生的数据量已经相当于过去人类产生的所有数据的总量,人类迈入大数据时代的脚步已经无法停下这是大势所趋的事情。
海量数据存储和分析技术的突破性发展如云存储和云计算等等,他们的应用使得很多行业能够获得了突破的契机。当然也包含了服装相关的行业。
而起步于电子商务的服装行业发展十分迅速,相对于传统的服装经营方式,也体现了巨大优势。
a.在互联网上建立交易平台或者借助淘宝、京东、阿里巴巴等交易平台。节省了中间流通产生的费用。消除了“中间商”降低了实际流通的通信费用。
b.服装行业的公司能在互联网的网站上做宣传,提升自己在的形企业的影响力,起到广告作用。
c.在网上,能够通过平台与顾客交流直接反馈到企业自身,省却中间环节,提高沟通效率。
d.尤其是对中小型服装企业通过电子商务的平台有机会能够参与到全球的大竞争环境当中去。
B2C这种商业模式,是现在服装企业普遍采取的一种电商模式,也是众多传统行业的选择。也就是服装企业通过在网上构建一个能够供个人或者企业消费者在互联网上进行产品挑选,购买的平台。
在如此多的传统领域中,发展较为良好的的产业应该属于服装电商了。在发展的这些年里一直发展迅猛。并从这之中获取了巨大的利润。1.1.2论文的意义
服装电子商务是借助互联网与企业客户进行互动,通过在网上展示自己的服装产品并为客户提供服务。在整个过程中涉及到了许许多
多环节比如资金的流动,物流运输以及信息的流动而这其中远远脱不开互联网的支持和参与。现在的服装电子商务可谓百家齐放,销售通过网络平台,交易越来越规模化,形式也越来越多多样化,也越来越注重自身的品牌经营。
由于服装电商的成长十分迅速,因此企业的发展被带上了高速的轨道。其中的无限商机是人们不可想象的,但是,机遇的同时伴随而来的也有挑战,告诉发展的路上竞争越来越激烈,问题也越加的明显。那么如何应对这其中挑战并抓住机遇呢?但终究还是需要让消费者满意才行。所以如何抓住消费者的心才是关键。
要留住客人们的心,其中包含了很多方面。而对于电子商务这个行业来说有大概这么几点,首先有企业的自身形象,产品定位,企业的管理,网站设计,营销推广、售后,物流,还有客户。其中对于服装行业来说,整个企业网站的风格、功能设计、购物流程及售等等后。各种微小的环节有不到位都会改变顾客的最终想法。所以想要在如此激烈的大环境中傲视群雄的话,就要让自身服装企业的网站具有鲜明独特的风格,能够让顾客印象深刻,牢牢记住,并同时用良好的服务让顾客成为熟客。
1.1.3目的
作者期望通过对于大数据的背景下是在服装图像检索和识别方面的研究应用,能够使客户在消费过程中能够有更加良好的消费体验,使他们不再是仅仅通过打字来描述自己想的要服装,因为毕竟不是所有人都善于文字描述,而且通过客户本身自己来描述难免带有自身的主观性,不利于在海量数据中检索出结果,通过服装图像自身所有含有的信息作为检索条件的话,能够更加客观而准确的检索到结果。以便顾客达到良好的购物体验,也使得服装企业在电子商务领域的发展更进一步。
1.2 国内外的发展现状
1.2.1国外发展现状
从上世纪就有人在从事对图像的检索的研究了,在那时候,人们的研究方向主要是以文本内容为索引的图像检索,等到了上个世纪末的时候。在数据库的技术得以进步,以及计算机视觉方面的技术也在不断发展,在此条件下基于内同的图像检索技术应人们的需求,逐渐
发展成为一个备受关注的研究领域,当时有许多科研所和实验室都着手研究这个项目。
而现在基本的方向有以下几个:
1.2.1.1基于文字的图像检索
顾名思义利用文本来描述图像的特征并通过已有的算法在预先准备好的数据库中进行检索。并且通过这种搜索方法所获得的结果也非图像本身,而是该图像有关联的文本信息,通过这些信息才能找到所需图像。该方法虽然有很多优点,但是,以文本为主的检索也还是有其局限和不足,它的劣势体现于当图像内容太多本身过于复杂时,人工无法通过文字准确描述出图像本身所涵盖的内容(比如不规则多边形或者颜色的准确性以及纹理等都无法通过文字而准确的进行描述)。还有一点需要注意的是,由于通过人工用文本来标注的话具有很强的主观色彩,如此情况下由于描述者的差异对于相同的图像也有着理解上的差异,因而对其的描述也会产生差异(这种主观性质无法避免),所带来一定的歧义,而且通过人工标注图像特征的工作十分费时费力,一旦图像内容过于丰富,其中的消耗件显得太大了而且效率十分低下,无法满足大量数据下的多媒体检索要求。
1.2.1.2基于内容的图像检索
这里我们简称为CBIR是一种通过提取图像本身的所存在的客观特征(如形状,轮廓,外观。区域空间,颜色和纹理等)然后通过这些视觉特征的相似性,从而搜索出符合所选要求的结果。该检索方法因为是从图像本身的内容为出发点,通过客观的特征进行检索,无需或者仅需很少的人工标注,是当前网络环境图像检索技术中的主流技术。与基于文本的图像检索相比较,通过各种考量此方法更符合用户的实际需求。
1.2.1.3基于色彩的索引技术
色彩是物体表面的一种物理特征,是人类通过眼睛对光的一种感受,任何物体都有一定的色彩属性。如蓝色往往是和天空,海洋产生联系,因此我们用色彩来进行图像检索;通过对色彩信息的统计并且用直方图来表示结果进行检索。基于色彩特征的索引技术是对色彩信息采集的一种方式其中又可以细分为基于全局色彩特征的索引还有就是基于局部色彩特征的索引。全局索引目前经常选用的是直方图的方法。这种方法主要是利用每种色彩出现的可能性,然后在频度图中