基于大数据的用户行为分析技术、个性化推送服务技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于大数据的用户行为分析技术、个性化
推送服务技术
天津大学机械工程学院机械工程专业2013级硕士
摘要:本文介绍了大数据的背景,概念,特点,产生的来源,通过对用户行为的分析等,基于用户产生的大量的数据进行个性化的推送服务技术等。最后通过分析对大数据的应用前景和展望进行了分析。
关键词:大数据用户行为分析个性化展望
1 大数据的产生背景
从硅谷到北京,大数据的话题正在被传播。随着智能手机以及“可佩带”计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。如今,一个大规模生产、分享和应用数据的时代正在开启。我们所了解的大数据的真实价值如冰山一角,所以有待我们去挖掘。
1.1 大数据概念
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
1.2 大数据的特点
大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume(大量)、Velocity (高速)、Variety(多样)、Value(价值)。
1.3 大数据的产生来源
与传统数据的来源不同,大数据的来源不再仅仅局限于ERP、CRM等业务数据,还包括机器生成数据和社交数据。机器生成数据包括电话呼叫数据、各类服务器日志、传感器数据等,随着物联网的不断发展和传感器设备的普及,可获取的传感器数据变得越来越多。社交数据则指在Web 2.0网络中用户参与的微博、社交网络、用户反馈等数据。
根据IDC的研究报告,人类社会的信息量每两年就会翻一番,2011年新产生和复制的数据总量达到1.8ZB(1.8万亿GB),其中75%的数据是个人产生的。人们日常生活中使用的网络、手机或其他电子设备,每天都在不停地产生大量新的数据,超出了以往系统所能分析的能力。然而大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
由于大数据的来源和类型多样,分析大数据时必须能同时处理结构化和半结构化,甚至是原始格式的数据。因此这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。
云计算为我们打开大数据的宝藏提供了钥匙,突破了数据处理的瓶颈。因此基于大数据的用户行为分析技术、个性化推送服务技术的研究将翻开崭新的一页。
2 用户行为分析与个性化推送服务技术
大数据的一大应用是对用户行为进行分析和进行个性化推送服务,而分析的关键就在于搞清三个关键问题:什么是用户行为分析;为什么分析用户行为;如何分析用户行为。基于对用户行为的分析,再设计个性化的推送服务。
什么是用户行为分析:用户行为分析就是根据用户历来的行为来分析用户的需求或即将要做的事情。一般我们分析用户行为离不开数据,这些数据可以来自于数据库也可以来自于用户操作日志。比如武汉播思的Hugetable系统就是一个很好的用户行为分析系统平台。
为什么分析用户行为:探究用户的行为,并采用某些技术手段分析这些行为,最终提供给营销人员基于真实用户行为的参考数据。例如,通过对各资费档次用户使用特征的比较,获得高资费用户上网的特征,找到目标用户,通过业务引导、资费策略等方式使用户想高资费转移。再例如,通过对政企客户使用业务种类的特征分析,向大客户营销商务领航系列产品。
如何分析用户行为:基于数据的用户个性化分析的核心思想就是事先根据用户的事件,分析出一些典型的行为,再通过采集用户的事件来匹配这些行为。由于行为的发生会再影响到用户的个性化的标签,标签匹配度会由于行为的不同有增有减,而不是一旦赋予终身不变,这符合人性变化的特点,经过一段时间的数据积累,我们将逐渐清楚用户各方面的特征。
基于用户行为分析并进行个性化推送服务成功的案例已经有很多,例如亚马逊,谷歌,农夫山泉等等,下面以亚马逊为例具体解释基于大数据的用户行为分析技术和个性化推送服务所带来的不同结果。
全球电子商务创始者亚马逊(),它在利润并不丰厚的图书行业竞争中取胜的根本原因在于对数据的战略性认识和使用,通过传统门店无法比拟的互联网手段,空前地获取了极其丰富的用户行为信息,并且进行深度分析与挖掘。
它利用了用户在网站上发生的所有行为,如搜索、浏览、打分、点评、加入购物车、取出购物车、加入期待列表、购买、使用减价券和退货等信息;甚至包括在第三方网站上的相关行为,如比价、看相关评测、参与讨论、社交媒体上的交流、与好友互动等信息,收集到了大量客户在购买前的行为信息,而不是像门店收集到的只是交易信息,如购买、退货、折扣、返券等和最终交易相关的信息。两者相比起来,前者可以更深度地反映出潜在客户的购买心理和购买意向。
例如,客户A连续浏览了5款电视机,其中4款来自国内品牌S,1款来自国外品牌T;4款为LED技术,1款为LCD技术;5款的价格分别为4599元、5199 元、5499元、5999元、7999元;这些行为某种程度上反映了客户A对品牌认可度及倾向性,如偏向国产品牌、中等价位的LED电视。而客户B连续浏览了6款电视机,其中2款是国外品牌T,2款是另一国外品牌V,2款是国产品牌S;4款为LED技术,2款为LCD技术;6款的价格分别为5999元、7999元、8300元、9200元、9999元、11050元;类似地,这些行为某种程度上反映了客户B对品牌认可度及倾向性,如偏向进口品牌、高价位的LED电视等。
亚马逊通过对这些行为信息的分析和理解,制定对客户的贴心服务及个性化推荐。例如:当客户浏览了多款电视机而没有做购买的行为时,在一定的周期内,把适合客户的品牌、价位和类型的另一款电视机促销的信息通过电子邮件主动发送给客户;再例如,当客户再一次回到网站,对电冰箱进行浏览行为时,可以在网页上给客户A推荐国产中等价位的冰箱,而对客户B推荐进口高档价位的商品。
这样的个性化推荐服务往往会起到非常好的效果,不仅可以提高客户购买的意愿,缩短购买的路径和时间,通常还可以在比较恰当的时机捕获客户的最佳购买冲动,也降低了传统的营销方式对客户的无端骚