电商销售数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
所得结果
结果发现,下列每一组中的手机互为替代商品
(a)UMO/优摩 w9220 Yusun/语信 T28 (b)Huawei/华为 C8812 ZTE/中兴 N807 (c)OPPO U705T TCL Y910T (d)Coolpad/酷派 8150D ZTE/中兴 V889D (e)K-Touch/天语 E800 UMO/优摩 W800 七喜 TD710 (f)UMO/优摩 W800 七喜 TD710 Konka/康佳 E5680 (g)UniscopE/优思 U1201 Huawei/华为 Y300-0000 (h)Coolpad/酷派 8050 Coolpad/酷派 E239 (i)Motorola/摩托罗拉 XT800 索爱正品SA-I960 安卓4.0 (j)Coolpad/酷派 8020 Haier/海尔 HT-I600 (k)七喜 H750 Gionee/金立 C620 (l)Lenovo/联想 A790E 广信 ef58 (m)Huawei/华为 c8810 Samsung/三星 s6108 (n)AUX/奥克斯 V930 TCL Y710 (o)Philips/飞利浦 W8355 ONN/欧恩 V8 16G版 (p)TCL Y710 Gionee/金立 GN705w
将手机聚类,找出互为替代的手机。
替代商品的挖掘
from __future__ import division from math import sqrt #coding=gbk f1=open(r'E:\tmao\shoujiInformation.txt') records=f1.readlines() f1.close() price=[] number=[] product=[] for i in range(len(records)): item=records[i].split('\t') price.append(item[0]) product.append(item[1]) number.append(item[2]) for i in range(len(price)): for j in range(i+1,len(price)): distance=sqrt(pow((float(price[i])-float(price[j])),2)+pow((int(number[i])int(number[j])),2)) if distance<=2: #if the distance minuse 2,we consider the two is replaced product print product[i],'\t',product[j] else: pass
电商销售记录分析
严智强、贺强、刘瑞、 崔亚松、臧茹歌
LOGO
Background
消费Leabharlann Baidu 群
消费记 录
消费习 惯
网购流 行
潜在价 值
电商崛 起
市场方 向
消费喜 好分析
Contents
contents
电商数据
天猫手机销售数据分析
京东商城销售数据分析
数据的 获取与 预处理
替代商 品的挖 掘
价格空 洞的发 现
销量——价格 散点图
替代商品的挖掘
我们认为,如果两件手机的售价和销 量十分接近,则认为这两件手机互为替代 商品。从网络营销的特点来看,从店铺的 角度出发,选择进价更低的手机可获得更 多利润。
替代商品的挖掘
我们以欧氏距离小于等于2为标准
sqrt((a.price-b.price)^2+(a.sales_number-b.sales_number)^2)<=2
用户消费记录的分析
通过用户的消费记录,分析出用户的喜好 品牌,从而当该品牌有新产品推出和促销 活动时优先推荐给这些用户。
牛仔裤销售数据分析
用户尺码大小
颜色偏好
数据获取与预处理
以爬虫程序从京东商城获取牛仔裤销售记 录,并过滤出每个用户所购买的颜色、尺 码。
数据获取与预处理
#coding=gbk import re import urllib page=[16,16,16,16,16,16,16,16,15,15,15,15,15,15,15,14,14,14,14,14,13,13,13,13,13,13,12,12,12,12,12,12,1 2,12,12,12]#page记录了每件商品的评论页面数目 f1=open(r'C:\Users\YANZHIQIANG\Desktop\jdongNiuZaiKuAdd.txt')#goods存储商品评论地址 goodslist=f1.readlines() f1.close() s1=r'E:\jdong\niuzaikupinglunAdd' s3='.txt' for i in range(0,len(goodslist)): for j in range(1,page[i]+1): content=urllib.urlopen(goodslist[i].strip()+str(j)+'-0.html').read() print goodslist[i].strip()+str(j)+'-0.html' save=s1+str(i)+s3 f2=open(save,'a') f2.write(content) f2.write(goodslist[i].strip()+' page '+ str(j) +' downloaded \n') f2.write('#####\n') f2.close() s1=r'E:\jdong\niuzaikupinglunAdd' s3='.txt'
用户尺码大小与颜色偏好挖掘
for a in size: for b in range(0,len(daxiao)): if re.search(daxiao[b],a.strip()): countSize[b]=countSize[b]+1 break elif re.search('^XS$',a.strip()): countSize[14]=countSize[14]+1 break elif re.search('^S$',a.strip()): countSize[15]=countSize[15]+1 break elif re.search('^M$',a.strip()): countSize[16]=countSize[16]+1 break elif re.search('^L$',a.strip()): countSize[17]=countSize[17]+1 break elif re.search('^XL$',a.strip()): countSize[18]=countSize[18]+1 break elif re.search('^XXL$',a.strip()): countSize[19]=countSize[19]+1 break elif re.search('^XXXL$',a.strip()): countSize[20]=countSize[20]+1 break else: break f4=open(r'E:\jdong\sizeSummary.txt','a') d2=dict(zip(daxiao,countSize)) for key in d2.keys(): f4.write(str(key)+'\t'+str(d2[key])) f4.write('\n') f4.close()
用户尺码大小与颜色偏好挖掘
#coding=gbk import re name=['白','黑','粉','枣红','酒红','大红','红','紫','绿','杏','黄','棕','宝蓝','彩蓝','海蓝','深蓝','浅蓝','灰蓝','中蓝','天蓝','墨兰','墨蓝','藏蓝','蓝','橙','灰'] countColor=[0*i for i in range(len(name))] f1=open(r'E:\jdong\allNiuZaiKuColor.txt') color=f1.readlines() f1.close() for j in color: for k in range(0,len(name)): if re.search(name[k],j): countColor[k]=countColor[k]+1 break f2=open(r'E:\jdong\colorSummary.txt','a') d=dict(zip(name,countColor)) for key in d.keys(): f2.write(str(key)+'\t'+str(d[key])) f2.write('\n') f2.close() daxiao=[str(i) for i in range(10,36)] countSize=[i*0 for i in range(len(daxiao))] f3=open(r'E:\jdong\allNiuZaiKuSize.txt') size=f3.readlines() f3.close()
价格空洞的发现
经过分析,我们发现,作为中高端机营销,可选择35004000的价格空洞。可在较小压力下打入市场。
京东商城销售数据分析
牛仔裤销售数据分析
从生产厂家的角度来说,如果得到大量消 费者的尺码大小及颜色偏好,则对生产和 销售是非常有利的。因此,我们统计了京 东女性牛仔裤的销售记录,从中得到各尺 码和颜色在总的销售数据中的比例,从而 指导生产。
价格空洞的发现
数据的获取与处理
How to get the data
构建一个爬虫脚本,从天猫上获取销量前600的手机 销售记录,并匹配出每条记录的机型、售价、销量。
爬虫脚本
#coding=gbk import urllib import re f1=open(r'E:\tmao\shoujihtml.txt')#此处存储了销量前600的网页地址 http=f1.readlines() f1.close() f2=open(r'E:\tmao\shouji.txt','a') for i in http: content=urllib.urlopen(i.strip()).read() f2.write(content) f2.write('\n') f2.write('#'*50) f2.write('\n') f2.close() f3=open(r'E:\tmao\shouji.txt') lines='' for line in f3.readlines(): lines+=line.strip() f3.close() pattern=r'<p class="productPrice"><em title="(.*?)".*?<p class="productTitle">.*?target="_blank" title="(.*?)".*?<p class="productStatus"><span><em>(.*?)</em><br>' result=re.findall(pattern,lines) f4=open(r'E:\tmao\shoujiInformation.txt','w')#该文件中存储了每件手机的记录(机型、售价、销量) for item in result: for j in range(3): f4.write(item[j]) f4.write('\t') f4.write('\n') f4.close()
牛仔裤销 售数据的 分析
用户消费 记录的分 析
天猫手机销售数据分析
淘宝网作为国内第一大电商,占有
近50%市场份额,而天猫商城则是 所有优质店铺的集合,每月会产生 大量销售数据,这里以天猫近一个 月的手机销售数据进行分析,找出 这些数据隐含的价值。
天猫手机销售数据分析
数据的获取与预处理
替代商品的挖掘
数据获取与分析
for i in range(0,35): s=s1+str(i)+s3 f=open(s) lines='' for line in f.readlines(): lines+=line.strip() f.close() color=r'<dt>颜.*?色:</dt><dd>(.*?)</dd>' size=r'<dt>尺.*?码:</dt><dd>(.*?)</dd>' date=r'<dt>购买日期:</dt><dd>(.*?)</dd>' multiColor=re.findall(color,lines) print 'file',i,'has',len(multiColor),'color records\n' multiSize=re.findall(size,lines) print 'file',i,'has',len(multiSize),'size records\n' multiDate=re.findall(date,lines) print 'file',i,'has',len(multiDate),'date records\n' f1=open(s1+str(i)+'color'+s3,'w') for c in multiColor: f1.write(c) f1.write('\n') f1.close() f2=open(s1+str(i)+'size'+s3,'w') for s in multiSize: f2.write(s) f2.write('\n') f2.close() f3=open(s1+str(i)+'date'+s3,'w') for d in multiDate: f3.write(d) f3.write('\n') f3.close()