电商销售数据分析(PPT 33页)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将手机聚类,找出互为替代的手机。
替代商品的挖掘
from __future__ import division from math import sqrt #coding=gbk f1=open(r'E:\tmao\shoujiInformation.txt') records=f1.readlines() f1.close() price=[] number=[] product=[] for i in range(len(records)):
(n)AUX/奥克斯 V930
TCL Y710
(o)Philips/飞利浦 W8355 ONN/欧恩 V8 16G版
(p)TCL Y710
Gionee/金立 GN705w
价格空洞的发现
经过分析,我们发现,作为中高端机营销,可选择35004000的价格空洞。可在较小压力下打入市场。
京东商城销售数据分析
distance=sqrt(pow((float(price[i])-float(price[j])),2)+pow((int(number[i])int(number[j])),2))
if distance<=2: #if the distance minuse 2,we consider the two is replaced product
f4=open(r'E:\tmao\shoujiInformation.txt','w')#该文件中存储了每件手机的记录(机型、售价、销量) for item in result:
for j in range(3): f4.write(item[j]) f4.write('\t')
f4.write('\n') f4.close()
ZTE/中兴 V889D
(e)K-Touch/天语 E800
UMO/优摩 W800 七喜 TD710
(f)UMO/优摩 W800
七喜 TD710
Konka/康佳 E5680
(g)UniscopE/优思 U1201 Huawei/华为 Y300-0000
(h)Coolpad/酷派 8050
Coolpad/酷派 E239
item=records[i].split('\t') price.append(item[0]) product.append(item[1]) number.append(item[2]) for i in range(len(price)): for j in range(i+1,len(price)):
lines+=line.strip() f3.close() pattern=r'<p class="productPrice"><em title="(.*?)".*?<p class="productTitle">.*?target="_blank"
title="(.*?)".*?<p class="productStatus"><span><em>(.*?)</em><br>' result=re.findall(pattern,lines)
电商销售记录分析
严智强、贺强、刘瑞、 崔亚松、臧茹歌
LOGO
Background
消费人 群
消费习 惯
潜在价 值
网购流 电商崛
行
起
消费记 录
消费喜 好分析
市场方 向
Contents
contents 电商数据
天猫手机销售数据分析
数据的 获取与 预处理
替代商 品的挖
掘
价格空 洞的发
现百度文库
京东商城销售数据分析
牛仔裤销 售数据的
分析
用户消费 记录的分
析
天猫手机销售数据分析
淘宝网作为国内第一大电商,占有 近50%市场份额,而天猫商城则是 所有优质店铺的集合,每月会产生 大量销售数据,这里以天猫近一个 月的手机销售数据进行分析,找出 这些数据隐含的价值。
天猫手机销售数据分析
数据的获取与预处理 替代商品的挖掘 价格空洞的发现
print product[i],'\t',product[j] else:
pass
所得结果
结果发现,下列每一组中的手机互为替代商品
(a)UMO/优摩 w9220
Yusun/语信 T28
(b)Huawei/华为 C8812
ZTE/中兴 N807
(c)OPPO U705T TCL Y910T
(d)Coolpad/酷派 8150D
销量——价格 散点图
替代商品的挖掘
我们认为,如果两件手机的售价和销 量十分接近,则认为这两件手机互为替代 商品。从网络营销的特点来看,从店铺的 角度出发,选择进价更低的手机可获得更 多利润。
替代商品的挖掘
我们以欧氏距离小于等于2为标准
sqrt((a.price-b.price)^2+(a.sales_number-b.sales_number)^2)<=2
数据的获取与处理
How to get the data
构建一个爬虫脚本,从天猫上获取销量前600的手机 销售记录,并匹配出每条记录的机型、售价、销量。
爬虫脚本
#coding=gbk import urllib import re f1=open(r'E:\tmao\shoujihtml.txt')#此处存储了销量前600的网页地址 http=f1.readlines() f1.close() f2=open(r'E:\tmao\shouji.txt','a') for i in http:
(i)Motorola/摩托罗拉 XT800 索爱正品SA-I960 安卓4.0
(j)Coolpad/酷派 8020
Haier/海尔 HT-I600
(k)七喜 H750
Gionee/金立 C620
(l)Lenovo/联想 A790E
广信 ef58
(m)Huawei/华为 c8810
Samsung/三星 s6108
content=urllib.urlopen(i.strip()).read() f2.write(content) f2.write('\n') f2.write('#'*50) f2.write('\n') f2.close()
f3=open(r'E:\tmao\shouji.txt') lines='' for line in f3.readlines():
替代商品的挖掘
from __future__ import division from math import sqrt #coding=gbk f1=open(r'E:\tmao\shoujiInformation.txt') records=f1.readlines() f1.close() price=[] number=[] product=[] for i in range(len(records)):
(n)AUX/奥克斯 V930
TCL Y710
(o)Philips/飞利浦 W8355 ONN/欧恩 V8 16G版
(p)TCL Y710
Gionee/金立 GN705w
价格空洞的发现
经过分析,我们发现,作为中高端机营销,可选择35004000的价格空洞。可在较小压力下打入市场。
京东商城销售数据分析
distance=sqrt(pow((float(price[i])-float(price[j])),2)+pow((int(number[i])int(number[j])),2))
if distance<=2: #if the distance minuse 2,we consider the two is replaced product
f4=open(r'E:\tmao\shoujiInformation.txt','w')#该文件中存储了每件手机的记录(机型、售价、销量) for item in result:
for j in range(3): f4.write(item[j]) f4.write('\t')
f4.write('\n') f4.close()
ZTE/中兴 V889D
(e)K-Touch/天语 E800
UMO/优摩 W800 七喜 TD710
(f)UMO/优摩 W800
七喜 TD710
Konka/康佳 E5680
(g)UniscopE/优思 U1201 Huawei/华为 Y300-0000
(h)Coolpad/酷派 8050
Coolpad/酷派 E239
item=records[i].split('\t') price.append(item[0]) product.append(item[1]) number.append(item[2]) for i in range(len(price)): for j in range(i+1,len(price)):
lines+=line.strip() f3.close() pattern=r'<p class="productPrice"><em title="(.*?)".*?<p class="productTitle">.*?target="_blank"
title="(.*?)".*?<p class="productStatus"><span><em>(.*?)</em><br>' result=re.findall(pattern,lines)
电商销售记录分析
严智强、贺强、刘瑞、 崔亚松、臧茹歌
LOGO
Background
消费人 群
消费习 惯
潜在价 值
网购流 电商崛
行
起
消费记 录
消费喜 好分析
市场方 向
Contents
contents 电商数据
天猫手机销售数据分析
数据的 获取与 预处理
替代商 品的挖
掘
价格空 洞的发
现百度文库
京东商城销售数据分析
牛仔裤销 售数据的
分析
用户消费 记录的分
析
天猫手机销售数据分析
淘宝网作为国内第一大电商,占有 近50%市场份额,而天猫商城则是 所有优质店铺的集合,每月会产生 大量销售数据,这里以天猫近一个 月的手机销售数据进行分析,找出 这些数据隐含的价值。
天猫手机销售数据分析
数据的获取与预处理 替代商品的挖掘 价格空洞的发现
print product[i],'\t',product[j] else:
pass
所得结果
结果发现,下列每一组中的手机互为替代商品
(a)UMO/优摩 w9220
Yusun/语信 T28
(b)Huawei/华为 C8812
ZTE/中兴 N807
(c)OPPO U705T TCL Y910T
(d)Coolpad/酷派 8150D
销量——价格 散点图
替代商品的挖掘
我们认为,如果两件手机的售价和销 量十分接近,则认为这两件手机互为替代 商品。从网络营销的特点来看,从店铺的 角度出发,选择进价更低的手机可获得更 多利润。
替代商品的挖掘
我们以欧氏距离小于等于2为标准
sqrt((a.price-b.price)^2+(a.sales_number-b.sales_number)^2)<=2
数据的获取与处理
How to get the data
构建一个爬虫脚本,从天猫上获取销量前600的手机 销售记录,并匹配出每条记录的机型、售价、销量。
爬虫脚本
#coding=gbk import urllib import re f1=open(r'E:\tmao\shoujihtml.txt')#此处存储了销量前600的网页地址 http=f1.readlines() f1.close() f2=open(r'E:\tmao\shouji.txt','a') for i in http:
(i)Motorola/摩托罗拉 XT800 索爱正品SA-I960 安卓4.0
(j)Coolpad/酷派 8020
Haier/海尔 HT-I600
(k)七喜 H750
Gionee/金立 C620
(l)Lenovo/联想 A790E
广信 ef58
(m)Huawei/华为 c8810
Samsung/三星 s6108
content=urllib.urlopen(i.strip()).read() f2.write(content) f2.write('\n') f2.write('#'*50) f2.write('\n') f2.close()
f3=open(r'E:\tmao\shouji.txt') lines='' for line in f3.readlines():