常见数据分析方法及案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011年2月全量网吧用户1.43亿。qq用户约6.6亿。 其中男性70%,女性30%,男女比例显著高于腾讯全量用户(2011年 1月数据,男56.2%、女42.9%); 网吧整体用户年龄分布与腾讯总体相比更加年轻,24岁以下用户占 78%,腾讯全量用户为53.5%(2011年1月数据)。
量大!男性化!年轻化!如何应用特征?
Thanks & QA
数据敏感!目标明确!逻辑严密!
用户是否使用soso和年龄有关么?
结论:有关系;从年龄分布上 看,小于18岁用户中不活跃 用户的占比最大;而用户的 年龄越大,重度活跃用户的 比例越高。
报表分析:简单!有效!
说明:
1、a/b test:为了验证某种方案是否更优,采取分组测试方法。 2、如何保证测试有效性:参照系稳定,数据充分。 3、测试指标:不仅仅是数量,还有质量。 4、联盟网吧案例:各个联盟网吧的分组指标如下:
回答要点:抽样后样本平均每个用户有50条电话记录,不符合实际情况 (全量样本中平均每个用户有5条电话电话记录)。 原因主要是这个抽样方法是针对于电话记录的随机,对用户不随机(多电 话记录的用户被抽中的可能性大)。 正确抽样方法是:从全量记录里面抽取全量不同的用户,然后在用户里面 随机抽取2万用户,在用这2万用户去匹配电话记录,构成样本。
常用的数据分析方法及案例
吴志坚 2011-7-26
目录
1、分析思路 2、报表分析 3、在A/B测试 4、用户数据画像
分析思路
1、业务导向(目标和方法关系) 2、结果完整(体检报告:结论,数据,分析,建议) 3、螺旋上升 4、逻辑严密
Βιβλιοθήκη Baidu
测试你的逻辑:
抽样问题:电信12580客户细分项目。项目目标:电信想具体分析12580的 客户特征(如性别比例;使用12580频次等)。数据基本情况如下:2千万不同客户 (电话号码)产生全量1亿条电话记录。抽样方法如下:从1亿记录随机抽取2万条电 话记录,发现里面包含1.9万客户(电话号码)。这1.9万客户对应全量记录里面一共 产生100万条电话记录,用这100万条电话记录构成抽样分析的样本。请问上述抽样是 否有问题?问题出在哪里?如何解决?
分组:识别差异!分析差异!优化!
用户画像
1、画像对象:qq用户; 2、通过qq号码,将用户的属性和行为关联起来;寻找用户的特征; 3、数据只有对比才能说明问题:给数据寻找参照系;
网吧用户画像
1、背景:了解网吧用户特征,用以网吧联盟战略参考; 2、通过qq号码,判断用户是否在网吧ip登录; 3、部分特征如下:
相关文档
最新文档