大数据时代及数据挖掘的应用 最终版
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
√每天会有 2.88 万个小时的视频上传到Youtube, 足够一个人昼夜不息的观看3.3年…
√推特上每天发布 5 千万条消息,10 秒钟浏览一条信息, 足够一个人昼夜不息的浏览16年…
√每天亚马逊上将产生 6.3 百万笔订单… √每个月网民在Facebook 上要花费7 千亿分钟,
被移动互联网使用者发送和接收的数据高达1.3EB… √ Google 上每天需要处理24PB的数据…
BIG dATA
数据挖掘分析流程
——了解用户,才能更精准的挖掘。
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
根据用户特性,制定关键词群。
1.产品关键词:
挖掘对产品有直接需求的用户:他们本身对 产品有需求,想要购买,他们需要的是更好的 推荐。
2.行为关键词:
挖掘对产品有潜在需求的用户:他们的行 为有极大可能对产品产生需求,我们需要更好 的刺激需求,也可借此扩大品牌影响力。
文本挖掘借助于数据挖掘算法对文本信息进行分析,通过统计分析,聚类分析,规 则发现,模式探索与识别对文本信息进行探索分析,发现其潜在的规律规则。
情绪识别和分析技术 关键词关联度发现技术 文本挖掘与规则发现技术
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
海量数据库
新浪每日微博数据1亿条。
通过API接口,根据挖掘策略,
获取基础数据:约6万条
——初步数据挖掘,是对所有相关用户的整合。
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
克鲁斯,原地不动,球门右下角。 阿亚拉,低平球,左下角。马克 西,右侧死角。坎比亚索,等待, 原地不动,左下角。
✓ 这便是教练拥有的一个非常 详尽的私人数据库,收集了 13000个点球录像,进行了 详细的分析,通过记录和分 析去了解阿根廷球员的习惯, 最后浓缩成了这张纸条。
BIG dATA
数据,带来的是实打实的效果!
产品特征 人群特点
分类话术
阶段任务:
1.根据用户给出的资料,给产品消费者“画轮廓”(群体描述); 2.根据数据挖掘师的报告,给潜在用户“涂颜色”(属性分类);
注意事项:
1.群体描述时,尽量在大范围内精准,不要有过分细节的描述; 2.属性分类时,先选取有价值的属性,然后尽可能细致的进行分类。
BIG dATA
主要包括:
• 总体呈现 • 关键词呈现 • 用户类型 • 性别分析 • 年龄分析 • 地域分析 • 发言时间 • 微博等级
•网购激励因素分析 •用户对网络广告/活动的参与情况 •用户网购的时间段 •用户触媒习惯 •用户浏览购物网站的地点 •潜客收入分析 •消费群体的划分与定位 •消费群体的喜好及网络行为特征
10
掘金大数据时代
✓ 一小伙应聘上海(均价4万高档 小区)的物业管理,自己配了扫 描枪,每天盯着小区垃圾堆,看 见有条形码就扫描,晚上回家把 数据整理出来,得出这小区的人 喜欢喝什么水、吃什么油、买什 么衣服,他对整个小区的消费品 类偏好和品牌偏好一清二楚,最 终,形成报告卖给大公司,报告 价值数十万。
难点:如何准确识别潜客? 应对:行业切词+语义分析
执行产出之三:互动报告
月互动总数约6000条
自动回复→带来的二次回复
4193条
1842条
人工回复→带来的二次回复
1807条
1088条
给消毒蒸锅页面带去1820次的高精准点击。
BIG dATA
如何设置自动回复话术?
1
内容分配
产品特征 人群特点
分类话术
BIG dATA
数据挖掘基本流程
1 • 用户分析 • 挖掘策略 • 基础数据 • 数据清洗 • 语义分析
BIG dATA
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
产品特性:某品牌多组合蒸汽消毒锅 HY101W
售价:1299元
面向用户:0-6岁宝宝消毒用具需求者。 主要功能:为奶瓶、奶嘴和儿童餐具消毒。 主要优势:多组合、多功能、强力蒸汽、自动断电。
BIG
dATA 11
数据,带来的是白花花的银子!
马云的判断来自于数据分析
马云对未来的预测,是建立在对用户行为分析的基础上。通常而言, 买家在采购商品前,会比较多家供应商的产品。这些,反应到阿里巴 巴网站的统计数据中,就是——查询点击的数量和购买点击的数量会 保持一个相对的数值,综合各个维度的数据可建立用户行为模型。因 为数据样本巨大,所以保证了用户行为模型的准确性。
BIG dATA
数据挖掘分析流程
——了解产品,才能更好的了解用户。
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
母婴用户群体特性:
孩 子消费者特征:
扮演消费使用者,但由于年龄太小,自身没有判断力和购买能力。 产品使用和购买的最终评价主要来自——父母。
父 母消费者特征:
1.谈论子女的健康(预防,治疗); 2.谈论自己对子女的付出(精神,体力); 3.谈论子女的人生阶段(出生,满月,周岁等)。
BIG dATA
每日新增微博数据1亿条+
关键字相关微博数据 约60,000条左右
总体呈现:
具有分析意义的数据 约20,000条左右
时间: 2013.6.10-2013.6.21 潜客数据
约1185条+
0:00
12:00
BIG dATA
数据挖掘结果呈现
难点:如何获取数据? 应对:API+智能爬虫
难点:如何解读海量微博数据? 应对:建模清洗
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
海尔多组合蒸汽消毒锅挖掘关键词:
1.产品关键词 2.行为关键词
奶瓶 消毒 玩具 消毒 ……
洗 奶瓶 买 新奶瓶 奶瓶 卫生 一岁 送什么 满月 送什么 ……
——通过关键词群,挖掘出准确的潜在用户。
BIG dATA
BIG dATA
数据的价值到底在哪里?
让我们从案例说起——
BIG dATA
先从身边的案例看起:
✓ 喜欢看足球的人们可能还 记得,06年世界杯上一 场激烈的德国对垒阿根廷 的点球大战,最终以德国 守门员莱曼神勇扑出对方 多个点球而取胜。
✓ 有如神助? 不如说是:有如数据之助!
BIG dATA
✓ 德国成功的关键,就在赛前守 门员教练科普克塞给了莱曼一 张便筏:
aFocus
大数据时代及数据挖掘的应用
大数据: BIG 创新、竞争和生产力的下一个新领域!
dATA
大数据来了!
✓ 随着信息时代的到来,手机、电子邮箱、互联网搜
索……所有这些都可以用数据的形式表现并记录下来。 ✓ 然而,在这一片看似杂乱无章又毫无规律的数据面前,
很多人没有意识到其背后所蕴藏着的巨大价值。
1.系统清洗
• 蓝V清洗(蓝V认证) ——官微发布,多为产品推广或知识宣传。 • 链接清洗( 带链接 )——产品导流,加链接欲促成销售的账号。 • 字数清洗(字数过多)——草根特性,知识宣传等非快捷表达的大段文字。
……
——系统直接过滤掉绝非潜在用户的群体。
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
如何设置自动回复话术?
4
内容分配
阶段任务:
不但影响产品销量,甚至直接影响产品整体销售策略、定位策略!
BIG dATA
为什么是微博?
“从iPad和微博中,我似乎看到了一点点未来……”
——默多克
BIG dATA
对这些海量数据的存储,新浪微博超过了任何一家传统企
业的能力,但是对于整个互联网平台级的公司,他们每时每刻 都在忙于把这些数据收集、整理、归类、保存。
大数据的4V特性
1. Volume体 量
数据量巨大
3. value 价值密度
沙里淘金,价值密度低
BIG dATA
2. Variety 多样性
结构化、半结构化和非结构化数据
4. Velocity速 度
实时获取需要的信息
大数据有多大?
√全球每秒钟发送 2.9百万封电子邮件,一分钟读一篇的话, 足够一个人昼夜不息的读5.5年…
BIG dATA
数据,带来的是前瞻性的眼光!
大数据,大未来
数
✓ 以上的案例向我们解释了,要在浩
据
如烟海的数据中找到它的价值所在,
首要进行的便是数据挖掘的工作。
挖
掘
BIG dATA
数据挖掘:
BIG
大数据的淘金者!
dATA
数据挖掘能给我们带来什么?
BIG dATA
潜客
1
例:【某品牌消毒蒸锅】潜客数据部分预览:
每天,新浪微博产生1亿条数据Βιβλιοθήκη Baidu
BIG dATA
微博数据挖掘能帮助客户解决什么问题?
1. 制定产品策略,优化促销活动! 2. 挖掘潜在客户,进行个性化推荐! 3. 增加驻留客户,优化聚类客户! 4. 降低运营成本,提高企业竞争力!
BIG dATA
aFocus是怎么做的?
BIG dATA
【某品牌蒸汽消毒锅】
不是几百几千个用户的标签,而是成千万、上亿的群体性标签!
BIG dATA
订单
2
例:【某品牌移动硬盘】客户要求:形成直接的天猫旗舰店销售。
BIG dATA
实施效果:
平均每月成单100单以上。
用户受到正向影响 促进,决心下单。
BIG dATA
用户下单,完成购买。
口碑
3
根据潜在用户口碑资料,对产品进行改进。
整体建议:
1. 产品推销(60%):销售形象,介绍产品、加链接等; 2. 实用窍门(10%):秘书形象,讲解产品相关知识; 3. 疑难解答(20%):专家形象,解答网友产品相关困惑; 4. 交流心得(10%):朋友形象,交流产品使用心得。 注意:具体项目,需根据项目需要和数据挖掘结果,进行具体分配。
BIG dATA
大数据在哪?
✓ 纷繁复杂的数据,就像一个巨 大的矿脉,时时刻刻引诱着对 信息极为敏感的人们。他们依 托电脑为工具,进行着数据挖 掘的工作,希望在其中找到真
正的“金矿”!
BIG dATA
大数据是……?
无法在一定时间内用传统数据库软件工具对其内 容进行抓取、管理和处理的数据集合。
BIG dATA
2.数据分析师建模清洗
• 关键字规则(转让、代购、直购) • 用户数据规则(不常在线的)
……
——通过细致分析,筛掉反向需求用户和隐形需求用户。
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
自然语言识别:Natural Language Processing (NLP)
BIG dATA
如何设置自动回复话术?
2
内容分配
产品特征
人群特点
阶段任务:
1. 了解项目产品的总体定位; 2. 了解项目的主推产品或主推功能;
注意事项:
1. 整体定位对回复话术的设定有很大影响; 2. 主推产品和主推功能,直接决定话术的内容方向。
BIG dATA
分类话术
如何设置自动回复话术?
3
内容分配
自然语言识别特别是中文语义的识别需要基于智能、精准、可靠的切词技术,并能对上下文 语义和语境进行识别,还可根据预设语境抽取语义关键词。
中文切词分词技术
语言分段及结构化技术
自动摘要技术 符号学分析技术 词性识别纠正技术
实体对象识别与抽取技术 上下文语境定义技术
文本挖掘技术:Text Miner & Sentiment Analysis
微博链接
http://weibo.com/2881012711/zekmjeaL u
评论内容
祝你愿望早日实现哦~买DV亲可以关注一下JVC 的哟
网友再次回复内容
谢谢,我会关注了解的,也祝贵公司事业蒸蒸日 上。
回复时间间隔
网友晚上23点15发布,因此系统第二天早上才 回复。
达到效果
对JVC品牌的正面影响。
分析范围:用户最近发布的500条微博。
分析结果:(Excel表格方式呈现)→ →
• 婴儿年龄、生日 • 家电品牌偏好 • 消费水平 • 对促销的敏感度 ……
——分析客户背后的隐性资料。
BIG dATA
数据挖掘分析流程
执行产出之一:用户数据报表
——1万条左右高精准用户数据
BIG dATA
执行产出之二:用户数据报告
BIG dATA
微博颠覆了传统的 信息传播路径 传统:单中心、单向的传播方式
短信、电话、问卷:效率低且数量少。
微博:多中心、网状裂变传播方式
每一条都是直接的用户需求:效率高,且数量大。
更庞大!更快速!更直接!更高效!
BIG dATA
微博上的消费者是 数字化 的
• 在网络中,他们不会直接告诉你需求,企业必须自己去收集、分析、跟踪、 对比。谁先在海量数据中沙里淘金,谁将在这轮技术变革中,脱颖而出。
√推特上每天发布 5 千万条消息,10 秒钟浏览一条信息, 足够一个人昼夜不息的浏览16年…
√每天亚马逊上将产生 6.3 百万笔订单… √每个月网民在Facebook 上要花费7 千亿分钟,
被移动互联网使用者发送和接收的数据高达1.3EB… √ Google 上每天需要处理24PB的数据…
BIG dATA
数据挖掘分析流程
——了解用户,才能更精准的挖掘。
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
根据用户特性,制定关键词群。
1.产品关键词:
挖掘对产品有直接需求的用户:他们本身对 产品有需求,想要购买,他们需要的是更好的 推荐。
2.行为关键词:
挖掘对产品有潜在需求的用户:他们的行 为有极大可能对产品产生需求,我们需要更好 的刺激需求,也可借此扩大品牌影响力。
文本挖掘借助于数据挖掘算法对文本信息进行分析,通过统计分析,聚类分析,规 则发现,模式探索与识别对文本信息进行探索分析,发现其潜在的规律规则。
情绪识别和分析技术 关键词关联度发现技术 文本挖掘与规则发现技术
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
海量数据库
新浪每日微博数据1亿条。
通过API接口,根据挖掘策略,
获取基础数据:约6万条
——初步数据挖掘,是对所有相关用户的整合。
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
克鲁斯,原地不动,球门右下角。 阿亚拉,低平球,左下角。马克 西,右侧死角。坎比亚索,等待, 原地不动,左下角。
✓ 这便是教练拥有的一个非常 详尽的私人数据库,收集了 13000个点球录像,进行了 详细的分析,通过记录和分 析去了解阿根廷球员的习惯, 最后浓缩成了这张纸条。
BIG dATA
数据,带来的是实打实的效果!
产品特征 人群特点
分类话术
阶段任务:
1.根据用户给出的资料,给产品消费者“画轮廓”(群体描述); 2.根据数据挖掘师的报告,给潜在用户“涂颜色”(属性分类);
注意事项:
1.群体描述时,尽量在大范围内精准,不要有过分细节的描述; 2.属性分类时,先选取有价值的属性,然后尽可能细致的进行分类。
BIG dATA
主要包括:
• 总体呈现 • 关键词呈现 • 用户类型 • 性别分析 • 年龄分析 • 地域分析 • 发言时间 • 微博等级
•网购激励因素分析 •用户对网络广告/活动的参与情况 •用户网购的时间段 •用户触媒习惯 •用户浏览购物网站的地点 •潜客收入分析 •消费群体的划分与定位 •消费群体的喜好及网络行为特征
10
掘金大数据时代
✓ 一小伙应聘上海(均价4万高档 小区)的物业管理,自己配了扫 描枪,每天盯着小区垃圾堆,看 见有条形码就扫描,晚上回家把 数据整理出来,得出这小区的人 喜欢喝什么水、吃什么油、买什 么衣服,他对整个小区的消费品 类偏好和品牌偏好一清二楚,最 终,形成报告卖给大公司,报告 价值数十万。
难点:如何准确识别潜客? 应对:行业切词+语义分析
执行产出之三:互动报告
月互动总数约6000条
自动回复→带来的二次回复
4193条
1842条
人工回复→带来的二次回复
1807条
1088条
给消毒蒸锅页面带去1820次的高精准点击。
BIG dATA
如何设置自动回复话术?
1
内容分配
产品特征 人群特点
分类话术
BIG dATA
数据挖掘基本流程
1 • 用户分析 • 挖掘策略 • 基础数据 • 数据清洗 • 语义分析
BIG dATA
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
产品特性:某品牌多组合蒸汽消毒锅 HY101W
售价:1299元
面向用户:0-6岁宝宝消毒用具需求者。 主要功能:为奶瓶、奶嘴和儿童餐具消毒。 主要优势:多组合、多功能、强力蒸汽、自动断电。
BIG
dATA 11
数据,带来的是白花花的银子!
马云的判断来自于数据分析
马云对未来的预测,是建立在对用户行为分析的基础上。通常而言, 买家在采购商品前,会比较多家供应商的产品。这些,反应到阿里巴 巴网站的统计数据中,就是——查询点击的数量和购买点击的数量会 保持一个相对的数值,综合各个维度的数据可建立用户行为模型。因 为数据样本巨大,所以保证了用户行为模型的准确性。
BIG dATA
数据挖掘分析流程
——了解产品,才能更好的了解用户。
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
母婴用户群体特性:
孩 子消费者特征:
扮演消费使用者,但由于年龄太小,自身没有判断力和购买能力。 产品使用和购买的最终评价主要来自——父母。
父 母消费者特征:
1.谈论子女的健康(预防,治疗); 2.谈论自己对子女的付出(精神,体力); 3.谈论子女的人生阶段(出生,满月,周岁等)。
BIG dATA
每日新增微博数据1亿条+
关键字相关微博数据 约60,000条左右
总体呈现:
具有分析意义的数据 约20,000条左右
时间: 2013.6.10-2013.6.21 潜客数据
约1185条+
0:00
12:00
BIG dATA
数据挖掘结果呈现
难点:如何获取数据? 应对:API+智能爬虫
难点:如何解读海量微博数据? 应对:建模清洗
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
海尔多组合蒸汽消毒锅挖掘关键词:
1.产品关键词 2.行为关键词
奶瓶 消毒 玩具 消毒 ……
洗 奶瓶 买 新奶瓶 奶瓶 卫生 一岁 送什么 满月 送什么 ……
——通过关键词群,挖掘出准确的潜在用户。
BIG dATA
BIG dATA
数据的价值到底在哪里?
让我们从案例说起——
BIG dATA
先从身边的案例看起:
✓ 喜欢看足球的人们可能还 记得,06年世界杯上一 场激烈的德国对垒阿根廷 的点球大战,最终以德国 守门员莱曼神勇扑出对方 多个点球而取胜。
✓ 有如神助? 不如说是:有如数据之助!
BIG dATA
✓ 德国成功的关键,就在赛前守 门员教练科普克塞给了莱曼一 张便筏:
aFocus
大数据时代及数据挖掘的应用
大数据: BIG 创新、竞争和生产力的下一个新领域!
dATA
大数据来了!
✓ 随着信息时代的到来,手机、电子邮箱、互联网搜
索……所有这些都可以用数据的形式表现并记录下来。 ✓ 然而,在这一片看似杂乱无章又毫无规律的数据面前,
很多人没有意识到其背后所蕴藏着的巨大价值。
1.系统清洗
• 蓝V清洗(蓝V认证) ——官微发布,多为产品推广或知识宣传。 • 链接清洗( 带链接 )——产品导流,加链接欲促成销售的账号。 • 字数清洗(字数过多)——草根特性,知识宣传等非快捷表达的大段文字。
……
——系统直接过滤掉绝非潜在用户的群体。
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
如何设置自动回复话术?
4
内容分配
阶段任务:
不但影响产品销量,甚至直接影响产品整体销售策略、定位策略!
BIG dATA
为什么是微博?
“从iPad和微博中,我似乎看到了一点点未来……”
——默多克
BIG dATA
对这些海量数据的存储,新浪微博超过了任何一家传统企
业的能力,但是对于整个互联网平台级的公司,他们每时每刻 都在忙于把这些数据收集、整理、归类、保存。
大数据的4V特性
1. Volume体 量
数据量巨大
3. value 价值密度
沙里淘金,价值密度低
BIG dATA
2. Variety 多样性
结构化、半结构化和非结构化数据
4. Velocity速 度
实时获取需要的信息
大数据有多大?
√全球每秒钟发送 2.9百万封电子邮件,一分钟读一篇的话, 足够一个人昼夜不息的读5.5年…
BIG dATA
数据,带来的是前瞻性的眼光!
大数据,大未来
数
✓ 以上的案例向我们解释了,要在浩
据
如烟海的数据中找到它的价值所在,
首要进行的便是数据挖掘的工作。
挖
掘
BIG dATA
数据挖掘:
BIG
大数据的淘金者!
dATA
数据挖掘能给我们带来什么?
BIG dATA
潜客
1
例:【某品牌消毒蒸锅】潜客数据部分预览:
每天,新浪微博产生1亿条数据Βιβλιοθήκη Baidu
BIG dATA
微博数据挖掘能帮助客户解决什么问题?
1. 制定产品策略,优化促销活动! 2. 挖掘潜在客户,进行个性化推荐! 3. 增加驻留客户,优化聚类客户! 4. 降低运营成本,提高企业竞争力!
BIG dATA
aFocus是怎么做的?
BIG dATA
【某品牌蒸汽消毒锅】
不是几百几千个用户的标签,而是成千万、上亿的群体性标签!
BIG dATA
订单
2
例:【某品牌移动硬盘】客户要求:形成直接的天猫旗舰店销售。
BIG dATA
实施效果:
平均每月成单100单以上。
用户受到正向影响 促进,决心下单。
BIG dATA
用户下单,完成购买。
口碑
3
根据潜在用户口碑资料,对产品进行改进。
整体建议:
1. 产品推销(60%):销售形象,介绍产品、加链接等; 2. 实用窍门(10%):秘书形象,讲解产品相关知识; 3. 疑难解答(20%):专家形象,解答网友产品相关困惑; 4. 交流心得(10%):朋友形象,交流产品使用心得。 注意:具体项目,需根据项目需要和数据挖掘结果,进行具体分配。
BIG dATA
大数据在哪?
✓ 纷繁复杂的数据,就像一个巨 大的矿脉,时时刻刻引诱着对 信息极为敏感的人们。他们依 托电脑为工具,进行着数据挖 掘的工作,希望在其中找到真
正的“金矿”!
BIG dATA
大数据是……?
无法在一定时间内用传统数据库软件工具对其内 容进行抓取、管理和处理的数据集合。
BIG dATA
2.数据分析师建模清洗
• 关键字规则(转让、代购、直购) • 用户数据规则(不常在线的)
……
——通过细致分析,筛掉反向需求用户和隐形需求用户。
BIG dATA
数据挖掘分析流程
1.用户分析 2.挖掘策略 3.基础数据 4.数据清洗 5.语义分析
自然语言识别:Natural Language Processing (NLP)
BIG dATA
如何设置自动回复话术?
2
内容分配
产品特征
人群特点
阶段任务:
1. 了解项目产品的总体定位; 2. 了解项目的主推产品或主推功能;
注意事项:
1. 整体定位对回复话术的设定有很大影响; 2. 主推产品和主推功能,直接决定话术的内容方向。
BIG dATA
分类话术
如何设置自动回复话术?
3
内容分配
自然语言识别特别是中文语义的识别需要基于智能、精准、可靠的切词技术,并能对上下文 语义和语境进行识别,还可根据预设语境抽取语义关键词。
中文切词分词技术
语言分段及结构化技术
自动摘要技术 符号学分析技术 词性识别纠正技术
实体对象识别与抽取技术 上下文语境定义技术
文本挖掘技术:Text Miner & Sentiment Analysis
微博链接
http://weibo.com/2881012711/zekmjeaL u
评论内容
祝你愿望早日实现哦~买DV亲可以关注一下JVC 的哟
网友再次回复内容
谢谢,我会关注了解的,也祝贵公司事业蒸蒸日 上。
回复时间间隔
网友晚上23点15发布,因此系统第二天早上才 回复。
达到效果
对JVC品牌的正面影响。
分析范围:用户最近发布的500条微博。
分析结果:(Excel表格方式呈现)→ →
• 婴儿年龄、生日 • 家电品牌偏好 • 消费水平 • 对促销的敏感度 ……
——分析客户背后的隐性资料。
BIG dATA
数据挖掘分析流程
执行产出之一:用户数据报表
——1万条左右高精准用户数据
BIG dATA
执行产出之二:用户数据报告
BIG dATA
微博颠覆了传统的 信息传播路径 传统:单中心、单向的传播方式
短信、电话、问卷:效率低且数量少。
微博:多中心、网状裂变传播方式
每一条都是直接的用户需求:效率高,且数量大。
更庞大!更快速!更直接!更高效!
BIG dATA
微博上的消费者是 数字化 的
• 在网络中,他们不会直接告诉你需求,企业必须自己去收集、分析、跟踪、 对比。谁先在海量数据中沙里淘金,谁将在这轮技术变革中,脱颖而出。