第三讲:社会化媒体中的人群识别-5-识别工具-InterestBase
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同学们接下来我们讨论社会化媒体人群识别的基本工具。
第一个想和大家讨论的是,
按照人群兴趣的分析和识别工具,我们看PPT。
什么叫按照人群兴趣来分析和识别的工具,
目的是通过分析用户感兴趣的事物来锁定特定人群,
同学们注意啊,我们用这个工具的目的是,我们对用户感兴趣的事物,
分析用户感兴趣的事物来锁定不同的人群。
这个模型是美国公司设计出来的模型概念叫InterestBase,
是开发的人群兴趣的分析工具。
那么我们在讨论一个工具和模型的时候,首先我们知道,
我们这些数据的来源在哪里,这是一个基本条件,任何一个模型出来以后,
就我这个模型是针对哪些平台上的数据采集之后来做分析的。
这个InterestBase的工具非常有意思,它是跨媒体,
所谓跨媒体的是,它在博客网站,
它在博客,在新闻网站在社交论坛上抓取什么,刚才我们讲,抓取的是
社会化媒体平台上互联网平台人的
话语的表达,也就是刚才我们所说的,内容深沉,
通过人的话语和内容深沉的信息来抓取数据分析,来看人的兴趣所在。
这是第一个。
第二个是什么呢?然后通过这些 这些话语以数据的形式沉淀下来,我记得我在
第一讲讲课就讲,数据生成信息,
是吧,数据生成信息。而信息关联到人的行为和思想,
和他的内心情感的表达。
所以在这里我们是抓取了数据以后呢,我们要通过
发现不同的话语之间的关联性实际上是话语背后的数据
通过链接来分析看这些不同话语的关联性,这是要通过算法的。
然后基于这些话语的关联性来 归类用户的兴趣,建立与兴趣有关的分析模型。
所以第一个工具是人群兴趣的分析模型。
那么这里面我觉得还是有必要说一下的,
就是这个工具是采用了自然与语言的处理算法,
这个学计算机和软件都知道采用的自然语言的处理方法,处理什么?
处理内容,还有通过机器学习的方式把这些
互联网上人的生成的内容的信息进行分析,
按照特定的分析的框架来梳理清晰归类, 得出结果。
那么做计算机做网络
技术的那些同学和朋友们就知道我们用什么样的 框架,用什么样的一个
相互规律来把这些相关数据进行清洗以后的分析。
所以接下来我们有第二个说明是处理和分析的过程我觉得这是非常重要的。
刚才我们也说这个是分析人群的兴趣了, 于是我们看A B C三点我要做一点解释。
第一,机器也就是我们刚才讲的机器学习,或者采用自然语言处理的算法。
机器对参与回应了广告主以往营销活动的
人们的兴趣他的特征进行学习,所谓的学习就是,
我们要把这些兴趣处理以后归类。
怎么解释呢,就是说,当任何一
个社会事件,
商业事件发生以后传播以后,人在接触了这些事件的信息以后他会参与
讨论,他会回应各种各样的问题, 这是语言的沉淀我们刚才就对内容
用户生成内容进行分析,在分析的过程当中把
兴趣关注点A B C D根据不同的关注点来分类,这是第一步。
比如说我们说,
我们互联网上卖一个新的产品,在这新产品推出以后,
不同的人群他的反应是不一样的,就是第一步,第二步,
我们还要同时参照注意ppt上的说明二的第二个小点B,
我们同时还要参照品牌组的CRM系统, 也就是说客户管理系统。
在客户关系系统里面我们找到原来已有客户的兴趣规律和表现模式,
这一点我觉得非常重要,我们要理解就是说刚才我们讲的那些参与
和回应了以往的营销活动的那些表达,同时我们还要看,
原有的CRM数据库里面那些已有客户的兴趣规律和表现模式,
那么从这里我们也看到,我们对那些新参与活动
回应的,它有什么独特性,可以补充到我们已有的这样的数据库里。
所以这样,我们就可以通过借助于上述两个可以分析的获知的规律,
以此为基础,从网络上抓取什么抓取一些数据,数据以后筛选出
可能的新的目标人群, 而可能的新的目标人群,他既是原有数据库里
有的那些规律特征也可能是对原有数据库的,
那些感兴趣的人的情感因素兴趣特征一种新的补充。
所以它是一个轮回,我记得我曾经在课堂上和同学们讨论这个问题,
CRM数据库,如何如果不和社会化媒体
打通的话,它是一个相对静止的沉睡的CRM数据库,
但一旦把这个数据库和社会化媒体打通,所谓打通就是我们在通过社会化媒体当中,
人的兴趣特征进行学习归类以后,
再链接到CRM数据库里,所以不断的补充和丰富同时借助于已有数据库里的模型来反观
现在在社会化媒体上表现的人群可以补充他的数据,这就打通,
所以现在的S D I M 数据这样的思考前提下形成的一个现代的
客户数据库管理的基本思想。
同学们想如果无论站在品牌的管理
和产品销售管理角度来说不断地用这样的来回
往返的交替,那么我们客户管理数据库就越来越丰富。
基于这样的前提我们还要谈一点相对的,我们通过机器学习,machine
learning。
所谓的machine learning是出了利用已有的人群资料的数据分析提高准确率和
针对性之外我们看ppt,机器学习的优点是可以通过不断学习进行良性更新。
同学们注意哦,良性更新什么,更新原有的CRM数据库。
也就是今天我们所称的S C I M数据库。
也就是说在大范围人群识别的过程中发现新的兴趣点,同学们注意
我这表述啊,发现新的数据兴趣点,所谓新的数据点
对我
们的价值是什么?就是我们的marketing策略可以根据这种新的兴趣点,
表达我们的品牌特征和我们的产品特征,于是就扩大我们的目标人群,消费人群,
我们在扩充我们原来数据库里的信息点的A
B C D。
所以同学们注意啊,在大范围人群识别的过程当中发现新的
兴趣点,反馈到CM数据库里的优点是什么?让广告主能够实时监测人群的特征变化,
这个现在我们在国内的有些公司也做到这样一个实时监测, 反馈,
那么给广告主一个什么非常好的一个平台什么,他能够监测我的目标人群在不同
的商业传播的过程当中,在推出不同的新的产品以后,这种兴趣点的特征是变化了的,而不是静止的。
他反馈到广告主将来开发新的产品, 或者说在原有产品的上的改进,这个极好的数据支持和
甚至是一个思想库,一个创新裤,所以我们不能静止地看这个数据,
所以我们说从数据库的和数,使数据库的分析机制, 因为数据库是相对不断地补充的,
不断地扩大的,当我们有一个好的分析机制,就可以从每一次的搜索数据的过程当中,
让数据库变得更聪明,而数据库变得更聪明就我们可以告诉我们这个品牌
我们的管理甚至我们的社会的公共传播,我可以用更好的策略来应对
已经显现的,我可以用相对显现的人群,我们对他说什么?
同学们我想这样我们可以知道,machine learning的目的和作用在哪里。
那下面是一个我们在互联网上进行这样的分析的一个基本流程。
我们来解释这样的一个基本流程就是,
InterestBase首先是分析广告主的CM,注意哦,我刚才在反复讲广告主的CM数据库。
首先我们刚才看这个图表,这个ppt同学们
不用这个,我们将来课后可以再把这个ppt上这个图表我们自己去琢磨,
我们现在听我的解释,里面有什么信息呢?已经购买过产品的消费者的信息
和以往参加过品牌营销活动的信息, 这些品牌活动包括电子邮件等等等等,
那么这个得到该品牌的消费者的兴趣特征,
从而为该品牌确定最佳的细分市场。这个我们做marketing都很清楚,
那么这个iii大数据环节下,
确定品牌给品牌确定,最佳的细分市场,是据 这样的数据分析而得的。
之后我们将在社,网络和社交媒体上通过分析非结构化数据,
所谓非结构化数据是文本和网页当中提取人群的兴趣
信息,然后比对以往的兴趣特征,刚才我们讲的模型的三,两个方面找到更具有类似兴趣的潜在目标人群。
所以这个模型是让
程序的CIM数据库里面的这个特征拿着这个尺子去测量在社会化媒体上,
活动人群的兴趣特征,找到最佳的目标人群,
所以这样的分析结果可以让我们的营销传播的效果,
不
断的被优化,不断的被优化的前提是据数据分析。
我想经过这四点的说明我们应该理解
什么叫按人群分析的,按人群兴趣而分析识别的工具的
基本的着眼点在哪里。