基于微博影响力的评价模型(最终版)
清博指数——精选推荐
清博指数微博传播指数BCI(V9.0)微博传播指数BCI(Micro-blog Communication Index)通过微博的活跃度和传播度来反映账号的传播能⼒和传播效果。
BCI重在评估账号的原发微博传播⼒,旨在⿎励⾼质量原创内容。
1、指标体系: 采⽤数据:发博数X1、原创微博数X2、转发数X3、评论数X4、原创微博转发数X5、原创微博评论数X6、点赞数X7。
采⽤指标:主要通过活跃度和传播度两⼤维度来进⾏评价。
建⽴如下指标体系:2、BCI相关指标与权重:3、计算公式:注:BCI采⽤指标数据仅包括正常情况下账号发布⽂章的统计数据,部分指标数据可能因为微博功能设置原因(如个性化推送)与实际评价数据有所差异微信传播指数WCI(V12.0)1、关于公式调整说明:由于WCI-11.3在指标设置上存在⼀定局限性(总阅读数受评价周期长短影响⼤,平均、最⼤值受周期影响⼩),不利于不同周期的WCI计算和⽐较,现升级为12.0版本。
WCI-12.0保持原有评估维度和指标权重设置,在此基础上将“总阅读数”指标改为“⽇均阅读数”,为避免和“平均阅读数”造成误解,将“平均阅读数”改为“篇均阅读数”(点赞数同作调整),其他暂不变。
整体⽽⾔,WCI-12.0版本旨在⿎励账号提⾼单篇⽂章质量,合理把握推⽂数量,多做精品、少发“垃圾⽂”,提⾼账号的整体传播⼒和影响⼒。
2、计算公式如下:其中,R为评估时间段内所有⽂章(n)的阅读总数;Z为评估时间段内所有⽂章(n)的点赞总数;d为评估时间段所含天数(⼀般周取7天,⽉度取30天,年度取365天,其他⾃定义时间段以真实天数计算);n为评估时间段内账号所发⽂章数;Rmax和Zmax为评估时间段内账号所发⽂章的最⾼阅读数和最⾼点赞数。
品牌价值指数BVI1、市值/估值:名单中包括上市和⾮上市公司。
2、品牌⼝碑、品牌潜⼒:两项为专家打分。
3、BCI:微博传播指数BCI(Micro-blog Communication Index)通过微博的活跃度和传播度来反映账号的传播能⼒和传播效果。
基于HRank的微博用户影响力评价
基于HRank的微博用户影响力评价贾冲冲;王名扬;车鑫【摘要】针对微博社交网络平台中的用户影响力评价问题,提出了一种基于HRank 的评价算法.该算法将评价科学家科研绩效影响力的判定参数H指数引入进来,构造出能反映用户影响覆盖度的粉丝H指数和用户微博受追捧程度的微博被转发H指数,以分别表征用户的静态特征和在微博平台上的动态行为特征.在此基础上,结合粉丝H指数和微博被转发H指数构建出对用户影响力进行综合评价的HRank模型.粉丝数与用户影响力的相关性不是很强,同样数据集下相对PageRank,HRank用户影响力模型与新浪用户影响力官方排名更为接近,可有效实现对微博用户影响力的客观评判.【期刊名称】《计算机应用》【年(卷),期】2015(035)004【总页数】4页(P1017-1020)【关键词】用户影响力;微博;PageRank;H指数【作者】贾冲冲;王名扬;车鑫【作者单位】东北林业大学信息与计算机工程学院,哈尔滨150040;东北林业大学信息与计算机工程学院,哈尔滨150040;东北林业大学信息与计算机工程学院,哈尔滨150040【正文语种】中文【中图分类】TP301.6Web2.0技术的发展带领大家走进了社交网络交互时代,新技术催生了微博并使之成为新的信息互动和传播的社会化媒体,网络与用户间的关系已由用户被动接受网络呈现的信息转变为用户主动参与的模式。
用户通过发布微博、参与讨论以及分享转载等行为使得互联网的形态更加主动和丰富。
随着微博用户群体的迅速增长,数据呈现出增长海量化、类型多样化、传播即时化等特征,信息技术在提供便利的同时也考验着人们对海量数据的分析和驾驭能力。
在微博平台经常会有这样一种现象,一些尚未得到足够关注的微博在被“大V”转发或评论之后,突然就成为了热点话题。
这些“大V”就是微博网络中的高传播影响力用户,他们拥有更多的关注度和话语权,很大程度上影响着消息的传播、话题的形成,甚至舆论的走势。
微博用户情感分析与影响力评估
微博用户情感分析与影响力评估随着社交媒体的不断普及和使用,微博已经成为了一种流行的社交平台。
作为国内最具影响力的社交媒体之一,微博拥有数亿的用户,其中不乏许多具有一定影响力的大V。
然而,仅仅拥有大量的关注者并不足以证明一个用户的影响力,因为每个人都有自己的情感和价值观,而用户发表的每一条微博均会直接或间接地影响到他的粉丝,对于微博用户的情感分析和影响力评估,因此具有十分重要的意义。
一、微博情感分析微博用户发表的微博中包含丰富的情感信息,它们可以是喜悦、愤怒、悲伤、惊讶等等。
情感分析就是一种通过计算机技术对这些情感信息进行识别和分类的方法。
情感分类的目的就是将微博分成积极、中性和消极三大类,这样就可以更好地理解网民的态度和观点。
情感分析技术通常采用机器学习和自然语言处理等技术,首先需要对大量的微博数据进行训练,建立情感识别模型。
训练集的建立需要耗费大量的人力和物力,在训练集具备一定的规模和代表性之后,利用这些数据训练模型,根据模型给出的概率或权重,对新的微博进行分类。
微博情感分析除了能够帮助用户了解网络上的观点和态度外,还可以应用到企业的品牌管理和公共舆情监测中。
二、微博影响力评估对于大V或是其他影响力人士而言,影响力评估同样具有重要的意义。
影响力评估其实是通过对用户的微博进行分析,整合用户在微博上的各种数据,并对其深入挖掘,最终判断该用户在微博中的影响力大小。
影响力评估一般可以包括以下几个方面:1. 粉丝数粉丝数是判断一个用户影响力大小的最简单和最直接的指标之一。
但是,单纯的粉丝数量并不能反映出用户在微博中的价值和影响力。
2. 微博转发量转发量是最能反映一个微博的传播效果的指标之一。
对于大V来说,越多的转发意味着更广泛的传播和更高的影响力。
3. 微博原创量原创微博是用户表达个性、个人认知和态度最直接的途径。
发表多量且质量高的原创微博,可以增加自身在粉丝中的影响力。
4. 微博互动量在微博上与粉丝之间的互动可以增强粉丝的忠诚度和归属感,帮助用户提高自己的影响力。
微博用户影响力模型研究
PageRank的基础上,我们考虑引进用户内在影响力建立偏随机游走的PageRank算法;基于偏随机游走的PageRank对用户
的影响力具有更好的分析性。本文没考虑到地域性的差异,怎么结合地域的特点来建立模型也是下一步研究的重点。如
果能较好地结合时间性与地域性的特点,那么我们能更好地预测重点舆论爆发的时间,并且有效地进行控制。
舆论控制或者信息传播是十分重要的。 目前有许多人应 用了Pa geR a n k 算法对 微 博用户影响
力进行排名。因此本文以新浪微博作为社交网络的出发点, 类似于偏随机游走PageRank算法从一个新的角度构建微 博用户的影响力模型。
1 研究现状 用户影响力在微博领域的延伸始于链接分析,2010年
微博吸引了越来越多来自各个行业、拥有各种背景的 人。人们可以自定义标签,五花八门的内容体现出用户的 兴趣需求点又广又细。然而,除了一些大众的需求,很多相 对冷门的兴趣点并没有聚合起用户。一方面,在当前嘈杂 的微博环境中,信息一出现就很有可能被迅速淹没,据数 据显示[1],只有很少量的微博才得以广泛传播;但是只要 有一部分影响力大的用户点赞或者转发相应的微博就会 使信息得到广泛的关注。因此找到微博影响力大的用户对
Forum 学术论坛
微博用户影响力模型研究①
昆明理工大学 毕秋敏 云南财经大学 倪明明 曾志勇
摘 要:本文建立的算法可用于在微博中寻找影响力大的用户,并为控制虚假新闻的传播提供有效的途径。笔者在分析微
博用户的影响力中,发现本文提出的算PageRank与改进的
①基金项目:云南省哲学社会科学规划基金项目“微博用户 影响力模型研究”研究成果 (QN2014071)。
作者简介:毕秋敏 (1981-),女,硕士研究生,副教授,主要 从事新媒体传播方面的研究; 倪明明 (1990-),男,硕士研究生,主要从事统计 学理学方面的研究;
一种改进的微博用户影响力评价算法
i d e a o f t r a d i t i o n a l P a g e Ra n k a l g o r i t h m i s u s e d t o i mp r o v e a n e w i n l f u e n c e r a n k i n g a l g o r i t h m ( Us e r
i S e f f e c t i v e . Ke y wo r d s: mi c r o b o l g;us e r i n f l ue n c e; P a g e Ra n k a l g o r i t hm ;u s e r i n lu f e n c e r a n k a l g o r i t h m
0 引言
微博, 即微型 博客 ( m i c r o b l o g ) 的简 称 , 是 一个 基 于用户 关系 的信息 分享 、 传播 以及 获取平 台 , 是一种 传 播 及互 动性极 快 的新兴 网络 应用 。用 户在微 博 中可 以 随时 编 写简 短 文本 ( 1 4 0字左 右 ) , 并 根 据 自己 的意
I n l f u e n c e Ra n k) .C o mp a r e d t h r o u g h e x p e r i me n t s wi t h t r a d i t i o n a l a l g o r i t h m,t h e p r o p o s e d a l g o r i t h m
愿 公开 发布 。它允 许任 何人 阅读 或者 只能 由用户 选择 的群组 阅读 。随着 技 术 的发 展 , 微博 消 息 可 以被 很 多方式 传 送 , 包 括 网页 、 实 时 消 息软 件 、 电子 邮件 或短 信 , 某 些 微 博 也 可 以发 布 多 媒 体 , 如 图 片或 影 音 剪
波特五力模型分析微博
微博的替代品
• 1、SNS • 2、博客 • 3、邮箱 • 4、IM通信工具 • 5、社交网站 • 6、论坛 • 7、门户网站 • 8、新闻媒体
卖方与买方
1、微博战争实质上就是一场拉客之争。 2、目前国内的微博还没有一家处于明显的强势地位,
从这个角度看,微博提供者的议价能力很弱。 3、买方议价能力强,这是指整个用户群体,但是我
们知道,用户通常都是以个体的形式在观望,单 个普通用户几乎没有议价能力。 4、新浪博客的做法----主打明星牌,拉到了名人, 就拉到了粉丝,一切都是粉丝经济。 5、部分明星用户的议价能力强,因为他们可以带来 许多粉丝,提高人气。 6、单个普通的用户感叹“被微博”。
我们认为微博未来发展趋势
• 1、越来越工具化。 • 2、微博的细分,或者说微博的垂直化。 • 3、移动端发展将是出路。
• 2、微博挑战传统互联网媒体新闻服务的门户网站。 • 3、微博的门槛很低,哪怕是一个没有受过严格中
文训练的人,只要会发短信,也就能使用微博客。 • 4、个人可以记录生活中的点滴在一定程度上替代
了博客。 • 5、SNS与微博部分上功能重叠,网络上也掀起了
微博挑战SNS但微博不会取代SNS社区,但是会 减少社区上的活动。 • 6、微博的潜在竞争者,主要还是未进入的门户网 站、SNS、搜索引擎等。
谢谢观赏
111工作室
@呼啦很开心官方微博
以通过频道影响力本身来提高收入,而 不需要通过单个产品来盈利。 • 3、国内经营独立微博没有实力去做好言 论监控所以在与门户网站竞争中所处的 劣、搜狐微博、腾讯微博 • 3、网易微博、做啥网
替代品和潜在进入者的重合
• 1、微博至今没有任何一项网络应用能够完全替代 它,它更像目前网络应用的混合体。
传统新闻媒体微博影响力的评价模型——基于主成分分析的实证研究
传统新闻媒体微博影响力的评价模型——基于主成分分析的实证研究作者:武仲元来源:《科技传播》 2018年第1期摘要本文以15 家传统媒体的官方微博为研究对象,样本涉及通讯社、报纸、广播电视等传统媒体,选取6 项关键性指标,运用SPSS 软件对影响传统媒体微博影响力的因子做主成分分析,提取了“社交活跃度”和“内容生产力”两个主成分,并由此得到传统新闻媒体微博影响力的评价模型。
关键词传统媒体;微博;媒体融合;主成分分析中图分类号 G2 文献标识码 A 文章编号 1674-6708(2018)202-0146-021 研究问题的提出在传统媒体与新兴媒体融合发展的时代背景下,“两微一端”成为传统新闻媒体“转战”新媒体领域的标配。
然而,随着微信公众号的兴起和迅猛发展,曾几何时影响力如日中天的微博逐渐式微,甚至一度面临平台热度危机。
另外,微博仍然因其较之于微信更具媒体属性,因此许多受众依旧将微博作为发布和获取新闻资讯的重要平台。
目前新浪微博影响力较大,拥有巨大的用户群。
因此,对于通讯社、报纸、广播、电视等正在积极转型的传统媒体而言,如何在微博平台上扩大影响力、提升话语权成为关键。
绝大多数传统媒体在新浪微博上拥有官方账号,并且保持一定的发布数量。
由此引出本文的研究问题:如何准确地衡量和描述传统媒体在微博上的影响力?2 数据来源说明本文选取目前新媒体排行榜中比较有影响力的“新榜”数据中排行前50 名的媒体机构微信公众号中前15 位传统媒体(包括《人民日报》、央视新闻、新华社、《参考消息》、《环球时报》等)的官方微博(以新浪蓝V 认证为准)作为研究对象,用八爪鱼数据采集软件抓取这15 个新浪微博在党的十九大召开这一重大新闻事件期间(即2017 年10 月18 日到2017 年10 月25 日)7 天的发博数、评论数、转发数和点赞数,以及截至2017 年10 月25 日的关注数和粉丝数,通过这些来比较研究这15 家传统媒体在微博上的影响力。
基于微博传播信息流的微博效果评价模型及实证研究
s h o w ha t t mo e r b l o g g i n g f o wa r rd e d d o e s n o t me n a b e t t e r ma rk e i t n g;t h e u s e r wi t h p o we fu r l i n t e r a c i t v e i n f l u e n c e wh o f o wa r rd s C n a e f f e c — iv t e l y i mp r o v e he t e n t e pr r is e ic m r o— b l o g g i n g ma rk e t i n g e f f e c t . Ke y wo r ds m ic r o- b l o g g i n g mi c r o- b l o g g i n g p r o p a g a t i o n mi c r o —b l o g g i n g ma rk e t i n g i n f o r ma i t o n lo f w e v lu a a t i o n mo d e l
第3 2卷
第 7期
情
报
杂
志 Βιβλιοθήκη Vo 1 . 32 No. 7
2 0 1 3年 7月
J OURNAL OF I NTE LL I GENC E
J u l y 2 01 3
基 于微 博 传播 信 息 流 的微 博 效 果 评 价 模 型 及 实证 研 究
米
毕凌 燕 张镇 鹏 左 文 明
e v lu a a i t o n s c h e me .Th u s,s t r a t e g i c ec r o mme n da i t o n o t e n h nc a e e n t e pr r is e i c m r o- b l o g g i n g o p e r a t i o n e f f e c t i s g i v e n.Ex pe ime r n t a l r e s u l t s
基于微博数据的舆情分析及预测模型研究
基于微博数据的舆情分析及预测模型研究舆情分析是指通过对社交媒体上的舆情信息进行收集、整理和分析,从而了解公众对特定事件或话题的态度和情感趋势。
微博作为中国最大的社交媒体平台之一,拥有庞大的用户群体和丰富的信息资源,因此成为了研究舆情分析的重要数据来源。
本文将基于微博数据,探讨舆情分析的方法和预测模型。
一、微博数据的收集与整理微博数据的收集可以通过API接口进行,也可以通过网络爬虫技术获取。
对于大规模数据的收集,可以使用分布式爬虫框架进行加速。
收集到的数据需要进行预处理,包括数据清洗、去噪、分词等操作,以保证后续分析的准确性和效率。
二、舆情分析的主要方法1. 文本情感分析:通过对微博文本进行情感分类,判断其积极、消极或中性。
常见的方法包括基于词典的方法、机器学习方法和深度学习方法等。
词典方法依靠提前构建的情感词典进行词语情感打分,从而对整句的情感进行估计。
机器学习方法则是通过训练分类器,从已标注好的数据中学习情感特征,然后对未标注的数据进行情感分类。
深度学习方法则是通过神经网络模型提取文本的上下文特征,从而进行情感分类。
2. 主题挖掘:通过对微博文本进行聚类或关联规则挖掘,提取出微博数据中的热门话题或关键词。
主题挖掘可以使研究者更好地了解公众的关注点和讨论热点,从而更准确地预测舆情发展。
3. 社交网络分析:微博作为一个社交平台,用户之间的关注关系以及转发、点赞等行为会对舆情产生影响。
通过对微博用户之间的关系网络进行分析,可以揭示其对舆情的扩散和影响力。
网络分析方法包括社区检测、影响力评估等。
三、舆情预测模型舆情预测模型旨在根据历史数据的分析,预测未来舆情趋势。
常用的模型包括:1. 时间序列模型:通过对时间维度上的数据建模,来捕捉舆情的季节性或周期性变化趋势。
常见的时间序列模型包括ARIMA模型、指数平滑模型等。
2. 机器学习模型:通过对历史舆情数据进行特征提取和训练,来预测未来舆情的发展。
常用的机器学习模型包括支持向量机(SVM)、随机森林(Random Forest)等。
基于用户分析的微博用户影响力度量模型
基于用户分析的微博用户影响力度量模型
张绍武;尹杰;林鸿飞;魏现辉
【期刊名称】《中文信息学报》
【年(卷),期】2015(29)4
【摘要】微博用户影响力作为影响力研究在微博领域的延伸,已逐渐成为一个研究热点.该文在传统影响力度量指标的基础上,结合微博价值、消息传播过程中产生的影响力扩散以及用户的活跃程度,提出了三种新影响力度量方法,包括微博影响力、行为影响力以及活跃度影响力.此外,通过有效融合上述三种新度量方法提出了新的微博用户影响力度量模型.最后,针对不同影响力度量指标,该文对它们的内部关系进行分析,并阐述了影响力度量指标之间关联程度及形成原因.
【总页数】8页(P59-66)
【作者】张绍武;尹杰;林鸿飞;魏现辉
【作者单位】大连理工大学计算机科学与技术学院信息检索研究室,辽宁大连116024;大连理工大学计算机科学与技术学院信息检索研究室,辽宁大连116024;大连理工大学计算机科学与技术学院信息检索研究室,辽宁大连116024;大连理工大学计算机科学与技术学院信息检索研究室,辽宁大连116024
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于用户分析的国家图书馆微博服务研究 [J], 李健
2.基于新浪微博的社交网络垃圾用户分析与检测 [J], 孟祥飞;徐路;王思雨;
3.“公共领域”中的微博用户分析--基于微博范式下的网络舆论监督与引导 [J], 卢娟
4.基于新浪微博的社交网络垃圾用户分析与检测 [J], 孟祥飞;徐路;王思雨
5.基于天气问卷调查的微博微信用户分析 [J], 刘馨泽;夏冬;陆文;邹宇晨;谢霞因版权原因,仅展示原文概要,查看原文内容请购买。
基于Swarm模型的微博用户影响力评价方法
2021572微博作为社会经济活动中常见的一种网络信息交互形式,因为其自身便利、快捷的传播机制而受到广泛的肯定和应用,微博中的大量活跃用户使得微博每天产生海量的数据。
这些数据包括微博用户发表的微博帖子、点赞、分享转发、评论等。
微博用户的这些错综复杂的关系形成了一个巨大的社交网络结构。
由于微博的这些自身特点和优势,逐渐成为专家和学者研究的重点。
在社交网络群体与互动方面的相关研究中,个体影响力评估一直是一个重要方向。
在社交网络中,用户基于社交目的或者自我价值实现的需要,发布和传播特定话题的信息并与他人互动,以获得和增强其在网上的话语影响力[1],用户的影响力是用户在微博中特定领域重要性的综合体现。
目前关于微博用户影响力的研究,大体上从以下两个方面进行。
基于用户的静态属性来研究,Cha等[2]分别从入度、出度、提到以及转发指标入手,分别研究了各个指标对用户影响力的影响,并分析了这几个指标的效果。
Wang等[3]提出了一种在具有可调参数的复杂网络中节点重要性的新度量。
与其他几个中心度量相比,他们提出的度量比网络节点的度数、中间度和紧密度中心性更具有区别性。
Chen等[4]提出Personal Rank算法,该算法也可以用于计算微博用户的影响力,但在计算时还是需要依赖PageRank算法。
基于用户行为特征来研究,Kwak等[5]提出的基于Swarm模型的微博用户影响力评价方法王利,于磊,吴渝重庆邮电大学计算机科学与技术学院,重庆400065摘要:微博作为一种重要的社交媒体,许多学者都对微博中用户的影响力进行研究,但大多数影响力的评价算法都是根据微博话题中用户的静态属性或微博话题发生后用户的行为特征对用户影响力进行评价。
从用户的转发、评论和点赞三种行为入手,结合突现计算模型,提出一种基于Swarm模型的用户影响力排序算法,SMRank算法可以在微博话题发生的过程中对用户每个时间段的影响力进行计算,给出了一种计算微博话题用户影响力的新方法。
波特五力分析中国微博
2009 —2010 学年第二学期课程名称:电子商务案例分析任课教师:黄山河论文题目:波特五力模型分析微博第八组:ITE07005 张奕ITE07014 吴鸿莲ITE07019 蒋当亦ITE07021 陈涵ITE07025 雷永麟ITE07061 钟亦婷提交日期:2010 年5 月5 日“微博”即微型博客,简单地说就是你每天在微博网站上随时打上一两句话,告诉你的好友你正在做什么事情或是有什么感想。
这是一种新型的交流方式,与电子邮件和网上聊天等沟通交流方式都不相同。
看到你的微博的人不一定要答复,他们只须瞄一下就行了。
如果感兴趣,可以在你的原话上进行简单回复。
相对于微博而言,现有的博客似乎太过“中规中矩”,每篇博文都要有主题和正文内容,对于忙碌的现代人而言,每天写一篇博客确实让人为难。
而微博则没有这些“繁文缛节”,简单、随意甚至随性。
最具代表性的微博非Twitter莫属了,自Twitter推出以来,受到越来越多网络玩家的追捧,大有赶超SNS鼻祖Facebook之势。
博客说“大事”,微博讲“小事”,已成为当下不少年轻人的网络生活新方式。
1、微博的起源“微博”即微型博客,简单地说就是你每天在微博网站上随时打上一两句话,告诉你的好友你正在做什么事情或是有什么感想。
这是一种新型的交流方式,与电子邮件和网上聊天等沟通交流方式都不相同。
看到你的微博的人不一定要答复,他们只须瞄一下就行了。
如果感兴趣,可以在你的原话上进行简单回复。
相对于微博而言,现有的博客似乎太过“中规中矩”,每篇博文都要有主题和正文内容,对于忙碌的现代人而言,每天写一篇博客确实让人为难。
而微博则没有这些“繁文缛节”,简单、随意甚至随性。
自推出以来,受到越来越多博客玩家的追捧。
博客说“大事”,微博讲“小事”,已成为当下不少年轻人的网络生活新方式。
2006年3月的创始人威廉姆斯(Evan Williams)推出了Twitter,英文原意为小鸟的叽叽喳喳声,用户能用如发手机短信的数百种工具更新信息。
基于社会评级的微博动态影响力指数构建
基于社会评级的微博动态影响力指数构建作者:姜伟伟,顾程来源:《新媒体研究》 2017年第11期摘要当前对社交媒体的研究集中于关注微博、微信的用户使用行为分析,缺乏对微博尤其是微博信息实时影响力的动态性研究。
本研究以页面评级(Page Rank)算法为基础,提出改进的社会评级(Social Rank)算法,结合用户微博使用行为分析得出的权重值,并将时间因素纳入微博动态影响力评估模型之中。
通过具体实例探讨了微博动态影响力指数构建的重要性和实用性。
研究认为社交媒体中大量数据的深度分析与挖掘可以更好地帮助市场营销以及舆情监管部门及时掌握信息的发展动态,从而更有效地推进品牌传播和干预舆论信息的走向。
关键词新媒体;微博;信息传播;动态影响力中图分类号 G2 文献标识码 A 文章编号 2096-0360(2017)11-0045-02随着互联网技术的不断发展,许多社交平台也从最初的萌芽逐渐发展成熟,人与人之间的空间距离得以进一步拉近。
特别是微博、微信等社交工具的出现,也更进一步地推动了互联网的发展,人们可以借助微博、微信,以及一些移动客户端随时进行信息的浏览、关注与分享。
大量的信息浏览、关注与分享也产生了大量的数据,数据尤其是实时数据的深度分析挖掘可以帮助舆情监管部门及时发现影响力最强的信息,从而有针对性地对其可能产生的负面影响及时进行干预,避免负面信息更大范围传播所带来的负面影响。
互联网信息的影响力主要通过信息排序获取,排序越靠前的信息人们对它的关注程度越高,影响力也就越大。
本研究认为新的微博影响力评估方法应强调信息辨识的问题,并考虑怎样解决时间因素对于信息影响力衰减的影响,进而实现一个兼顾全面性、及时性和真实性的实时互联网信息列表构建。
基于以上分析,本研究以微博信息为研究对象,结合以往有关网页排序的Page Rank 算法,在此基础上提出了Social Rank 的计算方法,得到相应微博用户的权重信息,并将时间因素纳入到信息影响力排名计算之中,构建了更为合理的微博动态影响力指数。
微博社交网络的用户影响力评价方法
微博社交网络的用户影响力评价方法吴慧;张绍武;林鸿飞【摘要】This paper investigates the evaluation of the user influence on Sina microblog .Among various factors ,a user is considered as more influential if his information is disseminated faster to a largerextent .Compared with tra-ditional methods ,the user's active degree and the quality of posts are both taken into consideration .Treating each user as a node in the social network ,the final user influence is estimated .The experiments on both public dataset and real dataset from Sina microblog show the validity of the method .%该文主要研究在微博社交网络中怎样评价用户的影响力.在影响用户影响力的众多因素中,该文认为用户的传播能力越强,用户的信息便可以更快地在网络中扩散,其影响力也越大.和传统的用户影响力评价方法相比,该文综合考虑用户的活跃度和用户所发微博质量两个方面的因素,得到用户的影响力权重,然后把每一个用户作为社交网络中的节点,计算其在社交网络中的影响力.通过在公开语料集和真实数据中的实验,表明该方法是可行的,比传统的用户影响力评价方法更能客观、真实地反映用户的实际影响力.【期刊名称】《中文信息学报》【年(卷),期】2017(031)004【总页数】7页(P184-190)【关键词】社交网络;用户影响力;活跃度;微博质量【作者】吴慧;张绍武;林鸿飞【作者单位】大连理工大学计算机科学与技术学院,辽宁大连 116024;大连理工大学计算机科学与技术学院,辽宁大连 116024;大连理工大学计算机科学与技术学院,辽宁大连 116024【正文语种】中文【中图分类】TP391Abstract : This paper investigates the evaluation of the user influence on Sina microblog. Among various factors, a user is considered as more influential if his information is disseminated faster to a larger extent. Compared with traditional methods, the user’s active degree and the quality of posts are both taken into consideration. Treating each user as a node in the social network, the final user influence is estimated. The experiments on both public dataset and real dataset from Sina microblog show the validity of the method.Key words: social network; user influence; active degree; microblog quality 微博作为一种新型的在线媒介形态,正在悄无声息地改变着人们的生活和思考方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于微博影响力的评价模型摘要本文研究的是微博用户和微博的影响力,以及最大好友圈和消息最佳发布问题。
对于问题一,首先,我们查阅相关文献,基于已给数据将用户粉丝数量,用户和粉丝的活跃度,粉丝的专注度作为我们评价微博用户影响力的指标。
根据这些指标,我们对题目所给表格中的数据进行统计,将得到的结果作为各个用户在各指标下得到的分数。
然后,我们建立了熵权模型,将这些数据进行标准化处理,对各个指标的权重进行了计算,分别得到了在不同人数的微博环境下各指标在评价用户影响力时所占权重。
最后,将各指标下分数与权重相乘,再将各个用户的所有指标分数求和得到最终用户影响力评分。
将其排序筛选后,得到影响力最大的十个大V编号。
对于问题二,首先,在问题一所建立模型的基础上,我们确立了将微博被转发次数和转发人的影响力作为我们评价微博影响力的指标。
然后,我们统计了各条微博在各指标下的数据。
其次,我们利用熵权模型将数据标准化处理,并求出了这两个指标在评价微博影响力时所占权重。
最后,我们将各微博各指标下分数与权重相乘,并将所有指标分数求和得到最终微博影响力评分。
将其排序筛选后,得到影响力最大的十条微博消息。
对于问题三,首先,我们根据题目对于好友圈的定义,将M={(i,j)}定义为关注情况矩阵,即第j用户关注第i用户的情况。
进而将多人相互关注的关系用函数关系式表达出来,将所有符合条件的用户编号写入矩阵E中。
然后,先通过对符合两两关注情况的用户进行筛选,再从筛选好的用户中逐步添加用户,判断是否为三人相互关注,四人相互关注,直至好友圈内不能再添加人为止。
此时的好友圈为最大好友圈。
最后,我们通过循环算法实现上述过程,得到了2000人微博环境下10人为最大好友圈,10000人微博环境下13人为最大好友圈,并求出了好友圈中所有用户的编号。
对于问题四,我们将其转化为优化问题,建立了0-1规划模型处理。
首先,将用户发布消息与微博用户之间相互关注的情形转化为0-1矩阵(0表示用户未发布消息或表示微博用户之间未相互关注,1则反之),分别表示为x和A。
这样若某用户能看到消息,则x与A转置后的矩阵乘积大于等于1。
然后,我们将其推广至所有用户,将该问题转化为目标函数为发布消息的人数最少,约束条件为x与A转置后的乘积全部大于等于1的优化问题。
最后,我们通过matlab中自带的遗传算法求得最小用户数。
但发现效果并非很好。
又采用了贪婪算法,求得了2000人微博环境下发布该消息的用户数最少为93人,10000人微博环境下则为249人。
本文建立的模型在已有文献的基础上有一定的改进,求解算法科学,定位速度更快,定位精度更高,有一定的实用和推广价值。
关键词:微博影响力熵权模型遗传算法贪婪算法1 问题重述1.1 问题背景微博,作为互联网上新兴应用,由于智能手机的普及,使得其运用变得极其方便,从而吸引了大量的注意力。
而微博上的大V用户往往有着很大的影响力,如何正确而有效的评价用户影响力是需要关注的应用问题之一。
1.2数据集数据文件data1.xls和data2.xls分别包含了当用户总量为2000和10000时这些用户的相互关注数据,每一行为该行号对应的用户对其它用户的关注信息。
数据文件data3.xls和data4.xls分别为当用户总量为2000和10000时这些用户发布或转发的消息数据,每一行为该行号对应的用户发布或转发的消息编号。
1.3 提出问题根据上述问题背景及数据,题目要求我们建立数学模型讨论下列问题。
(1)对具有较大影响力的大V定义合适的影响因子,并且找出影响力最大的十个大V。
(2)某些微博消息,被大量的用户关注和转发,因而具有很大的影响,请找出影响力最大的十条消息。
(3)在微博中,相互关注的用户被称为好友,对于一个群体,如果他们相互之间均为好友,则称为好友圈,请找出人数最多的好友圈。
(4)假设一微博用户发布的消息,其粉丝都会看到,如果要发布一则消息,确保所有用户都能看到(不考虑转发),请选择一种发布该消息的用户数最少的方案。
2 模型假设(1)用户之间不会因为消息的转发而对消息的原创者进行关注,即关注是在初始状态下不会改变的。
(2)忽略各条微博影响力的时效性,即微博影响力随时间是不变的。
(3)假设所有用户均非长期不上线用户。
(4)不考虑同一用户多次转发同一消息的情况。
(5)用户只能由关注对象发布后才能看到或转发消息。
3 符号说明注:其余符号在文中使用时说明。
4 问题分析4.1问题一问题一要求我们分别在2000人和10000人的微博环境下,对用户的影响因子进行定义,并筛选出影响力前十的用户。
首先,经查阅文献[1],并基于已给数据,我们确定了用户的影响力指标可由名人指标和粉丝指标两项决定,将这两个指标作为一级指标。
名人指标又由博主活跃度和粉丝数量两个指标决定。
而粉丝指标又由粉丝活跃度和粉丝专注度两项指标决定。
将这四个指标作为二级指标(如图1所示)。
其中,活跃度由博主或粉丝发布或转发微博数量反映。
图1 用户影响力评价指标体系其次,根据选好的指标,我们通过matlab程序对已给数据进行统计,求出各用户所关注的人数,发布或转发的微博数量,以及各用户被关注的人数。
然后对各项指标下的数据进行标准化处理,作为各用户各项指标的得分,使用熵权法算出各项指标的权重。
最后,将各指标下的分数与权重相乘,再将各指标下处理后的分数相加,作为各用户影响力评判的最终得分。
根据分数高低进行排序,筛选出影响力为前十的用户。
图2 问题一思路流程图4.2 问题二问题二要求我们确定评价微博消息影响力的指标,并依照这些指标进行评分,进而排序和筛选出影响力前十名的消息。
首先,由题意可知,微博消息影响力主要由微博被转发次数和转发人的影响力决定。
所以,我们将这两个因素作为评价微博消息影响力的两个指标。
并且,对各条微博消息被转发次数以及所有转发人的影响力进行统计,得到统计结果。
其次,我们将得到的统计结果进行数据的标准化处理,得到两指标下的处理后的分数。
再利用熵权法求出两项指标的权重。
最后,将权重与各指标分数相乘,对各指标分数求和,得到各条微博消息的影响力评分,将其排列并筛选出影响力前十名的消息。
4.3 问题三问题三要求我们求出2000人和10000人环境下的最大好友圈,这实则是最大团问题。
首先,根据定义好友圈中的每个人都和圈中其余的人互相关注,所以,构成好友圈的用户一定有好友,即和某人互相关注。
由此,我们可以缩小数据规模,只考虑存在相互关注情况的用户,故可将两两关注的情况可以列出。
本文则采用循环算法从小到大找到最大的好友圈。
其次,若已知两人构成好友圈,若有第三人与这两人构成好友圈,就说明第三人与这两人都相互关注。
如此类推至第四人,第五人至第N 人,直至已有M 人的朋友圈内的任意一个人都找不到1M 个人加入该好友圈,则该好友圈已为最大好友圈最后,我们通过不断循环求解,得到在2000人微博用户环境下最大好友圈内人数为10人,10000人微博用户环境下最大好友圈内人数为13人。
……图3 好友圈确立示意图4.4 问题四问题四要求我们求出在发布某消息的用户数最少的情况下,使所有用户都能看到的最少用户数量。
首先,将用户发布消息与微博用户之间相互关注的情形转化为0-1矩阵,分别表示为x 和A 。
这样若某用户能看到消息,则矩阵x 与A 转置后的矩阵乘积大于等于1。
然后,我们将其推广至所有用户,将该问题转化为以发布消息的人数最小值为目标函数,以x 与A 的乘积全部为1的列矩阵为约束条件的优化问题。
最后,使用遗传算法和贪婪算法对其求解即可。
5 模型建立与求解5.1 问题一的模型建立与求解5.1.1 数据统计经查阅文献,我们已确立了将博主活跃度和粉丝数量,粉丝活跃度和粉丝专注度作为我们的二级指标,也是我们需要统计的对象(统计结果如下列表格所示,表1至表4为2000人微博环境下各指标统计结果,表5至表8为10000人微博环境下各指标统计结果,所有表格只展示用户编号为前50名的结果)。
1 26 26 262 22 27 183 23 28 114 21 29 175 23 30 32 61831198 21 33 219 25 34 2410 13 35 2211 26 36 2312 19 37 2013 33 38 2014 27 39 2215 23 40 1716 29 41 2617 21 42 2518 26 43 1919 21 44 2620 28 45 1821 28 46 2522 11 47 2223 20 48 2224 17 49 1725 15 50 27表2 用户发布或转发微博数量的统计结果(2000人微博环境)用户编号用户微博数(单位/个)用户编号用户微博数(单位/个)1 25 26 212 27 27 203 28 28 184 27 29 215 28 30 246 23 31 267 27 32 268 24 33 199 29 34 2410 17 35 2111 26 36 2812 21 37 2613 21 38 2314 28 39 3015 26 40 2016 34 41 2117 29 42 2218 20 43 2319 21 44 2520 26 45 2021 25 46 1623 20 48 2524 23 49 3125 27 50 30表3 用户粉丝发布或转发微博数量的统计结果(2000人微博环境)用户编号粉丝活跃度用户编号粉丝活跃度1 984 26 2592 943 27 3673 367 28 8254 484 29 9845 804 30 5386 325 31 2517 466 32 5308 705 33 3129 256 34 50410 317 35 59111 130 36 55712 922 37 89013 731 38 27814 454 39 20115 204 40 59516 567 41 72517 414 42 29618 356 43 41919 262 44 58320 225 45 57521 487 46 97522 513 47 76923 628 48 83424 825 49 51825 660 50 951表4 用户所关注他人人数的统计结果(2000人微博环境)用户编号粉丝专注度用户编号粉丝专注度1 934 26 2932 861 27 3553 327 28 7514 487 29 8245 738 30 4876 324 31 2647 444 32 5838 655 33 2889 274 34 49810 300 35 56011 109 36 54612 991 37 84913 755 38 28514 491 39 18915 213 40 60616 618 41 69717 359 42 26618 363 43 37719 260 44 52120 242 45 63921 442 46 102022 484 47 80523 610 48 77924 764 49 49225 660 50 931表5 博主粉丝数量的统计结果(10000人微博环境)用户编号粉丝数量(单位/个)用户编号粉丝数量(单位/个)282 2786390 2880493 2990593 3074695 3175774 3273887 3385987 34881083 35801196 36911271 37781381 38771487 399115106 40861688 41841788 42791899 43741987 447520104 45882182 46712282 47722381 48912488 49842589 5082表6用户发布或转发微博数量的统计结果(10000人微博环境)用户编号用户微博数(单位/个)用户编号用户微博数(单位/个)152 2659261 2740345 2852449 2943533 3051650 3157743 3245843 3358956 34581045 35551144 36581246 37401355 38561446 39491546 40381656 41511741 42521842 43581954 44432034 45452136 46442250 47482350 48492454 49352547 5058表7 用户粉丝发布或转发微博数量的统计结果(10000人微博环境)用户编号粉丝活跃度用户编号粉丝活跃度16411 2688527622 27220334289 28178043450 29785051149 307767 6629 317466 74427 327598 84087 332127 91085 345893 101259 356369 11792 366650 126493 376297 134161 381292 142436 396114 155594 402262 163291 416275 176970 425596 186759 431561 192726 445177 204956 451058 214055 462134 221145 477763 231675 48780 243123 49781 256481507484表8 用户所关注他人人数的统计结果(10000人微博环境)用户编号粉丝关注度用户编号粉丝关注度111416 261615 213339 27446 36896 283738 46439 2914531 52094 3013536 61021 3113930 78727 3213855 88257 333881 91828 3410709 102231 3512279 111208 3611754 1211727 3711130 137470 382237 143901 3911168 159265 403956 165921 4111113 1712146 429637 1811521 43309719 4737 44 9495 20 9378 45 1762 21 7103 46 3890 22 2355 47 14268 23 2777 48 1282 24 4955 49 1272 251147450145295.1.2影响力评价模型的建立鉴于指标集都是有具体的数据,我们采用客观赋权的方法——熵权法,对各个指标进行赋权,进而建立线性综合评价模型。