基于传染病模型的微博信息传播规律研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Techniques of Automation &Applications
基于传染病模型的微博信息传播规律研究*
白黎,杨亚强
(宝鸡文理学院,陕西宝鸡721016)
摘
要:无本文在经典传染病模型的基础上,加入重复转发因素的影响,构建了易感染者-犹豫者-感染者-免疫者的微博信息传播
模型。并使用雷洋事件信息传播数据进行模拟仿真,仿真结果表明,该模型可以很好地描述微博信息传播的规律。
关键词:微博;SIR 模型;信息传播与控制;模拟仿真中图分类号:TP393
文献标志码:A
文章编号:1003-7241(2019)06-0059-04
Simulation on Microblog Information Transmission
Based on SIR Model
BAI Li,YANG Ya-qiang
(Baoji University of Arts and Sciences,Baoji 721016China )
Abstract:Based on the classic SIR model,the whole transmission node is divided into healthy node,browse node,transmission
node and immune node.Meanwhile,factors for users to repeatedly forward messages are input to improve infectious dis-ease model.Finally,the collected Weibo information dissemination data is simulated.The simulation results show that the simulated results agree well with actual statistical data of "Lei Yang incident"information dissemination,meantime the es-tablished micro-blog information propagation model can well describe the spread law.
Key words:microblog;Susceptible-Infected-Removed model;information transmission and control;simulation
*基金项目:国家社会科学基金项目(编号15XGL021)收稿日期:2018-09-14
1引言
微博作为一种新型社会化媒体已经成为信息沟通和传播的重要平台。它以其快捷性和高效性赢得了亿万用户的青睐,根据中国互联网络信息中心(CNNIC)发布的
《第35次中国互联网络发展统计报告》[1],截止2014年12
月,中国网民规模达到6.49亿,新浪微博注册用户已经达到了2.49亿人次。到2016年,微博月活跃用户数达3.13亿,日活跃用户数也增长到1.39亿。微博的快速发展是一把双刃剑,正面的消息可以在传播系统里面快速传播,并带来积极的影响,但同时负面的消息也会得到快速的传播,带来消极的影响。特别是现在信息技术的快速发展,使微博迅速成为一种快速、便捷的舆情传播方式。一旦一个热门话题在微博中出现,因为其受众人数巨大,信息传播快速,可以在短时间内形成井喷式的网络舆情,就
会影响到事件的发展方向,进而对有关部门对发生事件的裁决、处理和应对带来影响。趋利避害是人们的基本思想,人们都希望正面的、积极的消息能够在大范围快速传播;消极的、负面的消息能够第一时间得到控制与澄清,特别是作为政府部门门户的官方微博,对这方面的要求就显得尤为重要。因此通过研究和分析微博信息传播的特点,掌握其内在的传播规律,从而达到对网络中传播舆情话题发展过程的监控和预测,将对于相关部门对网络舆情的正确疏导和管理起到重要作用。
2文献分析
从20世纪开始,许多学者利用传染病模型研究信息的传播规律。Ross 等研究蚊子和人群之间的疟疾的传播,提出了SI 模型[2],Kermack 和McKendrick 研究黑死病传播规律时,提出了SIR 模型[3],后来学者们根据不同的情境对SIR 模型进行了改进,并将这些模型广泛的应用到信息传播规律的研究中[4]。Leskovec 基于SIS 模型构
59
建了博客网络中的话题信息传播模型[5];Gruhl等人建立了基于SIRS的博客信息传播模型[6];Zhao依据传染病SI 模型,提出了微博信息传播中突发性话题的传播模型[7];Zhang等人依据传染病SIR模型结合群组动力学,对微博信息传播中热点话题的传播规律进行了研究[8];Chakrabarti等人利用传染病模型的方法预测微博的转发规模[9];Li等人利用扩展的传染病模型对腾讯微博信息的转发次数进行了准确的预测[10];Wang等人提出了扩展的SIS疾病传染模型[11];陆静等人建立了微博网络消息传播的ISSR模型[12];丁学君等人建立了基于SCIR的微博舆情话题传播模型[13];刘丹等人提出了微博信息传播的SIR 模型并对微博信息扩散规律进行了仿真分析[14];李可嘉,游新年等人提出了改进的SIR模型来研究微博信息的传播规律[15-16]。
这些研究利用经典的传染病模型,将整个传播系统中的节点分为健康节点、传播节点和免疫节点,来研究社会网络中信息传播的规律,为微博信息传播规律的研究奠定了一定的基础。但是微博信息的传播还与人在获取信息以后的真实情感、决策、信息互动模式有关,所以要更好的模拟和反映微博信息传播的真是规律,就需要对经典的传染病模型进一步改进。
3微博的信息传播模型
本文基于传染病的SIR模型,构建了一个新的微博信息传播模型。在模型中引入了一个新的节点——浏览节点和一个新的因素——自己重复转发因素。这样在信息传播过程中所有的节点就分为四种:健康节点、浏览节点、传播节点和免疫节点。信息传播的规律是:(1)当一个健康节点(易感染者)接触到一个传播节点(感染者)发布的消息以后,易感染者一部分可能要对信息进行核实或者验证,从而使其处于是否要转发的状态,我们称之为犹豫状态,即一部分健康节点以概率p1转化为浏览节点。另一部分则直接以概率p2进行转发,从而成为新的传播节点,在这里p1+p2≤1。
(2)处于浏览节点的用户经过一定时间的思考、验证之后以概率p3转化为新的传播者,或者以概率p4拒绝转发成为免疫节点,在这里p3+p4≤1。
(3)新的传播节点以概率p5拒绝转发成为免疫节点。
(4)某些用户发布了一条信息以后可能出于营销策略、扩散市场、忘记自己曾经转发或者出于信任一些官方信息传播正确舆论的目的而进行重复转发,这一过程可以认为是传播节点自身以概率p6进行重复转发,一般而言p5远大于p6。
依据上述的微博信息传播规律分析,我们建立如下
微博信息传播模型:
本文定义N(t)为t时刻网络中的节点总数,则S(t),H (t),I(t),R(t)分别代表t时刻微博信息传播网络中的健康节点(易感染者)、浏览节点(犹豫者)、传播节点(感染者)及免疫节点(免疫者)的密度,即四类节点的数量分别在N(t)中所占的比例,由假设可知S(t)+H(t)+I(t)+R(t)=1。
4实验模拟
4.1数据的准备
本文的实验数据来源于2016年5月7日采集的某粉丝众多的新浪微博账户,该用户5月7日发布了中国人民大学硕士雷洋因涉嫌嫖娼被民警采取强制措施导致死亡的事件,这件事情被发到在网络上以后上引起了轩然大波,一度成为最热门的话题。本文的数据采集从某一原创微博用户出发,根据统计该用户的关注列表,逐个统计分析用户间的关注关系以及每个用户在采样期间(从第一条微博发出到30天内)转发、评论和原创的微博总数。
4.2实验结果及讨论
本文使用MATLAB仿真软件,对于构造的微博信息传播模型进行实验仿真,通过300次的实验迭代,微博传播网络中四个节点都达到了稳定状态,并得到以下仿真结果。
在本模型中由于微博信息传播网络中用户一旦发布了舆情信息,除了特殊情况几乎所有的粉丝用户都可以看见这个信息,所以可以取p1=0.9,在传播过程中出于自身目的对信息进行重复转发的比例很小,所以取p6=0.01,根据相关文献[13,15],对其他参数取值如下:p2=0.1, p3=0.3,p4=0.1,p5=0.3。
4.2.1微博信息转发数随时间变化关系
图1中纵坐标为雷洋事件微博信息的转发总量的标准化值。从图中可以看出实际统计的数据和理论计算数
60
Techniques of Automation&Applications