基于社交网络的信息传播模型研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于社交网络的信息传播模型研究作者:胡章荣
来源:《电脑知识与技术》2020年第22期
摘要:社交网络中用户转发是信息传播的重要渠道。研究用户转发模式和信息传播规律,将有利于在网络话题传播过程中进行监控和抑制。为了更好了解社交网络中信息的传播机制,本文在对微博这类社交网络及其机制进行文献综述的基础上研究了社交网络中信息传播机制。对接受新信息的人数、信息创造者的中心地位及其局部聚类系数之间的相关性进行了仿真,结果表明社交网络中信息传播与中心性成正比,与聚类系数成反比。
关键词:社交网络;信息传播;聚类系数;中心性
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2020)22-0054-02
开放科学(资源服务)标识码(0SID):
1 问题背景
随着Web 2.0的出现,如Facebook、Twitter微博、知乎、朋友圈等社交网络(SNS),已成为在Internet上传播信息的重要工具[1]。用户可以向他们的朋友和其他关心它的人传播信息。在各种社交媒体中,微博是目前最受欢迎的服务之一,有着超过上亿的用户在使用。与传统的信息传播途径相比,社交网络中的信息传播具有传播延时小、速度快、不受时空限制等优势[2],但错误信息或谣言的传播也会给社会带来很大的负面影响。因此,了解信息在社交网络中的传播机制,可以更好促进正面信息的传播,遏制负面信息的传播。许多学者对社交网络的一些基本属性,包括度分布、聚类和网络核进行了研究,结果表明SNS用户的网络很可能是无标度网络[3]。虽然类似微博的网站形成了一个有向图,但其主要属性仍是相同的。因此可以使用无标度网络来模拟社交网络的初始条件。在这篇论文中,我们对微博这类社交网络及其机制进行建模。然后对影响信息传播的几个因素进行了研究:首先,给定相同的网络条件,
中心性聚类系数如何影響网络传播;第二,网络发生变化时信息的传播;最后,信息传播过程中网络是如何演进的。
2 信息传播网络模型
在此模型中,每个节点代表社交网络中的一个人。黄色方块代表信息。最初,我们随机选择一个人作为信息创建者。信息传播遵循以下规则:
(1)每个持有信息的人都会将信息安以下规则推送给所有邻居;(2)当收到信息时,可能会对信息感兴趣,在这种情况下,我们说这个人掌握了信息;(3)如果某人与信息创建者有完全不同的意见,他会阅读但忽略信息。随着信息在网络上传播,网络可以发展壮大。增长遵循以下规则:如果此人持有信息,他将关注该信息的创建者。
为了更好可视化上述规则,这里用两种颜色表示不同的群体,如图1所示。蓝色表示将忽略此消息,红色代表持有相同观点的群体,粉红色的节点代表那些掌握信息的人,绿色代表那些持相同观点但对信息不感兴趣的人,灰色代表那些收到消息且对消息持有不同意见的人。灰色和绿色节点均读取该信息,但是,他们不会进一步转发它。同时,使用两种不同的度量来描述网络中节点的特征一局部簇系数和中心度。在复杂网络中,某个节点的簇系数( Clustering Coefficient)是指该节点的邻居中彼此相连的概率。节点的聚类系数越低,其邻居之间的重叠连接就越少。中心性用于描述节点在图中的重要性,在这里,我们主要使用度中心度和紧密度中心度来分析图。
3 模拟结果分析
对社交网络进行仿真,首先生成节点数为500的无标度社区网络,并随机选取一个节点作为信息的制造者。假设社区成员对信息的感兴趣度为50%,信息生命周期为3个时钟。单色网络中所有节点都会转发信息,双色节点中,蓝色节点收到消息后会忽略此消息。
3.1 单色网络
我们首先让网络增长200个周期,然后执行信息传播功能。结果表明接收信息的人数与中心程度成正相关关系,本地聚类系数成反比,如图2、3所示。
3.2 双色图网络
如图1所示,双色网络图用蓝色代表接收者忽略接收的信息,红色代表对信息持相同观点的群体,两色图的仿真结果如图4和图5所示。
结果类似于一个彩色图表,即接收信息的人数与中心性成正比,与局部聚类系数成反比。但是,我们发现接收信息的人数的绝对值比单一彩色图表要小。造成这种现象的原因是,蓝色节点对信息沿某个路径传播进行计时,从而增加了信息传播的难度。
3.3网络演进
仿真还得到了收到信息的人数与tick之间的关系,结果如图6所示:可以得出随着网络的发展,具有相同的信息生命周期,更多的人可以接收信息。这是因为随着网络的增长,整个网络变得更加紧密。有一个有趣的发现,在某些循环之后,这个数字似乎饱和了。这种饱和来自信息生命周期,这限制了信息可以传播的深度。在节点总数远大于饱和节点数的情况下,如果我们增加新的生命周期,那么会有更多的人收到消息。
3.4 网络发展的影响
在等待网络增长很长时间之后,收到信息的人数与中心性之间的关系如图7所示。尽管从总体上看,该图仍告诉我们信息接收人数与中心信息之间的比例关系,但它更加饱和,特别是在较低的x轴区域。这是因为尽管某些节点具有较低的中心性,但是图形节点之间的连接非常紧密,因此信息仍然可以传播开来。
4 结论与启示
本文建立了一个社交网站模型,并研究了会影响信息传播的节点特征。结果发现收到信息的人数与中心性成正比.与聚类系数成反比。这个结果解释了为什么名人的推特可以被很多人看到。首先,他们有很多追随者,这意味着他们具有比较大的中心地位。其次,他们的追随者非常多样化。因此它们的局部簇系数很小。这个结果也给我们一些启示。为了扩大我们的网络,我们应该尝试与更多的人建立联系,更重要的是,我们需要结识来自不同地区,不同背景的不同类型的人。此外,从网络增长模拟中我们可以看到,随着网络之间的连接越来越紧密,收到信息的人数也随之增加。随着时间的流逝,当越来越多的人可以访问Internet时,我们的社会可以更加紧密地联系在一起,信息传播的速度将更快。该仿真模型的主要局限是没有引入真实的SNS数据。所有的网络拓扑结构都来自理想状况,这与实际情况有所不同。
参考文献:
[1]田雅.社交网络下的垃圾信息处理算法研究[D].济南:山东师范大学,2017.
[2]张霄宏,钱凯,鲍亚雷.基于SIR的Device-to-Device移动社交网络信息传播模型[J].河南理工大学学报(自然科学版),2019,38(3):131-136.