基于社会网络分析的群体评价重要专家识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于社会网络分析的群体评价重要专家识别
作者:靳晓宇
来源:《现代经济信息》 2018年第9期
引言
在群体评价中,评价者即专家群体的相关知识和经验是保证评价科学合理性的重要因素。
然而因为评价者的教育背景与社会经验的不同,如何对专家的话语权以及所给评价信息怎样构成最后的评价结果,都需要对专家在群体中所处的地位、作用有清晰的了解。
本文基于社会网络分析法,对评价专家构成的协商网络进行分析,识别出对评价过程中起重要作用的专家。
一、网络节点重要性排序理论
“社会网络分析”(Social Network Analysis)( 简称SNA,有的文献称为“社会网”或“网络分析”) 是一门对社会关系进行量化分析的艺术和技术,它要求有较高的统计学、数学功底,以及计算机编程技术和能力等。
从形式上看,社会网络都可以定义为一组已经或有可能( 直接或间接) 连接的点,这些点的特征和它们之间关系的全体。
其中点(nodes) 可以是社会分析的任何单位,如个人、群体、组织和社区等,点的特征指的是这些单位本身的特征。
点之间的连接(linkage) 表示点之间的某种关系。
关系具有一定的内容,这一内容就是关系的实质。
关系的内容往往表现为关系传递的东西。
社会网络分析的一大核心问题为节点分析,最核心的问题就是如何识别重要的节点。
所谓的重要节点是指相比网络其他节点而言能够在更大程度上影响网络的结构与功能的一些特殊节点。
这里的网络结构包括度分布、平均距离、连通性、聚类系数、度相关性等,网络功能涉及网络的抗毁性、传播、同步、控制等。
重要节点一般数量非常少,但其影响却可以快速地波及到网络中大部分节点。
重要节点对网络的结构和功能有着巨大的影响,节点重要性的排序和重要节点的挖掘意义重大。
节点重要性排序的方法可以总结为四种:
1. 基于节点近邻的节点排序方法
度中心性(Centrality)(1972) 认为一个节点的邻居数目越多,该节点能够直接影响的邻居也就越多,影响力也就越大。
度中心性指标计算方便简单,但仅考虑最局部邻居信息,实际效果欠佳。
为了权衡算法的效率和效果,陈端兵等人(2012) 提出了一种基于半局部信息的节点重要性排序方法,称为半局部中心性。
其排序效果好于度中心性,适用于大规模网络。
划分节点重要性的时候节点在网络中的位置也是至关重要的因素。
与度中心性观点不同的,一些学者认为在网络中,如果一个节点处于网络的核心位置,即使度较小,往往也有较高影响力,而处在边缘的大度节点影响力往往有限。
基于此, Kitsak(2010) 等人提出用K- 壳分解法(K-shell decomposition) 将外围的节点层层剥去,从而确定网络中节点的位置。
K- 壳分解法能够有效地应用在大型复杂网络中,但对规则网络、树形网络、标准BA 网络等很多典型网络失效。
2. 基于路径的节点排序方法
离心中心性(Closeness Centrality) (1995) 用一个节点与其他节点的最短路径的最大值来衡量其重要程度,但该方法只能用在连通网络中。
接近中心性(Closeness Centrality)
(1979) 通过计算节点与网络中其他所有节点的距离的平均值来消除特殊值的干扰。
一个节点与网络中其他节点的平均距离越小,该节点的接近中心性就越大。
接近中心性也可以理解为利用信息在网络中的平均传播时长来确定节点的重要性。
不同于接近中心性, Katz 中心性(1953) 同时考虑所有节点对之间路径的数目和每条路径的长度对一个节点中心性的不同的增强作用。
信息指标(Information indices) (1989) 通过路径中传播的信息量来衡量节点重要程度。
考虑了所有路径,可以很容易地扩展到含权网络中,并且该方法收敛速度快且稳定,可适用于非连通的网络。
3. 基于特征向量的排序方法
基于特征向量的方法不仅考虑节点邻居数量还考虑了其质量对节点重要性的影响。
特征向量中心性(Eigenvector centrality) (1972)认为一个节点的重要性既取决于其邻居节点的数量( 即该节点的度),也取决于每个邻居节点的重要性。
但该方法迭代次数多,到达稳定值比较缓慢。
在特征向量中心性的基础上,为了使打分值能够收敛并且快速收敛,累计提名(Cumulative nomination) (2000) 方法在每次迭代过程中,同时考虑邻居节点和自身的打分值。
HITs 算法认为,一个网络中不同类型的节点功能不同,每个节点的重要性往往不能由单独的一个指标给出, HITs 算法(1999) 赋予每个节点两个度量值,分别计算节点的权威性和枢纽性,即可以计算一个节点相互关联的两个属性,并可推广到其他计算相互关联属性的问题中。
4. 基于节点移除和收缩的排序方法
节点删除的最短距离法[1] 用一个节点被删除后造成的不连通的节点的原始最短距离的倒数之和来表征节点的重要性。
该方法在计算节点集的重要性的时候更加有效,比较适用于稀疏网络中。
节点收缩法[2] 通过节点收缩后网络凝聚度的变化评估节点的重要性,该方法每收缩一个节点就要计算一次网络的凝聚度,时间复杂度高。
本文用基于节点删除方法的指标来测度节点中心性。
节点的存在不同程度的影响着网络的连通性及信息传递效率,因此,可以通过计算删除某一节点对网络整体效率产生的影响来测度节点在网络中的重要程度。
二、专家评价信息网络建立
专家评价信息网络G 节点代表专家,节点值为专家的评价值,边为专家之间的关系( 有协商为1,无协商为0),边的权为专家评价值的距离,为两评价值之差,差越大,两专家距离越远。
应用Floyd 算法算出任意节点之间的最短距离,计算由Matlab实现,根据公式2 得到全网络G 的网络效率各节点的剩余网络效率,由公式3 算得各节点的重要程度得到专家重要性排序:
排序越靠前的专家在协商网络中起着越重要的作用。
四、结语
通过建立专家群体评价信息网络可以得到专家在该网络中所起的作用,本文所用方法得到的是专家信息在网络中传递时每一专家的重要性。
当我们采取其他社会网络分析方法时也可得到更多面的结论,例如用度中心性来得到专家在网络中是否处于中心地位,用介数中心性来衡量专家之间存在的关系在网络中的重要性等。
利用数据构造网络为研究评价专家行为等问题提供了更直观化的科学依据,为评价提供了更多的参考信息,值得进一步的研究与探讨。