科学知识扩散的网络模型_高霞
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 25 卷 第 2 期 2013 年 4 月 文章编号: 1004-8308( 2013) 02-0045-10
研究与发展管理 R & D MANAGEMENT
Vol. 25 No. 2 Apr. 2013
科学知识扩散的网络模型
高 霞1 ,陈凯华2 ,官建成3
( 1. 内蒙古大学 经济管理学院,呼和浩特 010021; 2. 中国科学院 科技政策与管理科学研究所,北京 100190; 3. 中国科学院大学 管理学院,北京 100049)
摘 要: 本文从一个新的视角构建科学知识扩散的网络模型,即具有时间维度且面向个体的网络模型,并且以
当前国际上科学计量学研究的热点领域———Hirsch 指数为实证研究对象,验证了其在定量分析科学知识扩散
过程方面的可行性和有效性. 该模型基于社会网络分析中的扩散和系谱理论建立,从真实的扩散网络出发,充
随着节点和时间的变化而变化. 计算公式如下.
i -1
∑Aj
Ei =
j =1 n
i,j = 1,2,…,n
( 4)
∑Aj
j =1
其中,Ei 表示第 i 时刻某节点的曝光值,Aj 表示 j 时刻与该节点相连的节点数.
6) 阈值( threshold) . 当某节点的曝光值达到一定数值( 阈值) ,他( 她) 将接受该新事物,并开始“传
46
研究与发展管理
第 25 卷
络的整体特征进行刻画,如网络密度、核心节点、集聚程度等,而对那些能够实时再现知识扩散动态过程 的具体问题,如知识是通过节点间怎样的相互作用进行扩散的、扩散速度如何、扩散的主要路径是什么 等,没有很好地给予解释.
针对以上不足,本文以社会网络分析中的扩散( diffusion) 和系谱( genealogy) 理论为依托,从一个新的 视角构建知识扩散的网络模型并进行实证研究. 具体来说,我们以公开发表的科学论文( 即显性的科学知 识) 为研究对象,以引文( citations) 作为直接测度科学知识扩散的代理指标,构建一个具有时间维度且面 向个体的有向网络模型( individual-based directed network model with a time dimension) . 网络中的节点就是 具体的科学论文,连接两个节点( 论文) 的有向边则是论文间的引用关系. 该网络模型从科学知识扩散的 真实网络( 引文网络) 出发,充分还原组织中个体的差异性和客观存在的知识扩散路径,可以直观、鲜活 地展现科学知识在网络中随时间扩散的动态过程. 由于在已有文献中还没有看到类似研究,故该网络模 型具有一定的新意和应用价值.
接受者接触,则他( 她) 被“传染”的可能性越大. 换句话说,即某个体“曝光”机会越多,则其变为新的接受
者的可能性越大. 与某节点相连的所有节点称为该节点的邻居,其值为该节点的度( degree) . 某特定时刻
网络中某节点的曝光值等于该节点的所有邻居中,在该特定时刻之前已成为接受者所占的比例. 曝光值
染”其他人. 某节点的阈值就是其开始接受新事物( 即变成接受者) 那一刻的曝光值. 一般而言,节点阈值
越小,说明该节点越具“创新性”,即越早或ຫໍສະໝຸດ Baidu容易接受新事物.
1. 3 基于主路径分析技术找到扩散所经历的关键路径
主路 径 分 析 就 是 找 到 每 个 不 同 时 刻 下 的 那 些 关 键 节 点 和 链 接 ,由 它 们 连 接 而 成 的 路 便 构 成 了 整
收稿日期: 2012-03-12; 修改日期: 2012-08-11. 基金项目: 国家自然科学基金资助项目“我国 IT 产业合作创新网络的结构演化及其对创新绩效的影响研究———合作发明的视角”
( 71103078) 和“创新投资过程绩效与创新环境影响模式的建模研究”( 71103173) ; 内蒙古自治区自然科学基金资助项目 “中国合作创新网络的结构演化与知识转移研究”( 2011BS1002) . 作者简介: 高 霞( 1976—) ,女,博士,讲师,研究方向为知识管理、创新管理.
梳理有关显性知识扩散定量研究的文献可看到以下特点和不足. ①基于复杂网络或传染病模型对知 识扩散的仿真模拟,虽然从宏观上对知识扩散的网络结构、扩散路径以及其他动力学特征给予了较好的 模拟和解释,但这些方法只能提供对特定环境下知识扩散现象的整体性描述,并不能深入到微观层面的 个体( 节点) 的具体知识扩散行为. 因为它们在模拟知识扩散行为时均将组织( 网络) 中的个体( 节点) 看 作是同质的( homogeneities) ,这样会导致在知识扩散中个体的差异化信息缺失,从而影响对知识扩散行 为的微观解释. 实际上,组织( 网络) 中的每个个体( 节点) 是异质( heterogeneities) ,它们在组织( 网络) 中 的地位或作用是不同的,如有些个体( 节点) 是组织( 网络) 中的领导( leader) ,在信息传播中起到关键性 的作用. ②在基于社会网络分析中的典型网络指标和方法在对知识扩散的实证研究中,网络中的节点虽 然是异质的,但是这些网络指标所刻画的知识扩散往往是静态的而非动态的. 它们通常是对知识扩散网
社会网络分析中也认为: 新事物( innovation) 的扩散过程( 如新思想、新方法、新技术、新产品等) 与疫 病的流行过程具有相似性,即新事物最先被为数很少的个体接触、采纳或接受,然后通过这些个体的社会 关系( 朋友关系、客户关系或引用关系等) ,将此新事物“传染”给其他个体,以此类推,随着时间的推移, 该事物就被传播开来. 这种新事物通过社会关系被传播、扩散的过程也称为社会传染( social contagion) . 因此,从某种角度上讲,扩散( diffusion) 是一种重要的社会过程,而社会关系是实现这一扩散过程的主要 媒介[8]. 另外,如果将这些个体抽象成网络中的节点,社会关系( social relations) 看作是网络中节点间发生 链接的媒介,那么新事物的扩散过程其实也是节点和链接增多并形成扩散网络的过程. 利用大型社会网 络分析软件 Pajek,可画出扩散网络随时间的演化图. 通过该演化图,可以非常清晰、直观地看到扩散过程 宏观上是如何按照时间顺序进行的. 1. 2 深入研究扩散过程细节问题
目前,国内外学者对显性知识扩散的研究主要集中在对知识扩散的概念、构成、机制、条件、作用等方 面的定性讨论,而对显性知识扩散问题的定量研究关注较少. 就显性知识扩散的定量研究而言,从研究方 法上可以大致分为两类: ①基于复杂网络或传染病模型对知识扩散的动力学特征和演化过程进行的仿真 模拟和建模[3-5]; ②基于社会网络分析中的典型网络指标和方法( 如密度、集聚度、中心度、K-核、多维尺度 分析等) 对知识扩散网络结构和演化进行的实证研究[2,6-7]. 从研究角度上,也可将有关显性知识扩散的 研究分为两类: ①将论文引文或期刊间的引证关系作为知识扩散的代理指标对科学层面的知识扩散进行 的分析[3-4,6-7]; ②将专利间的引证关系( 专利引文) 作为知识扩散的代理指标对技术层面知识扩散进行探 讨[2,5].
本文其余部分结构安排如下: 首先,着重介绍构建科学知识扩散网络模型的过程和相关指标; 其次, 是有关数据来源的描述; 再次,以 Hirsch 指数为例的知识扩散实证研究; 最后是结论与讨论.
1 扩散的网络模型 ( diffusion network model)
本文基于社会网络分析理论与方法构建知识扩散的网络模型,即建立一个具有时间维度且同时面向 个体的有向网络模型. 该模型并非传统意义上的数学推理模型,而是描述知识扩散由浅入深的过程模型. 本文模型构建可以分为 3 个步骤: 首先,根据所收集到的关系数据生成科学知识的扩散网络,并利用 Pajek 画出具有时间维度的扩散网络图,进而从直观上研究其随时间演化的动态过程; 其次,基于社会网络 分析中的扩散理论[8],深入研究扩散所处阶段、扩散速度、扩散中的核心节点、触发扩散发生的阈值等细 节问题,进而对知识扩散行为予以微观解释; 最后,基于社会网络分析中的系谱理论[8],利用主路径分析 ( main path analysis) 技术找到扩散所经历的关键路径,对扩散发生的主要渠道进行分析. 模型构建过程具 体如下. 1. 1 生成扩散网络并画出扩散网络随时间的演化图
数学上,节点 i 的介数表达式为
∑ b( i) = gjik / gjk
( 3)
j,k
其中,gjk为从节点 j 到节点 k ( j,k≠i) 的最短路径的数量,gjik是经过节点 i 的从 j 到 k 的最短路径的数量.
网络中,某节点越是处于信息传递的中介位置,则它在网络中的地位越是中心.
5) 曝光值( exposure) . 在扩散过程中,接受者将新事物“传染”给与之接触的个体. 某个体与越多的
再增加.
4) 介数( betweenness centrality) . 节点在信息流交流中的重要程度可以由介数中心性来刻画. 这一指 标告诉我们在网络中谁是最有影响力的节点,谁就控制着与大多数节点间的信息交流[8]. 节点 i 的介数
是指: 网络中经过节点 i 的从节点 j 到节点 k 的最短路径数占从节点 j 到节点 k 所有最短路径数的比例.
第2 期
高 霞等: 科学知识扩散的网络模型
47
2) 接受速度( adoption rate,AR) 与加速度( acceleration) . 新事物扩散的速度可以用接受速度这一指
标来测度,它等于某时刻新增接受者的数量. 计算公式如下.
ARi = CAi - CAi-1
( 1)
其中,ARi 表示第 i 时刻的接受速度,CAi ( cumulative adopter) 表示第 i 时刻累积接受者的数量. 加速度则
分还原组织中个体的差异性,不但能够直观、鲜活地再现新事物在网络中随时间的演化过程,而且能够实时再
现知识扩散的微观动态过程.
关键词: 知识扩散; 网络模型; Hirsch 指数; 社会网络分析
中图分类号: G301
文献标识码: A
知识扩散是指通过市场及非市场渠道的传播,使知识从发源地向外进行空间传播、转移,或被其他地 域通过合法手段从知识生产者传递到使用者的过程[1]. 科技知识通过跨越时空的传播可使不同组织或个 体实现知识共享,进而促进知识的生产与利用. 组织间的知识扩散包含显性知识和隐性知识的扩散. 对于 那些已经编码化,存在于组织的论文、档案、专利和产品等实物的显性知识,可以通过对公开的科技成果 的引用和产品的购买实现组织间的知识扩散,而大部分不可言传以及处于个人知识向组织知识转化状态 的隐性知识则需要借助人员交流、学习等实现组织间的知识扩散[2].
在已有扩散网络的基础上,基于社会网络分析中的扩散理论,从扩散阶段、扩散速度、核心节点、触发 阈值等角度对扩散过程的细节进行阐释,主要用到以下指标.
1) 扩散曲线( diffusion curve) . 新事物的扩散一般会经历如下过程: 首先新事物被很少的个体接受, 然后通过这些个体的社会关系又将新事物“传染”给其他个体,随着接受者( adopter) 的数量增多和“传 染”速度增速加快,新事物就会开始迅速传播和蔓延,在某一时期接受者甚至会出现暴增现象. 随后,增速 将慢慢放缓,新接受者增加得越来越少,这个扩散过程也逐渐趋于结束. 如果将时间作为横坐标,累积扩 散速度作为纵坐标,那么上述扩散过程也表现出一条像 Logistic 增长曲线一样的 S 型曲线,称之为 S 型扩 散曲线. 我们可将该 S 型扩散曲线分为 4 个部分,亦即将扩散过程相应地划分为 4 个阶段: 引入期、成长 期、成熟期、衰退期.
用来测度接受速度变化的程度,它等于某时刻速度的变化量,即
Ai = ARi - ARi-1
( 2)
其中,Ai 表示第 i 时刻的加速度,ARi 表示第 i 时刻的接受速度.
3) 临界量( critical mass) . 它是指在无需外界干涉的情况下,使扩散过程得以维持的最少接受者数
量. 临界量一般在 S 型扩散曲线的第一个拐点处达到,此时虽然接受者的数量还在增多,但是接受速度不
研究与发展管理 R & D MANAGEMENT
Vol. 25 No. 2 Apr. 2013
科学知识扩散的网络模型
高 霞1 ,陈凯华2 ,官建成3
( 1. 内蒙古大学 经济管理学院,呼和浩特 010021; 2. 中国科学院 科技政策与管理科学研究所,北京 100190; 3. 中国科学院大学 管理学院,北京 100049)
摘 要: 本文从一个新的视角构建科学知识扩散的网络模型,即具有时间维度且面向个体的网络模型,并且以
当前国际上科学计量学研究的热点领域———Hirsch 指数为实证研究对象,验证了其在定量分析科学知识扩散
过程方面的可行性和有效性. 该模型基于社会网络分析中的扩散和系谱理论建立,从真实的扩散网络出发,充
随着节点和时间的变化而变化. 计算公式如下.
i -1
∑Aj
Ei =
j =1 n
i,j = 1,2,…,n
( 4)
∑Aj
j =1
其中,Ei 表示第 i 时刻某节点的曝光值,Aj 表示 j 时刻与该节点相连的节点数.
6) 阈值( threshold) . 当某节点的曝光值达到一定数值( 阈值) ,他( 她) 将接受该新事物,并开始“传
46
研究与发展管理
第 25 卷
络的整体特征进行刻画,如网络密度、核心节点、集聚程度等,而对那些能够实时再现知识扩散动态过程 的具体问题,如知识是通过节点间怎样的相互作用进行扩散的、扩散速度如何、扩散的主要路径是什么 等,没有很好地给予解释.
针对以上不足,本文以社会网络分析中的扩散( diffusion) 和系谱( genealogy) 理论为依托,从一个新的 视角构建知识扩散的网络模型并进行实证研究. 具体来说,我们以公开发表的科学论文( 即显性的科学知 识) 为研究对象,以引文( citations) 作为直接测度科学知识扩散的代理指标,构建一个具有时间维度且面 向个体的有向网络模型( individual-based directed network model with a time dimension) . 网络中的节点就是 具体的科学论文,连接两个节点( 论文) 的有向边则是论文间的引用关系. 该网络模型从科学知识扩散的 真实网络( 引文网络) 出发,充分还原组织中个体的差异性和客观存在的知识扩散路径,可以直观、鲜活 地展现科学知识在网络中随时间扩散的动态过程. 由于在已有文献中还没有看到类似研究,故该网络模 型具有一定的新意和应用价值.
接受者接触,则他( 她) 被“传染”的可能性越大. 换句话说,即某个体“曝光”机会越多,则其变为新的接受
者的可能性越大. 与某节点相连的所有节点称为该节点的邻居,其值为该节点的度( degree) . 某特定时刻
网络中某节点的曝光值等于该节点的所有邻居中,在该特定时刻之前已成为接受者所占的比例. 曝光值
染”其他人. 某节点的阈值就是其开始接受新事物( 即变成接受者) 那一刻的曝光值. 一般而言,节点阈值
越小,说明该节点越具“创新性”,即越早或ຫໍສະໝຸດ Baidu容易接受新事物.
1. 3 基于主路径分析技术找到扩散所经历的关键路径
主路 径 分 析 就 是 找 到 每 个 不 同 时 刻 下 的 那 些 关 键 节 点 和 链 接 ,由 它 们 连 接 而 成 的 路 便 构 成 了 整
收稿日期: 2012-03-12; 修改日期: 2012-08-11. 基金项目: 国家自然科学基金资助项目“我国 IT 产业合作创新网络的结构演化及其对创新绩效的影响研究———合作发明的视角”
( 71103078) 和“创新投资过程绩效与创新环境影响模式的建模研究”( 71103173) ; 内蒙古自治区自然科学基金资助项目 “中国合作创新网络的结构演化与知识转移研究”( 2011BS1002) . 作者简介: 高 霞( 1976—) ,女,博士,讲师,研究方向为知识管理、创新管理.
梳理有关显性知识扩散定量研究的文献可看到以下特点和不足. ①基于复杂网络或传染病模型对知 识扩散的仿真模拟,虽然从宏观上对知识扩散的网络结构、扩散路径以及其他动力学特征给予了较好的 模拟和解释,但这些方法只能提供对特定环境下知识扩散现象的整体性描述,并不能深入到微观层面的 个体( 节点) 的具体知识扩散行为. 因为它们在模拟知识扩散行为时均将组织( 网络) 中的个体( 节点) 看 作是同质的( homogeneities) ,这样会导致在知识扩散中个体的差异化信息缺失,从而影响对知识扩散行 为的微观解释. 实际上,组织( 网络) 中的每个个体( 节点) 是异质( heterogeneities) ,它们在组织( 网络) 中 的地位或作用是不同的,如有些个体( 节点) 是组织( 网络) 中的领导( leader) ,在信息传播中起到关键性 的作用. ②在基于社会网络分析中的典型网络指标和方法在对知识扩散的实证研究中,网络中的节点虽 然是异质的,但是这些网络指标所刻画的知识扩散往往是静态的而非动态的. 它们通常是对知识扩散网
社会网络分析中也认为: 新事物( innovation) 的扩散过程( 如新思想、新方法、新技术、新产品等) 与疫 病的流行过程具有相似性,即新事物最先被为数很少的个体接触、采纳或接受,然后通过这些个体的社会 关系( 朋友关系、客户关系或引用关系等) ,将此新事物“传染”给其他个体,以此类推,随着时间的推移, 该事物就被传播开来. 这种新事物通过社会关系被传播、扩散的过程也称为社会传染( social contagion) . 因此,从某种角度上讲,扩散( diffusion) 是一种重要的社会过程,而社会关系是实现这一扩散过程的主要 媒介[8]. 另外,如果将这些个体抽象成网络中的节点,社会关系( social relations) 看作是网络中节点间发生 链接的媒介,那么新事物的扩散过程其实也是节点和链接增多并形成扩散网络的过程. 利用大型社会网 络分析软件 Pajek,可画出扩散网络随时间的演化图. 通过该演化图,可以非常清晰、直观地看到扩散过程 宏观上是如何按照时间顺序进行的. 1. 2 深入研究扩散过程细节问题
目前,国内外学者对显性知识扩散的研究主要集中在对知识扩散的概念、构成、机制、条件、作用等方 面的定性讨论,而对显性知识扩散问题的定量研究关注较少. 就显性知识扩散的定量研究而言,从研究方 法上可以大致分为两类: ①基于复杂网络或传染病模型对知识扩散的动力学特征和演化过程进行的仿真 模拟和建模[3-5]; ②基于社会网络分析中的典型网络指标和方法( 如密度、集聚度、中心度、K-核、多维尺度 分析等) 对知识扩散网络结构和演化进行的实证研究[2,6-7]. 从研究角度上,也可将有关显性知识扩散的 研究分为两类: ①将论文引文或期刊间的引证关系作为知识扩散的代理指标对科学层面的知识扩散进行 的分析[3-4,6-7]; ②将专利间的引证关系( 专利引文) 作为知识扩散的代理指标对技术层面知识扩散进行探 讨[2,5].
本文其余部分结构安排如下: 首先,着重介绍构建科学知识扩散网络模型的过程和相关指标; 其次, 是有关数据来源的描述; 再次,以 Hirsch 指数为例的知识扩散实证研究; 最后是结论与讨论.
1 扩散的网络模型 ( diffusion network model)
本文基于社会网络分析理论与方法构建知识扩散的网络模型,即建立一个具有时间维度且同时面向 个体的有向网络模型. 该模型并非传统意义上的数学推理模型,而是描述知识扩散由浅入深的过程模型. 本文模型构建可以分为 3 个步骤: 首先,根据所收集到的关系数据生成科学知识的扩散网络,并利用 Pajek 画出具有时间维度的扩散网络图,进而从直观上研究其随时间演化的动态过程; 其次,基于社会网络 分析中的扩散理论[8],深入研究扩散所处阶段、扩散速度、扩散中的核心节点、触发扩散发生的阈值等细 节问题,进而对知识扩散行为予以微观解释; 最后,基于社会网络分析中的系谱理论[8],利用主路径分析 ( main path analysis) 技术找到扩散所经历的关键路径,对扩散发生的主要渠道进行分析. 模型构建过程具 体如下. 1. 1 生成扩散网络并画出扩散网络随时间的演化图
数学上,节点 i 的介数表达式为
∑ b( i) = gjik / gjk
( 3)
j,k
其中,gjk为从节点 j 到节点 k ( j,k≠i) 的最短路径的数量,gjik是经过节点 i 的从 j 到 k 的最短路径的数量.
网络中,某节点越是处于信息传递的中介位置,则它在网络中的地位越是中心.
5) 曝光值( exposure) . 在扩散过程中,接受者将新事物“传染”给与之接触的个体. 某个体与越多的
再增加.
4) 介数( betweenness centrality) . 节点在信息流交流中的重要程度可以由介数中心性来刻画. 这一指 标告诉我们在网络中谁是最有影响力的节点,谁就控制着与大多数节点间的信息交流[8]. 节点 i 的介数
是指: 网络中经过节点 i 的从节点 j 到节点 k 的最短路径数占从节点 j 到节点 k 所有最短路径数的比例.
第2 期
高 霞等: 科学知识扩散的网络模型
47
2) 接受速度( adoption rate,AR) 与加速度( acceleration) . 新事物扩散的速度可以用接受速度这一指
标来测度,它等于某时刻新增接受者的数量. 计算公式如下.
ARi = CAi - CAi-1
( 1)
其中,ARi 表示第 i 时刻的接受速度,CAi ( cumulative adopter) 表示第 i 时刻累积接受者的数量. 加速度则
分还原组织中个体的差异性,不但能够直观、鲜活地再现新事物在网络中随时间的演化过程,而且能够实时再
现知识扩散的微观动态过程.
关键词: 知识扩散; 网络模型; Hirsch 指数; 社会网络分析
中图分类号: G301
文献标识码: A
知识扩散是指通过市场及非市场渠道的传播,使知识从发源地向外进行空间传播、转移,或被其他地 域通过合法手段从知识生产者传递到使用者的过程[1]. 科技知识通过跨越时空的传播可使不同组织或个 体实现知识共享,进而促进知识的生产与利用. 组织间的知识扩散包含显性知识和隐性知识的扩散. 对于 那些已经编码化,存在于组织的论文、档案、专利和产品等实物的显性知识,可以通过对公开的科技成果 的引用和产品的购买实现组织间的知识扩散,而大部分不可言传以及处于个人知识向组织知识转化状态 的隐性知识则需要借助人员交流、学习等实现组织间的知识扩散[2].
在已有扩散网络的基础上,基于社会网络分析中的扩散理论,从扩散阶段、扩散速度、核心节点、触发 阈值等角度对扩散过程的细节进行阐释,主要用到以下指标.
1) 扩散曲线( diffusion curve) . 新事物的扩散一般会经历如下过程: 首先新事物被很少的个体接受, 然后通过这些个体的社会关系又将新事物“传染”给其他个体,随着接受者( adopter) 的数量增多和“传 染”速度增速加快,新事物就会开始迅速传播和蔓延,在某一时期接受者甚至会出现暴增现象. 随后,增速 将慢慢放缓,新接受者增加得越来越少,这个扩散过程也逐渐趋于结束. 如果将时间作为横坐标,累积扩 散速度作为纵坐标,那么上述扩散过程也表现出一条像 Logistic 增长曲线一样的 S 型曲线,称之为 S 型扩 散曲线. 我们可将该 S 型扩散曲线分为 4 个部分,亦即将扩散过程相应地划分为 4 个阶段: 引入期、成长 期、成熟期、衰退期.
用来测度接受速度变化的程度,它等于某时刻速度的变化量,即
Ai = ARi - ARi-1
( 2)
其中,Ai 表示第 i 时刻的加速度,ARi 表示第 i 时刻的接受速度.
3) 临界量( critical mass) . 它是指在无需外界干涉的情况下,使扩散过程得以维持的最少接受者数
量. 临界量一般在 S 型扩散曲线的第一个拐点处达到,此时虽然接受者的数量还在增多,但是接受速度不