聚类0中活跃文献7

合集下载

聚类分析方法概述及应用

聚类分析方法概述及应用

聚类分析方法概述及应用聚类分析是一种常用的数据分析方法,用于将相似的数据点聚集在一起,形成有意义的群组。

它可以帮助我们理解数据的内在结构和模式,揭示隐藏在数据背后的信息。

本文将对聚类分析方法进行概述,并探讨其在不同领域的应用。

一、聚类分析方法概述聚类分析方法有多种类型,其中最常用的是原型聚类、层次聚类和密度聚类。

1. 原型聚类原型聚类是一种利用原型向量(即代表一个簇的中心点)来表示和分类数据的方法。

最常见的原型聚类算法是K均值聚类,它通过迭代过程将数据分成K个簇。

2. 层次聚类层次聚类是一种基于树状结构的聚类方法,它将数据点逐步合并为越来越大的簇,直到所有数据点都合并为一个簇。

层次聚类可以分为凝聚型和分裂型两种。

3. 密度聚类密度聚类是一种基于数据点之间密度的聚类方法。

它通过计算每个数据点周围的密度,将密度较高的数据点归为一类,从而形成簇。

DBSCAN是最常用的密度聚类算法之一。

二、聚类分析的应用聚类分析方法在各个领域都有广泛的应用,以下是其中几个典型的应用示例:1. 市场细分聚类分析可帮助企业将潜在消费者细分为不同的市场群体,根据不同群体的需求进行针对性的市场推广。

例如,一家保险公司可以利用聚类分析将客户分为不同的风险类别,制定相应的保险套餐。

2. 医学研究在医学领域,聚类分析可用于帮助识别患者的疾病风险、预测疾病进展、选择最佳治疗方案等。

通过分析患者的基因数据、病历记录和临床表现等信息,医生可以将患者分为不同的疾病类型,为个体化治疗提供指导。

3. 社交网络分析社交网络中存在着庞大的用户群体和复杂的网络关系。

聚类分析可以帮助我们理解社交网络中的用户群体结构,发现潜在的兴趣群体和社区,并为个性化推荐、社交媒体营销等提供支持。

4. 图像分析聚类分析可以应用于图像分析领域,如图像压缩、图像分类等。

通过对图像中的像素点进行聚类,可以将相似的像素点合并为一个簇,从而实现图像的压缩和分类。

5. 网络安全对于网络安全领域来说,聚类分析可以帮助识别异常网络流量、发现潜在的攻击者并采取相应的安全防护措施。

7种常用的聚类方法

7种常用的聚类方法

7种常用的聚类方法K均值聚类是一种基于距离的聚类方法,它将数据点分成K个簇,每个簇都有一个代表性的点,称为质心。

该方法的优点是简单易懂,计算速度快,适用于大规模数据集。

然而,K均值聚类对初始质心的选择敏感,容易陷入局部最优解。

层次聚类是一种树状聚类方法,它通过不断合并最相似的簇来构建聚类树。

这种方法不需要事先指定聚类个数,且对初始值不敏感,但计算复杂度较高,不适用于大规模数据集。

密度聚类是一种基于密度的聚类方法,它将高密度区域划分为簇,并能够发现任意形状的簇。

该方法对噪声和离群点具有较好的鲁棒性,但对参数的选择较为敏感。

模型聚类是一种基于概率模型的聚类方法,它假设数据是由若干个概率分布生成的,并通过模型拟合来进行聚类。

这种方法可以很好地处理数据中的噪声和缺失值,但对数据分布的假设较为苛刻。

谱聚类是一种基于图论的聚类方法,它将数据点视为图中的节点,通过图的拉普拉斯矩阵来进行聚类。

谱聚类能够发现任意形状的簇,且对参数的选择较为鲁棒,但计算复杂度较高,不适用于大规模数据集。

基于网格的聚类是一种将数据空间划分为网格单元,然后在每个单元中进行聚类的方法。

这种方法适用于高维数据和大规模数据集,但对网格大小的选择较为敏感。

分布式聚类是一种将聚类过程分布在多台计算机上进行的方法,它能够处理大规模数据集,并能够并行计算,但需要考虑数据通信和同步的开销。

综上所述,不同的聚类方法适用于不同的数据特点和应用场景。

在选择聚类方法时,需要综合考虑数据规模、数据特征、计算资源等因素,以及对聚类结果的要求。

希望本文介绍的7种常用聚类方法能够为读者在实际应用中的选择提供一定的参考和帮助。

常见的聚类方法及应用

常见的聚类方法及应用

常见的聚类方法及应用常见的聚类方法有层次聚类、K-means聚类、DBSCAN聚类和密度聚类。

层次聚类(Hierarchical clustering)是一种自下而上或自上而下的聚类方法。

这种方法通过划分数据集来构建聚类树,然后根据树的分支情况划分簇。

层次聚类方法有两种:凝聚性(Agglomerative)和分裂性(Divisive)。

凝聚性层次聚类是自下而上的方法,首先将每个样本看作一个簇,然后逐步合并相似的簇,直到形成一个大簇。

而分裂性层次聚类则是自上而下的方法,首先将所有样本看作一个大簇,然后逐步将大簇分割成更小的簇,直到每个样本都成为一个簇。

层次聚类方法的应用包括文本聚类、图像聚类和生物学数据分析等方面。

K-means聚类是一种基于划分的聚类方法。

这种方法将数据集划分为K个簇,每个簇包含与之最相似的数据点。

K-means聚类的过程分为两个步骤:选择初始质心和迭代优化。

选择初始质心可以用多种方法,比如随机选择或根据数据分布选择。

迭代优化通过计算数据点到簇质心的距离,并将每个点分配到最接近的质心,然后更新质心的位置,直到质心位置不再变化或达到预设迭代次数。

K-means聚类的应用包括图像分割、推荐系统和市场分析等方面。

DBSCAN聚类(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类方法。

这种方法将数据点分为核心点、边界点和噪声点。

核心点是一个密度可达的点,即在以该点为圆心,以一定半径内至少包含最小样本数的区域内有足够的样本点。

边界点是在以核心点为圆心,以一定半径内包含小于最小样本数的样本点。

噪声点是既不是核心点也不是边界点的点。

DBSCAN聚类的过程是通过寻找核心点的相邻点和扩展密度直达的样本点,从而形成一个簇。

DBSCAN聚类的应用包括异常检测、土壤学分析和客户细分等方面。

密度聚类(Density-based clustering)是一种基于样本密度的聚类方法。

聚类分析论文

聚类分析论文

聚类分析论文简介聚类分析是一种常用的数据分析技术,它将数据集中的对象划分为具有相似特征的群组。

这些群组通常称为“簇”,聚类分析可以帮助我们发现数据中的共性和相似性,从而提取有意义的信息和洞见。

本文将介绍聚类分析的基本概念、算法原理以及在实际应用中的一些案例。

聚类分析的基本原理聚类分析的目标是将数据集中的对象划分为若干个“紧密”群组,使得同一群组内的对象之间具有较高的相似性,而不同群组之间的对象相似度较低。

常用的聚类分析算法有层次聚类、K均值聚类和DBSCAN等。

层次聚类层次聚类是一种自底向上的聚类方法,它从每个对象作为一个单独的群组开始,然后将对象逐步合并,直到所有对象都属于同一个群组。

层次聚类可分为凝聚(自底向上)和分裂(自顶向下)两种类型。

凝聚层次聚类从单个对象开始,然后将最相似的对象合并为一个群组,直到所有对象都合并在一起。

分裂层次聚类则从所有对象开始,然后逐步分裂为多个子群组,直到每个对象都成为一个单独的群组。

K均值聚类K均值聚类是一种迭代的聚类算法,它将数据集划分为K个不重叠的群组,其中K是用户指定的参数。

算法的基本思想是通过迭代计算,将每个对象分配给其最接近的质心,然后根据分配结果更新质心的位置,直到达到一定的收敛条件。

DBSCANDBSCAN是一种基于密度的聚类算法,它将数据集划分为具有相似密度的群组。

算法的基本思想是通过定义领域半径和邻近点数量的方式,将对象分为核心对象、边界对象和噪声对象。

DBSCAN算法具有自动确定群组数量的优点,并且对数据中的噪声相对稳健。

聚类分析的应用案例客户分群聚类分析在市场营销领域广泛应用,特别是在客户分析和客户细分方面。

通过对市场数据进行聚类分析,可以将客户划分为不同的群组,从而更好地理解和满足客户的需求。

例如,一家电商公司可以根据购买行为、兴趣爱好和消费水平等指标将用户分为高价值客户、潜在客户和低价值客户,以针对性地提供个性化的服务和推荐。

社交网络分析聚类分析可以应用于社交网络中的节点(如用户或组织)分析,帮助揭示社交网络中的社群结构和节点之间的相互关系。

聚类8种方法

聚类8种方法

聚类8种方法聚类是一种无监督学习方法,它将数据集中的对象分成不同的组或簇,使得同一组内的对象相似度较高,而不同组之间的对象相似度较低。

聚类方法可以应用于各种领域,如数据挖掘、图像处理、生物信息学等。

本文将介绍8种常见的聚类方法。

1. K均值聚类K均值聚类是最常见的聚类方法之一。

它将数据集中的对象分成K 个簇,每个簇的中心点称为质心。

算法的过程是先随机选择K个质心,然后将每个对象分配到最近的质心所在的簇中,接着重新计算每个簇的质心,重复以上步骤直到质心不再改变或达到预设的迭代次数。

2. 层次聚类层次聚类是一种自下而上或自上而下的聚类方法。

它将数据集中的对象逐步合并成越来越大的簇,直到所有对象都被合并为一个簇或达到预设的簇数。

层次聚类有两种方法:凝聚聚类和分裂聚类。

凝聚聚类是自下而上的方法,它从每个对象开始,逐步合并成越来越大的簇。

分裂聚类是自上而下的方法,它从所有对象开始,逐步分裂成越来越小的簇。

3. DBSCAN聚类DBSCAN聚类是一种基于密度的聚类方法。

它将数据集中的对象分为核心点、边界点和噪声点三类。

核心点是在半径为ε内有至少MinPts个对象的点,边界点是在半径为ε内有少于MinPts个对象的点,但它是核心点的邻居,噪声点是既不是核心点也不是边界点的点。

DBSCAN聚类的过程是从任意一个未被访问的核心点开始,找到所有密度可达的点,将它们合并成一个簇,直到所有核心点都被访问。

4. 密度聚类密度聚类是一种基于密度的聚类方法,它将数据集中的对象分为不同的簇,每个簇的密度较高,而不同簇之间的密度较低。

密度聚类的过程是从任意一个未被访问的点开始,找到所有密度可达的点,将它们合并成一个簇,直到所有点都被访问。

5. 谱聚类谱聚类是一种基于图论的聚类方法。

它将数据集中的对象看作是图中的节点,将它们之间的相似度看作是边的权重。

谱聚类的过程是将相似度矩阵转换成拉普拉斯矩阵,然后对拉普拉斯矩阵进行特征值分解,得到特征向量,将它们作为新的特征空间,再用K均值聚类或其他聚类方法进行聚类。

聚类分析法ppt课件全

聚类分析法ppt课件全

8/21/2024
25
1.2.2 动态聚类分析法
1.2 聚类分析的种类
(3)分类函数
按照修改原则不同,动态聚类方法有按批修改法、逐个修改法、混合法等。 这里主要介绍逐步聚类法中按批修改法。按批修改法分类的原则是,每一步修 改都将使对应的分类函数缩小,趋于合理,并且分类函数最终趋于定值,即计 算过程是收敛的。
8/21/2024
23
1.2.2 动态聚类分析法
1.2 聚类分析的种类
(2)初始分类 有了凝聚点以后接下来就要进行初始分类,同样获得初始分类也有不同的
方法。需要说明的是,初始分类不一定非通过凝聚点确定不可,也可以依据其 他原则分类。
以下是其他几种初始分类方法: ①人为分类,凭经验进行初始分类。 ②选择一批凝聚点后,每个样品按与其距离最近的凝聚点归类。 ③选择一批凝聚点后,每个凝聚点自成一类,将样品依次归入与其距离
8/21/2024
14
1.2 聚类分析的种类
(2)系统聚类分析的一般步骤 ①对数据进行变换处理; ②计算各样品之间的距离,并将距离最近的两个样品合并成一类; ③选择并计算类与类之间的距离,并将距离最ቤተ መጻሕፍቲ ባይዱ的两类合并,如果累的个
数大于1,则继续并类,直至所有样品归为一类为止; ④最后绘制系统聚类谱系图,按不同的分类标准,得出不同的分类结果。
8/21/2024
18
1.2 聚类分析的种类
(7)可变法
1 2 D kr
2 (8)离差平方和法
(D k 2 pD k 2 q)D p 2q
D k 2 rn n ir n n p i D i2 pn n ir n n q iD i2 qn rn in iD p 2 q
8/21/2024

聚类分析综述范文

聚类分析综述范文

聚类分析综述范文聚类分析(Cluster Analysis)是一种数据分析技术,用于将相似的数据点分为不同的组或聚类。

这种统计技术非常有用,在许多领域中都被广泛应用,包括数据挖掘、图像处理、生物信息学、市场研究等。

聚类分析的目标是将数据点分为不同的组,每个组内的数据点彼此相似,而不同组之间的数据点则有较大的差异。

通过聚类分析,我们可以获得数据的结构,发现隐藏的模式和规律,从而对数据进行更深入的理解。

聚类分析的方法主要有两大类:层次聚类和划分聚类。

层次聚类方法将数据点组织成一棵树状结构,从而建立层次结构,同一层次上的数据点具有相似性。

划分聚类方法则将数据点划分为互不重叠的聚类,每个数据点仅属于一个聚类。

层次聚类方法有两种主要的算法:凝聚法和分裂法。

凝聚法从每个数据点作为一个独立的聚类开始,然后将具有最小距离的聚类合并,直到只剩下一个聚类。

分裂法则从所有数据点作为一个聚类开始,然后逐步将数据点分成越来越多的聚类,直到每个数据点都成为一个聚类。

划分聚类方法中最常用的算法是K-means算法。

K-means算法将数据点分成K个非重叠的聚类,其中K是用户定义的聚类数量。

算法开始时,根据初始的聚类中心随机分配数据点,然后通过计算每个数据点与每个聚类中心之间的距离,将数据点重新分配到最近的聚类中心。

然后,更新聚类中心,继续迭代直到满足停止准则。

除了这些经典的聚类方法,还有一些其他的聚类算法被提出,例如DBSCAN、OPTICS、谱聚类等。

这些算法在聚类分析过程中也起着重要的作用,并提供了不同的可选择的方法。

聚类分析在实际应用中具有广泛的应用,其中一个重要的应用领域是市场研究。

通过聚类分析,可以将顾客细分为不同的群体,从而更好地了解他们的需求和偏好。

这可以帮助企业开展有针对性的市场营销,并制定更好的产品策略。

另一个应用领域是图像处理。

聚类分析可以帮助我们对图像进行分割和分析,从而识别出图像中的不同对象和区域。

这对于计算机视觉和模式识别具有重要的意义。

聚类分析方法

聚类分析方法

聚类分析方法聚类分析是一种常用的数据分析方法,它可以帮助我们将数据集中的对象按照它们的相似性进行分组。

通过聚类分析,我们可以发现数据中的内在结构和规律,从而更好地理解数据。

在本文中,我们将介绍聚类分析的基本概念、常见的聚类方法以及聚类分析的应用场景。

首先,让我们来了解一下聚类分析的基本概念。

聚类分析是一种无监督学习方法,它不需要预先标记的训练数据,而是根据数据对象之间的相似性来进行分组。

在聚类分析中,我们通常会使用距离或相似度作为衡量对象之间关系的指标。

常见的距离指标包括欧氏距离、曼哈顿距离和余弦相似度等。

通过计算对象之间的距离或相似度,我们可以将它们划分到不同的类别中,从而实现数据的聚类。

接下来,让我们来介绍一些常见的聚类方法。

最常用的聚类方法包括层次聚类、K均值聚类和密度聚类。

层次聚类是一种基于对象之间相似性构建层次结构的方法,它可以分为凝聚式层次聚类和分裂式层次聚类。

K均值聚类是一种迭代的聚类方法,它将数据对象划分为K个类别,并通过迭代优化来找到最优的聚类中心。

密度聚类是一种基于数据密度的聚类方法,它可以发现任意形状的聚类簇,并对噪声数据具有较强的鲁棒性。

最后,让我们来看一些聚类分析的应用场景。

聚类分析可以应用于各个领域,例如市场营销、生物信息学、社交网络分析等。

在市场营销中,我们可以利用聚类分析来识别不同的消费群体,并针对不同群体制定个性化的营销策略。

在生物信息学中,聚类分析可以帮助我们发现基因表达数据中的基因模式,并识别相关的生物过程。

在社交网络分析中,我们可以利用聚类分析来发现社交网络中的社区结构,并识别影响力较大的节点。

总之,聚类分析是一种非常有用的数据分析方法,它可以帮助我们发现数据中的内在结构和规律。

通过本文的介绍,相信大家对聚类分析有了更深入的了解,希望能够在实际应用中发挥其价值,为各行各业的发展提供有力支持。

聚类分析在学术文献检索中的优化

聚类分析在学术文献检索中的优化

聚类分析在学术文献检索中的优化一、聚类分析概述聚类分析是一种将数据集中的对象分组的统计方法,目的是使得同一组内的对象相似度高,而不同组之间的对象相似度低。

在学术文献检索领域,聚类分析可以有效地帮助研究者从海量文献中发现主题相似的文献集,从而提高检索效率和准确性。

1.1 聚类分析的核心概念聚类分析的核心概念包括数据预处理、相似度度量、聚类算法和聚类评估。

数据预处理是聚类分析的第一步,包括数据清洗、标准化等。

相似度度量是衡量文献之间相似性的关键,常用的度量方法有余弦相似度、Jaccard相似度等。

聚类算法是实现聚类的核心,包括层次聚类、基于中心的聚类、密度聚类等。

聚类评估则是评价聚类效果的重要手段,常用的评估指标有轮廓系数、Davies-Bouldin指数等。

1.2 聚类分析的应用场景聚类分析在学术文献检索中的应用场景广泛,包括但不限于以下几个方面:- 主题发现:通过聚类分析,可以快速识别出文献集中的主要研究主题。

- 研究趋势分析:聚类可以帮助研究者发现某一领域的研究趋势和热点问题。

- 文献推荐系统:聚类分析可以作为文献推荐系统的基础,为用户推荐与其兴趣相似的文献。

- 学术网络构建:通过聚类分析,可以构建学术领域的合作网络,发现关键的研究者和机构。

二、聚类分析在学术文献检索中的优化策略聚类分析在学术文献检索中的应用并非一蹴而就,需要通过一系列的优化策略来提高其效果和效率。

2.1 数据预处理的优化数据预处理是聚类分析的基础,优化数据预处理可以显著提高聚类效果。

优化策略包括:- 关键词提取:采用自然语言处理技术,自动提取文献的关键词,作为聚类的特征。

- 文本向量化:将文本数据转换为数值型向量,常用的方法有TF-IDF、Word2Vec等。

- 异常值处理:识别并处理数据集中的异常值,避免影响聚类结果。

2.2 相似度度量的优化相似度度量是聚类分析的关键,优化相似度度量可以提高聚类的准确性。

优化策略包括:- 多维度相似度融合:结合多种相似度度量方法,综合考虑文献的多个方面。

聚类分析法经典案例

聚类分析法经典案例

聚类分析法经典案例聚类分析法是一种常用的数据分析方法,它通过对数据进行分类和分组,帮助我们发现数据中的内在规律和特征。

在实际应用中,聚类分析法被广泛运用于市场营销、社交网络分析、医学诊断、图像处理等领域。

下面,我们将介绍一些聚类分析法的经典案例,帮助大家更好地理解和应用这一方法。

首先,我们来看一个市场营销领域的案例。

某公司想要对其客户进行分类,以便更好地制定营销策略。

他们收集了客户的消费行为、年龄、性别、地理位置等数据,并利用聚类分析法对客户进行了分组。

通过分析,他们发现客户可以被分为三大类,高消费高端用户、中等消费稳定用户和低消费新用户。

有了这些分类信息,公司可以针对不同类型的客户制定不同的营销策略,提高市场营销效率。

其次,我们来看一个社交网络分析的案例。

一家社交媒体公司希望了解用户在平台上的行为和兴趣,以便更好地推荐内容和广告。

他们利用用户的浏览记录、点赞行为、评论信息等数据,通过聚类分析法将用户分为几个群体。

通过分析,他们发现用户可以被分为电影爱好者、音乐迷、美食达人等不同类型的群体。

有了这些分类信息,社交媒体公司可以更精准地为用户推荐内容和广告,提高用户满意度和广告点击率。

再次,我们来看一个医学诊断的案例。

医院收集了患者的临床症状、实验室检查结果、病史等数据,希望通过聚类分析法对患者进行分类,以便更好地制定治疗方案。

通过分析,他们发现患者可以被分为几个病情严重程度不同的群体。

有了这些分类信息,医生可以更好地制定个性化的治疗方案,提高治疗效果和患者生存率。

最后,我们来看一个图像处理的案例。

一家无人驾驶车辆公司希望通过图像识别技术对道路上的车辆和行人进行分类,以便更好地进行交通管理和安全预警。

他们利用摄像头采集的图像数据,通过聚类分析法将道路上的车辆和行人进行分类。

通过分析,他们可以更准确地识别不同类型的车辆和行人,并做出相应的交通管理和安全预警措施。

通过以上经典案例的介绍,我们可以看到聚类分析法在不同领域的广泛应用。

聚类分析外文文献

聚类分析外文文献
11 Cluster Analysis
The next two chapters address classification issues from two varying perspectives. When considering groups of objects in a multivariate data set, two situations can arise. Given a data set containing measurements on individuals, in some cases we want to see if some natural groups or classes of individuals exist, and in other cases, we want to classify the individuals according to a set of existing groups. Cluster analysis develops tools and methods concerning the former case, that is, given a data matrix containing multivariate measurements on a large number of individuals (or objects), the objective is to build some natural subgroups or clusters of individuals. This is done by grouping individuals that are “similar” according to some appropriate criterion. Once the clusters are obtained, it is generally useful to describe each group using some descriptive tool from Chapters 1, 8 or 9 to create a better understanding of the differences that exist among the formulated groups.

基于CiteSpace国内慕课研究的知识图谱可视化分析

基于CiteSpace国内慕课研究的知识图谱可视化分析

高师理科学刊Journal of Science of Teachers' College and University第41卷第1期2021年 1月Vol. 41 No.1Jan. 2021文章编号:1007-9831 ( 2021 ) 01-0075-05基于CiteSpace 国内慕课研究的知识图谱可视化分析岳新1张剑飞1王金环2(1.黑龙江科技大学计算机与信息工程学院,黑龙江哈尔滨150022; 2.黑龙江中医药大学第一临床医学院,黑龙江哈尔滨150040)摘要:在新冠肺炎疫情期间,教育部提出“停课不停教、停课不停学”,慕课等线上教学资源得 到充分利用,基于CiteSpace 软件,对知网上慕课研究的文献进行知识图谱可视化分析.通过对关键词节点、聚类和突现词的细节分析,发现研究者不同时期共同关注的热点问题,分析慕课模式 的发展演化过程,寻找慕课研究重点和未来趋势.关键词:CiteSpace ;知识图谱;慕课;在线课堂;可视化分析中图分类号:TP311 : G642.0文献标识码:A doi : 10.3969/j.issn.1007-9831.2021.01.019Visualization analysis of knowledge graph of domestic research ofMOOC based on CiteSpaceYUE Xin 1, ZHANG Jianfei 1, WANG Jinhuan 2(1. School of Computer and Information Engineering, Heilongjiang University of Science and Technology, Harbin 150022, China;2. Heilongjiang University of Chinese Medicine, First School of Clinical Medicine, Harbin 150040, China )Abstract : During the epidemic period of Covid-19, the Ministry of Education put forward the idea of stopping classeswithout stopping teaching , stopping classes without stopping learning , and massive open online course ( MOOC ) andother online teaching resources were fully utilized. Based on CiteSpace software , carry out the knowledge mapvisualization analysis on the literature of MOOC research on the CNKI. Through the detailed analysis of key wordnodes,clusters and emergent words,the hot issues of common concern to researchers in different periods were found,and the development and evolution process of MOOC model was analyzed to seek out the research focus and futuretrend of it.Key words : CiteSpace ; mapping knowledge domains ; MOOC ; online course ; visualization analysis2020年新冠肺炎在全球蔓延,教育部要求各高校应充分利用线上的慕课和省、校两级优质在线课程教学资源,在慕课平台等支持带动下,实现“停课不停教、停课不停学” [T.慕课(Massive Open Online Course,MOOC,大规模开放在线课程),大规模化、开放性、在线网络化和创新性是它的4个主要特征.今年第一季度,慕课新增约5 000门,疫情期间学习慕课人数成爆炸性增长[3-4],国内慕课资源得到了充分的应用.本文利用知识图谱对国内慕课研究重点和未来趋势进行可视化分析.收稿日期:2020-08-17基金项目:黑龙江省教育规划科学"十二五”规划重点课题(GJB1319128);黑龙江中医药大学创新团队项目(2019TD03)作者简介:岳新(1977-),男,黑龙江绥化人,副教授,硕士,从事知识图谱、大数据分析研究.E-mail: **************通信作者:王金环(1977-),女,黑龙江绥化人,主任医师,博士,从事中医血液病学及其教学的研究.E-mail : ****************76高师理科学刊第41卷1研究方案1.1研究工具CiteSpace是一款用于分析和可视化展示科学文献的趋势及动态的Java应用程序,是一个多元、分时、动态和可视化分析工具.主要包括合作分析、共现分析和共被引分析,提供时间切片功能,可以按照年份对文献进行切片分析[5-7].对于数据庞大的学科,可以使用网络切割,主要方法是最小树切割法和网络切片法.将数据以Refworks格式导出后通过CiteSpace将数据转换,设置时间切片阈值,确定文献的时间区间,选择需要分析的类型节点,采用节点、聚类和突现词显示整个网络的方法将数据以可视化的形式呈现.将知识图谱中信息以图或表的形式显示出来以供细节分析[7-8].1.2数据来源和阈值选择文献以知网数据库平台期刊为来源数据进行统计.以主题“慕课”或“MOOC”或“MOOCS”或“大规模开放在线课程”或“大规模开放性在线课程”,来源选择知网上SC I来源期刊,EI来源期刊,核心期刊,CSSCI,CSCD期刊的中文文献.统计时间为2012-01-01—2020-03-31.共统计出2824条相关文献,经过筛选、剔除报告类文章,最终有效文献2697条.采用CiteSpace软件5.7.R2.7z版本对其进行可视化分析.选取时间间隔2012—2020年,时区切片为1年,选择N=30,Top N%=5%up to50(C,CC,CCV)默认原值,进行共词分析,算法选择Pathfinder,Pruning sliced networks,Pruning the merged network,可视化采用Cluster View-Static,Show Merged Network®7].2国内慕课研究的知识图谱分析2.1合作作者分析设置节点为作者进行分析,了解重要学者分布与合作关系.样本中共有288个节点,141个边,网络密度为0.003 4.从网络图(见图1)可以了解,当前作者合作分散不密切,形成陈丽、郑勤华研究团队;从图片边线蓝色绿色橙色看,该团队从2013年到现在一直有持续的研究,经阅读相关文献发现,陈丽、郑勤华[9-14]团队主要进行慕课的理论和调查研究.汪琼[15-16]的研究多为慕课的理论和发展.肖俊洪[17-18]研究的合作者多为外籍研究者,主要进行慕课发展理论研究.张立彬[19-20]的研究较晚,从2016年开始主要研究图书馆慕课版权.钱小龙[21-22]的研究多以加州大学欧文分校为例,进行结构和商业模式研究.从图谱可以看出陈丽、郑勤华有合作构成一个研究团队,汪琼不能称为一个研究团队但有一位合作研究者,其他几位作者都是单独节点,没有形成研究团队.从这主要的6位研究者看,大部分进行慕课理论和发展研究,涉及具体应用的较少.谟逸洲'苗|3锡斌韭建钢哦小龙械杰济晓明徐晓E(H甫中狂*富砂立彬\C许涛\療新民個洪罚丽/7\券成如花/\\I硝俊洪嘗/\\旭图1作者合作网络可视化图M S A RSK4-MI■:xr呂益i常*'urm>CC”H和2.2研究机构分析设置节点为机构进行分析,可以了解机构之间合作关系(见图2).样本中共有181个节点,61个边,网络密度为0.0037.从网络图谱中可以看出,主要研究机构为师范类大学或者大学的教育学院或信息技术类学院,也有图书馆或出版社等机构,符合慕课的研究群体.北京大学和北京师范大学有合作,主要是陈丽、郑勤华研究团队.慕课早期建设一般都是以学校为单位各个学科进行,学校与学校之间较少形成合作关系.随着慕课研究和建设的逐渐成熟,将会形成多个学校进行慕课研究和建设的合作.2.3研究热点分析2.3.1关键词共词分析节点设置为关键词,运行CiteSpace生成关键词共现知识图谱(见图3),有140个节点,155个边,网络密度为0.0159.节点圈的大小选择表示关键词频率大小,连线颜色表示时间,绘制出热点关键词频率排序表(见表1),包括频率、中心性、首次出现年份、关键词4个属性.从知识图谱的角度分析,中心性和频次高的关键词代表研究者共同关注的问题,即研究热点.频次越高,点中心性第1期岳新,等:基于CiteSpace 国内慕课研究的知识图谱可视化分析77越高,说明节点在该领域愈重要."卜怖楹犬技术7院【西师柜人学教務华人学菽冇餅允IK$内前祖大技术7院"ll头广播电8!大学. ■鲁教ff ill版社鱼逖学院申?fdM 理学屁 q、 I 师越大佯远Wttff研宛中心图2研究机构网络图图3关键词共现图表1热点关键词频率排序频率中心性年份关键词频率中心性年份关键词9620.112013MOOC540.042013在线课程6120.812013慕课5402014在线学习2200.552014翻转课堂490.182014微课990.262014SPOC 482013大数据940.042014教学模式440.262014图书馆900.042014教学改革4402015在线开放课程880.112014高校图书馆430.142015互联网+860.042013高等教育370.222014“慕课”830.642013在线教育370.112014教学设计590.082015混合式教学360.082014思想政治理论课580.482013大规模开放在线课程320.482013远程教育时区视图(timezone )是一种侧重于从时间维度上来表示知识演进的视图(见图4),它可以清 晰地展示出文献的更新和相互影响,其中图中文字显示的是关键词中心度大于0.1的关键词,中心性 大于0.1的关键词有研究意义.2.3.2关键词聚类分析CiteSpace 依据谱聚类算 法提供了自动聚类的功能,并提供了从聚类施引文 献中提取聚类主题词的3种算法,对检索的文献信 息进行关键词共现网络分析,共现网络形成大小聚类共15个.按照聚类大小和研究的相关度,结合TF*IDF 加权算法和 LLR (log-likelihood ratio )算法 抽取的标识词,代表了当前该领域研究的主要热点图4关键词时区视图领域和基本的研究主题.CiteSpace 依据网络结构和聚类的清晰度,提供了模块值(Q 值)和平均轮廓值(S值)2个指标,它可以作为评判图谱绘制效果的一个依据.一般而言,Q 值在[0,1]区间内,Q>0.3就意味着划分出来的社团结构是显著的.当S 值在0.5以上,聚类一般认为是合理的,当S 值在0.7以上,聚类是高效率令人信服的.聚类视图(cluster )见图5,节点数100,连线数106,密度0.021 4, Q 值0.783 6, S值0.633 2.它侧重于体现聚类间的结构特征,突出关键节点及重要连接.时间线视图(Timeline )见图6,侧重于勾画聚类之间的关系和某个聚类中文献的历史跨度.主要介绍4个最大聚类,规模最大聚类#0开放 教育资源,轮廓值0.952,最活跃的文章是袁莉[23]等(2013 )大规模开放在线课程的国际现状分析.文章对大规模开放在线课程(MOOCs )进行了综述分析,讨论了可持续发展、教学方法和质量以及考核和学分方78高 师 理 科 学 刊第 41 卷面的问题.第二大规模聚类# 1xMOOC,轮廓值0.932,最活跃的文章是王萍[24](2013 )大规模在线开放课程的新发展与应用:从cMOOC 到xMOOC.文章对MOOC 主要有2种模式进行了探讨,即基于关联主义学习理论的cMOOC 模式和基于行为主义学习理论的xMOOC 模式.第三大规模聚类#2高校图书馆,轮廓值0.951,最活跃的文章是郑伟[25](2014)MOOCs 背景下的高校图书馆服务探索与思考.文章探讨高校图书馆在面向慕课学生、教师提供服务等,以及对版权保护和数字化技术提供支持服务.第四大规模聚类#3成人 教育,轮廓值0.841,最活跃的文章是陈豪[26](2014)“慕课”对高校思想政治理论课教学改革的启示.文 章讨论了慕课对高校思想政治理论课教学改革的启示,提岀慕课可以作为思想政治理论课教学的重要补 充.育!学模式I 转课堂#0开放教冇资源女敕玮/ 蘇而在线课'#2商校图蝶[J 刀OOC€线课程\ #1 cmooc-車联网+#3心人教育#9网络课程课#6微谍图5关键词聚类视图#8教育信息化世跌治理论课 、栽育#5教v 模式:践 职业戲育"圮联网+” 混合敦孚2.3.3关键词突现性研究 突现性(Burstness )通过对关 键词跟踪分析它们在不同时间区间内出现频率的突然变 化(激增),识别出代表研究前沿的若干关键词,以辨识研究前沿的结构及发展演化(见图7).结合图7突现词 时间可知,信息技术、“互联网+”是近4年的研究热点;在线开放课程、混合式教学、在线课程是近3年的研究热点,其中混合式教学突现值最大.通过关键词的频率、中心性、突现性等综合判断,发现关键词:信息技术、在线教育、开放教育资源、混合式教学、学习者、微课程、“互联网+”实验教学、个性化学习等是未来慕课研究的方向.3结语通过可视化分析,了解到慕课从2012年出现,迅速发展,关键词在线开放课程、混合式教学和在线课程是近图6关键词时间线视图Top 17 Keywords with the Strongest Citation BurstsKeywords Year Strength Begin End 2012 - 2020在线教育2012 3.3174 20137014 __课程20123 1469 20132014__开放教育资源2012 4.2396 20137014 7-—201223336 20137014 na ._ __尢抑橙开能在线谗袒232 3.3846 20137014 na .___网络课稈20124.0298 20142015 ■■微课程2012 3.6926 20142015 ■■个性怦学习2012 3.3556 20142015 ■■中华人民共和国2012 5.3816 20142015■■20124 5282 20152016 ■■信息素养教育2012 4.022 ******** ■■实验教学2012 3.6658 20172018 ■■20124.7172 20172020 ■■■■信息技术20125.9846 20172020 ■■■■在线开放课程2012 5.9598 20182020 ■■■混合式教学20129.8146 20182020 ■■■在线课程201277S7 201R2020 —图7关键词突变性图3年研究的突现关键词,说明慕课在不断演化.而2014年出现的关键词SPOC (频率99,中心性0.26)更是提出了小规模限制性在线课程的许多优点.同年出现的关键词微课(频率49,中心性0.18 )强调短时间微视频,碎片化学习.2019年出现的新关键词金课(中心性0.61),是教育部提出的五大金课总称,其中包括线上金课和线上线下金课,线上金课更像是慕课模式的改进版,线上线下金课和SPOC 模式比较接近.第1期岳新,等:基于CiteSpace国内慕课研究的知识图谱可视化分析79最高突现值(9.8146)关键词混合式教学一直都是慕课研究的重点,它可以和包括MOOC在内的许多在线教学模式相结合.这些慕课模式的发展演化,是在外部条件正常情况下进行的,但现在外部条件发生了巨大变化,疫情期间,所有教师完全线上授课.这就使包括慕课模式在内的线上课程成为唯一的教学方式,线上教学模式大部分选择“慕课+线上答疑”或线上直播课.截止2020年4月3日教育部高教司统计全国在线开学的普通高校共计1454所,95万余名教师开设94.2万门、713.3万门次在线课程,参加在线课程学习的学生达11.8亿人次.可以看出,包括慕课等在线教学模式在经历这次大规模高校师生参与后,未来将会更快更好地发展,其相应的理论研究也会更深入.参考文献:[1]杨海军,张惠萍,程鹏.新冠肺炎疫情期间高校在线教学探析[J].中国多媒体与网络教学学报:上旬刊,2020(4):194-196[2]余闯.教育部印发指导意见一疫情防控期间做好高校在线教学组织与管理工作[J].现代教育技术,2020,30(2):1[3]张鸯远.“慕课”(MOOCs)发展对我国高等教育的影响及其对策[J].河北师范大学学报:教育科学版,2014,16(2):116-121[4]冯智文.中国外语金课的内涵及其建设方略[J].外语教学,2020,41(2):59-63[5]陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253[6]侯剑华,胡志刚.CiteSpace软件应用研究的回顾与展望[J].现代情报,2013,33(4):99-103[7]胡玥,董永权,杨淼.基于CiteSpace的国内翻转课堂研究现状与趋势研究[J].高教探索,2017(11):50-57[8]王晴.我国MOOCs研究的网络结构与主题聚类一基于CiteSpace皿的知识图谱分析[J].中国远程教育,2015(5):18-23,79[9]郑勤华,李秋菊,陈丽.中国M O OCs教学模式调查研究[J].开放教育研究,2015,21(6):71-79[10]王志军,陈丽,郑勤华.MOOCs的发展脉络及其三种实践形式[J].中国电化教育,2014(7):25-33[11]郭文革,陈丽,陈庚.互联网基因与新、旧网络教育——从MOOC谈起[J].北京大学教育评论,2013,11(4):173-184[12]李小杉,陈丽,王文静,等.联通主义视阈下的cMOOC知识生产的实证研究一基于机器学习的对比分析[J].中国远程教育,2020(1):23-34,76[13]陈丽,逯行,郑勤华.“互联网+教育”的知识观:知识回归与知识进化[J].中国远程教育,2019(7):10-18,92[14]陈丽.“互联网+教育”的创新本质与变革趋势[J].远程教育杂志,2016,34(4):3-8[15]汪琼.高校面对慕课:机遇与挑战[J]中国高等教育,2015(24):7-8[16]汪琼.美国慕课评优原则分析[J].现代远程教育研究,2017(3):50-57[17]梅雷亚德•尼克•朱拉•梅西尔,马克•布朗,肖俊洪.慕课同心圈式发展:从高等教育破坏性创新向持续性创新模式的转变[J]中国远程教育,2019(3):58-68,93[18]杰里米•诺克斯,肖俊洪.慕课革命进展如何:慕课的三大变化主题[J].中国远程教育,2018(1):53-62,80[19]张立彬.慕课环境中图书馆版权服务的内容与思考[J].图书馆工作与研究,2016(3):32-35[20]张立彬,吴嘉敏.慕课环境下美国高校图书馆的MOOC版权指南文件探赜[J].图书馆学研究,2019(14):88-97[21]钱小龙.大学慕课商业模式的成本结构解析一以加州大学欧文分校为例[J].教育学术月刊,2019(7):103-111[22]钱小龙,盖瑞•马特金.加州大学欧文分校慕课商业模式的客户关系解析[J].现代远距离教育,2017(4):75-83[23]袁莉,斯蒂芬•鲍威尔,马红亮.大规模开放在线课程的国际现状分析[J].开放教育研究,2013,19(3):56-62, 84[24]王萍.大规模在线开放课程的新发展与应用:从cMOOC到xMOOC[J].现代远程教育研究,2013(3):13-19[25]郑伟,梁霞.MOOCs背景下的高校图书馆服务探索与思考[J].图书馆理论与实践,2014(9):59-63[26]陈豪.“慕课”对高校思想政治理论课教学改革的启示[J].思想理论教育,2014(4):70-73。

聚类分析案例

聚类分析案例

聚类分析案例聚类分析是一种常用的数据挖掘技术,它可以帮助我们将数据集中具有相似特征的对象进行分组,从而揭示数据内在的结构和规律。

在本文中,我们将通过一个实际的案例来介绍聚类分析的应用。

案例背景:某电商平台希望对其用户进行分群,以便更好地了解用户的特征和行为习惯,从而精准推荐商品、提高用户满意度和促进销售额的增长。

为了实现这一目标,我们将运用聚类分析技术对用户数据进行分析。

数据准备:我们收集了一定时间内的用户行为数据,包括用户的浏览记录、购买记录、点击广告的次数、收藏商品的数量等信息。

这些数据将作为聚类分析的输入。

聚类分析步骤:1. 数据预处理,首先,我们需要对收集到的原始数据进行清洗和预处理,包括去除异常值、缺失值处理、数据标准化等工作,以确保数据的质量和可靠性。

2. 特征选择,在进行聚类分析之前,我们需要对数据进行特征选择,选择能够代表用户特征和行为的变量作为聚类的特征,例如购买频率、浏览深度、活跃时段等。

3. 模型选择,根据业务需求和数据特点,我们可以选择合适的聚类分析模型,常用的包括K均值聚类、层次聚类、密度聚类等。

4. 聚类分析,在选择好模型后,我们可以利用数据挖掘工具(如Python中的scikit-learn库)进行聚类分析,将用户分成若干个群体,并对每个群体的特征进行分析和解释。

案例结果:经过聚类分析,我们将用户分成了三个群体,高消费用户、低消费用户和潜在用户。

高消费用户的购买频率和客单价较高,对促销活动和新品推荐比较敏感;低消费用户购买频率较低,但对特价商品和折扣活动有一定的响应;潜在用户则具有较高的点击广告次数和浏览深度,但购买行为较少。

通过对不同群体的特征分析,电商平台可以有针对性地制定营销策略,提高用户的满意度和促进销售额的增长。

结论:通过本案例的聚类分析,我们可以看到聚类分析在电商领域的重要应用价值。

通过对用户行为数据的聚类分析,电商平台可以更好地了解用户的特征和行为习惯,从而精准推荐商品、提高用户满意度和促进销售额的增长。

聚类检索过程

聚类检索过程

聚类检索过程(原创版)目录1.聚类检索的定义和目的2.聚类检索的过程3.聚类检索的应用4.聚类检索的优缺点正文一、聚类检索的定义和目的聚类检索是一种将大量文献按照相似度进行分组的方法,其目的是为了帮助用户在大量文献中快速找到与自己需求相关的文献。

聚类检索不同于传统的检索方法,它不需要用户输入明确的检索词,而是通过计算文献之间的相似度来进行分组和排序。

二、聚类检索的过程聚类检索的过程主要包括以下几个步骤:1.预处理:对文献进行预处理,包括去除停用词、词干提取、词形还原等操作,以便于后续计算相似度。

2.计算相似度:利用相似度计算方法(如余弦相似度、Jaccard 相似度等)计算文献之间的相似度。

3.聚类:根据计算出的相似度,将文献分为若干个类别。

常用的聚类方法有 K-means、DBSCAN 等。

4.排序和展示:按照聚类结果对文献进行排序和展示,以便于用户阅读和分析。

三、聚类检索的应用聚类检索在许多领域都有广泛应用,如信息检索、知识图谱、数据挖掘等。

通过聚类检索,可以在海量数据中快速定位相关信息,提高工作效率。

四、聚类检索的优缺点聚类检索具有以下优点:1.不依赖于预先设定的检索词,能够发现未知的关联信息。

2.能够处理多义性、模糊性等复杂情况。

3.支持用户根据需要调整聚类参数,以获得更精确的结果。

然而,聚类检索也存在一定的局限性:1.对于一些专业领域的文献,预处理可能不够充分,导致聚类效果不佳。

2.聚类算法的性能受限于计算能力和数据规模。

3.聚类结果可能受到初始聚类中心的影响,导致局部最优解。

总之,聚类检索作为一种新型的文献检索方法,具有很大的潜力和应用价值。

聚类分析ppt课件

聚类分析ppt课件
第七章 聚类分析
第一节 引言 第二节 相似性的量度 第三节 系统聚类分析法 第四节 K均值聚类分析 第五节 两步聚类分析
1
第一节 引言
什么是聚类分析? ❖ 聚类分析是根据“物以类聚”的道理,对样本或指
标进行分类的一种多元统计分析方法,它们讨论的 对象是大量的样本,要求能合理地按各自的特性进 行合理的分类,没有任何模式可供参考或依循,即 在没有先验知识的情况下进行的。
1.明考夫斯基距离
p
dij (q) (
X ik X jk )q 1/ q
k 1
明考夫斯基距离简称明氏距离。
(7.1)
13
按q的取值不同又可分成下面的几个式子
(1)绝对距离( q 1)
p
dij (1) X ik X jk k 1
பைடு நூலகம்
(7.2)
(2)欧氏距离( q 2)
p
dij (2) (
X ik X jk )2 1/ 2
22
第三节 系统聚类分析法
一 系统聚类的基本思想 二 类间距离与系统聚类法
23
一、系统聚类的基本思想
❖ 系统聚类的基本思想是:距离相近的样品(或变量)先聚成 类,距离相远的后聚成类,过程一直进行下去,每个样品( 或变量)总能聚到合适的类中。系统聚类过程是:假设总共 有n个样品(或变量),第一步将每个样品(或变量)独自 聚成一类,共有n类;第二步根据所确定的样品(或变量) “距离”公式,把距离较近的两个样品(或变量)聚合为一 类,其它的样品(或变量)仍各自聚为一类,共聚成n 1类 ;第三步将“距离”最近的两个类进一步聚成一类,共聚成 n 2类;……,以上步骤一直进行下去,最后将所有的样品 (或变量)全聚成一类。为了直观地反映以上的系统聚类过 程,可以把整个分类系统画成一张谱系图。所以有时系统聚 类也称为谱系分析。除系统聚类法外,还有有序聚类法、动 态聚类法、图论聚类法、模糊聚类法等。

聚类方法在标准引用分析中的应用

聚类方法在标准引用分析中的应用

聚类方法在标准引用分析中的应用
聚类方法是一种常见的数据分析技术,它在标准引用分析中有着广泛
的应用。

标准引用分析是指通过对科学论文的引文进行分析,来揭示学术
界的研究重点、学科之间的关系和学术合作网络等信息。

下面将详细介绍
聚类方法在标准引用分析中的应用。

首先,聚类方法可以帮助发现研究领域的热点主题。

研究者可以通过
将文献的引用关系构建成引用网络,然后利用聚类方法对引用网络进行分析。

聚类会将具有相似引用关系的文献聚集到一起,从而形成一些独立的
研究主题群。

通过对这些聚类结果进行分析和解释,研究者可以发现研究
领域中的热点主题,提前了解到重点研究方向。

此外,聚类方法还可以帮助揭示学术合作网络。

在标准引用分析中,
研究者常常关注的问题之一是研究者之间的合作关系。

聚类方法可以通过
分析文献的引用关系,将那些相互引用的文献聚集到一起,形成一个独立
的聚类,这些聚类代表了研究者之间的合作网络。

通过对聚类结果的分析,研究者可以了解到学术合作网络的结构、研究者之间的合作强度和合作的
主题方向等信息。

最后,聚类方法还可以帮助找到标杆文献。

在标准引用分析中,研究
者通常会找到一些具有重要影响力的标志性文献。

聚类方法可以对引用网
络进行分析,找到那些受到大量其他文献引用的文献,这些文献往往是标
杆文献。

通过对聚类结果的分析,研究者可以找到标杆文献,了解它们的
研究主题、影响力和引用网络的结构等信息。

聚类分析毕业论文

聚类分析毕业论文

聚类分析毕业论文聚类分析毕业论文在当今信息爆炸的时代,数据分析已经成为了各个领域中不可或缺的一环。

无论是商业决策、医学研究还是社会调查,数据分析都扮演着重要的角色。

而聚类分析作为一种常用的数据分析方法,也在各个领域中得到了广泛的应用。

本篇文章将围绕聚类分析在毕业论文中的应用展开讨论。

聚类分析是一种无监督学习的方法,其目的是将数据集中的对象划分为不同的群组,使得同一群组内的对象相似度较高,不同群组之间的相似度较低。

在毕业论文中,聚类分析可以用来对研究对象进行分类,从而更好地理解和解释数据。

首先,在社会科学领域的毕业论文中,聚类分析可以帮助研究者对调查样本进行分类。

以教育领域为例,研究者可能对不同学校的学生进行调查,以了解他们的学习动机、学习成绩等因素。

通过聚类分析,可以将学生划分为不同的群组,比如高成绩组、低成绩组、高动机组、低动机组等。

这样,研究者可以更好地理解不同群组之间的差异,从而提出相应的教育政策建议。

其次,在商业领域的毕业论文中,聚类分析可以帮助研究者对市场进行细分。

以市场营销为例,研究者可能对某种产品的消费者进行调查,以了解他们的购买偏好、消费行为等因素。

通过聚类分析,可以将消费者划分为不同的群组,比如高价值客户、低价值客户、忠诚客户、潜在客户等。

这样,研究者可以有针对性地制定营销策略,提高市场竞争力。

此外,在医学领域的毕业论文中,聚类分析可以帮助研究者对疾病进行分类。

以癌症研究为例,研究者可能对患者的基因表达数据进行分析,以了解不同基因的表达模式与疾病的关系。

通过聚类分析,可以将患者划分为不同的群组,比如不同亚型的癌症患者。

这样,研究者可以更好地理解不同亚型之间的差异,从而为个性化治疗提供依据。

最后,在自然科学领域的毕业论文中,聚类分析可以帮助研究者对实验数据进行分类。

以生态学研究为例,研究者可能对不同地区的生物多样性进行调查,以了解不同物种的分布规律。

通过聚类分析,可以将不同地区划分为不同的群组,比如高物种多样性地区、低物种多样性地区等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Firm heterogeneity and location choice of Chinese firms in Latin America and the Caribbean:Corporate ownership,strategic motives and host country institutions ☆Yue LIN ⁎CEAO,UAM,SpainModulo III-215B,Centro de Estudios de Asia Oriental,Ciudad Universitaria de Cantoblanco,Calle Francisco Tomás y Valiente,1,28049Madrid,Spaina r t i c l e i n f o ab s t r ac tArticle history:Received 9July 2014Received in revised form 2March 2015Accepted 2March 2015Available online 9March 2015China's ODI in Latin America and the Caribbean is entering into the second phase with diversi fication of economic actors and industries of investment.This paper extracts the approved projects by the Chinese Ministry of Commerce from its online database between 2003–2012,and fits a random effect negative binomial regression model.Our statistical estimates on the one hand con firm some of the previous findings on the disparity between Chinese public and private investors in their ODI motivations and perception of risks,on the other hand find that host country institutions are not purely ownership speci fic,but also contingent on industries and activities in which firms tend to invest.The direction of institutional effect is not consistent across sectors and firm types.The revealed complexity of China's ODI in Latin America and the Caribbean suggests a multi-level framework in further research,which treats Chinese transnational firms as endogenously heterogeneous beyond the dichotomous categorisation according to corporate ownership.©2015Elsevier Inc.All rights reserved.JEL classi fications:F21F23O53O54Keywords:ChinaLatin AmericaForeign direct investment Corporate ownership1.IntroductionDespite of geographical remoteness,the economic relationship between China and Latin America and the Caribbean (LAC)has en-tered into the second phase,from that led by commercial exchanges to a more profound connection bounded by the capital flows.China's outward direct investment (ODI)in the region has increased tenfold in less than ten years,reaching more than US$10billion in 2010and 2011.Even adjusted by its concentration in the Cayman Islands and British Virgin Islands,according to the estimation of ECLAC (2011),China was still the third largest investor in terms of ODI flows in the region,behind the United States and the Netherlands in 2010.However,the increasing visibility of Chinese firms in LAC received more doubts (if not critics)than applauses.For most external observers,China's ODI in LAC is qualitatively speci fic because of the dominant presence of Chinese state-owned enterprises (SOE),and the high concentration in extractive industries.1China's ODI is thus presented as no more than an illustrating case of China's grand external strategy with its Southern partners,seeking to secure its resources sources (Peters,2013).This escalatesChina Economic Review 34(2015)274–292☆I thank Kefei You and Guglielmo Maria Caporale (Guest Editors)and two reviewers for excellent guidance,and very helpful comments.Financial support from the Spanish National Research Project No.FFI2011-25897is gratefully acknowledged.All views and errors are of the author and not those of the sponsor.⁎Modulo III-215B,Centro de Estudios de Asia Oriental,Ciudad Universitaria de Cantoblanco,Calle Francisco Tomás y Valiente,1,28049Madrid,Spain.Tel.:+34914976695;fax:+34914975278.E-mail address:yue.lin@uam.es .190%of China ’s ODI in 2010were in extractive activities (ECLAC,2011)./10.1016/j.chieco.2015.03.0011043-951X/©2015Elsevier Inc.All rightsreserved.Contents lists available at ScienceDirectChina Economic Reviewthe concerns about “deindustrialization ”and “re-primarization ”of regional economies,already triggered by bilateral commercial imbalances (Gallagher &Porzecanski,2008;Jenkins &Barbosa,2012;Jenkins,Peters,&Moreira,2008;Mesquita Moreira,2007).More critically,if strong and assertive home government speeds up the internationalization of Chinese SOEs,geopolitical motive at least complements economic rationale in explaining their expansion in LAC (Tulder,2010).As a form of diplomacy,China's ODI in LAC is characterized by a relatively high concentration in countries plagued by limited civilian liberty and political instability.There-fore,China's ODI is parallel to that originating from industrialized countries,which have increasingly targeted service and manufactur-ing sectors and rewarded the countries with better local governance (Peters,2013).More tolerant of risk and less demanding of the legal system,China's ODI implies greater political challenges in LAC,where ef ficient institution building is deemed to be essential for future development.Nevertheless,the current political discourse on China's ODI in LAC tends to identify Chinese SOEs as representing China,and overlooks thousands of privately-owned enterprises (POE)also active in the region.By 2013,among 183veri fied green field projects,76projects were carried by POEs with an estimated capital investment equivalent to US$10billion,accounting for almost one third of total investment engaged.2Under such circumstance,any attempt to infer the existence of a consistent and coherent national strategy guiding China's ODI in LAC bears a special burden.It is required to answer whether the internationalization strategy of Chinese POEs when entering into LAC is con figured in the same manner as their SOE counterparts by the political preference and national interests,and to what extent their ODI patterns are converged to a high-risk and aggressive one.Given the importance of these questions,relevant empirical studies are surprisingly scant.Most of the previous works are designed to test Dunning's eclectic paradigm (Dunning,1973;1980)by using the aggregate value of China's ODI as the dependent variable (Buckley et al.,2007;Cheng &Ma,2010;Cheung &Qian,2009;Huang &Wang,2011;Hurst,2011;Kang &Jiang,2012;Kolstad &Wiig,2012;San filippo,2010).However,ODI data at the aggregate level,as acknowledged by Buckley,Cross,Tan,Xin,and Voss (2008),makes analytical techniques,such as regression analysis,an imperfect method working by inference about the strategic motives at firm level.Moreover,because of potential extreme values that characterize the capital-intensive extractive projects,aggregate ODI data suffer from the skewed data structure that would affect adversely the model fit and estimations (Ramasamy,Yeung,&Laforet,2012).Finally,without suf ficient disaggregation of data input,those studies are unable to distinguish the investment patterns between firms of distinct ownership structure.Most recently,some researchers recourse to alternative data sources,such as survey results (Duanmu,2012),financial reports of listed companies (Ramasamy et al.,2012),and commercial database (Amighini,Rabellotti,&San filippo,2013)to measure the ownership effects on location choices of Chinese firms investing abroad.This article contributes firstly to this still limited empirical stream by exploring a publicly accessible database maintained by China's Ministry of Commerce (MOFCOM),which keeps raw information about all approved ODI projects.To our best knowledge,it is the first empirical work of this kind concerning China's ODI in LAC.MOFCOM's data allow us not only to disaggregate China's ODI projects in the region by ownership of investors but also by internationalization strategic motives.The second contribution is to extend the current debate on ownership differentiation into a broader framework on firm heterogeneity.To do this,we take into account strategic motives of ODI captured by the industries and activities Chinese firms tend to invest.We introduce simple industry dummies into the standard model in order to evaluate more precisely how the interaction between corporate ownership and host country institutions could be moderated by strategic intents of globalization.We argue that corporate ownership and strategic intent of globalization are two related but different dimensions of firm heterogeneity.Even if ownership remains an important differentiator of Chinese firms,within each group of firms de fined by their ownership structure,there are differences in the internationalization strategies at firm level that may alter the magnitude and direction of institutional effects interacted with investors'ownership structure.In other words,we believe that host country institutional effect on the location choice of Chinese firms is not solely ownership speci fic,but also contingent on firms'motivation of internalization.In order to understand better the complexity of investment behavior of Chinese firms,we suggest a multi-level analytical framework that integrates institution-based view,resource-based view and industry-based view.The following part of the paper is organized in four sections.Section 2reviews the theoretical arguments and presents our research hypotheses.Section 3provides a detailed description of dataset and methodology,and Section 4discusses the empirical findings,which lead to the concluding remarks presented in Section 5.2.Theoretical arguments and hypothesis developmentExtant literature well documents the unique characteristics of Chinese multinationals,seemingly undaunted by the risks that Western firms have associated with internationalization.Two strands of arguments are provided.First of all,Chinese firms are described as risk lovers because of the active role of home government.Strong and assertive home government could speed up the internationalization strategies of dominant national firms,especially when they are state-owned companies.Tulder (2010)thus in-troduces a mesoeconomic layer of analysis of BRIC 3companies,focusing mainly on the relationship with the home country government,and suggests a renewal of Raymond Vernon's obsolescing bargain argument in the way that it is rather the BRIC governments instead of companies themselves that are prepared to bargain directly with host country governments.Geopolitical motives of the home governments were obvious behind ODI from China and Russia in the resources sector.In the extreme case,as Zweig and Jianhai (2005)have claimed,“Beijing's resource-based foreign policy has little room for morality ”.While the majority of2 ,consulted June 9th of 2014.3Created by Jim O'Neill in 2001,BRIC is a grouping acronym that refers to the countries of Brazil,Russia,India and China,which are all deemed to be at a similar stage of newly advanced economic development.275Y.Lin /China Economic Review 34(2015)274–292276Y.Lin/China Economic Review34(2015)274–292surplus in natural resources in general and oil in particular are located in high political risk areas,China as latecomer has gone into business with states avoided by other countries,such as Sudan,Chad,Angola,Myanmar,Iran and Venezuela(Gao,2009).China's ODI in LAC,one major natural resources exporting region,is thus expected to be not risk averse.Under this approach,Chinese firms'tolerance of political risk is explained by the substitution offirms'own economic rationale by Beijing's geopolitical alliance with certain periphery states and national strategy to secure the resources sources.While the economic return of investment is not the main objective,host country institution as well as investment risk becomes irrelevant.The second strand of arguments emphasize home country embedded advantages that Chinesefirms can derive from the experience of operating at home and coping with home country conditions(Buckley et al.,2007;Buckley et al.,2008;Voss, Buckley,&Cross,2009).A company's experience at home with political and regulatory processes may influence its tolerance of political risk when investing abroad.Having developed in riskier political and economic environments,Chinesefirms may gain experience,familiarity and expertise to maneuver the business in a weak institutional environment by western standards(Buckley et al.,2007;Buckley et al.,2008;Quer,Claver,&Rienda,2011),and depend on the global ethnic and family networks to cope with uncertainties(Bräutigam,2003;Erdener&Shapiro,2005).Their notions of risk can thus be very different from those of developed countries'companies.Chinesefirms,as well as other emerging market multinationals,can leverage their capabilities developed at home markets as competitive advantages in other developing countries with similar institutional and political environments.In other words,it is not the institution quality per se of a focal country,but rather the institutional distance between home and host country that matters whenfirms invest abroad.The greater the level of political risk in the home country,the less sensitive to political risk they tend to be.Therefore,Chinesefirms,even if they are not vehicles of ODI projects steered by their home country government, could still turn out to be less risk averse by not avoiding the economies where codified market-enhancing institutions are weak.The underlying reason could be the different understanding and calculation of investment risks because of the existence of various risk-safeguard mechanisms embedded in home country institutions.However,as we will argue,such mechanisms are not impartial to all economic entities.Firm specific capabilities to mobilize and leverage home based institutional resources would largely determine their responses to host country institutional environments as they globalize.2.1.Ownership structure and location choiceThe Chinese industrial sector used to be dominated by SOEs.After the unsuccessful internal managerial improvement in the1980s, SOE reform in the1990s broke the rigid capital structure.The shareholding system was used to privatize completely a lot of small-scale SOEs,while large-scale SOEs were reorganized into limited-liability joint stock companies.A selected group of them were listed on domestic stock exchanges.This“corporatization”of SOEs blurs the boundary between the public and private ownership,which used to be clearly cut when the association of public and private capital was nonexistent.For the purpose of our study,we define SOEs as those enterprises owned and controlled by the central or the local government.This being said,SOEs in our paper include not only the officially categorized state enterprises(guoyou qiye),limited liability companies with full state investment(guoyou duzi youxian zeren gongsi),and state-controlled joint stock companies(guoyou konggu gufen youxian gongsi), but also those joint stock companies listed on the stock markets whose ultimate controlling shareholders are SOE groups.4It is worth to be noted that POEs,on the other hand,have a broader meaning including all forms of enterprises other than that owned and controlled by the state capital.Despite of theflourish offirms with mixed ownership,we suggest that the ownership structure remains an important differentiator of Chinesefirms in terms of sector concentration,firm size and capital intensity due to the domestic market imperfection.The restructuring of SOEs is accompanied by the revision of Marxist doctrine in order to establish a“socialist market economy”.The socialist nature of Chinese market economy means that the State,while retreating from the mature and competitive sectors,insists on maintaining a high command hand on certain strategic sectors.This generates a dual industrial structure,where POEs play a key role in competitive sectors,such as labor-intensive manufacturing industries,while SOEs are concentrated in heavy industries,resources sectors,machinery and infrastructure.Taking advantage of implicit government protection of their monopolist and oligopolistic positions,SOEs outmatch POEs by average size.According to the Chinese Statistic Yearbook of2013,at the end of 2012,SOEs represent merely5%of above-scale industrial enterprises,5but control more than40%of the industrial assets.The economic power accrued in certain large SOE groups allows them to exert noticeable influence on China's policy formation,such as China's ODI policy.China's ODI regime,through the reform in the last decade,has repositioned the role of central authorities from the one that directly intervenes in the business decisions to that which influences and directs the market through rules and incentives(Luo,Xue,&Han, 2010).Nevertheless,such a pro-market transformation,due to various institutional constraints,mayfinally turn out to be a pseudo-liberalization captured by corporate interests of powerful SOEs(Liou,2014),and generates discriminatory policy tools against certain industries and ownership forms(Buckley et al.,2007;Voss et al.,2009).In thefirst place,the political discrimination is manifested in the unbalanced support toward energy and mining industry,which favors rather SOEs than POEs.When the Chinese government pronounced in2001the“going out”policy,all the industries that can promote exports,secure raw materials,and accede to technology were encouraged.Nevertheless,most of the following political measures have been made to promote ODI in natural 4One main difficulty to estimate correctly the presence of Chinese SOEs is the existence of a large number of joint stock companies that are controlled indirectly by the public authorities through state holding companies(Huang,2008).According to the estimation of Liu and Sun(2003),if the official data showed that only8.5%of the listed companies on Shanghai stock markets were controlled directly by the State,the real weight of the state controlled companies was84.1%in2001.5Since2011,above-scale industrial enterprises include those industrial enterprises whose annual revenue from principal business is over20million yuan.resources sector where large SOEs enjoy the de facto monopoly in the domestic market 6(Zhang,2010).In such context,political support to ODI of Chinese POEs remains symbolic.Even though nowadays there exists a “Small –Medium Enterprises International Market Development Fund ”,the relevant decrees set out a tariff of support as a percentage of the total sum to be invested,and can hardly amount to huge financial sums (Gu,2011).In the second place,the political discrimination is also re flected in the regulation of China's ODI.While all the Chinese firms (excluding those in financial sectors)have to go through a two-stage process,7The NDRC document published in 20048and revised in 20119stipulated that resources projects valued below US$300million and non-resources projects below US$100million were separated into two types:those for centrally-af filiated SOEs would require no approval but only file the projects at NDRC,while local companies,including private ones,would require approval of the provincial of fices of NDRC.10Moreover,while the approval process was indeed institutionalized,it ironically reduces the free space of Chinese POEs,which used to be good at maneuvering China's fragmented bureaucracy to get approval for their investment projects through informal channels (Ye,2014).China's current ODI regime thus suggests a weaker China State than we would imagine (Pearson,2005;Yeo,2009).Both ODI incentive mechanism and its regulation regime are not totally independent from the in fluence of large SOE groups,which have successfully created a favorable domestic political environment for their own interests in acquiring strategic assets overseas,especially scarce natural resources when investing in LAC,to enhance their monopoly positions at home (Huang &Wang,2011;Song,Yang,&Zhang,2011).In the meantime,Chinese POEs,overly concentrated in highly competitive industries and left alone on their limited internal resources,tend to be focused on particular industrial sectors and forced to explore new markets abroad in order to survive the fierce competition and to achieve competitiveness in the domestic markets (Boisot &Meyer,2008;Song,2011;Voss et al.,2009).Therefore,we hypothesize:H1.Chinese SOEs are more likely natural resource-seeking driven and tend to be attracted to resource rich countries when investing in LAC.H2.Chinese POEs are more likely market-seeking driven and tend to be attracted to countries with large market size when investing in LAC.China's ODI policy exempli fies the gradual reform process characterized by regulated and targeted piecemeal solutions rather than the systematic removal of institutional impediments to construct a level playing ground.Both institutional hindrance and government promotional policies coexist.Under such circumstances,the foreign expansion decision at firm level should be viewed as a strategic reaction to dual yet disparate institutional forces (Luo et al.,2010),and as Voss et al.(2009)suggest,that relational access to governmental bodies that can grant preferential treatment remains an important asset to companies.Although political connection is not necessarily determined by corporate ownership,11SOEs,compared with private ones,do have more capabilities to draw bene fits from yet opaque and unbalanced business environments.This difference in relational asset,in turn,may alter the perception and calculation of investment risks between firms when going abroad.SOEs can be more tolerant towards risks for three reasons.In the first place,as Morck,Yeung,and Zhao (2008)and Buckley et al.(2008)have argued,the privileged access to financial resources,such as cheap bank loans,enhances SOEs'soft budget constraints and exempts them from commitment to the public shareholders.In the second place,SOEs are ready to take advantage of the risk-safeguard mechanism established through government help,such as political risk insurance provided by Sinosur (MIGA,2010).Finally,the corporate governance determined by ownership structure may also explain the bold advance of SOEs in their overseas expansion.As Morck et al.(2008)have emphasized,while most managers of SOEs are appointed through the nomenclature6For example,in 2003the Ministry of Commerce and the Ministry of National Resources created the “speci fic funds for discovery and exploration of foreign mineral resources ”.In December 2005,the Ministry of Finance and the Ministry of Commerce published the “Regulation on administration of speci fic funds for foreign economic and technical cooperation ”,which identi fied the ODI in resource and energy sector as the main bene ficiary of annual speci fic funds.Ever since 2008,the encouragement and the support of ODI in natural resources sector are even enhanced.In 2008,the National Energy Administration was created.In its development plan 2009–2011,the newly created administration advocated to establish the development funds for discovery and exploration of foreign energy sources using the national foreign reserves,to provide banking credits with favorable terms and to raise the proportion of fiscal funds in the related projects.Such political suggestions were later expanded to other ODI projects in steel and nonferrous metal industries,when the State Council published in 2009“Adjustment and development plan of steel industry ”and “Adjustment and development plan of nonferrous metal industry ”.7Chinese SOEs as well as POEs,before applying to SAFE to use foreign exchange earnings abroad,have to firstly apply to the National Development and Reform Com-mission (NDRC)and Ministry of Commerce (MOFCOM)for their ODI approval.Speci fically,NDRC has the authority to approve overseas investment proposals,while the MOFCOM has the authority to approve proposals to set up companies abroad.Nevertheless,the formal decrees have been biased against private ODI.8“Interim Measures for the Administration of Examination and Approval of the Overseas Investment Projects ”/fzgggz/wzly/zcfg/wzzcjwtz/200507/t20050719_37411.html .9“Notice of the National Development and Reform Commission on the Decentralization of Approval Authority of Overseas Investment Projects ”/aarticle/b/g/201109/20110907760681.html .10On April 8,2014,the NDRC announced the “Administrative Measures for Approval and Recordation Filing of Overseas Investment Projects ”,which replaces the decades-old approval system with a system that requires a mere “recordation filing ”.Speci fically,all ODI projects (including those carried by private companies)involv-ing investment of less than US$1billion,other than projects involving designated “sensitive regions ”or “sensitive industries ”,are subject to a filing procedure with the NDRC at the central level.For ODI projects involving investment of less than US$300million,filing with the competent provincial government agency is generally suf ficient.11According to Dickson (2007),the China Communist Party and private entrepreneurs have approached each other for years.The CCP is increasingly integrating itself with the private sector,both by co-opting entrepreneurs into the Party and encouraging current Party members to go into business.China's capitalist elites and com-munist of ficials share interests in maintaining the political status quo and creating a form of “crony communism ”.277Y.Lin /China Economic Review 34(2015)274–292278Y.Lin/China Economic Review34(2015)274–292system,they have little individual interest in theirfirm's long-term economic performance.Higher risks may be taken to pursue personal agendas to advance their career in state bureaucracies or simply advance their personal wealth.In contrast,the nature of government and private sector relations makes it difficult for private companies to avail themselves of “going out”policy.Gu(2009),during hisfieldwork in Africa,finds that privatefirms are largely bereft of practical government support and face a significant gap between policy formulation and policy implementation.In such circumstances,Chinese privatefirms, majorly small and medium ones,have less resources and will tend to be more cautious in their overseas expansion.More critically, a burdensome legal and regulatory framework at home,while conferring an advantage on Chinese POEs—at least in other emerging markets,may also push them out to conduct,in the words of Dunning and Lundan(2008),“escape investment”.In most cases,they tend to raise capital offshore,to accede to better legal and accounting institutions offered by host countries,and to circumvent other domestic institutional constraints on their activities(Ning&Sutherland,2012;Sutherland&Ning,2011).In fact,if“institutional arbitrage”,proposed by Boisot and Meyer(2008),is one of the principle motives for Chinese private investors to go abroad,then they would be attracted to where more efficient institutions are found.We then hypothesize:H3.Chinese SOEs are less risk averse and tend to be attracted to countries with weak institutions when investing in LAC.H4.Chinese POEs are more risk averse and tend to be attracted to countries with strong institutions when investing in LAC.2.2.Strategic motives and location choiceBy emphasizingfirms'differentiation in ownership structure,we do not suggest a rigid dichotomous approach,which risks giving the impression,falsely,of two distinct but homogenous groups offirms.On the contrary,we argue that even within each group defined by the corporate ownership,there are differences in strategic motives of outward investors,and the ownership effect on location choice could be moderated by the strategic consideration.In fact,if any support for the above hypotheses are to be found, it raises immediately the following questions:to what extent the institutional effect is sector specific?And to what extent is it contingent on corporate ownership per se?According to Dunning(1980,1993),there is good reason to believe thatfirms with different strategic intent of globalization,be it natural resource-seeking,market-seeking,efficiency-seeking or strategic asset-seeking,will look for specific location advantages.This can be tested if we include the second dimension offirm heterogeneity into our empirical specification.We suggest that Chinesefirms'strategic motives of ODI can be reflected in the activity of their overseas subsidiaries.By disaggregating China's ODI projects by types of activity,we introduce simply industry dummies into the standard model,and expect firms sharing the same ODI motivation to respond similarly to a multitude of host country determinants,including the institutional environment.Two kinds of subsidiaries are of our specific interests concerning China's ODI in LAC:extractive and trading subsidiaries.Investment in extractive subsidiary is mainly pulled by supply side factor of a host country,namely the natural resource endowment.However,investing in resource rich developing countries has to deal with the resource curse problem,which is characterized by the association between resource abundance and low economic growth,onset of civil war and low levels of democracy.12Although the causal direction between resource abundance and political risk is arguably uncertain(Rosser,2006),it suffices to suggest a higher probability that extractive ODI would end in the countries where poor institutions prevail.Therefore, host country institutions,as a pulling factor of ODI,could matter very differently for this type of ODI.For instance,Asiedu and Lien (2011),for112developing countries over1982–2007,find that in countries with high natural resource shares in exports democracy actually reduces FDI.This phenomenon,according to Kolstad and Wiig(2009),could be explained by rent-seeking behavior of political actors as well as social actors,including foreign investors,enticed by the lack of impartiality enhancing institutions.Without sufficient and adequate institutional check,political elites and foreign investors would share the similar interests in establishing the patronage linkage in order to seize the large and appropriable resource rents(Mehlum,Moene,&Torvik,2006;Torvik,2002).Due to the bilateral monopoly that governs the relations between foreign investors and host countries(Buckley,2008),foreign investors could even have specific advantages in negotiating with countries plagued by political instability and low levels of democracy,which are often ready to grant an investment agreement that favors generously the foreigner willing to invest.As a consequence,the poor institution quality is not only less problematic to draw extractive ODI,but also could be attractive in certain circumstance.The attraction of weak host country institution is expected to be pronounced in the case of extractive ODI originating from China,where the awareness to promote corporate social responsibility by Chinese authorities and Chinesefirms is still at very early stage(OECD,2008).We then hypothesize:H5.Chinesefirms investing in LAC tend to locate their extractive subsidiary in countries with weak institutions.Investment in trading subsidiary is principally pulled by the demand side factor of a host country,measured through two variables: host country GDP which reflects its absolute market size,and host country per capita GDP that captures its development stage and the market affluence.A large body of evidence has confirmed the positive and significant relationship between the market size and Chinese ODI in OECD countries,but found no such correlation in non-OECD countries(Buckley et al.,2007;Cheung&Qian,2009; Hurst,2011;Kolstad&Wiig,2012).Nonetheless,such observation may be biased by the methods that overlook the heterogeneity even within the non-OECD countries.Indeed,Sanfilippo(2010),based on China's reported ODI stocks in41African countries from 12For an excellent literature review on resource curse problem,please see Rosser(2006).。

相关文档
最新文档