定性数据的统计分析理论与应用研究_刘洋

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

定性数据的统计分析理论与应用研究

刘 洋 西安财经学院

摘 要:定性数据的统计研究一直以来在统计研究方法中都起着十分重要的作用,尤其近几年更是成为统计学研究的重点之一。由于统计方法的逐步发展,定性数据的研究也正不断有新的突破和新的方法,以求找到更适合自身的理论方法。相应分析方法和结构方程模型方法都是较新的定性数据分析应用中的方法。

关键词:定型数据 相应分析 统计分析

一、定性数据的背景及发展

1.研究背景及意义。随着实际问题中愈来愈多定性数据的出现,学会使用定性数据来处理实际问题便成为了必要的技能之一,定性数据的统计方法也成为统计学研究的重点之一。定性研究方法是根据社会现象或事物所具有的属性和在运动中的矛盾变化,从事物的内在规律性来研究事物的一种方法或角度。它以普遍承认的公理、一套演绎逻辑和大量的历史事实为分析基础,从事物的矛盾性出发,描述、阐述所研究的事物。定性数据的性质间接决定了定性数据成为了统计研究中不可小觑的一部分,也为统计研究方法在实际中遇到的困难扫清了很多障碍。

2.定性数据的发展。定性研究起于19世纪,早期的定性研究是从社会调查运动中的实际问题引发的,但是很少有人能意识到它的价值所在。Pearson(1904)首次提出了列联表的概念,也就意味着开始了定性数据的研究。Bartlett(1935)定义了三维列联表三变量的交互作用,但仍不能进行结构复杂的大量数据的研究。随着科技的不断发展,统计学运用计算机处理数字的能力越来越强,使定性数据的研究更是有大幅的提高,现在对定性数据的研究方法更是多样的,例如相应分析、结构方程模型等。

二、定性数据相关的统计分析理论

1.定性数据。在统计学中,数据按照其取值分为四种类型,即计量数据、计数数据、名义数据和有序数据。其中,计量数据和计数数据称为定量数据。名义数据和有序数据称为定性数据,定性变量中包含了名义定性变量和有序定性变量。

2.相应分析。相应分析(correspondence analysis)也叫对应分析,其特点是它所研究的变量可以是定性的,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。通常意义下的相应分析,是指对两个定性变量(因素)的多种水平进行相应性研究,因而它的应用越来越广泛,现在这种方法已经成为常用的多元分析方法之一。相应分析的思想首先由Richardson和Kuder于1933年提出,后来法国统计学家Benzecri等对该方法进行了详细的论述而使其得到了发展。

3.结构方程模型。结构方程模型(Structural Equation Modeling)在20世纪80年代以来迅速发展,是可以处理多个原因、多个结果关系,或者处理不可直接观测变量即潜变量的好方法,解决了一些传统的统计方法不能很好解决的问题。结构方程模型可以假设潜变量的存在,即潜变量可以在结构方程模型中使用,而不是作为观测变量。使定性数据得到了更好更全面的分析,适用于新的统计方法。主要适用于数据较多的定性数据的调查问卷。

三、定性数据统计分析的实证研究

1.数据处理。

1.1数据来源。本文所采用数据来自于由朱建平主编的《应用多元统计分析》一书中相应分析章节举例。应用spss17.0做相关分析。

1.2定性数据数字化。每个定性数据都含有不可量化成分,所以,在分析定性数据之前需要把定性数据中所代表的不同含义或不同范围用简单整数表示,一种含义或范围只能用一个整数表示,这样就使得定性数据数字化。

2.定性数据的相应分析。

2.1相应分析原理。相应分析是在列联表的基础上通过交互汇总数据来解释变量之间的内在联系,用相同的因子轴同时描述两个因素各个水平的情况,把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上。一般情形,取两个公共因子,在一张二维平面图上绘出两个因素各个水平的情况,即可以直观地描述两个因素A和因素B以及各个水平之间的相关关系。同时揭示了同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。

2.2相应分析实证。研究数据为1992年美国总统大选的部分数据。对1847位选民的最高学历与所支持总统候选人进行相应分析。由于该分析通过了卡方检验,所以相应分析的分析结果是有效的。

从图1中可以发现大学本科(bachelor)层次的选民最支持Bush,其次是高中(high school)层次的选民。Clinton更受研究生(graduate degree)层次的选民的青睐,而Perot的支持者更多是专科学历者(junior college)。大学本科和高中学历的选民是普通选民所拥有的最普遍学历,也就是说得到的支持中这部分学历的选民最多的话,也就可以说明这个人得到了相对大多说人的支持。

相应的对选民的年龄与所支持的总统候选人间进行相应分析的结果可以看出,年龄在45-64岁之间的选民最支持Clinton,35-44岁的选民其次,这部分选民相对而言更多的选择了支持Bush。Clinton与Bush更多的赢得的是中年人的支持,其中Clinton赢得了相对较多的老年群体的票数支持。Perot与两名竞争对手在支持选民年龄上显示了很大不同,支持他的选民相对年轻化,且选民随之年龄的增长逐渐减少,超过65岁的选民几乎没有支持者。

3.模型结果分析。以上模型分析了该定性数据的显著特点与有趣的分类,知道了选民在最高学历与年龄的不同上对所支持政客不同的相对应分析,让我们从新认识了这组定性数据。通过以上实证分析模型证实利用相关分析的方法可以对定性数据进行有效合理的分析,使得我们更好的对定性数据进行理解。由于定性数据本身的特点,使得我们不能很好的直接通过定性数据本身观测、理解和使用定性数据,但是借助于相关分析,我们可以透过定性数据难以分析的数据特点来理解定性数据,使数据为研究服务。

四、结论与建议

1.结论。定性数据不应只通过数据表面的观测进行分析,由于定性数据自身性质会给相关研究带来误导性信息且不准确。所以定性数据的统计研究方法为统计研究做出了重要贡献。虽然定性数据在问卷调查的应用中还是相对突出的,但是了解和学会定性数据的分析方法可以使你在任何数据的面前不再担心它的种类,都能做到游刃有余。

定性数据的分析理论正在迅速发展,一些相关理论已经相当成熟,但要深入分析,仍需不断探索新理论与新方法。分析定性数据的对数线性模型、结构方程模型和相应分析方法都已相对成熟,而非线性主成分分析方法仍在起步,需要更多的研究与实证支持。

2.建议。由于定性数据的多样性,可以在分析定性数据时使用多种分析方法,以便正确数据所包含信息。定性数据和定量数据一般都是相互结合使用,互相融合,共同发展的,定性数据在数量化之后也属于定量数据,所以在发展定性数据统计研究方法的同时,定量数据的统计研究方法也会相应进步,相互取长补短。定性数据的分析方法仍然满足不了数字化的发展,对新方法的创新仍是耽误之急。希望完善以前好用的方法,不断创新新方法。

参考文献:

[1]葛新锋.有序数据的多元分析模型及实证研究[D].山西财经大学,2009.

[2]王静龙、梁小筠.定性数据统计分析[M].中国统计出版社,2008.

[3]朱建平.应用多元统计分析[M].科学出版社,2013.

[4]王济川,王小倩,姜宝法.结构方程模型:方法与应用[M].高等教育出版社,2011.

[5]Donald J. Treiman.量化数据分析:通过社会研究检验想法[M].社会科学文献出版社,2012.

作者简介:刘洋(1989—),女,吉林东丰人,西安财经学院2013级统计学专业研究生,研究方向:经济统计。

2014年·8月·中期经营管理者

学 术

理 论

经营管理者 Manager' Journal

207

相关文档
最新文档