社会研究的定量分析.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章社会研究的定量分析
作为社会调查研究对象的社会现象有其质和量两方面,我们对整理好的资料也必须展开定性和定量两方面的分析,缺一不可。但是,定性分析是以研究者的理论功底为基础,主要靠个人的悟性。定量分析就不同了,它是我们每个人通过学习都可以统一掌握的技术。所以学习社会调查研究方法,课堂教学在资料分析方面重点讲得是统计分析,定性分析所需要的悟性则留给学习者平时逐步积累。
9.1 统计调查资料及其整理
经过调查收集上来的资料虽然是大量的,却很可能是杂乱无章的,用它来直接做分析往往有困难。统计整理是对调查数据资料的条理化、系统化和有序化,通过它,社会调查研究才能进入统计分析阶段。因此,资料整理是沟通社会调查和资料分析的桥梁。
不过,资料整理在很多情况下是一个自然过程,并非一定先要专门学习不可。但调查来的数据资料有所不同,它的整理有一套规范的做法,这是需要专门学习的。所以与统计分析相匹配,课堂教学在资料整理方面重点讲得是调查数据资料的整理,主要是指统计调查资料的整理,简称统计整理。当然其他调查资料的整理也能触类旁通,由此受到启发。
一、统计分组和频数分布
统计整理是与统计分组相联系的。所谓统计分组,就是将情况相同或相近的数据资料加以分门别类的归并,使之简单明晰,以便为统计分析中提取各种有用信息打下基础。
频数分布是统计分组的结果,它是指众多的调查数据在各个组(各类别、各等级或各区间)出现或发生的次数。频数分布是对客观事物自然形成的分布状态的集中反映和描述。如一个学校的学生的性别有男也有女,而且男同学和女同学的人数不尽相同,我们将这种情况如实地描述出来,便得到该校学生性别的频数分布。
将原始资料编排成序列资料,再把序列资料编制成为频数分布表(频数用f表示)。这样一来,学生总体中的性别分布状况就清晰地呈现出来了。原始资料次序资料分组资料,这反映了对资料进行整理和简化的顺序。这三种形式是依次逐步简化和条理化的,使人们看起来越来越容易、越来越清楚。
二、频率分布与总体内部结构
分组资料虽然简单明了,但不能直接显示出总体内部结构。为了实现这个要求,就要在分组资料的基础上派生出频率分布表(频率用P表示)。频率就是各组人数占总体人数的比重,即P=f/N。比重都小于1,经常用百分数来表达,它反映了对象总体的内部结构。
而累计频数或频率,我们便得到向上累计(F ↑)或向下累计(F ↓)频数表或频率表。这
也是我们常常应用在资料整理之中以便描述的方法之一。
三、图示法
把无序的原始资料整理成频数分布表,是表示统计资料的一种有效方式,我们可以称为
列表法。其实,用图示法来表示统计资料比列表法更能一目了然。我们可以根据整理好的频
数分布(或频率分布和累积百分数分布)绘制出相应的统计图。最常用的有直方图、条形图、
折线图、曲线图等。
9.2 统计分析一:描述统计
调查数据资料经分类整理后,已经使杂乱无章的原始数据资料成为有系统、有条理的数
据资料,这就为统计分析中提取各种有用信息打下了基础。而在社会调查的定量研究中,描
述统计是基础。所谓描述统计就是讨论范围仅以搜集资料本身为限,而不予以扩大。包括推
论统计在内,没有描述统计作为基础,想要运用好也是不可能的。描述统计所用数学较少,
实用性又很强,因此在社会调查研究中使用的机会很多。
一、集中趋势统计量
1.算术平均数(X )
·简单算术平均数
统计原始资料,计算简单算术平均,其公式为
X =
N
X N X X X X N ∑=+++Λ321 (9.1) ·加权算术平均数 统计分组资料,计算加权算术平均,其公式为
X =N X f X f X f X f n n +++Λ332211=N
fX ∑ (9.2) 式中f 代表频数,由于各变量值X i 对于总体的影响要由各组频数f i 所决定,所以f i 也称
为权数。这样一来,在统计分析中,凡对应于分组资料的计算式,都被称为加权式。而对应
于未分组资料的计算式,则被称为原始式。
值得注意的是,在统计计算中,权数不仅用来衡量总体中各变量值在总体中作用,同时
也反映了对象总体的内部结构,所以它有两种表现形式:绝对数(频数)和相对数(频率)。
这样一来,加权算术平均数也可以依据频率分布来计算,(9.2)式也可以写成
X =X N f ∑=∑PX (9.3)
(注:分组资料有单项式和组距式两种。对组距式分组资料要做近似处理,即用每组
的组中值m i 来权充该组划一的变量值X i 。)
2.中位数(M d )
用中位数作为集中趋势统计量,在许多场合能发挥很好的作用。所谓中位数,是把一组
数据分成相等的两部分,一半数值比它小,一半数值比它小,它居中。所以中位数也是一种
反映现象一般水平和集中趋势的有代表性的数值。
·原始资料的中位数
对于原始资料求中位数,只要先将各个数值按大小排序,再将居中的那个数值拿出来
就行了。
·分组资料的中位数
对于组距式分组资料求中位数,首先按排序的方法找出中位数组,再按下面的公式近
似求得中位数
h f F N L M m
m d ⨯-+=-12 (9.4) 式中的L 代表中位数组下限,N 代表总体单位数,F m-1代表低于中位数组下限的累积频
数,f m 代表中位数组的频数,h 代表中位数组的组距。(注:对于单项式分组资料,不用近
似计算,可很简单得到中位数。)
3.众数(M 0)
“众”即多的含义。众数是在一组数据中,出现次数“最多”的那一个(或几个)数
值。众数只与数值出现的次数有关,因而它可以用于定距资料,也可以用于定类、定序资料。
应该指出,众数有时不存在,有时有两个以上。
·原始资料的众数
对于原始资料的众数,一般情况下只要按众数的定义直接识别就可以了。
·分组资料的众数
对于组距式分组资料求众数的方法,是先按最高频数找出众数组,再按下面的公式近
似求得众数。
02
1100h L M ⨯∆+∆∆+= (9.5) 式中△1为众数组频数与前一组频数之差,△2为众数组频数与后一组频数之差,h 0为众