社会研究的统计应用》复习大纲

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

社会研究的统计运用(陈登源)
第一章科学方法与社会研究历程
▲选择或填空题
1、社会学在规划一项研究时，大致上可以分为下面的五个阶段与步骤：选定研究项目、初
步探索、成立假设、理论解释与澄清概念、研究策略
2、用上多个指标时，为便于分析，有时候也需要将各项指标合并起来。

合并的方法有：类
型法、指数构成法、尺度法（综和尺度法、感觉尺度法、累加尺度法）
3、测量层次由低到高分为四个层次：定类（区分异同）、定序（区分异同、次序即大小）、
定距（区分异同、次序即大小、加减）、定比（区分异同、次序即大小、加减、乘除），低级拥有的数学特质，高级更应当拥有，但高级拥有的，低级不一定拥有。

划分定类层次时，要注意两个原则：一是互斥性，二是无遗性
4、抽取样本以后，就要收集资料，收集的方法：访问法、观察法、档案资料
5、一份问卷可能有许多不同的问题：但答案的方式主要有两种：一种是固定答题，另一种
是自由答题
6、用问卷收集资料的方式又可以分为两类：自填和对答，自填又分为邮寄和当面填写两类，
对答又分为电话访问和面对面访问。

7、观察法分为参与观察法和非参与观察法
8、收集资料资料以后便要进行整理，在整理资料时一般分为两步：校对和编码。

9、总结的步骤如下：统计分析、解释研究结果、理论贡献与实际贡献、要提供若干新的研
究项目
10、一个严谨的研究，在未分析变项与变项之间的关系之前，应该先检验每个的测量信度和测量效度。

11、社会学研究的一个重要环节：统计分析，要了解它的作用，就要了解整个社会学研究的历程，包括怎样规划一项研究，怎样落实研究计划，和怎样总结研究的成果。

12、社会调查法可以分为两类：叙述性调查和解释性调查
13、社会学研究就是运用科学的方法来搜集和分析社会事实，以理解社会现象之间的关系。

14、定距层次就是具有值与值之间的距离，具有加与减的数学特值。

15、定序层次就是能确定值的次序，即变项的值能把研究对象排列高低或大小。

定类层次只能把研究对象分类。

第二章简化一个变项之分布
▲填空或选择题
1、适用于简化一个定类变项资料的方法有：次数分布（最基本）、比例、比率、图示（长
条图、圆瓣图）、对比值等；定序层次除以上外，还有累加次数、累加百分率；定距层次拥有以上方法，还有组限(真实下限＝标示下限－0.5，真实上限＝标示上限－0.5)、组中点＝真实上限和真实下限的平均数。

2、适用于每一类测量层次（定类、定序、定距）的单变项叙述统计法，要坚持一个原则，
就是适用于较低测量层次的统计法，也适用于较高的层次。

3、社会学研究常用平滑曲线来表示定距变项的资料分布：这些曲线有J 形曲线、U形曲线、
峰状曲线、对称与不对称曲线。

4、众值就是次数最多之值，适合于分析定类变项，也适用定序变项和定距变项。

5、集中趋势测量法有：众值、中位值、均值，离散趋势测量法有：离异比率、四分位差、
标准差、质异指数。

6、正态分布具有单峰和对称的特质，因此，众值、中位值、均值是相同的。

标准正态分布
的均值是0，标准差是2.4。

两个标准值的范围（面积）在位于同一边时相减，在不同两边时用加。

7、集中趋势测量法就是找出一个数值来代表变项的资料分布，以反映资料的集结情况。

8、离散趋势测量法是要求出一个值来表示个案之间的差异情况。

第三章简化两个变项之分布
▲选择或填空题
1、相关指一个变项的值与另一个变项的值有连带性。

2、正相关是指一个变项的值在增加，另一变项的值也增加。

3、负相关是指一个变项的值在增加，另一变项的值在减少。

4、相关测量法，就是一个统计值表示变项与变项之间的关系，这个值，通常称为相关系。

5、PRE的数值愈大，就表示以 x值预测 y值时能够减少的误差所占的比例愈大；也就是
说x 与y的关系愈强。

6、PRE介于0和1之间的数值如果越大，就表示相关的程度越强。

PRE=1，反映x 与y是
全相关。

PRE=0，反映x 与y是无相关。

7、PRE的数值意义就是表示用一个现象来解释另一个现象时能够减除百分之几的错误。

第四章相关测量法和测量层次
▲填空或选择题
1、两个定类变项测量层次有（1）Lambda（一是对称形式，另一非对称形式）只用部分边
缘次数和条件次数，其统计值介于0 与1 之间，（2）tau－y测量法（只使用不对称形式）包括全部边缘次数和条件次数，故其敏感高于Lambda，其统计值介于0 于1之间（3）列联相关系数（4）v相关系数（5）phi 相关系数，前面两个具有消减差比例的意义，后面三个不具有。

2、两个定序变项有：古德曼和古鲁斯卡的Gamma系数（对称相关测量法）、萨默斯的dy系
数（不对称）其系数值介于—1和+1之间，表示相关的程度和方向，都具有消减误差比例的意义。

3、级序相关测量法有古德曼和古鲁斯卡的Gamma系数（对称相关测量法）、萨默斯的dy系
数（不对称）、肯德尔的tau系数（ tau—a tau—b tau—c）（对称）其值没有消减误差比例的意义、斯皮尔曼的 rho系数（对称）其统计值又—1到+1之间，其平方值具有消减误差比例的意义。

4、两个定距变项的b 值是表示自变项对依变项的影响的大小和方向，它是一个分析不对称
关系的统计法，其值不限于—1到—1之间，而r值假定x 与y的关系是对称（对称相关测量法），其值由—1到+1之间，其平方值具有消减误差比例的意义。

R系数越大，就表示线性回归方程式的预测能力愈强。

5、一个定类变项和一个定距变项：相关比率，又称eta平方系数，其值是由0到1之间，
其平方值具有消减误差比例的意义。

它还可分析非线性关系。

6、一个定类变项和一个定序变项：1)威尔科森的区分系数，又称theta系数（不对称）,
其系数值是由0至1之间，但没有消减误差比例的意义。

2) Lambda
7、在选择相关测量法时，首要的准则是变项的测量层次，次要的是考虑关系的对称与否。

第五章抽样与统计推论
▲填空或选择题
1、社会学研究关心的是总体的情况，不是样本情况，从样本中计算出来的数值称为统计值，
在总体中的数值称为参数值。

只要我们是采用随机抽样法，就可以根据抽样分布，以样本的数值来推测总体的情况。

2、求取一个有代表性的样本，减少抽样误差的五个步骤：界定总体、搜集全部名单、决定
样本大小、选取样本个案、评估样本之正误
3、非随机抽样法有：立意抽样法、偶遇抽样法、定而抽样法
4、随机抽样法有：简单随机抽样（最简单、最基本）、系统随机抽样、分层随机抽样、集
体抽样法、多段抽样、多期抽样
5、均值的抽样分布的特征：（1）样本相当大（2）抽样分布之均值就是总体之均值（3）抽
样分布的均值两旁，包括多少个样本均值
6、统计推论一般分为参数估计和假设检定
7、立意抽样法又称判定抽样法，是根据研究员的主观和判断，选取他认为是典型的个案。

8、偶遇抽样法是选取一些遇见的个案作为样本，这个方法又称方便抽样法。

9、定额抽样法是根据某些标准将总体分组，然后用立意或偶遇抽样法由每组中选取样本个
案。

10、简单随机抽样要求每个个案被选取的机会是相同的，系统随机抽样首先将全部个案排列起来，按抽样比例分成间隔，并在第一个间隔内选取第一个个案，然后每经一个间隔就选取一个个案。

11、参数估计就是根据一个随机样本的统计值来估计总体之参数值是多少。

12、假设检定就是先成立一个关于总体情况的假设，继而抽取一个随机样本，然后以样本的统计值来验证假设。

第六章参数值的估计
▲填空或选择或判断
1、在样本大小相同的情况下，如果要求的可信度愈大，则间距就会越大，这个间距称为可
信间距，它与样本的大小成反比。

2、在正常的情况下，样本越大就越有代表性，因此，在决定样本大小时，坚持的原则：（1）
在能够付出的研究代价以内，选取最大的样本（首要的准则）（2）用意容忍多少错误（3）所研究的个案之间的相互差异有多大。

3、间距估计就是以两个数值之间的间距来估计参数值，至于间距的大小，就要取决于我们
在估计时所要求的可信度是多少。

4、点值估计就是以一个最适当的样本统计值来代表总体的参数值。

第七章假设检定：均值与百分率
▲选择或填空题
1、显著度越小，便越难否定虚无假设，也即越难证明研究假设是对的。

如果所选定的显著
度相同，二端检定比一端检定跟难否定虚无假设。

2、用做检定假设的推论统计方法有：参数检定法（Ｚ检定法，它要求大样本，n»100以上；
和Ｔ检定法n«３０，要求自由度；Ｆ检定法，也称为方差分析法，两个变项中有一个是定距变项），这三个要求总体具备某些条件，如（１）正态分布或标准差，（２）而且变项的数值具有定距变项数学特值，（３）随机抽样。

非参数检定法即分布自由检定法（x²检定（两个变项都是定类变项、随机抽取）、 u 检定、k —s检定、走动检定）它不要求使用于定距测量层次，适用于定类或定序资料。

3、如果只有两个样本，那么两个样本均值的差异的检定方法有f检定法、Ｚ检定法、Ｔ检
定法
4、无论样本的大小如何，都可用Ｔ检定法，Ｚ检定法可以说是Ｔ检定法的特殊情况。

5、如果检定值是在否定域范围内，可以否定h0,即h1可能是对的，否则的话，就不能否定
h0,也h1即可能是错误的。

6、否定域就是抽样分布内一端或两端的小区域，如果样本的统计值在此区域范围内，则否
定虚无假设。

7、显著度表示否定域在整个抽样分布中所占的比例。

显著度越小，便愈难否定虚无假设h0.
8、甲种误差是指否定h0，但实际上h1是对的错误可能性。

乙种误差是指不否定h0，但实际
上h0是不对的错误可能性。

9、统计法的检定力是指该统计法能够准确地判断虚无假设（h0）的正误能力。

10、自由度是指有多少个案的数值可以随意变更， t的抽样分布形状取决于自由度。

第八章假设的检定：两个变项之相关
▲选择或填空题
１、x²检定：适用范围（１）两个变项都是定类变项、随机抽取（２）一个定类变项，一个定序变项，它用于右端检定，x²愈大，就是h0的正确可能性越小。

２、Gamma：要求两个定序变项，它常通过s检定来检定Ｇ,在总体中，s＝０，Ｇ＝tau＝dy ＝０
３、单因方差分析中的Ｆ检定要具备的条件：（１）随机样本（２）有一个变项是定距变项、（３）正态分布（４）相等的方差
４、Ｆ检定，右端检定，最适合于推论一个定类变项和一个定距变项的关系，一个定序变项和一个定距变项也可以。

５、x²分布最适用于两个定类变项的关系，一个定类变项和一个定序变项也可以，
9、u 检定（两个样本）、k —s检定、走动检定这些非参数检定法来推论一个二分变项与
一个定序变项的关系，即检定两组个案在等级排列上是否有分别，u检定最使用于分析一个二分定类变项和一个定序变项的关系，如果要检定三个或以上的组在级序上的差异用H检定（三个样本）
10、所有的检定假设方法的共同点：（１）只使用随机抽样样本（２）其关心的都是总体情况，不是样本的情况，（３）目的都在了解在总体中是否相关，而不是相关的强弱程度。

任何的假设检定法都是样本越大时越难否定虚无假设。

第九章详析模式和统计控制
▲选择或填空题
１、多变项分析可依据研究目的分为三大类：详析分析（又可以依其作用不同分为因果分析、阐明分析、条件分析）、多因分析、多项相互分析
2、因果分析的作用是要检定自变项与依变项之间是否有因果关系，在因果分析中，第三类变项被称为前置变项。

在控制w以后，研究结果原则上有三种可能性：（1）x 与y的关系消失（2）x 与y的关系维持原状（3）x 与y虽有关系，但其相关程度弱小了。

3、在阐明分析中，也可用分表法，将分表的统计值与原表比较，就可知道情况：（1）完全阐明，（2）不能阐明，（3）部分阐明
4、净相关系数以积矩相关系数r为基础，它是对称相关测量法的一种，要求变项之间是线性关系，且必须是定距变项，其值—1到+1之间，其平方值具有消减误差比例的意义。

5、因果分析的作用，要签定自变项与依变项之间是否确实有因果关系。

这种分析，又称为辩明模式。

6、阐明分析的作用就是要以事实来验证：x是通过某些因素而对y产生影响的。

7、条件分析就是以第三类变项作为基础来了解x与y在不同情况下的关系。

8、x与y本来是没有关系的，但在标明若干条件以后，x与y显然是有关的。

这种情况称
为压抑分析。

9、曲解分析把原先的负相关变为正相关或把原先的正相关变为负相关的分析。

10、净相关分析就是以一个系数值来表示在控制第三类变项以后x与y 的相关。

第十章多因分析
▲选择或填空题
1、在社会学研究中最常用的多因统计法有：复相关系数、多因线性回归分析（多因分析）、虚构分析、因径分析、判别分析、典型相关分析、方差分析和协方差分析
2、复相关要求全部变项是定距变项，其值在0和1之间，统计值越接近1，表示相关越强，r的平方值具有消减误差比例的意义。

它的剩余误差为1—r².
5、多因线性回归分析要求全部变项是定距变项，以两个或以上的自变项来预测一个依变项
的数值，同时比较各个自变项的影响力的大小。

6、积矩相关是对称的相关测量法，而回归系数b是不对称的，见249页
7、上述的复相关系数、多因线性回归分析都是假定各个自变项的效果是直线性的。

8、逐步回归是使各个自变项依先后次序进入回归方程式，谁先谁后，取决于统计的重要性
和理论要求。

9、将每个定类变项或定序变项变为一组虚构变项，因为虚构变项是定距变项，就可以适合
于研究定距变项之间的关系的统计方法来分析资料了。

虚构变项不假定是直线关系，因而可以显露非直线的效果。

10、典型相关分析两边都有多个变项，它的作用是测量两组变项的最大相关，其值是由0到1之间。

典型相关的平方值（称为特征值或潜根）具有消减误差比例的意义，要求全部变项是定距变项。

并且两组变项的相关具有对称关系。

典型相关可用来分析两组虚构变项的相关。

一般来讲，样本越小和变项数目越多，做典型相关分析时犯错误的可能性越大。

当两变项组中有一组是只有一个变项时，典型相关就是复相关。

11、判别分析是以多个定距变项来判断两个或以上组别的异同性，以预测该个案属于何组，可以依据判别系数值来推算每个个案应属于每组的几率。

12、多个定类变项与定距变项的关系称为多因方差分析，两个定类变项与一个
定距变项的关系称为二因方差分析
第十一章因径分析
▲选择或填空题
1、在因径分析时，要遵循的原则：（1）变项分类（外生变项、内生变项和先决变项）、（2）每个内生变项都受其先前的变项所决定、（3）每个变项的都话为标准值，即以0为均值和1为标准差。

）。

2、由多个变项所组成的因果网可以分为两大类：单向模式（可逆）和非单向模式（不可逆）进行单向模式的因径分析时通常要假定成立的条件：（1）要求全部变项是定距变项（2）变项间的关系是线性的（3）多因效果是相加性的（4）剩余变项是不相关的，即是独立的。

3、因果网是根据我们的理论而推理而成立的，所组成的单向模式分为三个：完整单向模式（因果网内所有因果路径都存在）、部分含蓄单向模式、缺径单向模式。

4、因径系数就是标准净回归系数，它都是根据各个变项的标准值计算出来的，如是随机样本，可以用F检定每个因径系数的显著度。

５、因径分析就是把多因分析与详析这两类方法结合起来，使我们得以理解因果网内变量间的复杂关系。

第十二章定类或定序依变项回归分析
▲选择或填空题
1、当定类依变项为二分变项时，普通线性回归方程仍可使用，但有其局限性：其一是数学上的，其二是实质解释上的。

2、对二分依变项的描述有：几率、比率。

3、所谓拟然就是观察数据的联合几率，观察几率取决于二项分布的参数和观察值
4、对数几率回归和对数线性模型两个都检验总体拟合优度的统计量很多，常用的方法：对数拟然比卡方和皮尔孙卡方统计量。

5、二分变项的四种转换函数：简单对数比率回归、逆正函回归、互补双对数、双对数函数
6、当依变项是定序变量，对数比率回归:有邻类比、升级比、累进比
7、当处理的依变项是定类变项时，可以用一种更方便有效的方法即对数线性模型
8、二维交互表的常见的非饱和模型：独立模型、准独立模型、层次模型或拓补模型、线性关联模型、乘积RC关联模型
第十三章多项互关分析
▲选择或填空题
1、多项互关分析包括因子分析（又包括基元分析和公因分析，他们要求全部变项都是定距变项）、聚类分析、最小空间分析
2、聚类分析的基本作用是将众多的变项分组，简化了他们的相互关系。

它要求在分组后计算归属系数。

3、因子分析的步骤：组成互关矩阵（互关矩阵的主对角线上的数值都是1，能解释全部方差）、抽取共同因素、旋转因子。

4、基元分析中，除了注意因子负荷的数值以外，也要留意每个因子的的特征值（潜根）
5、在基元分析中最重要问题是旧金究竟选取多少因子，常用的准则：（1）因子的的特征值小于1不予选用（2）因子所解释的平均方差小于0.05，不予选用（3）共量总值大于0.9时，不再继续抽取其余的因子（4）因子的数目达到所要求的数目时，就舍去其余的因子
6、依据旋转准则来旋转因子时，有两类方法：一是直角旋转（变值尽简法和因值尽简法），二是斜角旋转
7、因子分析的基本作用：（1）简化多个变项的相互关系（2）利用所抽取的因子将各个变项分组，（3）可用来澄清概念和成立量度尺度（4）分析多个自变项和多个依变项的关系
8、最小空间分析的疏离系数不同于回归系数的疏离系数
9、相关分析有两种途径：R 技术和Q技术。

聚类分析、因子分析、最小空间分析这三种方法都可用R 技术和Q技术，R 技术将多个变项分组，Q技术将多个个案分组。

10、聚类分析是依据我们的理论见解或各对变项的实际相关情况将各个变项分组、，然后测量分组的方式是否有效，即是否能将性质相近的变项聚于相同的组中。

11、因子分析是从众多的相关变项中抽取若干共同的因素，目的是使复杂的实际情况得以简化。

12、最小空间分析的主要作用是找出一个最小而又最能代表实际情况的空间，就是尽量减少坐标轴的数目，而所形成的空间又是相当适合实际资料的。

第十四章趋势资料分析法
▲选择或填空题
1、纵贯研究分为：趋势研究（调查不相同的样本）和同组研究（调查相同的样本）
2、多个时期的资料所显示的变化情况有三种可能性：长期趋势、周期性波动、不规则波动
3、长期趋势的几种时间系列分析法：列表法和图示法，半列平均法，移动平均法，最小平方法（这四种方法只研究一个变项的变化）
4、系列相关是研究两个或以上的变项在不同时期的变化中是否相关。

5、横剖研究了解社会现象在某时期的相关情况，纵贯研究了解社会现象在不同时期中的变动情况。

第十五章同组分析
▲选择或填空题
1、同组研究比趋势研究更能反应事实，可采取相关测量法来显示社会现象的稳定或变动程度：相关系数值越大，就表示越稳定，即变动越小。

2、同组研究的资料可用于多种统计分析：共变分析、因果优先性分析、分析两个变项在每一时期的变化、每个变项在不同时期的变化。

3、同组研究存在的问题：遗失个案的问题、前期测量的效应，影响后期的测量的准确性05年1月试卷
一、不定项选择题
1、F检定法对数据的要求有（）
A、随机样本
B、有一个变量是定距变量
C、各组的总体是正态分布
D、各组总体的方差相等
2、以下说法是正确的有（）
A、X2值愈大，虚无假设是正确的可能性愈小
B、X2值愈大，虚无假设是正确的可能性愈大
C、X2检定法适用于检定总体中两个定类变量是否相关
D、X2检定法属于非参数检定法
3、在对总体参数进行间距估计时，要求的可信度愈高，间距（）
A、愈小
B、愈大
C、不变
D、两者没有关系
4、在抽样调查中，决定样本量大小的因素有（）
A、能够付出的研究代价
B、我们愿意容忍多少错误
C、所研究的个案之间的差异的大小
D、研究总体的大小
5、非参数检定法的特点是（）
A、不要求总体具备特殊的条件
B、要求总体呈正态分布
C、要求总体具备某些条件
D、要求变量是定距层次
6、变量X与Y本来不相关，但是引入第三个变量W之后，在W取某数值的条件下，X与Y
是显著相关的，这种情况通常称为（）
A、因果分析
B、阐明分析
C、曲解分析
D、压抑分析
7、上题中所说的变项W是（）
A、中介变项
B、前置变项
C、压抑变项
D、曲解变项
8、假如要比较两个地区的家庭平均收入是否有差异，在抽样调查样本为小样本的情况下，
常用的检定方法是（）
A、Z检定法
B、t检定法
C、 X2检定法
D、非参数检定法
9、下列变项中，仅适宜用平均值描述其集中趋势的是（）
A、定类变项
B、定序变项
C、定比变项
D、定距变项
10、下列参数中，适于分析两个定类变量的相关关系的系数有（）
A、rs
B、r
C、λ
D、G
二、填空题
11、在选用统计方法时，要考虑变量的测量层次。

有一个基本原则，就是适用于较低层次变量的统计法，也可以适用于＿＿＿＿＿＿＿＿＿＿＿＿＿＿变量。

12、一个严谨的研究，在分析变量的关系之前，应该先检查每个变量的测量信度和＿＿＿＿＿＿＿＿＿＿。

13、积矩相关系数适用的条件是：两个变量之间具有＿＿＿＿＿＿＿＿＿＿关系。

14、对于两个成线性关系的定距变量，其回归方程的决定系数大，利用其回归方程进行预测的准确性＿＿＿＿＿＿＿＿＿＿。

15、集中趋势测量法是用＿＿＿＿＿＿＿＿＿＿来代表一个变量的分布特征。

16、以群体为研究单位研究得出的结论＿＿＿＿＿＿＿＿＿＿＿＿推论到以个人为研究单位时的情况。

17、所谓净相关，就是以一个系数来表示控制＿＿＿＿＿＿＿＿＿＿＿＿＿以后两个变项X 与Y的相关。

18、显著度表示样本的统计值落在＿＿＿＿＿＿＿＿＿的机会。

19、检定假设的基本原则是直接检定＿＿＿＿＿＿＿＿＿＿＿＿＿，从而间接地检定＿＿＿＿＿＿＿＿＿＿＿＿＿，以排除抽样误差的可能性。

三、计算题
20、以下是对某厂80名职工婚姻状况的调查统计表；
婚姻状况人数
未婚48
已婚22
离异6
丧偶4
试（1）作百分比分布表；
（2）选择适当的集中趋势值和离散趋势值，并讨论之；
（3）作适当的统计图来表示表中的分布。

││
21、根据三年前的资料，某地区的独生子女率为60%。

现根据最新对100户的随机抽样调查，独生子女率为62%。

问能否认为该地区三年来独生子女率有所增长（a=0.05）？
（试写出研究假设、虚无假设、统计量和研究结论）（查表知│z│0.05≥1.65，一端检定）22、为了了解甲乙两地中学毕业生成绩的差别，对两地做了随机抽样调查，结果是：
甲地：X1 =520（分），s1 =40（分），n 1=800；
乙地：X2 =505（分）， s2=40（分）， n 2=800。

问：能否认为两地平均成绩有差异（可信度为95%）？（试写出研究假设、虚无假设、统计量和研究结论）？（查表知│z│0.05≥1.96 ，二端检定）。