社会统计学----教材
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《社会统计学》全书目录
第一章导论
第一节什么是社会统计学
社会统计的产生与发展•社会统计学的对象与特点•社会统计的方法•社会统计工作的程序
第二节社会统计学的几个基本概念
总体与单位•标志与变量•指标与指标体系
第二章社会统计资料的搜集
第一节统计调查的方法及种类
原始资料与次级资料•静态资料与静态资料•全面调查与非全面调查•一般调查与专项调查•经常性调查与一次性调查
第二节统计调查的组织形式
普查•重点调查•典型调查•抽样调查
第三节概念的操作化与测量
概念的操作化•定类尺度•定序尺度•定距尺度•定比尺度
第四节统计误差
登记性误差•代表性误差•抽样误差
第三章社会统计资料的整理
第一节统计分组的原则与标准
“穷举”与“互斥”•频数(或次数)分布数列•品质数列与变量数列
第二节统计表
统计表的格式、内容与种类•统计表的制作规则
第三节变量数列的编制
对于离散变量•对于连续变量•组距和组数的确定•累计频数
第四节统计图
直方图•折线图•曲线图•累计顿数分布曲线•洛仑兹曲线与基尼系数
第四章集中趋势测量法
第一节算术平均数
对于未分组资料的算术平均数计算•对于分组资料的算术平均数计算•算术平均数的性质
第二节中位数
对于未分组资料的中位数计算•对于分组资料的中位数计算•中位数的性质•其他分割法
第三节众数
对于未分组资料的众数计算•对于分组资料的众数计算•众数的性质
第四节几何平均数、调和平均数及其他
几何平均数•调和平均数•各种平均数的关系
第五章离中趋势测量法
第一节全距与四分位差
全距•四分位差
第二节平均差
对于未分组资料A•D的计算•对于分组资料A•D的计算•平均差的性质
第三节标准差
对于未分组资科S的计算•对于分组资料S的计算•标准差的性质•标准分
第四节相对离势
变异系数•异众比率•偏态系数
第六章概率与概率分布
第一节概率论
随机现象和随机事件•事件之间的关系•先验概率•经验概率
第二节概率的数学性质
概率的数学性质•排列与样本点的计数•运用概率方法进行统计推断的前提
第三节概率分布、期望值与变异数
离数型随机变量及其概率分布•连续型随机变量的概率分布•分布函数•数学期望•变异数
第七章假设检验
第一节二项分布
二项分布的数学形式•二项分布的讨论
第二节统计检验的基本步骤
建立假设•求抽样分布•选择显著性水平和否定域•计算检验统计量•判定
第三节正态分布
正态分布的数学形式•标准正态分布•正态曲线下的面积•二项分布的正态近似法
第四节中心极限定理
抽样分布•中心极限定理
第五节总体均值和成数的单样本检验
σ已知,对总体均值的检验•学生t分布(小样本总体均值的检验)•关于总体成数的检验
第八章常用统计分布
第一节超几何分布
超几何分布的数学形式•超几何分布的数学期望与方差•关于超几何分布的近似
第二节泊松分布
泊松分布的数学形式•泊松分布的性质•关于泊松分布的近似
第三节卡方分布( 分布)
卡方分布的数学形式•卡方分布的性质•样本方差的抽样分布
第四节F分布
F分布数学形式•F分布的性质•关于F分布的近似
第九章参数估计
第一节点估计
无偏性•一致性•有效性
第二节区间估计
精确性和可靠性•抽样平均误差与概率度•区间估计的步骤
第三节其他类型的置信区间
未知,小样本总体均值的区间估计•总体成数的估计•总体方差的区间估计
第四节抽样平均误差
简单随机抽祥的抽样误差•分层抽样的抽样误差•整群抽样的抽样误差•等距抽祥的抽样误差
第五节样本容量的确定
影响样本容量的因素•确定样本容量
第十章双样本假设检验及区间估计
第一节两总体大样本假设检验
大样本均值差检验•大样本成数差检验
第二节两总体小样本假设检验
小样本均值差检验•小样本方差比检验
第三节配对样本的假设检验
单一实验组的假设检验•一实验组与一控制组的假设检验•对实验设计与相关检验的评论
第四节双样本区间估计
σ12和σ22已知,对均值差的区间估计•σ12和σ22未知,对均值差的区间估计•大样本成数区间估计•配对样本均值差的区间估计
第十一章非参数检验
第一节符号检验
配对样本的“符号检验”•符号检验与二项检验•简便检验•“符号检验”的作用
第二节配对符号秩检验
配对样本的符号秩检验•配对符号秩检验的步骤•符号秩检验的效力
第三节秩和检验
独立样本的秩和检验•秩和•秩和检验的具体步骤•U检验
第四节游程检验
独立样本的游程检验•游程•游程检验的具体步骤•差符号游程检验
第五节累计频数检验
独立样本的累计频数检验•累计频数检验的步骤•没有预测方向和已经预测方向•经验分布与理论分布之比较第十二章相关与回归分析
第一节变量之间的相互关系
相关程度与方向•因果关系
第二节定类变量的相关分析
列联表•削减误差比例•系数•系数
第三节定序变量的相关分析
同序对、异序对、同分对•Gamma系数•肯德尔等级相关系数•萨默斯(d系数)•斯皮尔曼等级相关系数•肯德尔和谐系数
第四节定距变量的相关分析
相关表和相关图•积差系数的导出和计算•积差系数的性质
第五节回归分析
线性回归•积差系数的PRE性质•相关指数R
第六节曲线相关与回归
第十三章检验与方差分析
第一节拟合优度检验
问题的导出•拟合优度检验(比率拟合检验) •正态拟合检验
第二节无关联性检验
独立性、理论频数及自由度•关于频数比较和连续性修正•列联表的卡方分解•关系强度的量度
第三节方差分析
总变差及其分解•关于自由度•关于检验统计量Fo的计算•相关比率•关于方差分析的几点讨论第四节回归方程与相关系数的检验
回归系数的检验•积差系数的检验•回归方程的区间估计
第十四章动态分析与指数分析
第一节时间数列及其指标分析
时间数列的构成与分类•动态比较指标•动态平均指标
第二节时间数列的趋势分析
随手绘法•移动平均法•半数平均法•最小平方法
第三节指数分析法
动态指数及其分类•质量指标综合指数•数量指标综合指数•用与个体指数的联系来求综合指数•其他权数形式的质量和数量综合指数•指数体系和因素分析•静态指数
第一章导论
统计是关于数字和数据合成的学问。
马克思说,科学只有当它利用了数学的时候,它才达到了完善的程度。
恩格斯也说,数字是我们所知道的最纯粹的量的规定,但是它充满了质的差异。
毛泽东则反复告诫我们,如果不懂得注意事物的数量方面,不懂得注意基本的统计、主要的百分比,不懂得注意决定事物质量的数量界限,一切都是胸中无“数”,结果就不能不犯错误。
第一节什么是社会统计学
“统计”一词,英语为statistics,用作复数名词时,意思是统计资料,用作单数名词时,指的是统计学。
一般来说,统计这个词包括三个含义:统计工作、统计资料和统计学。
这三者之间存在着密切的联系,统计资料是统计工作的成果,统计学来源于统计工作。
1.社会统计的产生与发展
社会统计的实践已有几千年的历史,是最早产生的统计。
古埃及在建造金字塔时,为征集建筑费用对全国人口和财产进行过简单的调查和统计。
古希腊在公元前400年就进行过人口普查。
古罗马则在公元前400年就建立了出生、死亡登记制度。
从奴隶社会到封建社会这段漫长的时期,社会统计主要局限于对事物进行原始的调查登记和简单的计算汇总,这是奴隶主或封建王朝为实现征税或服兵役和服劳役的需要而进行的。
华夏文化是世界上有数的几大文明之一,有关统计的方法、思想及工作,与中国的文化渊源紧密相连,都可以追溯到远古时代。
例如,公元前2000多年大禹治水时,依据山川土质、人口物产等分全国为九州,从而有了九州人口和土地的数字,称为九州表。
又如,汉代司马迁在他编的《史记》中多次用到统计表,晋代在分组上所采用的两端开口组,宋代对中位数的应用等等,这一切都远远走在当时的西欧诸国之前。
尽管如此,由于中国始终没有进入资本主义社会,商品经济始终没有形成一种社会经济形态,中国统计工作尤如一条流入沙漠的河流,慢慢地消失、衰亡了。
17世纪后,由于资本主义生产关系和商品经济形态的形成,在西方各国,简单的人口、土地、资源统计已不能满足社会发展的需要,因而产生了以工业、农业、贸易、交通等方面统计为主的社会经济统计。
在不断丰富的统计实践经验的基础上,比较系统的统计理论知识逐步形成,这便产生了统计学。
目前在统计分析中经常使用的一些基本方法和术语都始于这一个时期,比如最小平方法、正态分布曲线、误差计算等等。
但在近代统计学的初创阶段,由于统计学者所处的历史环境不同,对统计实践的理解不同,从而总结出来的经验和概括出来的理论也有所差别,这就产生了不同的统计学派。
统计学的发展,很大程度上正是在不同学派的争论中得以实现的。
国势学派这一学派产生于德国,其创始人为康令(1606—1681)和阿享瓦尔(1719—1772)。
阿享瓦尔在1749年所著《欧洲最主要各国新国势学概要》一书绪言中,把国势学定名为“Statistik”(统计)这个词。
国势学派又可称为记述学派和历史学派。
该学派有一句名言:“统计是静止的历史,历史是流动的统计。
”但由于其特征是只用文字记述,不用数字计量,所以历史上人们又将这一学派称为“有名无实”的学派。
政治算术学派该学派的创始人是英国人格朗特(1620—1674)和威廉·配第(1623—1687),它以后者的著作《政治算术》而得名。
676年《政治算术》一书问世,威廉·配第运用有关人口、土地税收和国家收入等方面的数字资料,对英国、法国、荷兰的经济实力进行比较,首创了一种数字对比分析的方法。
用配第自己的话来说,“即用数字、重量、尺度来表达自己想说的问题”。
配第没有使用统计学这一名词,但他使用的社会宏观数量对比和分析方法揭示了统计学所要研究的内容,因此历史上人们又将这一学派称为“有实无名”学派。
马克思对配第评价很高,誉他为“政治经济学之父,在某种程度上也可以说是统计学的创始人”。
数理统计学派和社会统计学派19世纪末20世纪初,随着资本主义的发展,统计理论没等上述两个学派争论结束,又有了新发展。
数理统计学派的创始人是比利时的凯特勒(1796—1874),其最大的贡献就是将法国的古典概率论引入统计学,用纯数学的方法对社会现象进行研究。
由于把概率论引进统计学,使社会随机现象
数量方面的研究提高了准确性。
凯特勒应用大量观察法研究犯罪、人口等现象,曾准确地预测到1830年法国犯罪行为的种类和数量。
1867年,一门兼有数学和统计学双重性质的学科被命名为“数理统计学”,凯特勒也被人称为“现代统计学之父”。
凯特勒的另一个重要贡献,是他把政治经济学、数学和当时政府统计工作的方法结合在一起,建立了一个专门研究社会现象的统计学派。
后来这个学派传到德国,就出现了以克尼斯(1821—1898)、梅尔(1841—l 923)和恩格尔(1821—1896)为代表的德国社会统计学派。
但在近代统计学的发展过程中,数理统计学派和社会统计学派的争论也是比较大的。
社会统计学在广义和狭义两方面的实践意义得到公认,二次大战后,世界政治格局发生重大变化的结果。
众所周知,20世纪下半叶,科学技术迅速进步,经济发展成为全人类面临的共同问题。
但在注重经济增长的同时,在工业发达国家出现了一系列难以解决的社会问题,诸如环境污染、犯罪率和离婚率上升、失业和贫困加剧等等。
在发展中国家,经济增长反而带来了政治的不稳定、社会动荡和国内的贫富差距。
这一切使人们逐渐认识到,经济增长并不一定意味着社会发展,经济高涨不等于社会进步,经济效益好不等于社会效益佳。
这就要求从社会整体发展的观点出发,应用社会调查和各种统计方法,收集大量的、更全面的事实来描述、分析、研究社会发展状况和发展趋势,从而监测社会发展和采取相应措施,达到统计为社会服务的目的。
20世纪60年代以来,西方发达资本主义国家先后都制定了社会发展计划。
法国较早地强调了计划的社会方面,在1962—1965年的战后第四个计划中,法国政府把原来的计划名称“经济现代化与投资计划”改为“经济与社会发展计划”。
垄断资本主义国家制定与实施社会发展计划的活动直接推动了社会统计的发展。
20世纪60年代首先在美国掀起了一个颇有声势的“社会指标运动”。
从20世纪70年代起,一些区域性或世界性的组织开始颁发统一使用的社会统计指标体系。
1976年经互会为各成员国颁发了《社会统计基本指标体系》。
同年,联合国经济合作与发展组织(OECD)编制了《社会生活质量的计量》的社会统计指标体系。
建国以来,我国已经建立了以社会主义计划经济为基础的统计组织机构和统计制度方法,在社会经济统计的实际工作和理论研究方面,积累了不少适合我国国情的宝贵经验,取得了很大成就。
但也应该看到,我国过去的统计工作,存在着反映物质生产领域情况多、反映非物质生产领域情况少的弊病。
1982年,我国把国民经济发展计划改为国民经济与社会发展计划。
为了适应这一状况,我国的统计工作发生了一系列变化。
首先,是统计组织机构与统计制度的变化。
其次,是统计指标与制度化报表的变化。
2.社会统计学的对象与特点
社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法与技术。
任何一门独立的学科,都有区别于其他学科的独特研究对象。
社会统计学的研究对象,概括而言是指社会现象的数量方面。
但值得注意的是,由于客观需要和具体任务的不同,社会统计学具有广义与狭义之分,它们的对象范围是不同的。
广义的社会统计学,在我国实际上就是社会经济统计学。
而从社会经济统计学中独立出来的社会统计学便是狭义的社会统计学,它是本书讨论的重点。
那么狭义的社会统计学同经济统计学是怎样一种关系呢?
3.社会统计的方法
所谓社会统计方法,简单地说就是指搜集、整理与分析资料的研究技术或手段。
同众多定量研究方法一样,社会统计方法的根本特征也是数量分析。
但社会统计学所研究的对象具有大量性、变异性的特点,这就决定了社会统计研究必须采用大量观察法。
所谓大量观察,即是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。
大量观察法是统计调查阶段的重要方法。
大量观察法之所以成为统计上特有的方法,是与大数规律的作用分不开的。
大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。
统计的重点是统计分析,这是在统计资料收集和整理之后展开的。
统计按其内容主要包括两个方面:描述统计和推论统计。
实际上,描述统计和推论统计也就是统计分析的两种基本方法,它们之间有紧密联系也有重要差别。
描述统计是统计分析方法的基础。
推论统计是对抽样调查来讲的。
描述统计固然对处理样本资料也有效,但样本能否代表总体,能在多大的
程度上代表总体,只有通过统计推论才能得出结论。
所以抽样调查一定要有推论统计。
推论统计有两个基本内容:①参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和区间估计。
②假设检验,即就社会研究中提出的某种假设应用抽样法来加以统计检定。
4.社会统计工作的程序
统计工作的程序,须视具体情况具体对待,一般可分为以下五步:(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
应该指出,统计工作的程序,从宏观上讲离不开统计立法,而且统计活动的首要前提是统计立法。
按国际惯例,统计立法应明确、具体地规定出统计活动所涉及的各方面的法律责任,以保证统计资料的准确性和客观性。
例如对提供虚假数据的被调查对象,统计法应具体规定出惩罚条款,违法必究。
第二节社会统计学的几个基本概念
每一门学科都有它自己的专门术语和概念,统计学也是如此。
本节我们叙述的概念有总体和单位、标志和变量、指标和指标体系,它们是各门统计学都少不了的基本概念。
1.总体与单位
统计是大量观察的结果。
统计所研究的不是个别的数量关系而是总体的数量关系,而没有大量个体的数量特征当然就谈不上总体的数量表现。
所以总体和总体单位是统计学的两个基本概念。
所谓总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。
总体也有人称之为母体。
构成总体的每一个个体称为总体单位,简称单位,也称为个体。
总体作为统计研究的对象,显然具有三个基本特征:大量性、同质性和变异性。
总体必须由足够多的单位所组成,个别或少数几个单位不足以构成总体。
总体按其包括的单位的数目是有限还是无限,分成有限总体和无限总体。
总体在抽样调查及推论统计中,还引出了它与样本总体这个概念的联系与区别。
推论统计有“部分推断总体”的特征。
通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为样本或样本总体。
样本中所含的单位数,在统计学上称为样本大小,也叫做样本容量。
从总体抽选出样本的过程叫抽样,也有叫取样的。
在推论统计中,当要研究概率及概率分布时,就接触到现实总体和想象总体这一对概念。
想象总体都是无限总体。
想象总体对应着先验概率。
总体和总体单位的概念是相对于一定的统计研究的目的而言的。
随着研究目的的不同,同一事物可以作为总体,也可以当作总体单位。
总体是统计的研究对象,但大量观察却必须从总体中的个别单位开始。
而把观察得来的个别事实综合起来,结果所反映的却是整个总体的规律。
2.标志与变量
总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志。
凡能用数量的多少来表示的标志,称为数量标志,如年龄,它们用以说明事物量的规定性。
凡不能用数量的多少来表示而只能文字表述的标志,称为品质标志,如性别,它们用以说明事物质的规定性。
标志按变异情况可以分为不变标志和可变标志。
不变标志是构成总体同质性的基础,任何个体只有在某些预设的不变标志的基础上才能集合成一个总体。
但统计研究之所以成为必要,是在于总体的变异性。
因此可变标志才是统计研究真正所关心的。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用
X。
通过调查得来的关于某一数量标志的一系列数值,在统计数值表示,我们称之为变量。
变量值一般记作
i
上又称数据。
变量的取值有连续和非连续之分。
凡是相邻的两个变量值之间可以连续不断分割的变量,称为连续变量。
凡是各变量值之间是以整数断开的变量,称为离散变量。
离散变量可以精确计量,其值可以是精确值。
连续变量不可能精确计量,其值都是近似值。
如果变量之间存在着—定的函数关系,我们就可以区别出自变量和因变量。
自变量是作为变化根据的变量,而因变量是随自变量而发生对应变化的变量。
变量按其性质又可分为确定性变量和随机变量。
在相同的条件下进行观测,其可能实现的值(或观测值)不止一个,有这种性质的变量称为随机变量,随机变量正是统计要处理的对象。
3.指标与指标体系
统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
如人口数、湿地面积、就业率、性比例等等,这些概念用于反映一定总体的数量方面时,就是统计指标。
在实际应用时。
一个完整的统计指标总是由两个部分构成:指标名称和指标数值。
统计指标按其内容或作用不同,可分为数量指标和质量指标。
数量指标说明总体在外延上的数量特征,如人口总数、居民收入、产品产量等,一般都以总量指标的形式出现。
质量指标说明总体在内涵上的数量特征,如人口密度、劳动生产率、产品价格等,一般都以相对指标或平均指标的形式出现。
通常,数量指标数值的大小随总体范围的大小而增减变动,而质量指标数值的大小与总体范围的大小没有直接关系。
统计指标和标志都是质的规定性和量的规定性的结合,它们之间有联系也有区别。
主要区别是:①指标是说明总体特征的,标志是说明总体中各单位特征的;②指标只能用数值表示,而标志中有不用数值而用文字表示的品质标志这种情况。
主要联系是:①指标名称和标志名称具有对应关系,在统计研究中两者往往是同一概念;②指标数值是由总体单位的个数和数量标志的标志值汇总而来的。
统计指标按其数值的三种表现形式(即绝对数、相对数、平均数),又有总量指标、相对指标和平均指标之分。
总量指标一般由统计汇总而来,它是研究问题的基础。
相对指标和平均指标一般由总量指标派生而来。
社会现象都是错综复杂的矛盾体,任何一个指标都只能反映对象总体的一个侧面。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。