社会统计学(二章)1节

合集下载

00278 社会统计学

00278 南京大学编 (高纲号 0252)Ⅰ、课程性质与设置目的要求一、社会统计学课程的性质我国从1982年起把“国民经济发展计划”改为“国民经济与社会发展计划”，从而推动了社会统计的发展。

社会统计是党与政府了解情况、制定政策不可缺少的重要工具，也是各行各业更自觉地发展社会事业的有效手段。

社会统计学则是搜集与分析社会现象和问题的数量特征及其关系的一门科学，它运用统计学的一般原理与方法，对社会各种静态结构与动态趋势进行定理描述或推论，它是社会学、政治学、法学等各门社会科学进行定量研究的基本手机与工具。

随着我国社会由传统向现代变迁和转型，社会统计的发展也将进入一个新阶段，这是可以预期的。

社会统计学作为社会管理专业和公共关系专业的一门基础课，体现了现代社会对人才素质越来越高的标准和要求。

马克思说过：“科学只有当它利用了数学的时候，它才达到了完善的程度。

”但是，社会统计学阐述一些数量关系与数学公式，旨在增强我们认识社会的洞察力和增强我们对未来的适应能力，重在应用。

因此就本大纲所规定的社会统计学的内容而言，比较容易掌握。

为了很好地自学社会统计学，请按照本大纲参阅教材中的有关章节。

二、社会统计学课程的内容社会统计学的内容主要有两个：１、社会统计描述，即运用社会统计资料描述社会现象与问题的数量特征与数量关系。

２、社会统计推论，即通过部分研究对象的统计资料对研究对象总体的性质进行推断与归纳。

社会管理专业与公共关系专业所要求的主要内容是掌握社会统计描述，因而社会统计学课程的自学与考试范围限于教材第一章到第九章，现列示如下：１、社会统计的历史、方法及基本概念；２、社会统计资料的搜集与整理；３、集中趋势的量度，其中算术平均数、中位数、众数是重点。

４、离中趋势的量度，其中平均差、标准差、相对离势是重点。

５、相对指标，包括结构相对数，比较相对数，强度相对数及时间相对数。

６、时间数列的指标分析和趋势分析，其中动态比较指标、动态平均指标及最小平方法是重点。

社会统计学PPT课件

• 所谓重点单位，是着眼于现象量的方面，尽管这些单位在全部单位中只是一部分，但是它们的某一标志的标志总量在总体标志总量中占有绝大比重。
四、典型调查
（一）含义：
根据调查的目的任务，对所研究的现象总体进行初步分析的基础上，有意识地选取若干具有代表性的单位进行调查和研究，借以认识事物发展变化的规律。
（一）研究对象大量社会现象总体的数量方面，即现象总体的数量特征、数量关系及数量界限。
（二）统计学研究对象的特点 1、数量性 2、总体性 3、具体性 4、社会性
第二节统计研究的方法与过程
一、统计工作的过程
(一)统计设计：对统计活动各个方面和各个环节所作的通
盘考虑和合理安排。
(二)统计调查：根据一定的目的，通过科学的调查方法，
社会统计学课程总结
统计调查统计整理
统计分析
第一章第二章第三章第四章第五章第六章第七章第八章第九章
绪论统计调查统计整理综合指标（一）综合指标（二）抽样推断时间数列统计指数统计预测
第一章绪论
第一节统计与统计学
一、统计的含义
（一）统计工作
（二）统计资料
（三）统计学
二、社会统计的产生与发展三、社会统计研究的对象和特点
（三）标志与指标的主要联系
有些统计指标的数值是从总体单位的数量标志值汇总得到的。在一定的研究范围内，指标和数量标志之间存在着变换关系,当研究目的改变,原来的总体变为总体单位,则相应的统计指标就变为数量标志了,反之亦然。
第二章统计调查
• 统计调查方案 • 统计调查组织形式 • 统计调查问卷 • 撰写统计调查报告
（二）统计总体的特点：
1.大量性：

《社会统计学》PPT课件(110页)

《社会统计学》PPT课件(110页)一、引言社会统计学是研究社会现象数量特征及其规律的学科，是社会学的重要组成部分。

本课件将带领大家深入了解社会统计学的定义、研究方法、数据来源以及在社会各个领域的应用。

二、社会统计学的定义社会统计学是一门应用统计学原理和方法，对社会现象进行数量分析和描述的学科。

它通过收集、整理、分析和解释社会数据，揭示社会现象的数量特征、变化规律和相互关系，为社会决策提供科学依据。

三、社会统计学的研究方法1. 调查研究法：通过问卷调查、访谈等方式，收集社会数据，了解社会现象的实际情况。

2. 实验研究法：在控制条件下，对研究对象进行实验，观察和记录实验结果，分析社会现象的因果关系。

3. 文献研究法：通过查阅相关文献，了解社会现象的历史、现状和发展趋势。

4. 案例研究法：选取具有代表性的社会现象，进行深入分析，揭示其内在规律。

5. 统计模型法：运用统计模型，对社会现象进行定量分析，预测社会现象的未来发展趋势。

四、社会统计学数据来源1. 政府统计部门：提供国家、地区和行业的社会经济数据。

2. 学术研究机构：发布学术研究报告，提供社会现象的定量分析结果。

3. 社会调查机构：开展社会调查，收集社会数据，为政府、企业和社会组织提供决策依据。

4. 新闻媒体：报道社会现象，提供社会数据的实时更新。

5. 公共图书馆和档案馆：保存历史文献，为研究社会现象提供数据支持。

五、社会统计学在社会领域的应用1. 社会经济领域：分析经济增长、就业、收入分配等社会经济现象，为国家制定经济发展政策提供依据。

3. 社会问题领域：分析社会问题，如贫困、犯罪、环境污染等，为解决社会问题提供科学依据。

4. 社会发展领域：研究社会发展规律，为推动社会进步提供理论支持。

5. 社会管理领域：分析社会管理现状，为提高社会管理水平提供数据支持。

社会统计学作为一门研究社会现象数量特征及其规律的学科，具有广泛的应用价值。

通过掌握社会统计学的定义、研究方法、数据来源及其在社会领域的应用，我们可以更好地了解社会现象，为政府、企业和社会组织提供决策依据，推动社会进步。

社会统计学2

第二章单变量的统计描计
第一节分布、统计表和统计图
• 一、变量及其测量划分 • 变量是所研究问题的特征或性质，也称作指标。在自然科学中，
变量是可以通过仪器进行测量的。在社会学研究中，变量往往通过向被访者问问题来进行测量。落实在变量的设计上，就需要根据调查研究的问题的不同，设计出不同层次的变量，具体划分为定类变量、定序变量、定距变量、定比变量。
• １、定类变量
• 定类变量是最低的变量层次，它的取值只有类别属性之分，而无大小程度之别，如民族、婚姻、职业等变量。
• ２、定序变量
• 定序变量的取值除了有类别属性之外，还有等级次序的差别，其层次高于定类变量，常见的定序变量，如受教育程度、满意度、幸福感、社会经济地位等。在使用量表测量时，往往是基于定序变量。
如贫困问题，需要对低收入段分得细一些。研究老龄化问题，则需要对老年群体分得细一些。这些都会带来非等距分组。
• ３、组限
• 组限是指每组的范围，即每组的上限和下限。对于离散型变量一般采取相邻组限不重叠的原则，而对于连续型变量，可能出现相邻组限重叠的情况，这时采取的原则就是“上组限不在内”原则。对于开口组求组中值，是依据相邻组的组距加减其一半求得。
• 箱体图反映数据的集中程度，也反映出均值的代表性程度。
• 图2-8显示，流动人口中，女性的平均年龄略低于男性，女性的年龄更加集中。
第二节集中趋势测量法
• 集中趋势测量法是找出一个数值来代表该变量数据集结情况的方法。该方法的优劣在于，由于是根据一个代表值来估计或预测每个研究对象的数值，因此运用该方法要舍去变量的某些信息，但由于该数据是最有代表性的数值，以该数值做代表所产生的误差最小。
• １、点线图
• 线代表变量，线上标明的是变量的取值，线上方的每一个点代表一个观测值。点线图的优点是直接，能够看到哪些地方观测值密集，哪些地方观测值稀少，不丢失任何信息。

社会经济统计学各章重点知识

《社会经济统计学》各种重点知识第二章1、总体是根据一定的目的要求所需研究事物的全体，它由客观存在的具有某种共同性质的许多个别事物所组成。

2、总体单位是指组成总体的基本单位，它是所要统计的各种数量特征的承担者。

3、确定总体和总体单位，必须注意：构成总体的单位必须是同质的；构成总体的单位必须是大量的、足够多的；总体与总体单位具有相对性；随着研究目的的不同，总体和总体单位可以相互转化。

4、标志是指用来说明总体单位数量特征或属性特征的概念或名称。

5、标志分为品质标志与数量标志，品质标志表示事物质的特征，一般用文字说明；数量标志表示事物量的特征，一般用数值说明6、指标是用来反映总体数量特征的概念，应该包括他的概念和数值。

7、指标按其所反映总体的内容不同分为数量指标和质量指标。

数量指标是指反映社会经济现象总体规模或工作总量的统计指标；质量指标是指反映社会经济现象的相对水平或工作质量的统计指标。

8、指标按其功能和作用分为描述指标、评价指标和预警指标。

描述指标是指用于反映社会经济现实状况和社会生产、生活过程及其结果的统计指标；评价指标是指用于对社会经济活动的结果进行比较、评估、考核，以检查其经济效益和工作质量的统计指标；预警指标主要用于对宏观经济运行状况进行监控，并依据其指标值的变化，预报国民经济即将出现不平衡状态和突发事件，以及某些结构性障碍。

9、统计指标体系是指由一系列相互联系的统计指标所构成的指标群体，用以说明所研究的社会经济现象总体各方面相互依存和相互制约的关系。

10、变异是标志或指标具体表现的差异。

11、变量是指可变的数量标志和指标。

变量的数值表现就是变量值，亦即可变的数量标志或指标的不同取值。

12、定类尺度是指分组标志是对一些客观事物的名称进行排列。

它的特点是只能对数据进行平行的分组或分类，具有互斥性，不能对各组的编号进行加减乘除等数学运算。

13、定序尺度指把各类事物按一定特征的强弱、高低等顺序排列起来。

张小山新编《社会统计学与spss应用》课后习题答案

第二章随机现象与基础概率练习题：1.从一副洗好的扑克牌（共52张，无大小王）中任意抽取3张，求以下事件的概率：（1）三张K ；（2）三张黑桃；（3）一张黑桃、一张梅花和一张方块；（4）至少有两张花色相同；（5）至少一个K 。

解：（1）三张K 。

设：1A ＝“第一张为K ” 2A ＝“第二张为K ” 3A ＝“第三张为K ”则()()()()123121312//P A A A P A P A A P A A A =＝432525150⨯⨯＝15525若题目改为有回置地抽取三张，则答案为()123P A A A =444525252⨯⨯12197=（2）三张黑桃。

设：1A ＝“第一张为黑桃” 2A ＝“第二张为黑桃” 3A ＝“第三张为黑桃”则()()()()123121312//P A A A P A P A A P A A A =＝131211525150⨯⨯＝11850（3）一张黑桃、一张梅花和一张方块。

设：1A ＝“第一张为黑桃” 2A ＝“第二张为梅花” 3A ＝“第三张为方块”则 ()()()()123121312//P A A A P A P A A P A A A =＝131313525150⨯⨯＝0.017注意，上述结果只是一种排列顺序的结果，若考虑到符合题意的其他排列顺序，则最终的结果为：0.017×6＝0.102（4）至少有两张花色相同。

设：1A ＝“第一张为任意花色”2A ＝“第二张的花色与第一张不同”3A ＝“第三张的花色与第一、二张不同”则()1P A ＝5252＝1 ()21/P A A ＝5213521--＝3951 312(/)P A A A ＝5226522--=2650()123P A A A ＝1-123()P A A A ＝3926115150⎛⎫-⨯⨯ ⎪⎝⎭＝0.602（5）至少一个K 。

设：1A ＝第一张不为K2A ＝第二张不为K 3A ＝第三张不为K则()1P A ＝52452- ()21/P A A ＝51452- 312(/)P A A A ＝50452- ()123P A A A ＝1-123()P A A A ＝4847461525150⎛⎫-⨯⨯ ⎪⎝⎭＝0.2172.某地区3/10的婚姻以离婚而告终。

社会统计学(卢淑华),第二章

计量资料频数表的编制
计量资Байду номын сангаас频数表的编制
一般情况下,样本含量小于30的统计资料无须编制频数表,但对于大样本含量的资料,
编制频数表有利于进一步的统计分析、且频
数表本身也具有统计描述的作用.
编制频数表的步骤
编制频数表的步骤
第一组段包括极小值，最后一组段包括极大值，除最后一组段可同时标出上下限，
续例
计量资料频数分布表
118 例 13 岁女孩身高（cm）资料频数表。身高组段（1） 129～ 132～ 135～ 138～ 141～ 144～ 147～ 150～ 153～ 156～ 159～162 合计频数（2） 2 2 8 20 26 25 20 9 3 2 1 118 组中值 (3) 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 —
*
144.9 145.5 139.3 146.2 145.2 155.2 148.7 148.7 137.5 146.7 152.3 149.5
152.2 149.5 144.8 146.8 146.8 138.9 139.5 153.2 143.5 139.2 141.8 147.5
145.0 141.1 147.5 142.3 148.9 140.9 140.6 146.5 150.0 142.6 150.8 140.3
%
20.0 27.6 52.4 100.0
干部工人农民总数
二、统计表

统计表的制作要注意的问题： 1、标题、内容简明 2、统计栏数多时，要加编号 3、数字填写要求：位数对准，同栏数字、小数位要一致，相同数字不可以写“同上”，无数字栏用 “—”，缺资料“…” 4、表中数字用同一单位时，标在右上角 5、表的左右两端不封闭判断练习：分别制作定类、定序、定距变量统计表注意：统计表的分组科学性问题

社会统计学重点知识梳理

《社会统计学》重点知识梳理第一章绪论[教学目的]：本章是对社会统计学这门课程对概要性介绍。

通过本章对学习，首先使学生熟悉到学习这门课程对重要意义和作用，激发其学习对踊跃性和主动性。

其次使学生对该课程有一个大体对了解，并掌握其中的一些基础性的知识，为后面对学习打下基础。

[教学重点]：变量及变量层次[教学难点]：统计和统计学对含义[教学方法和手段]：讲授法[学时分配]：4学时[教学内容]：统计和统计学的含义，统计学的产生和发展，变量及变量层次第一节统计和统计学的含义一统计的含义统计作为一种社会实践活动已有悠长的历史。

在外语中，统计一词与国家一词来自同一词源。

因此，可以说，自从有了国家就有了统计实践活动。

最初，统计只是为统治者管理国家对需要而搜集资料，弄清国家对人力、物力、财力，作为国家管理的依据。

（如早在古代奴隶制的国家，由于赋税、徭役、征兵对需要，就开始了人口、土地等的记录和简单的统计工作。

今天，统计一词已被人们赋予多种含义，在不同场合，其可以具有不同含义。

一般来说，统计一词包括以下三种含义：一指统计工作，即调查研究，包括资料的收集、整理和分析；二指统计资料，包括统计数据和分析报告；三指统计学这门学科，研究如何搜集、整理和分析数据资料。

其中，前两种含义统计工作和统计资料指的是统计的实践活动，统计学则指理论研究。

二统计学的含义一、概念统计学是一门收集、整理和分析统计数据的方法科学，其目的是探索数据的内在规律性，以达到对客观事物的科学认识。

统计数据的收集是取得统计数据的过程，它是进行统计分析对基础。

离开了统计数据，统计方法就失去了用武之地。

如何取得所需的统计数据是统计学研究的内容之一。

统计数据的整理是对统计数据的加工处理过程，目的是使统计数据系统化、条理化，符合统计分析的需要。

数据整理是介于数据收集与数据分析之间的一个必要环节。

统计数据的分析是统计学的核心内容，它是通过统计描述和统计推断的方法探索数据内在规律对过程。

社会统计学,卢淑华(第4版),第2章.pptx

家庭结构核心家庭
直系家庭联合家庭
频次 1050
720 110
百分比（%） 49.30
33.80 5.16
其他
总数
250
2130
11.74
100.00
多选项二分法
a 样本1 样本2 样本3 样本4 样本5 √ × √ √ √ b √ × × √ √ c √ √ × × × d × √ √ × × e √ √ √ √ √
Me=“乙”
（三）组距式分组
• ①首先确定中位数组；②使用公式 • 下限公式： f S m 1 Me L 2 i fm
• 上限公式：
Me U
f
2
S m1 fm
i
公式中各字母含义
• • • • U：中位数组的上限； L：中位数组的下限； fm：中位数组的频数； Sm-1：向上累计时中位数组前一组的累计频数，即中位数前一组所对应的向上累计频数； • Sm+1：向下累计时中位数组后一组的累计频数即中位数后一组所对应的向下累计频数； • i：中位数组的组距。
（二）定距数据
1、未分组资料（spss版本）
Q1位置=(n+1)/4； Q2位置=(n+1)/2； Q3位置=3(n+1)/4 表2.10 Q1位置=(n+1)/4=25.25； Q2位置=(n+1)/2=50.5； Q3位置=3(n+1)/4=75.75
Q1=x(25)+0.25× [x(26)-x(25)]=1.37+0.25 ×[1.37-1.37]=1.37 Q2=x(50)+0.5× [x(51)-x(50)]=1.4+0. 5 ×[1.41-1.4]=1.405 Q3=x(75)+0.75× [x(76)-x(75)]=1.44+0.75 ×[1.44-1.44]=1.44

《社会统计学》全书目录

《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展·社会统计学的对象与特点·社会统计的方法·社会统计工作的程序第二节社会统计学的几个基本概念总体与单位·标志与变量·指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料·静态资料与静态资料·全面调查与非全面调查·一般调查与专项调查·经常性调查与一次性调查第二节统计调查的组织形式普查·重点调查·典型调查·抽样调查第三节概念的操作化与测量概念的操作化·定类尺度·定序尺度·定距尺度·定比尺度第四节统计误差登记性误差·代表性误差·抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”·频数(或次数)分布数列·品质数列与变量数列第二节统计表统计表的格式、内容与种类·统计表的制作规则第三节变量数列的编制对于离散变量·对于连续变量·组距和组数的确定·累计频数第四节统计图直方图·折线图·曲线图·累计顿数分布曲线·洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算·对于分组资料的算术平均数计算·算术平均数的性质第二节中位数对于未分组资料的中位数计算·对于分组资料的中位数计算·中位数的性质·其他分割法第三节众数对于未分组资料的众数计算·对于分组资料的众数计算·众数的性质第四节几何平均数、调和平均数及其他几何平均数·调和平均数·各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距·四分位差第二节平均差对于未分组资料A·D的计算·对于分组资料A·D的计算·平均差的性质第三节标准差对于未分组资科S的计算·对于分组资料S的计算·标准差的性质·标准分第四节相对离势变异系数·异众比率·偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件·事件之间的关系·先验概率·经验概率第二节概率的数学性质概率的数学性质·排列与样本点的计数·运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布·连续型随机变量的概率分布·分布函数·数学期望·变异数第七章假设检验第一节二项分布二项分布的数学形式·二项分布的讨论第二节统计检验的基本步骤建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布正态分布的数学形式·标准正态分布·正态曲线下的面积·二项分布的正态近似法第四节中心极限定理抽样分布·中心极限定理第五节总体均值和成数的单样本检验σ已知，对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式·超几何分布的数学期望与方差·关于超几何分布的近似第二节泊松分布泊松分布的数学形式·泊松分布的性质·关于泊松分布的近似第三节卡方分布(2 分布)卡方分布的数学形式·卡方分布的性质·样本方差的抽样分布第四节F分布F分布数学形式·F分布的性质·关于F分布的近似第九章参数估计第一节点估计无偏性·一致性·有效性第二节区间估计精确性和可靠性·抽样平均误差与概率度·区间估计的步骤第三节其他类型的置信区间σ未知，小样本总体均值的区间估计·总体成数的估计·总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差·分层抽样的抽样误差·整群抽样的抽样误差·等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素·确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验·大样本成数差检验第二节两总体小样本假设检验小样本均值差检验·小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验·一实验组与一控制组的假设检验·对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知，对均值差的区间估计·σ12和σ22未知，对均值差的区间估计·大样本成数区间估计·配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”·符号检验与二项检验·简便检验·“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验·配对符号秩检验的步骤·符号秩检验的效力第三节秩和检验独立样本的秩和检验·秩和·秩和检验的具体步骤·U检验第四节游程检验独立样本的游程检验·游程·游程检验的具体步骤·差符号游程检验第五节累计频数检验独立样本的累计频数检验·累计频数检验的步骤·没有预测方向和已经预测方向·经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向·因果关系第二节定类变量的相关分析列联表·削减误差比例·λ系数·τ系数第三节定序变量的相关分析同序对、异序对、同分对·G amma系数·肯德尔等级相关系数·萨默斯（d系数）·斯皮尔曼等级相关系数·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE性质·相关指数R第六节曲线相关与回归第十三章2 检验与方差分析第一节拟合优度检验问题的导出·拟合优度检验(比率拟合检验)·正态拟合检验第二节无关联性检验独立性、理论频数及自由度·关于频数比较和连续性修正·列联表的卡方分解·关系强度的量度第三节方差分析总变差及其分解·关于自由度·关于检验统计量F o的计算·相关比率·关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验·积差系数的检验·回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类·动态比较指标·动态平均指标第二节时间数列的趋势分析随手绘法·移动平均法·半数平均法·最小平方法第三节指数分析法动态指数及其分类·质量指标综合指数·数量指标综合指数·用与个体指数的联系来求综合指数·其他权数形式的质量和数量综合指数·指数体系和因素分析·静态指数。

社会统计学笔记

第一章科学方法与社会研究历程1·社会学研究：就是运用科学的方法来搜集和分析社会事实，以理解社会现象之间的关系。

2·科学研究：就是运用客观的、逻辑的和系统的方法来搜集事实及分析事实。

3·社会学研究的整个历程，大致上可以分为三个阶段：（1）筹划，（2）执行，（3）总结。

4·初步探索步骤：（1）收集有关的文献，（2）咨询那些对研究的题目有经验、有知识的人，进行了解，（3）观察个案。

5·假设：就是根据我们对问题的了解，假定现象与现象之间的关系。

就是假定某一现象的变化与另一种现象的变化具有某种关系。

假设的方式：函数式（要求变项之数值有高低之分）、差异式（不存在高低之分）6·较为常用的研究方式：实验法、社会调查法。

（皆可验证假设）①实验法的逻辑：有意的改变A变项，然后看看B变项是否随着变化；如果B变项显然是随着A变项的变化而变化，就说明A变项对B变项有影响。

②社会调查法特点：在研究过程中不改变社会现状，只求就地取材，然后以统计方法推算变项与变项之间的关系。

7·能够有效地验证假设的实验法称为典型或理想实验法8·社会调查法可以分为两大类：一是叙述性调查（重点是报道社会事实，较少分析社会事实（即变项）之间的因果关系），一是解释性调查（目的是要证明不同的变项之间是否有因果关系）。

9·全体调查：就是从所有研究对象中搜集资料。

抽样调查：就是从全体的研究对象中科学的抽出一个数目较少的样本，然后据此样本的资料推论全体的情况。

10·个案研究：就是选择一个或几个个案（即研究对象），作深入的接触和观察，目的是对所研究的问题作深入的了解。

11·横剖研究：指的是在同一时期搜集资料，目的是理解各种社会现象（即变项）在某时期的相关情况的研究。

纵贯研究：是指在不同时期搜集的，目的在了解社会现象（即变项）在不同时期中的变动情况的研究。

社会统计学

8
（二）社会研究的四种范式 1.实证主义 2.解释主义 3.批判主义 4.后现代主义
9
（三）社会研究的四种基本方式 1.调查研究 2.实验研究 3.文献研究 4.实地研究
二、社会统计学的知识背景与哲学基础
10
三、社会统计学的应用 1.帮助我们把复杂的社会现象进行简化，用比较科学、客观的方式描述和认识他们 2.比较精确地分析不同社会现象之间的关系 3.可以让我们成功地有样本的信息推论到总体 4.有助于提高统计思维，提高我们对不确定现象做出合理决策
第一章社会统计学
第一节社会统计学的基本含义一、几个相关概念（一）统计 1.事情 2.数据 3.方法统计量与参数
1
（二）统计学 1.描述性统计 2.推论性统计
（三）数理统计概率论
2
二、社会统计学的含义一门系统地收集、整理、计算、分析和解释有关社会现象的数据资料的科学变量社会统计学与数理统计的区别前者涉及大量数学属性较低的定类定序变量，后者涉及较高定比变量
11
12
3

第二节社会统计学简史一、古典时期（一）国势学派国势学派可谓“有名无实”的学派：只用文字记述，不用数字计量。它又称记述学派和历史学派。代表人物是康令（1606~1681）和阿亨瓦尔（1719~1772）。
4
（二）政治算术学派格朗特《自然和社会观察》威廉 ·配《政治算术》哈雷
5
二、近代时期拉普拉斯《概率论的解析理论》凯特勒《社会物理学》 “平均人” 高尔顿：相关指数皮尔逊：卡方检验，复相关计算
6

三、现代时期格赛特 t分布内曼区间估计威夏特多变量统计自杀论

3社会统计学第二章

众值：次数最多的那个值（类别）。 • 以众值估计变量的取值所犯的错误总数是最小的。 • 众值最适合于分析定类变量，也可以分析定序和
定距变量。
29
二、定序变量：中位值（Md）
• 中位值：一个序列中间位置的那个值。有一半取值比它大，有一半取值比它小。
• 以中位值去估计定序变量的取值，所犯的错误总数是最小的。
• 反之，要求较高测量层次的统计法，不能用于较低的层次。
25
集中趋势
用一个统计值表达资料的集结情况
26
集中趋势测量法
• 集中趋势测量法：用一个数值来代表变量的资料分布，以反映资料的集结情况。
• 这个数值，应具有代表性，根据其来估计每个研究对象的数值，所犯的错误应该最小。
27
28
一、定类变量：众值（Mo）
《社会统计学》
第二篇
统计叙述：单变量与双变量
1
第二章：化一个变量之分布简化一个变量的资料
第三章：简化两个变量之分布简化两个变量的资料第四章：相关测量法
描述两个变量之间的关系
2
第二章简化一个变量之分布
基本技术
简化一个变量的资料
集中趋势
用一个统计值表达资料的集结情况
离散趋势
用一个统计值表达资料的差异情况
• 组限、组距、组中点。
14
15
A.矩形图（直方图）以一个矩形的面积（长×宽）表示每组数值的次数或者百分率。
• 直方图与长条图的区别：长条图：条的宽度没有意义；离散排列；长度。直方图：条的宽度有意义；连续排列；面积。
16
17
B.多角线图 • 把直方图各矩形顶端的中点用直线连接起来，使
会犯多少错误。
40

社会统计学(二章)1节方案

表头标识行
主体行
表尾
SPSS统计包对多选项问题的处理方法
• 1.多选项二分法对每一个问题进行分别统计，做出不同的统计表。
• 2.多选项分类法由于各项取值分散在不同变量中，因此把取值相同的频次累计起来。作为该取
值的总人次，把不同变量总取值相加，得出被选中的总人次。然后用每个变量总取值/被选中的总人次，进行比较。
组距式分类
家庭人口数
1—2 3—4 5—6 6以上
频次
n1 n2 n3 n4
第一节分布统计图统计表
一、统计表(Statistical tables) 统计表就是用表格形式来表示所研究变量的分布 (一) 定类变量
例：某校学生的父亲职业（XX地，2003,7）
Hale Waihona Puke 职业农民工人干部频次（n） 110 152 228
连续，如身高
若变量为离散型变量，且取值相对较少，可以按照定类或定序统计表方式统计频次或百分比。统计表中变量取值，按取值大小排序，不要任意打乱。
若变量为连续型变量，则需要将变量值分为若干个区间或组，统计每一个组内或区间内的频次或百分比。
• 数据分组时需要考虑的几个问题：
A 组数
B 组距
C 组限
如何制作分组统计表
规律
2. 不等距分组
– 各组频数的分布受组距大小不同的影响 – 各组绝对频数的多少不能反映频数分布的实际
状况 – 需要用频数密度（频数密度＝频数/组距）反映
频数分布的实际状况
人有了知识，就会具备各种分析能力，明辨是非的能力。所以我们要勤恳读书，广泛阅读，古人说“书中自有黄金屋。 ”通过阅读科技书籍，我们能丰富知识，培养逻辑思维能力；通过阅读文学作品，我们能提高文学鉴赏水平，培养文学情趣；通过阅读报刊，我们能增长见识，扩大自己的知识面。有许多书籍还能培养我们的道德情操，给我们巨大的精神力量，鼓舞我们前进。

社会统计学

社会统计学第一章导论一．社会统计学的产生与发展1。

国势学派：（又称记录学派或历史学派）对国家显著事迹的记录和比较。

“有名无实”代表人物:阿享瓦尔（1719—1772)“统计学之父”、康令(1606—1681）2。

政治算术学派:对国家事项首创数字对比、分析。

“有实无名"代表人物：威廉配第（1623-1687）“政治经济学之父”、格朗特（1620-1674）3。

数理统计学派：将法国古典概率论引入统计学，用纯数学的方法对社会现象进行研究。

代表人物：凯特勒（1796-1874)“现代统计学之父”4.社会统计学派：研究社会现象代表人物：克尼斯（1821—1898）、梅尔（1841—1925）、恩格尔（1821—1896）二．社会统计学的对象和特点社会统计学：用于统计的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种方法与技术。

研究对象概括而言是指社会现象的数量方面。

社会统计学特点:就研究对象而言，社会统计学主要是从研究和反映一定经济基础之上的上层建筑方面去认识社会；就研究内容而言，社会统计需要对人们的态度、观念、行为进行度量，测量这些社会现象目前还没有一个精确而统一的尺度，只能以近似估算或词语表达等方式来代替；就调查方法而言，社会统计中，由于其研究对象所具有的特征，抽样调查更为常用。

三．社会统计学的方法1.大量观察法：就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。

2。

大数定理:是随机现象出现的基本规律，一般意义为：观察过程中每次取得的结果可能不同(因为具有偶然性)，但大量重复观察结果的平均值却几乎接近某个确定的数值。

3。

综合指标法4。

统计推断法四．社会统计学的几个基本概念1．总体与单位总体：作为统计研究对象的，由许多具有共性的单位构成的整体。

单位：构成整体的每一个个体。

2．标志与变量,标志：总体的每个单位都具有许多属性和特性，说明总体单位属性或数量特征的名称在统计上称为标志.数量标志：凡能用数量的多少来表示的标志,称为数量标志，如年龄，它们用以说明事物量的规定性。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

人数
1岁以下
135
1-3
302
3-7
475
7-18
968
18以上
2560
返回
等距分组与不等距分组（在表现频数分布上的差异）
1. 等距分组
– – 各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度（频数密度＝频数/组距）反映频数分布的实际状况
总数
39
99.9%
2、定序单变量统计表
表2：微博用户的教育程度统计（N=4306）
受教育程度
频数
百分比
17 0.4 初中及以下 237 5.5 高中、职高、技校 866 20.1 大专 2752 63.9 大学本科 434 10.1 研究生及以上 4306 100 总计 SSI在线样本库，调查地包括北京、上海、广州、（资料来源：
120 128 124 115 139 128
单变量值分组（要点）
• 1. • 2. • 3. 将一个变量值作为一组适合于离散变量适合于变量值较少的情况
单变量值分组表（实例）
表2-4 某车间50名工人日加工零件数分组表
零件数 (个)
107 108 110 112 113 114 115 117 118
107.5
112.5 117.5 122.5 127.5 132.5 137.5
3
5 8 14 10 6 4 50
6
10 16 28 20 12 8 100
6
16 32 60 80 92 100
频数分布表的编制（实例）
【例 2.3】某生产车间 50 名工人日加工零件数如下（单位：个）。试采用单变量值对数据进行分组。
20.0
152
228 490
27.6
52.4
100%
应用——如何制作不同类型的单变量统计表？
1、定类单变量统计表
表号表1：微博用户的性别统计表（N=4306）表头
性别男女总计
频次 2747 1559 4306
百分比 63.8 36.2 100
标识行主体行
（资料来源：SSI在线样本库，调查地包括北京、上海、广州、深圳、成都、沈阳、西安、杭州八市）
如何制作分组统计表
1、确定组数：一般调查总数N与分组数有如下经验关系调查总数N 斯特格斯（Sturges）经验公式确定组数： 50~100 100~250 250以上分组数K 6~10 7~12 10~20
K=1+3.322lgN
2、确定组距：分为等距分组与非等距分组，一般来说为等距最小值）/组数
分组数 6—10 7—12 10—20
• 等距分组和异距分组 • 开口组和闭口组 • 上限、下限、组距
下限上限组中值 2 • (闭口组)
邻组组距组中值下限（缺上限的开口组） 2
邻组组距组中值上限（缺下限的开口组） 2
不等距分组表
某地区人口统计
年龄
2. 不等距分组
– – –
单变量统计描述分析
学习要点和难点
分布统计图统计表
离散趋势测量法
集中趋势测量法
第一节分布统计图统计表
一、分布(Distributions) 分布（频次分布）：社会统计学中的分布指的是一个概念或变量，它的各个情况出现的次数或频次，因此也成为。
例：某校学生的父亲职业职业农民工人干部频次（n） 110 152 228 概率（p） 0.200 0.276 0.524 百分比（%）
**地区残疾人月收入统计表（ N=1000）
收入组
1000元以下 1000-2000 2000-3000
组中值
500
百分比
20.2 45.1 22.8
1500 2500
3000-4000
4000元以上
3500
4500
7.6
4.3
分组统计表例表例：某车间50名工人日加工零件数
117 122 124 129 139 107 117 130 122 125 110 118 123 126 133 134 127 123 118 112 108 131 125 117 122 133 126 122 118 108 112 134 127 123 119 113 120 123 118 112 137 114 120 128 124 115 139 128 124 121
• • • •
•
117 122 108 118 110 118 112 127 137 124
122 125 131 108 118 112 134 135 114 121
124 129 139 107 117 130 125 117 122 133 126 122 123 126 133 134 127 123 127 123 119 113 120 123
深圳、成都、沈阳、西安、杭州八市）
3、定距和定比单变量统计表
定距和定比变量的两种类型：
• 离散型变量——取值为有限个或列为有限个，如子女数 • 连续型变量——取值为有限或无限区间内的任意实数，即变量的取值
连续，如身高
若变量为离散型变量，且取值相对较少，可以按照定类或定序统计表方式统计频次或百分比。统计表中变量取值，按取值大小排序，不要任意打乱。若变量为连续型变量，则需要将变量值分为若干个区间或组，统计每一个组内或区间内的频次或百分比。 • 数据分组时需要考虑的几个问题： A 组数 B 组距 C 组限
表尾
SPSS统计包对多选项问题的处理方法
• 1.多选项二分法对每一个问题进行分别统计，做出不同的统计表。 • 2.多选项分类法由于各项取值分散在不同变量中，因此把取值相同的频次累计起来。作为该取值的总人次，把不同变量总取值相加，得出被选中的总人次。然后用每个变量总取值/被选中的总人次，进行比较。 3. 加权平均法通过被访人对全部可供选择的答案，按重要性进行打分，一般采取5等分，然后按重要性的顺序赋予不同权数，计算各项回答的平均得分后，进行比较，平均分高的，表示重要性要高些。
（二）定序变量定序变量统计表内容、制作方法与定类变量相同，所不同的是，由于定序变量的取值有大小次序之分，因此在统计表制作时，应保留其变化趋势，不要任意打乱。
XX单位对武打片的偏好统计
喜爱程度非常爱看爱看一般不爱看很反感
频次 7 9 10 10 3
百分比 17.9 23.1 25.6 25.6 7.7
组距分组（要点）
1. 2. 3. 4. 5. 6. 将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则上组限不在内的统计规定可采用等距分组，也可采用不等距分组
组距分组（步骤）
1. 确定组数：组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时，可以按 Sturges 提出的经验公式来确定组数K
分组方法
分组方法
单变量值分组
组距分组
等距分组
异距分组
3、确定组限：一个组的最小值叫下限，最大值叫上限 4、分组原则：不重复、不遗漏，组上限不在内 5、中心值计算
各组中心值bi计算公式
第i组上限值+第i组下限值 bi 2
缺上限开口组组中值bi=下限+邻组组距/2
缺下限开口组组中值bi=上限-邻组组距/2
频数 (人)
1 2 1 2 1 1 1 3 3
零件数 (个)
119 120 121 122 123 124 125 126 127
频数 (人)
1 2 1 4 4 3 2 2 3
零件数 (个)
128 129 130 131 133 134 135 137 139
频数 (人)
2 1 1 1 2 2 1 1 2
分组步骤：
1、确定组数：K=1+3.322lg50≈7 2、计算组距: h=(L-S)/K=(139-107)/7=4.6 ≈5
3、确定组限，编制频数分布表
表1：工人日加工零件频数分布表
组号日加工零件数中心值频数频率（%）累计百分比% cf
1
2 3 4 5 6 7 合计
105-110
110-115 115-120 120-125 125-130 130-135 135-140
性别男女
频次 n1 n2
收入（元）
频次
0—1000 2000—3000 3000以上
n1 n2 n3
（二）变量取值必须互斥
居民个人收入（元）频次
家庭人口数 1 —2 3 —4 5 —6 6以上
频次 n1 n2 n3 n4
0—800 800—1600 1600—2400 2400以上
“上组界不包含在内” 组距式分类
20.0 27.6 52.4
• 如果将调查结果按被访对象归类，列出数据：（ X1 ，n1 ）（X2，n2）„„
每对数据用括号括起，表示数据是共存的，其中括号第一项表示变量X的一种可能取值，第二项表示该种取值对应的频次。所谓分布，其实质就是这些对数的集合。频次分布概率分布百分比分布
• 变量取值需要注意的问题： • （1）变量取值必须完备
n1 n2 n3 n4
第一节分布统计图统计表
一、统计表(Statistical tables) 统计表就是用表格形式来表示所研究变量的分布 (一) 定类变量
例：某校学生的父亲职业（XX地，2003,7）职业农民工人干部总数频次（n） 110 概率（p） 0.200 0.276 0.524 1.000 百分比（%）