卢淑华 《社会统计学》讲义
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
社会统计学讲义
第一章导论
一、社会统计学
1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序
(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念
(1)总体与单位
总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。构成总体的每一个个体称为总体单位,简称单位或个体。3个基本特征:大量性、同质性和变异性。(2)标志与变量
总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系
统计指标是反映总体(或样本总体)的数量特征的概念或范畴。一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序
社会学研究之阶段与步骤
(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;
(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探
索性研究;
(3)提出一定的想法和建立假设:差异式、函数式;
(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;
(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;
(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;
(7)调查实施(抽样调查):从局部推论到全体
(8)校核与登录
(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
科学研究方法
抽象层
经验层
概念命题理论
原则观察
量度
搜集测定测定
分析
研
究设计
分析
数据使用计算机对数据记录
储存、管理与分析
三、社会调查研究的特点和统计学的运用
1、社会调查资料的特点:随机性、统计规律性
2、统计学的运用:以概率论为基础的数理统计学
理论、假设、操作化是统计分析的前提。作用主要表现在经验层次的大面积数据处理方面。资料分析前要注意使用统计分析的前提是否满足:①资料的信度和效度;②资料收集的科学性;③资料在总体中的分布是否满足统计分析的要求etc.
3、统计分析的内容:统计描述和统计推论
在统计描述中,主要有资料的整理、分类和简化成特征研究;在统计推论中,主要有参数估计、假设检验、回归、列联、方差、等级相关等统计技术。
四、选用统计分析方法
1、全面调查与非全面调查
抽样调查就是在一定条件下,不是抽取总体的全部单位,而是科学、客观的抽取总体中的一部分单位来加以研究,其目的是获得对于总体性质的正确叙述。对全面调查一般采用统计描述,是将所观察的数据、资料进行整理、归纳和分析,以期找出某种规律。常用的方法有次数(频次)分布、统计图、统计表、集中趋势测量、离散趋势测量、相关等。
根据统计资料的统计规律性,运用概率论,正确的从局部推论到总体,这种根据不完全数
据对总体做出正确推论的方法称作统计推论,又称统计归纳。
2、单变量和多变量
3、变量层次
数学运算特性=,≠定类
√
定序
√
√
定距定比
√
√
√
√
√
√
√
>,<
+,-
×,÷
变量类型的划分不是唯一的。离散型变量是变量只可能取有限个或者一串值。连续型变量是它可能取某一区间内所有的值。
五、统计误差
第二章 单变量统计描述
一、分布、统计表和统计图
1、分布
(1)频次分布:就是变量的每一取值出现的次数。对于连续性变量,如定距变量,频次的 计算必须分组进行。其中每组上限即下一组的下限,通常将下限包括在本组中,每组用组中 值表示。
(2)频率分布:用变量每个取值的频次数除以总个案数,它是一个相对指标,排除了样本 规模的影响,因而可以用来比较不同的样本。一般频率分布使用比率的形式表示的。
2、统计表就是以表格形式来表示变量的分布。在制作统计表时,若有未回答或回答不合要
求的情况有两种处理方法:(A)仍以调查总数为基础计算频率,这时应加入一类:未详。 (B) 以有效回答为基数计算频率,这时应在表的下面、紧接着表的地方注明:未详****户。
3、统计图是以图形表示变量的分布情况。统计图虽然不如统计表精确,但是更直观、生动、 醒目。圆瓣图、条形图、直方图、折线图
4、累计图或累计表表示的是某个变量值的频次是多少或小于某个变量值的频次是多少。通 常可以比较个体在总体中的位置。
5、分布图分析
(1)峰点研究:有几个峰点,单峰 o r 多峰
(2)对称研究:有无对称轴,左偏态(负向偏态)or 右偏态(正向偏态) (3)U 形曲线与 J 形曲线 二、集中趋势测量法
集中趋势分析是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。除可 以说明某一社会现象在一定条件下数量的一般水平外 ;集中趋势还可以对不同空间的同类现 象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。
1、众数 就是出现频率最高的变量值。可适用于任何测量层次的变量,对于定类和定序变 量,众数可直接从变量的频率分布中观察到;对于定距变量,如果变量是在第 i 组具有最高的 频率密度,则用第 i 组的组中值表示变量的众数。
2、中位数
就是数据序列之中央位置的变量值。
(1)未分组数据:①根据原始资料:观察总数 N 为奇数时 中位值取居中位置左右两数的平均值为中位值。
②根据频次分布:中位值位置= +
= +;观察总数
N 为偶数时
(2)分组数据:计算方法:①根据统计表中的累计百分比,找出含有 50%的区间;②求出
含有 50%区间的上界值 U 、下界值 L 、上界累计百分数 U %、下界累计百分比 L%和组距;③