社会统计学第五讲
社会统计学讲义
《社会统计学》讲义教学目的和要求:通过本课程的学习,使学生熟悉常用的统计方法,并且学会如何将统计分析知识应用于社会调查研究之中,掌握统计方法的灵活运用。
本课程偏重统计方法的实际应用,而非其数理基础。
在教学过程中,注重对于不同统计分析方法适用条件的说明,统计公式的讲解,以及对于统计值意义的说明。
教学重点和难点:本课程的教学重点是不同统计分析方法所适用的条件以及统计值意义的解释。
难点是统计公式的讲解以及不同统计分析方法在实际社会调查研究中的应用。
教法特点说明:课堂讲授为主,注重对实例的讲解。
教材和参考书目:1、卢淑华著:《社会统计学(第三版)》,北京大学出版社,2007年。
2、李沛良著:《社会研究的统计应用》,社会科学文献出版社,2002年。
3、柯惠新等著:《调查研究中的统计分析法》,北京广播学院出版社,1992年。
4、风笑天著:《现代社会调查方法》,华中科技大学出版社,2001年。
5、袁方主编:《社会研究方法教程》,北京大学出版社,1997年。
第一章统计学简史教学目的和要求:通过本章的学习使学生了解统计学的产生、发展历程有初步的认识。
教学重点和难点:重点是国势学派与政治算数学派的差异,难点是文字记述与数字记述各自的特点。
教学方法:课堂讲授教学内容:一、统计学的起源统计技术:古埃及、古中国(大禹治水)统计学:17世纪中叶Status(拉丁词汇,国家、状态)——Statistics 研究国家的宏观状态①国势学②政治算术二、国势学(17世纪的德国)德国大学学派:H·Coring 用文字记录一个国家的状况和制度G·Achenwall 第一个定义——把国家的显著事项全部记录下来的学科三、政治算术(17世纪的英国)英国的经验主义者:用数量或数字的方法说明国家的特征J·Graunt 《关于伦敦死亡表的观察》用数量分析社会、政治问题William Petty 《政治算术》四、概率论(数理特征更加明显)1.J Bernoulli(贝努里)瑞士大数法则借助大数法则可以从社会现象复杂不定的偶然性中寻找规律,它说明了社会现象的稳定性2.Gauss(高斯)德国正态分布(中心极限定理的基础)五、数理统计学Adolphe Quetelet(阿道夫·凯特勒)法籍比利时人数理统计学派的创始人“经验社会学之父”《社会物理学》“平均人”六、描述统计高尔顿(F Galton)回归现象根据对1078对父、子身高的散布图发现,虽然身材高的父母比身材矮的父母倾向于有高的孩子。
卢淑华《社会统计学》讲义
卢淑华《社会统计学》讲义社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
社会统计学第五讲
体与已知总体在参数值上有差别。 ➢ 假设一与二必居其一; ➢ 假设一被称为原假设或虚无假设(Null Hypothesis) ➢ 假设二被称为备择假设(Alternative Hypothesis)
可编辑ppt
5
假设检验的原理与方法
社会统计学
2006年4月28日
主要内容
➢ 假设检验的原理与方法 ➢ 单总体假设检验 ➢ 两类错误 ➢ 二总体假设检验 ➢ 课本映射:第七章、第八章、第九章(第一、
二节、第三节第一条)
可编辑ppt
2
假设检验的原理与方法
➢ 抽样误差(sampling error):
➢ 抽样(sampling):通过一定的方法从总体中 随机抽取一定量的个体的过程。
➢ 这种检验方法被称为双边检验(Two-Tailed Test)
可编辑ppt
11
假设检验的原理与方法
➢ 如果备择假设明确假定样本对应总体的参数值 大于或小于已知总体参数值,则可以直接确定 拒绝域为α及所对应的临界值。
➢ 这种检验方法称为单边检验(One-Tailed Test)
可编辑ppt
12
假设检验的原理与方法
➢ 第四步:比较观测值与临界值。如果观测值的绝对值 大于临界值的绝对值,则拒绝原假设,接受备择假设; 反之,则接受原假设。
➢ 第五步:做结论。
可编辑ppt
14
单样本假设检验
➢ 单总体假设检验:总体的参数值已知的条件下, 对总体进行随机抽样调查得出样本的统计值。 通过样本统计值构建统计量检验总体参数值是 否与先前已知的总体参数不同。
α
单边│Zα│
社会统计学讲义
社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。
四、统计分析方法的选择1 、全面调查和抽样调查的分析方法2 、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。
尤其是直方图的意义。
二、标明组限与真实组限的换算,重要。
三、集中趋势测量法1 、定义、优缺点、注意事项;2 、众值:定义、计算公式、解释、运用,注意事项;3 、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;4 、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;5 、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1 、定义、优缺点、注意事项,与集中趋势的关系;2 、异众比例:定义、计算公式、解释、运用,注意事项;3 、质异指数:定义、计算公式、解释、运用,注意事项;4 、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。
5 、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;第三章概率一、概率:就是指随机现象发生的可能性大小。
随机现象具有不确定性和随机性。
二、概率的性质:1 、不可能事件的概率为O ;2 、必然事件的概率为1 ;3 、随机事件的概率在O 一1 之间;三、概率的计算方法:1 、古典法:计算等概率事件,P 一有效样本点数/样本空间数;2 、频率法:求随机事件在多次试验后的极限频率。
3 、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。
四、概率的运算:会画文氏图1 、加法公式:两个或多个随机事件的求和概率‘2 、乘法公式:两个或多个随机时间共同发生的概率。
社会统计学(卢淑华)PPT培训课件
例:
根据生命表,年龄为60岁的人,可望活 到下年的概率P=0.95。设某单位年龄为 60岁的人共有10人,问:
(1)其中有9人活到下年的概率为多少 (2)至少有9人活到下年的概率为多少 (3)至多有9人活到下年的概率为多少
第四节 多项分布
以三项分布作为研究对象,依此类推
三项分布: P x1 , x2 , x3 n! P P P 1 x1 2 2x 3 x3
x
x nx
n
xa
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
1、全不吸烟 2、1人吸烟 3、至少2人吸烟 4、2-4人吸烟
三、二项分布的数学期望
E
n
x
P
n
x
x
x
Cp q x
n
nx
n
p
x 0
x 0
5、二项分布的方差等于
2
2
6、查表方法
3、二点分布----一次贝努里试验的概率分布; 二项分布----n次贝努里试验的概率分布;
4、二点分布是二项分布的特殊情况
5、二点分布 :
变量的取值只有两类 ;
x
0
p
q
代码:0、1 ;
1
p
分布列:
6、二点分布的性质 1)P(=0)>0 P(=1) >0 2)P(=0)+ P(=1)=q+p=1 3)二点分布的期望与方差
如:同一地点的交通事故。
例
某城市一交叉路口每年平均发生交通事 故5起,如果交通事故的发生服从泊松分 布,在指定的一年内以下交通事故发生 的概率是多少?
《社会统计学》人大版
社会统计学的研究方法:统计 调查、统计分析、统计预测等
社会统计学的应用领域:社会 学、经济学、政治学、教育学 等
研究对象和范围
社会统计学的研究 对象:社会现象和 问题
研究范围:包括人 口、教育、就业、 收入、健康、犯罪 等社会领域
研究方法:采用定 量和定性相结合的 方法,包括描述性 统计、推论统计、 实验设计等
数据分析方法:描述性统计分析、推 论性统计分析、探索性数据分析等
数据的描述性分析
描述性统 计量:平 均数、中 位数、众 数、标准 差、方差 等
数据的分 布:正态 分布、偏 态分布、 峰度、偏 度等
数据的集 中趋势: 平均数、 中位数、 众数等
数据的离 散程度: 标准差、 方差等
数据的分 布形状: 直方图、 箱线图等
添加标题
显著性水平:用于 判断假设检验结果 的标准,通常为 0.05或0.01
添加标题
双尾检验:同时检 验两个方向的假设, 适用于对称分布的 数据
添加标题
单尾检验:只检验 一个方向的假设, 适用于非对称分布 的数据
方差分析、回归分析和相关分析
方差分析:用于比较两组或多组数据的平均值,判断它们是否 存在显著性差异
社会统计学PPT大纲
汇报人:XX
目录
01
02
03
04
05
06
单击添加目 录项标题
社会统计学 概述
社会统计学 的理论基础
社会统计学 的技术方法
社会统计学 在各领域的
应用
社会统计学 的前沿和发
展趋势
添加章节标题
社会统计学概述
定义和概念
社会统计学:研究社会现象的 数量关系和变化规律的科学
社会统计学的研究对象:社会 现象的数量特征和变化规律
社会统计学(卢淑华),第五章
卡方分布性质
性质1 如果随机变量 1 , 2 ,…… k 相互独立,
2
量:
x
2
1
2
i
k 2 i 1
仍然服从自由度为k的 X2 的平方分布。
性质2:
如果随机变量 和 独立,并且分别服 从自由度为K1与K2的X2 分布,则其和 服从自由度为K1 + K2的X2分布。
,求
2)P 1.3 3)P1.3 2.3
2、ξ 满足N 0,1 ,P 0.05 ,求λ 值。 3、ξ 满足 N 50,52 ,求 P 61
第四节 常用统计分布
一、X2分布(卡方分布) 1、设随机变量 1,2, k 相互独立,且都服
三、切贝谢夫大数定理
1、定义:设随机变量 , …是相互独立服 从 同 一 分 布 , 并 且 有 数 学 期 望 E i 差 Di 2 ,那么对于任何一个正数 ,
1
2
有: n 为 1 , 2 …n个随即变量的平均值 2、含义:当实验次数n足够大时,n个随机变 量的平均值 与单个随机变量的数学期望 的 差可以任意的小,这个事实以接近于1的很大 概率来说是正确的,即 趋近于数学期望 3、实际:意义可以用抽样的均值 做为总体均
P 2 z 2 0.9546
P 3 z 3 0.9973
例:
例1:σ相同而µ 不同。学习成绩:甲位于一班, 乙位于二班。一班平均成绩80分,二班平均成绩 60分,甲成绩80分,乙成绩80分。σ相同,为 10,比较二者在班上的成绩。 例二: µ 相同而σ不同:如果 1 2 60
统计学5章ppt课件
2024/9/28
2
统计学
二、时间数列旳种类
(一)绝对数时间数列
➢ 绝对数时间数列又称总量指标时间数列。它 是把一系列总量指标,按时间先后顺序排列 形成旳时间数列。
➢ 绝对数时间数列按反应社会经济现象时间状 态旳不同,又可分为时期指标时间数列和时 点指标时间数列,简称时期数列和时点数列。
2024/9/28
时点数列有连续时点数列和间断时点数列 两种。
(1)连续时点数列(已知每天数据)
统计学中旳时点指旳是某一天,假如已知每天旳数据, 则构成了连续时点数列,可直接采用算术平均法计算。
a a
n
或
a
af f
示例
式中:a 代表各期旳发展水平;n 代表时期项数;权数 f 表达变量不 发生变动旳天数。
2024/9/28
2024/9/28
7
统计学
(三)平均数时间数列
将一系列平均数,按时间先后顺序排列而形成旳 时间数列叫做平均数时间数列。
它反应社会经济现象总体各单位某一标志值一般 水平旳发展变动趋势。
相对数和平均数时间数列具有某些共同旳性质:
➢ 各指标值在时间上都没有相加性; ➢ 不存在时期数列和时点数列之分; ➢ 都能够经过两个时期数对比、两个时点数对比、或
2024/9/28
16
统计学
(4)年距(同比)增长水平
在实际统计分析中,为了消除季节变 动旳影响,经常需要计算年距(同比) 增长水平。
年距增长量 = 本期发展水平 — 去 年同期发展水平
2024/9/28
17
统计学
2.平均增长水平
平均增长水平也称平均增长量,用以表白社
会经济现象在一定时期内平均每期旳n 增长水
社会统计学重点知识梳理
《社会统计学》重点知识梳理第一章绪论[教学目的]:本章是对社会统计学这门课程对概要性介绍。
通过本章对学习,首先使学生熟悉到学习这门课程对重要意义和作用,激发其学习对踊跃性和主动性。
其次使学生对该课程有一个大体对了解,并掌握其中的一些基础性的知识,为后面对学习打下基础。
[教学重点]:变量及变量层次[教学难点]:统计和统计学对含义[教学方法和手段]:讲授法[学时分配]:4学时[教学内容]:统计和统计学的含义,统计学的产生和发展,变量及变量层次第一节统计和统计学的含义一统计的含义统计作为一种社会实践活动已有悠长的历史。
在外语中,统计一词与国家一词来自同一词源。
因此,可以说,自从有了国家就有了统计实践活动。
最初,统计只是为统治者管理国家对需要而搜集资料,弄清国家对人力、物力、财力,作为国家管理的依据。
(如早在古代奴隶制的国家,由于赋税、徭役、征兵对需要,就开始了人口、土地等的记录和简单的统计工作。
今天,统计一词已被人们赋予多种含义,在不同场合,其可以具有不同含义。
一般来说,统计一词包括以下三种含义:一指统计工作,即调查研究,包括资料的收集、整理和分析;二指统计资料,包括统计数据和分析报告;三指统计学这门学科,研究如何搜集、整理和分析数据资料。
其中,前两种含义统计工作和统计资料指的是统计的实践活动,统计学则指理论研究。
二统计学的含义一、概念统计学是一门收集、整理和分析统计数据的方法科学,其目的是探索数据的内在规律性,以达到对客观事物的科学认识。
统计数据的收集是取得统计数据的过程,它是进行统计分析对基础。
离开了统计数据,统计方法就失去了用武之地。
如何取得所需的统计数据是统计学研究的内容之一。
统计数据的整理是对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的需要。
数据整理是介于数据收集与数据分析之间的一个必要环节。
统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律对过程。
《社会统计学》全书目录
《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展·社会统计学的对象与特点·社会统计的方法·社会统计工作的程序第二节社会统计学的几个基本概念总体与单位·标志与变量·指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料·静态资料与静态资料·全面调查与非全面调查·一般调查与专项调查·经常性调查与一次性调查第二节统计调查的组织形式普查·重点调查·典型调查·抽样调查第三节概念的操作化与测量概念的操作化·定类尺度·定序尺度·定距尺度·定比尺度第四节统计误差登记性误差·代表性误差·抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”·频数(或次数)分布数列·品质数列与变量数列第二节统计表统计表的格式、内容与种类·统计表的制作规则第三节变量数列的编制对于离散变量·对于连续变量·组距和组数的确定·累计频数第四节统计图直方图·折线图·曲线图·累计顿数分布曲线·洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算·对于分组资料的算术平均数计算·算术平均数的性质第二节中位数对于未分组资料的中位数计算·对于分组资料的中位数计算·中位数的性质·其他分割法第三节众数对于未分组资料的众数计算·对于分组资料的众数计算·众数的性质第四节几何平均数、调和平均数及其他几何平均数·调和平均数·各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距·四分位差第二节平均差对于未分组资料A·D的计算·对于分组资料A·D的计算·平均差的性质第三节标准差对于未分组资科S的计算·对于分组资料S的计算·标准差的性质·标准分第四节相对离势变异系数·异众比率·偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件·事件之间的关系·先验概率·经验概率第二节概率的数学性质概率的数学性质·排列与样本点的计数·运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布·连续型随机变量的概率分布·分布函数·数学期望·变异数第七章假设检验第一节二项分布二项分布的数学形式·二项分布的讨论第二节统计检验的基本步骤建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布正态分布的数学形式·标准正态分布·正态曲线下的面积·二项分布的正态近似法第四节中心极限定理抽样分布·中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式·超几何分布的数学期望与方差·关于超几何分布的近似第二节泊松分布泊松分布的数学形式·泊松分布的性质·关于泊松分布的近似第三节卡方分布(2 分布)卡方分布的数学形式·卡方分布的性质·样本方差的抽样分布第四节F分布F分布数学形式·F分布的性质·关于F分布的近似第九章参数估计第一节点估计无偏性·一致性·有效性第二节区间估计精确性和可靠性·抽样平均误差与概率度·区间估计的步骤第三节其他类型的置信区间σ未知,小样本总体均值的区间估计·总体成数的估计·总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差·分层抽样的抽样误差·整群抽样的抽样误差·等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素·确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验·大样本成数差检验第二节两总体小样本假设检验小样本均值差检验·小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验·一实验组与一控制组的假设检验·对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对均值差的区间估计·σ12和σ22未知,对均值差的区间估计·大样本成数区间估计·配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”·符号检验与二项检验·简便检验·“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验·配对符号秩检验的步骤·符号秩检验的效力第三节秩和检验独立样本的秩和检验·秩和·秩和检验的具体步骤·U检验第四节游程检验独立样本的游程检验·游程·游程检验的具体步骤·差符号游程检验第五节累计频数检验独立样本的累计频数检验·累计频数检验的步骤·没有预测方向和已经预测方向·经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向·因果关系第二节定类变量的相关分析列联表·削减误差比例·λ系数·τ系数第三节定序变量的相关分析同序对、异序对、同分对·G amma系数·肯德尔等级相关系数·萨默斯(d系数)·斯皮尔曼等级相关系数·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE性质·相关指数R第六节曲线相关与回归第十三章2 检验与方差分析第一节拟合优度检验问题的导出·拟合优度检验(比率拟合检验)·正态拟合检验第二节无关联性检验独立性、理论频数及自由度·关于频数比较和连续性修正·列联表的卡方分解·关系强度的量度第三节方差分析总变差及其分解·关于自由度·关于检验统计量F o的计算·相关比率·关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验·积差系数的检验·回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类·动态比较指标·动态平均指标第二节时间数列的趋势分析随手绘法·移动平均法·半数平均法·最小平方法第三节指数分析法动态指数及其分类·质量指标综合指数·数量指标综合指数·用与个体指数的联系来求综合指数·其他权数形式的质量和数量综合指数·指数体系和因素分析·静态指数。
四、单变量的描述统计离散趋势分析和集中趋势分析
解:Md位置
=
成 绩 甲 乙 丙 丁 N
频 累计频次 次 cf 85 500 195 415 210 220 10 10 500 500
N+ 1 2
500+ 1 = 2
=250.5
中位值Md=乙
15
2、分组数据
根据统计表中的累积百分比,找出含有 50%的区间 找出含有50%区间的上界值U,下界值 L,上界累计百分数U%,下界累计百分 数L%以及组距等信息 根据线段对应成比例的原理,计算出累 计百分比为50%的变量值
O
fM
o
:众值的频次
44
异众比率(先找出众值.找到众值的频次分布)
表 1 家庭结构的频次分布表 家庭结构 频次 百分比 核心家庭 1050 49.3 直系家庭 720 33.8 联合家庭 110 5.2 其它 250 11.7 N 2130 100
【例1】:根据表1中 的数据,计算众值 和异众比率。
16
n cf 2 Md L f
w
L:中位数组的下限 f:中位数组的频数 w:中位数组的组距 (U-L) cf:低于中位数组下 限的累加次数 n:全部个案数 Md位置=n/2 (上 下各50%的位置)
17
ห้องสมุดไป่ตู้
例:分组数据:
首先将各组的次数累加起来
求中位数的位置: Md位置=n/2 =212/2=106
第106个位置在 25-35之间
18
分组变量看作是一组连续的数值
10 25 94 12
?
106
35
124
30
19
社会统计学----教材
《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展•社会统计学的对象与特点•社会统计的方法•社会统计工作的程序第二节社会统计学的几个基本概念总体与单位•标志与变量•指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料•静态资料与静态资料•全面调查与非全面调查•一般调查与专项调查•经常性调查与一次性调查第二节统计调查的组织形式普查•重点调查•典型调查•抽样调查第三节概念的操作化与测量概念的操作化•定类尺度•定序尺度•定距尺度•定比尺度第四节统计误差登记性误差•代表性误差•抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”•频数(或次数)分布数列•品质数列与变量数列第二节统计表统计表的格式、内容与种类•统计表的制作规则第三节变量数列的编制对于离散变量•对于连续变量•组距和组数的确定•累计频数第四节统计图直方图•折线图•曲线图•累计顿数分布曲线•洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算•对于分组资料的算术平均数计算•算术平均数的性质第二节中位数对于未分组资料的中位数计算•对于分组资料的中位数计算•中位数的性质•其他分割法第三节众数对于未分组资料的众数计算•对于分组资料的众数计算•众数的性质第四节几何平均数、调和平均数及其他几何平均数•调和平均数•各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距•四分位差第二节平均差对于未分组资料A•D的计算•对于分组资料A•D的计算•平均差的性质第三节标准差对于未分组资科S的计算•对于分组资料S的计算•标准差的性质•标准分第四节相对离势变异系数•异众比率•偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件•事件之间的关系•先验概率•经验概率第二节概率的数学性质概率的数学性质•排列与样本点的计数•运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布•连续型随机变量的概率分布•分布函数•数学期望•变异数第七章假设检验第一节二项分布二项分布的数学形式•二项分布的讨论第二节统计检验的基本步骤建立假设•求抽样分布•选择显著性水平和否定域•计算检验统计量•判定第三节正态分布正态分布的数学形式•标准正态分布•正态曲线下的面积•二项分布的正态近似法第四节中心极限定理抽样分布•中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验•学生t分布(小样本总体均值的检验)•关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式•超几何分布的数学期望与方差•关于超几何分布的近似第二节泊松分布泊松分布的数学形式•泊松分布的性质•关于泊松分布的近似第三节卡方分布( 分布)卡方分布的数学形式•卡方分布的性质•样本方差的抽样分布第四节F分布F分布数学形式•F分布的性质•关于F分布的近似第九章参数估计第一节点估计无偏性•一致性•有效性第二节区间估计精确性和可靠性•抽样平均误差与概率度•区间估计的步骤第三节其他类型的置信区间未知,小样本总体均值的区间估计•总体成数的估计•总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差•分层抽样的抽样误差•整群抽样的抽样误差•等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素•确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验•大样本成数差检验第二节两总体小样本假设检验小样本均值差检验•小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验•一实验组与一控制组的假设检验•对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对均值差的区间估计•σ12和σ22未知,对均值差的区间估计•大样本成数区间估计•配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”•符号检验与二项检验•简便检验•“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验•配对符号秩检验的步骤•符号秩检验的效力第三节秩和检验独立样本的秩和检验•秩和•秩和检验的具体步骤•U检验第四节游程检验独立样本的游程检验•游程•游程检验的具体步骤•差符号游程检验第五节累计频数检验独立样本的累计频数检验•累计频数检验的步骤•没有预测方向和已经预测方向•经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向•因果关系第二节定类变量的相关分析列联表•削减误差比例•系数•系数第三节定序变量的相关分析同序对、异序对、同分对•Gamma系数•肯德尔等级相关系数•萨默斯(d系数)•斯皮尔曼等级相关系数•肯德尔和谐系数第四节定距变量的相关分析相关表和相关图•积差系数的导出和计算•积差系数的性质第五节回归分析线性回归•积差系数的PRE性质•相关指数R第六节曲线相关与回归第十三章检验与方差分析第一节拟合优度检验问题的导出•拟合优度检验(比率拟合检验) •正态拟合检验第二节无关联性检验独立性、理论频数及自由度•关于频数比较和连续性修正•列联表的卡方分解•关系强度的量度第三节方差分析总变差及其分解•关于自由度•关于检验统计量Fo的计算•相关比率•关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验•积差系数的检验•回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类•动态比较指标•动态平均指标第二节时间数列的趋势分析随手绘法•移动平均法•半数平均法•最小平方法第三节指数分析法动态指数及其分类•质量指标综合指数•数量指标综合指数•用与个体指数的联系来求综合指数•其他权数形式的质量和数量综合指数•指数体系和因素分析•静态指数第一章导论统计是关于数字和数据合成的学问。
社会科学应用统计学原理
th 教材 教材:Kutner:Applied Linear Regression Models 4 Edition,Published by McGraw-Hill Companies, 2004. (国内出版:应用回归分析模型,海外优秀数学 和参 类教材系列丛书,影印版,高等教育出版社,2005 年 2 月) 考书 参考书:S. Weisberg: 应用线性回归,中国统计出版社,1998 年
00授课计划第一讲社会统计学概览与描述性统计11社会统计学简介12社会科学数据图表展示13数据汇总集中趋势分析14数据汇总离散变异分析第二讲概率与推断性统计基础21概率简介22正态分布与标准化检验23概率与抽样分布第三讲均值比较分析31假设检验显著水平效应量与势32单样本t检验和独立双样本t检验33重复测量样本t检验34估计与置信区间第四讲方差分析41一元独立样本方差分析42一元重复测量方差分析43二元独立样本方差分析第五讲非参数统计检验51非参数卡方检验52定序数据统计检验53相关与回归分析简介注
分层模型 (Multilevel Models) ,也称多水平分析 (Multilevel Analysis) 、 混合模型 (Mixed Models) 、混合效应模型 (Mixed-Effects Models) 、随机系 数模型 (Random Coefficient Models) 及 协 方 差 成 分 模 型 (Covariance Components Models) ,是社会统计及计量经济研究中针对嵌套 数据结构 (nested data structure) 、层级数据 (hierarchical structure) 及追踪数据 (longitudinal/panel data) 等进行混合效应(固定效应 +随机效 课程 应)分析的一种前沿统计方法。以往行为研究表明,个体的行为和结局测量 简介 (outcome measurement) 不仅受到其自身特征的影响,还会受其所处家庭、社 区及社会环境或社会场景 (social contexts) 的综合性影响。如何有效地将宏 观与微观分析相结合、解决不同层级变量置于单一层级的回归模型所带来的 估计偏倚、正确处理模型参数的估计、离析跨层分析的交互效应等,分层模 型的引入与应用将有的放矢,实有裨益。此外,本教程不重繁琐的数学公式 推导, 重在分层模型的实际应用与结果解读, 使学员熟悉与掌握 HLM 与 Stata 软件应用。
社会统计学PPT课件:第五章 公共部门统计1
统计)
• 2.从财政的管理渠道: • 预算内收入和预算外收入
•
•
(二)财政收入分组与构成统计
• 1.财政收入项目分组及构成统计 • (1)各项税收收入
• 工商税收(包括产品税、增值税、营业税、消费税等);所得税,包括企业所得税和 个人所得税;此外还有关税、资源税、城市维护建设税、印花税、土地使用税、农 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006
财政收入 财政支出 财政收支 财政债务 国内债务 国外借款 国内
差额
发行合计
其他债务
2937.10 3149.48 3483.37 4348.95 5218.1 6242.2 7407.99 8651.14 9875.95 11444.08 13395.23
2.财政收入来源分组及构成统计
• 是要针对提供收入的经济单位的性质对财政收入 予以分组。这样的分组包括:
• 第一,按收入来源的行业部门分组,划分出工业、 农业、建筑业、商业、交通运输业及服务业等部 门;
• 第二,按收入来源的经济类型分组,划分出来自 国有经济部门的财政收入、来自集体经济部门的 财政收入、来自个体和民营经济部门的财政收入、 来自外资经济部门的财政收入等。
况如下:
•
1. 税收收入。分设21款:增值税、消费税、营业税、企业所得税、
企业所得税退税、个人所得税、资源税、固定资产投资方向调节税、城
市维护建设税、 房产税、印花税、城镇土地使用税、土地增值税、车船
使用和牌照税、船舶吨税、车辆购置税、关税、耕地占用税、契税、烟
叶税和其他税收收入。
2. 社会保险基金收入。分设6款:基本养老保险基金收入、失业保
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验的原理与方法
为了证明差别的来源,可以设立两个假设: 假设一:差别是抽样误差引起的,即样本对应的总体 与已知总体在参数值上没有差别。 假设二:差别不是抽样误差引起的,即样本对应的总 体与已知总体在参数值上有差别。 假设一与二必居其一; 假设一被称为原假设或虚无假设(Null Hypothesis) 假设二被称为备择假设(Alternative Hypothesis)
(C)2006 GUOH 31
(C)2006 GUOH
32
两类错误
第一类错误的概率与第二类错误的概率不能同 时缩小。在样本量一定时,两者为此消彼长的 关系。 增大样本量n可以在α一定的情况下减少β。 因为n越大,Z值会越大,则越有可能拒绝H0, 则纳伪的错误概率减少。 在α和β之间进行权衡:社会科学一般要避免 犯第一类错误,所以要用较小的α。
社会统计学
2006年 28日 2006年4月28日
主要内容
假设检验的原理与方法 单总体假设检验 两类错误 二总体假设检验 课本映射:第七章、第八章、第九章(第一、 二节、第三节第一条)
(C)2006 GUOH
2
假设检验的原理与方法
抽样误差(sampling error): 抽样(sampling):通过一定的方法从总体中 随机抽取一定量的个体的过程。 非抽样误差(non-sampling error):在调查 过程中产生的错误,并非由抽样方法产生。理 论上可以完全消除。 抽样误差:由抽样方法造成的样本统计值与总 体参数值之间的差别。
(C)2006 GUOH 33
两类错误
H0实为 真 接受 拒绝 第一类错误, 弃真。P=α
☺
第二类错误, 纳伪。P=β
(C)2006 GUOH
伪
☺
34
二总体的假设检验
二总体的假设检验:从两个不同的总体中各独 立随机抽取一个样本,通过样本统计值计算总 体参数值之间的差别是否显著。 大样本总体均值差检验: 根据中心极限定理,大样本情况下的样本统计 值的抽样分布符合正态分布。 样本均值差的抽样分布也符合正态分布。
(C)2006 GUOH 15
单样本假设检验
作出原假设H0和备择假设H1; H0:μ=880 H1:μ≠880 假定H0成立,确定样本统计值的抽样分布和在 显著性水平下拒绝域和临界值; N=50 大样本 Z=(x bar-μ)/(s/sqrt(n))~N(0,1) α=0.05,双边检验,Zα/2=+/-1.96
(C)2006 GUOH
27
两类错误
影响假设检验中拒绝H0的因素: α的大小:α越大,越容易拒绝H0 单边检验或双边检验:相同的显著度下,单边 检验检验比双边检验更容易拒绝H0 分布的类型:相同显著度下,Z分布比t分布更 容易拒绝H0 当n=30,显著度为0.05时 t双边检验为+/-2.0423, 单边检验为1.6973
单样本假设检验
α=0.001 双边检验 Zα/2=+/-3.30 Z=(98-130)/(5/sqrt(36))=-38.4 Z<-3.30, 拒绝H0,接受H1。 以0.001为显著度,全国水平与该市水平有差 别。
(C)2006 GUOH
26
单样本假设检验
练习: 随机调查25名社会学研究生的GRE成绩,他 (她)们的成绩均值为458分,标准差为20分, 请问该成绩与全国平均水平440分有显著差异 吗?(α=0.05) t=4.5, 拒绝H0,接受H1。
(C)2006 GUOH 11
假设检验的原理与方法
如果备择假设明确假定样本对应总体的参数值 大于或小于已知总体参数值,则可以直接确定 拒绝域为α及所对应的临界值。 这种检验方法称为单边检验(One-Tailed Test)
(C)2006 GUOH
12
假设检验的原理与方法
α 0.05 0.01 0.001 单边│Zα│ 1.65 2.33 3.09
(C)2006 GUOH 35
(C)2006 GUOH
双边│Zα/2│ 1.96 2.58 3.30
13
假设检验的原理与方法
假设检验的步骤: 第一步:作出原假设H0与备择假设H1; 第二步:假定H0成立,确定样本统计值的抽样分布和 在显著性水平下的拒绝域和临界值; 第三步:计算在H0成立时,统计值在抽样分布中的观 测值; 第四步:比较观测值与临界值。如果观测值的绝对值 大于临界值的绝对值,则拒绝原假设,接受备择假设; 反之,则接受原假设。 第五步:做结论。
8
假设检验的原理与方法
假设检验中的名词: 显著性水平(显著度):在假设检验中小概率 的标准,即α。显著度一般是事先给定的,常 用的有0.1,0.01,0.05。 统计量的抽样分布:在假定原假设成立的条件 下构建的抽样分布。 拒绝域(Critical Region):在抽样分布中, 显著度在横轴上所对应的区间。 如果样本统计值处于拒绝域,则拒绝原假设。
(C)2006 GUOH 30
两类错误
第二类错误(Type II error):原假设本是错误的, 但却由于样本所对应总体的参数值与已知总体 参数值相距太近而接受了原假设,这种错误被 称为“纳伪”。发生该类错误的概率为β。 β由真实μ与原假设μ0之间的偏离程度决定, Δμ=μ-μ0越小,β越大。 β也与接受域有关,接受域越大,则发生第二 类错误的可能性也越大。
单样本假设检验
小样本单正态总体的均值检验: 总体方差未知: 已知初婚年龄服从正态分布。根据九个人的抽 样调查发现x bar=23.5岁,s=3岁,是否可以 认为该地区平均初婚年龄已超过20岁? (α=0.1) H0:μ=20 H1:μ>20
(C)2006 GUOH 23
单样本假设检验
n=9, 小样本,σ未知,t分布 t=(x bar-µ)/(s/sqrt(n))~t(n-1) α=0.1 单边检验,K=n-1=8 tα=1.3968 t=(23.5-20)/(3/sqrt(9))=3.5 t=3.5>1.3968 拒绝H0,接受H1。 以0.1为显著度,可以认为该地区平均初婚年 龄已超过20岁。
(C)2006 GUOH 14
单样本假设检验
单总体假设检验:总体的参数值已知的条件下, 对总体进行随机抽样调查得出样本的统计值。 通过样本统计值构建统计量检验总体参数值是 否与先前已知的总体参数不同。 大样本单总体均值检验: 为了检验统计报表的正确性,作了共五十人的 抽样调查,人均收入的结果有:x bar=871元, s=21元。问能否证明统计报表中人均收入 μ=880元是正确的?(α=0.05)
(C)2006 GUOH
17
单样本假设检验
大样本总体成数检验: 某地区成年人中吸烟的人占75%,经过戒烟宣 传之后,进行的抽样调查发现一百名被调查的 成年人中,有六十三人是吸烟者。问戒烟宣传 是否收到了效果?(α=0.05) 作出原假设H0和备择假设H1; H0:P=0.75 H1:P<0.75
(立,确定样本统计值的抽样分布和在 显著性水平下拒绝域和临界值; n=100 大样本 Z=(P hat-P)/sqrt(P(1-P)/n)~N(0,1) α=0.05,单边检验,Zα=-1.65 计算在H0成立时,统计值在抽样分布中的观测 值; Z=(0.63-0.75)/sqrt(0.75*(1-0.75)/100)=-2.79
(C)2006 GUOH 28
两类错误
样本量的大小:样本量 越大,越容易拒绝H0 因为根据标准分公式, 当n越大时,Z值会越大, 越容易进入拒绝域。 样本统计值与总体参数 值的差别:差别越大, 越容易拒绝原假设。
(C)2006 GUOH
Z=
x −µ
σ
n
29
两类错误
两类错误(two types of error): 因为假设检验依据的是小概率原理,所以在假 设检验中是需要冒一定风险的。 风险表现为两类错误: 第一类错误(Type I error):原假设本是正 确的,但由于抽样的原因造成样本统计值在拒 绝域内而否定了原假设。这种错误称为“弃 真”。发生该类错误的概率为显著度α。显著 度越大,越有可能犯第一类错误。
假设检验的原理与方法
如果一次抽样样本统计值在抽样分布中出现的 概率比较大,则可以认为原假设是成立的,即 差别来源于抽样误差; 如果一次抽样样本统计值在抽样分布中出现的 概率很小,则可以认为出现该样本统计值为小 概率事件,可以否定原假设。即差别来源于样 本对应总体与已知总体在参数值上的真实差别。
(C)2006 GUOH
(C)2006 GUOH 21
单样本假设检验
练习2: 在近期的一项全国性调查中发现,55%的被访 者反对设立全国性的彩票业务。根据在某城市 地区144人的随机调查发现,49%的被访者不 同意设立全国性的彩票业务。请问该差别显著 吗?( α=0.05 ) Z=-1.46, 接受H0,差别不显著。
(C)2006 GUOH 22
(C)2006 GUOH 24
单样本假设检验
总体方差已知 全国年均个人缴纳所得税为130元,标准差为 5元,某市随机调查36名市民。发现他(她) 们年均缴纳个人所得税为98元,问差别是否显 著?(α=0.01) H0:μ=130 H1:µ≠130 n=36 小样本, 方差已知,Z分布
(C)2006 GUOH 25
(C)2006 GUOH 6
假设检验的原理与方法
小概率原理: 小概率事件在观察中是不可能出现的; 如果在一次观察中出现了小概率事件,那么就 可以否定原事件具有小概率的假设。 在样本统计量的抽样分布中: 假定原假设成立,则一次抽样的样本统计值出 现在抽样分布中的概率应该是比较大的。
(C)2006 GUOH 7
(C)2006 GUOH 3
假设检验的原理与方法
假设检验(Hypothesis Test): 假定非抽样误差为零。 如果一次抽样的样本统计值与已知总体的参数 值之间有差别,差别的来源有两种可能: 该差别是由于抽样方法造成的,样本对应的总 体与已知总体在参数值上没有差别; 该差别是由于样本对应的总体参数值不同于已 知总体参数值。