社会统计学(卢淑华),第四章
社会统计学----教材
《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展•社会统计学的对象与特点•社会统计的方法•社会统计工作的程序第二节社会统计学的几个基本概念总体与单位•标志与变量•指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料•静态资料与静态资料•全面调查与非全面调查•一般调查与专项调查•经常性调查与一次性调查第二节统计调查的组织形式普查•重点调查•典型调查•抽样调查第三节概念的操作化与测量概念的操作化•定类尺度•定序尺度•定距尺度•定比尺度第四节统计误差登记性误差•代表性误差•抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”•频数(或次数)分布数列•品质数列与变量数列第二节统计表统计表的格式、内容与种类•统计表的制作规则第三节变量数列的编制对于离散变量•对于连续变量•组距和组数的确定•累计频数第四节统计图直方图•折线图•曲线图•累计顿数分布曲线•洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算•对于分组资料的算术平均数计算•算术平均数的性质第二节中位数对于未分组资料的中位数计算•对于分组资料的中位数计算•中位数的性质•其他分割法第三节众数对于未分组资料的众数计算•对于分组资料的众数计算•众数的性质第四节几何平均数、调和平均数及其他几何平均数•调和平均数•各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距•四分位差第二节平均差对于未分组资料A•D的计算•对于分组资料A•D的计算•平均差的性质第三节标准差对于未分组资科S的计算•对于分组资料S的计算•标准差的性质•标准分第四节相对离势变异系数•异众比率•偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件•事件之间的关系•先验概率•经验概率第二节概率的数学性质概率的数学性质•排列与样本点的计数•运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布•连续型随机变量的概率分布•分布函数•数学期望•变异数第七章假设检验第一节二项分布二项分布的数学形式•二项分布的讨论第二节统计检验的基本步骤建立假设•求抽样分布•选择显著性水平和否定域•计算检验统计量•判定第三节正态分布正态分布的数学形式•标准正态分布•正态曲线下的面积•二项分布的正态近似法第四节中心极限定理抽样分布•中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验•学生t分布(小样本总体均值的检验)•关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式•超几何分布的数学期望与方差•关于超几何分布的近似第二节泊松分布泊松分布的数学形式•泊松分布的性质•关于泊松分布的近似第三节卡方分布( 分布)卡方分布的数学形式•卡方分布的性质•样本方差的抽样分布第四节F分布F分布数学形式•F分布的性质•关于F分布的近似第九章参数估计第一节点估计无偏性•一致性•有效性第二节区间估计精确性和可靠性•抽样平均误差与概率度•区间估计的步骤第三节其他类型的置信区间未知,小样本总体均值的区间估计•总体成数的估计•总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差•分层抽样的抽样误差•整群抽样的抽样误差•等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素•确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验•大样本成数差检验第二节两总体小样本假设检验小样本均值差检验•小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验•一实验组与一控制组的假设检验•对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对均值差的区间估计•σ12和σ22未知,对均值差的区间估计•大样本成数区间估计•配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”•符号检验与二项检验•简便检验•“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验•配对符号秩检验的步骤•符号秩检验的效力第三节秩和检验独立样本的秩和检验•秩和•秩和检验的具体步骤•U检验第四节游程检验独立样本的游程检验•游程•游程检验的具体步骤•差符号游程检验第五节累计频数检验独立样本的累计频数检验•累计频数检验的步骤•没有预测方向和已经预测方向•经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向•因果关系第二节定类变量的相关分析列联表•削减误差比例•系数•系数第三节定序变量的相关分析同序对、异序对、同分对•Gamma系数•肯德尔等级相关系数•萨默斯(d系数)•斯皮尔曼等级相关系数•肯德尔和谐系数第四节定距变量的相关分析相关表和相关图•积差系数的导出和计算•积差系数的性质第五节回归分析线性回归•积差系数的PRE性质•相关指数R第六节曲线相关与回归第十三章检验与方差分析第一节拟合优度检验问题的导出•拟合优度检验(比率拟合检验) •正态拟合检验第二节无关联性检验独立性、理论频数及自由度•关于频数比较和连续性修正•列联表的卡方分解•关系强度的量度第三节方差分析总变差及其分解•关于自由度•关于检验统计量Fo的计算•相关比率•关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验•积差系数的检验•回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类•动态比较指标•动态平均指标第二节时间数列的趋势分析随手绘法•移动平均法•半数平均法•最小平方法第三节指数分析法动态指数及其分类•质量指标综合指数•数量指标综合指数•用与个体指数的联系来求综合指数•其他权数形式的质量和数量综合指数•指数体系和因素分析•静态指数第一章导论统计是关于数字和数据合成的学问。
(完整word版)卢淑华 《社会统计学》讲义
社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
社会统计学教学大纲
社会统计学教学大纲课程名称:社会统计学英文名称:social statistics课程编号:12600722j使用专业:社会工作专业总学时数:48学时总学分:3学分大纲撰写人:文法学院社工系马永方内容简介社会统计学是社会学主干课之一,与社会学调查研究方法结合起来,完整地介绍了当代社会调查研究的科学方法和资料处理技术。
社会统计学则侧重介绍资料的收集、整理、分析和推论的处理技术。
从事社会工作研究理论和实践的人都有必要掌握社会统计学这门有用的工具。
本课程共7章。
第一章导论,介绍社会统计学和相关概念,第二章统计资料的搜集,第三章统计资料的整理,第四章到第七章是统计分析。
第四章和第五章是描述统计,第六到第七章是统计推断,第六章概率论是统计推断的基础,统计推断有两个基本内容:假设检验第七章。
一、讲授的主要内容第一章社会学研究和统计分析(2学时)第一节社会学研究的科学性第二节社会调查资料的特点和统计学的运用第二章单变量统计描述分析第一节分布统计表统计图第二节集中趋势测量法第三节离散趋势测量法第三章概率(3学时)第一节基础概率第二节概率分布、均值和方差第四章二项分布及其他离散型随机变量的分布(3学时)第一节二点分布第二节排列与组合第三节二项分布第四节多项分布第五节超几何分布第六节泊松分布第五章正态分布、常用统计分布和极限定理(3学时)第一节什么是正态分布第二节标准正态分布第三节标准正态分布表的使用第四节常用统计分布第五节大数定理和中心极限定理第六章参数估计(4学时)第一节名词解释第二节参数的点估计第四节正态总体的区间估计第五节大样本区间估计第七章假设检验(4学时)第一节统计假设第二节统计检验的基本步骤一、建立假设二、求抽样分布三、选择显著性水平和否定域四、计算检验统计量五、判定第八章单总体假设检验(4学时)第一节大样本假设检验第二节小样本假设检验第九章二总体假设检验第一节引言第二节大样本二总体假设检验第三节小样本二总体假设检验第十章列联表(4学时)第一节什么是列联表第二节列联表的检验第三节列联强度第十一章等级相关(定序变量之间)(4学时)第一节斯皮尔曼等级相关系数第二节Gamma等级相关第三节其他等级相关系数第十二章回归与相关(6学时)第一节回归研究的对象第二节回归直线方程的建立与最小二乘法第三节回归方程的假定与检验第四节相关第五节用回归方程进行预测第十三章方差分析(3学时)第一节引言第二节一元方差分析第三节二元方差分析第四节多元方差分析第十四章非参数检验(4学时)第一节非参数检验第二节符号检验第三节符号秩检验第四节累计频次检验第十五章抽样(4学时)第一节引言第二节抽样调查方法第四节样本容量的确定二、参考书目1. 社会统计学,卢淑华,北京大学出版社,2005年第三版.2.社会统计学,张彦,高等教育出版社,2005年第一版.3.社会统计学导论,周德民、贺翠微,中南大学出版社,2004年第一版.教学大纲说明一、教学目的与课程性质任务本课程属于专业限选课,是社会工作专业课程体系的重要组成部分。
社会统计学(卢淑华)PPT培训课件
例:
根据生命表,年龄为60岁的人,可望活 到下年的概率P=0.95。设某单位年龄为 60岁的人共有10人,问:
(1)其中有9人活到下年的概率为多少 (2)至少有9人活到下年的概率为多少 (3)至多有9人活到下年的概率为多少
第四节 多项分布
以三项分布作为研究对象,依此类推
三项分布: P x1 , x2 , x3 n! P P P 1 x1 2 2x 3 x3
x
x nx
n
xa
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
1、全不吸烟 2、1人吸烟 3、至少2人吸烟 4、2-4人吸烟
三、二项分布的数学期望
E
n
x
P
n
x
x
x
Cp q x
n
nx
n
p
x 0
x 0
5、二项分布的方差等于
2
2
6、查表方法
3、二点分布----一次贝努里试验的概率分布; 二项分布----n次贝努里试验的概率分布;
4、二点分布是二项分布的特殊情况
5、二点分布 :
变量的取值只有两类 ;
x
0
p
q
代码:0、1 ;
1
p
分布列:
6、二点分布的性质 1)P(=0)>0 P(=1) >0 2)P(=0)+ P(=1)=q+p=1 3)二点分布的期望与方差
如:同一地点的交通事故。
例
某城市一交叉路口每年平均发生交通事 故5起,如果交通事故的发生服从泊松分 布,在指定的一年内以下交通事故发生 的概率是多少?
《社会统计学》课程大纲
《社会统计学》课程大纲课程介绍统计是社会科学研究中广泛采用的定量分析方法。
本课程系统地介绍了社会统计学的基本原理、基本概念和主要内容,按照变量的四个测量层次(定类、定序、定距和定比),课程详细阐述了统计描述和统计推论的操作程序和具体方法,并结合生动的实例说明了统计分析在社会研究中的作用和地位。
作为一门初中级社会统计学课程,本课程内容限定在单变量和双变量统计范围之内。
教学大纲指导思想:社会现象的独特性和社会研究方法的特点决定了统计在社会研究中的重要地位,统计也因此而成为社会研究的重要工具和重要手段。
近十几年来,统计理论、统计方法和统计手段迅速发展,其应用范围也越来越广泛。
本课程的目的就是为深入这一领域建立一个基础和平台,即对统计的基本概念、原理、类型、方法、程序、作用等有基本的和概括了解与把握,并能应用这些知识对研究问题进行简单的统计分析。
本课程的教与学强调:第一,社会研究是一项系统的和严谨的工作,从研究设计资料收集资料整理分析撰写研究报告,各个步骤之间相互联系、相互影响,密不可分。
统计分析作为研究的一个重要环节,只有放在社会研究过程的背景之下,注重其与研究问题及研究方法的联系,才能更准确地掌握每一种统计类型和统计方法的特征,才能针对具体的研究问题选择恰当的统计方法。
第二,作为一门应用性极强的课程,本课程特别强调理论联系实际的原则,在教与学的过程中,一方面教师要通过列举和分析大量研究和应用实例,深化学生对统计原理的和统计思想的理解;另一方面要求学生将学习到的知识不断运用到对实际社会问题的分析中去。
为此,要求学生在学习课程讲授的知识的同时,认真完成每一讲后面所指定的“实践性”的练习。
第三,在实际的社会研究中,资料的统计分析都是通过计算机完成的。
各种统计描述和统计分析方法被制作成用于计算机的专门的和通用的统计软件,如SPSS、SAS、STATE等。
本课程将熟练掌握和灵活运用上述统计软件作为本课程教与学的不可分割的一部分。
社会统计学Social Statistics
2019年5月23
例如:调查1000户家庭,7种家
庭类型户数的频次分布为:
(核心家庭,707户)
(直系家庭,182户)
(大家庭,7户)
(断代家庭,9户)
(单亲家庭,37户)
感谢你的观看 (单身家庭,15户)
15
第二章 单变量的描述统计分析 第一节 单变量的分布及其描述方法
2011年3月。
10. [美]James D.Hamilton著,刘明志译,《时间序列分析》,中国社会
科学出版社,1999年。
210119.年中5月国23统计年鉴http://www.s感t谢a你ts的.观go看
3
第一章 绪论
1 社会学研究的过程及统计学的应用
2 统计分析方法在社会学研究中的作用 3 抽样方法与统计分析方法的选择 4 变量的层次及统计分析方法的选择 Exe 本章习题
程》,2008年12月。
6. 何书元,《概率论与数理统计》,高等教育出版社,2006年6月。
7. 贾俊平 何晓群 金勇进编著,《统计学》(第五版),中国人民大学
出版社,2012年6月。
8. 同济大学概率统计教研组编著,《概率统计》(第二版),同济大学
出版社,2000年5月。
9. 易丹辉编著,《时间序列分析:方法与应用》,中国人民大学出版社,
一、统计分析方法应用水平是社会学研究科学性的重要标志 保尔·拉法格在《忆马克思》中谈到,马克思认为:“一种科学只 有在成功地运用数学时,才算达到了真正完善的地步。”
二、统计分析方法应用的目的是要发现和描述社会现象的统计规律 (一)社会调查资料的特点 1、随机性 客观现象可分为确定性现象和非确定性现象(随机现象) 2、统计规律性: 通过对大量个体特征的统计分析来描述和分析社会现象的统计规律。 (二)统计学是发现和彰显统计规律的有效工具
社会统计学课后题答案(卢淑华)
《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
社会统计学课后题答案(卢淑华)
《社会统计学》课程练习题(1)答案一、略二、(1)对立事件(2)互不相容事件(3)互不相容事件(1)对立事件三、)(28.516200182525400)(5252004025504000元元=´++==´-+=M M d )(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==´-+==´-+=Q Q Q Q Q )(66.225509245092410050924001001005260032760000)(2222元====-=-=åås s N N b n b n i i i i i i 四、(1)极差R=1529-65=1464R=1529-65=1464(百元)(百元)(2)将数据从小到大排序:)将数据从小到大排序:65 92 106 118 122 135 148 174 185 65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===´-+==´-+==+´==+=Q Q (3))(92.42164.178017101026742495204)(222百元==-=-=ååNNx x i i s五、五、32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、六、633.010*******)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=´===´=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、七、(1)10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P x(2) 10口井皆不产油的概率为:02825.07.03.0)0(1010===C P x(3)该公司赢利的机会为:85069.07.03.07.03.01)2(911101010=--=³C C P x八、八、1465.071828.28!24)2(4442=´====--e x P l 九、九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==££=--e ex P x P x P l 十、十、。
社会统计学课后题答案(卢淑华)
《社会统计学》课程练习题〔1〕答案一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、)(28.516200182525400)(5252004025504000元元=⨯++==⨯-+=M M d)(91.29040091.690)(91.690200226575600)(00.4002001510252001331元元元=-=-==⨯-+==⨯-+=Q Q Q Q Q)(66.225509245092410050924001001005260032760000)(2222元====-=-=∑∑σσNNb n bn i i ii四、〔1〕极差R=1529-65=1464〔百元〕〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529)74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25.84)110(375.241103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+=Q Q〔3〕)(92.42164.178017101026742495204)(222百元==-=-=∑∑NNx xi iσ32.010032)(15.08012)/(4.08032)/(4.010040)(12.010012)(6.02012)/(15.08012)/(2.010020)(8.010080)(==================AC P B A P A C P C P AB P B A P A B P B P A P六、633.0101157154)()()()(375.0415101)()()/(214.0715101)()()/(101)(157)(154)(=-+=-+=+=⨯===⨯=====AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P七、〔1〕10口井皆产油的概率为:0000059.07.03.0)10(0101010===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(100010===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010=--=≥C C P ξ1465.071828.28!24)2(4442=⨯====--e x P λ 九、6022.0!137.1!037.1)1()0()10(37.137.1137.10=+==+==≤≤=--e e x P x P x P λ 十、。
社会统计学卢淑华
1 A至多出现m次的概率
C p q m
P0 m
x
x nx
n• •
x 0
2 A至少出现m次的概率
C p q n
P mn
x
x
nx
n• •
x m
3 A出现次数不少于a不大于b的概率
C p q b
Pa b
x
x nx
n• •
x a
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
例题
已知某校有5%的学生是贫困生,随机抽 出50人,求下列情况的概率:
1、至多2位贫困生 2、至少1位贫困生
解
设贫困生数为X,则X~b 50,0.05 , n很大,p很小,近似服从泊松分布,
λ =50*0.05=2.5 1、查累积泊松分布表,p x≤2 =0.5438 2、p x≥1 =1-p x=0 =0.9179
第四讲
二项分布及其它离散型随机变量的分布
第一节 二点分布
1、贝努里试验 指只有两个可能结果的随机试验, 在现实生活中许多随机现象只有两种结果, 如,男-女;出现-不出现;合格-不合格等, 关注的结果---“成功”;另一结果—“失败”
2、n重贝努里试验 如果试验在相同的条件下重复n次,并且每次 的试验结果相互独立,则称n重贝努里试验,
第五节 超几何分布
1、适用条件:小群体研究 2、例: 设小组共有10名成员,7男3女,从中任
抽3名,求其中男性人数的概率分布,
超几何分布的概念及公式
设总体性质共分为两类:A类和非A类,总体总 数N,A类共有m个,从中任抽n个 nN-m , 则n中含有A类个数“”的概率分布为
C C x
n x
卢淑华讲义
社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。
四、统计分析方法的选择1、全面调查和抽样调查的分析方法2、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。
尤其是直方图的意义。
二、标明组限与真实组限的换算,重要。
三、集中趋势测量法1、定义、优缺点、注意事项;2、众值:定义、计算公式、解释、运用,注意事项;3、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;4、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;5、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1、定义、优缺点、注意事项,与集中趋势的关系;2、异众比例:定义、计算公式、解释、运用,注意事项;3、质异指数:定义、计算公式、解释、运用,注意事项;4、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。
4、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;第三章概率一、概率:就是指随机现象发生的可能性大小。
随机现象具有不确定性和随机性。
二、概率的性质:1、不可能事件的概率为0;2、必然事件的概率为1;3、随机事件的概率在0-1之间;三、概率的计算方法:1、古典法:计算等概率事件,P=有效样本点数/样本空间数;2、频率法:求随机事件在多次试验后的极限频率。
3、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。
四、概率的运算:会画文氏图1、加法公式:两个或多个随机事件的求和概率‘2、乘法公式:两个或多个随机时间共同发生的概率。
社会统计学 全套课件
记述,不用数字计量。它又称记述学派和历史学 派。
2. 政治算术学派 格朗特1662年在其《自然和社会观察》一书 中,从宗教管理、商业、气候、疾病等方面,对 当时伦敦人口的出生率、死亡率和性比例等方面 进行了综合的统计分析。 威廉 ·配第1667年在其《政治算术》一书
1886年,高尔顿:相关指数 1900年,皮尔逊:卡方检验,复相关计算 1928年,戈塞特t;费舍F
1950 S,拉扎斯菲尔德:自动化处理 1966年,斯坦福:SPSS
4.社会统计学派 凯特勒的另一个重要贡献,是他把政治经济学、
数学和当时政府统计工作的方法结合在一起,建立了一 个专门研究社会现象的统计学派。后来这个学派传到德
二次大战后,社会统计学在广义和狭义两方面的实 践意义逐步得到了人们的公认。
20世纪60年代以来,西方发达资本主义国家先后都 制定了社会发展计划。 20世纪60年代首先在美国掀起了 一个颇有声势的“社会指标运动”。
1966年,雷蒙 ·布埃尔提出用社会指标的方法解决社
会分析和社会规划的基本理论,出版了《社会指标》一 书。
什么是社会统计学
主要内容
社会统计学的几个 基本概念
第一节 什么是社会统计学
社会统计的产生与发展
社会统计的出现
国势学派
统计学的产生
政治算术学派
社会指标运动 社会统计在中国
数理统计学派 社会统计学派
17世纪以前,社会统计主要局限于对事物 进行原始的调查登记和简单的计算汇总。
如大禹时的九州表,明初的黄册和鱼鳞册; 古埃及、古希腊、古罗马在公元前400年就建立 的出生、死亡登记制度。
《社会统计学》人大版
第二章 单变量的描述统计分析 第一节 单变量的分布及其描述方法
一、变量及其分布 (二)变量的分布 • 变量分布指个体在变量取值上的分布。对一组观察值,一般用 频次分布、频率分布和累积频率分布三种方法描述变量分布。 • 1、频次分布:变量取值与取值上拥有的个体数的集合称为频
次分布。若变量有m个取值,则该变量的频次分布可表示为:
第二章 单变量的描述统计分析
1 2 3 Exe
单变量的分布及其描述方法 集中趋势 离散趋势
本章习题
第二章 单变量的描述统计分析 第一节 单变量的分布及其描述方法
• 单变量的描述统计就是用统计表、统计图和统计特征值将变量 的状态、水平和分布特征表现出来的方法。 一、变量及其分布 (一)变量的特征 • 1、变量的含义: – 研究对象的每个个体都具有很多属性和特征。比如每个人 都有身高、体重、年龄、学历等特征。这些在不同个体上 具有不同表现的特征就称为变量。统计学中的变量在个体 上是相对稳定的,在不同个体上表现出变化。这类变量也 称为随机变量。 • 2、变量取值的两个特征 – 完备性。完备性是指变量的取值必须涵盖全部的个案。 – 互斥性。互斥性是指变量的取值之间不能互相包容。
第一章 绪论 第四节 变量的层次及统计分析方法的选择
(二)尺度变量(Scale Variable) 若测量工具有单位,则测量结果就不仅能够比较大小,而且能 够比较出大多少或小多少。此种测量就是尺度测量,得到的变 量就是尺度变量。尺度变量根据测量工具是否具有绝对零分为 定距变量和定比变量。
1、定距变量
第二章 单变量的描述统计分析 第一节 单变量的分布及其描述方法
二、统计表 (三)描述尺度变量分布特征的统计表——分组表 • 1、分组表的制作步骤: • (1)确定全距。全距就是变量观察值的最大值与最小值之差。 • (2)确定组距与组数。一般是2、3、5、10或它们的倍数。 • (3)确定各组的上下限。最低组的下限要小于最小的观察值, 最高组的上限要大于最大的观察值。连续型数据的一组的下限与 下一组的上限为同一值,习惯上以组的上限为实,下限为虚。 (即“下组限不包括在内”的原则) • (4)登记各组中个案的频次,计算频率。将个案按照变量取值 大小划分到各组中,按需要统计出频次、频率及累计频率等,并 将统计出的数据置于相应单元格内,绘制成分组表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、二点分布是二项分布的特殊情况
.
5、二点分布 :
变量的取值只有两类 ;
x
0
p
q
代码:0、1 ;
1
p
分布列:
6、二点分布的性质
1)P(=0)>0 P(=1) >0
2)P(=0)+ P(=1)=q+p=1
3)二点分布的期望与方差
n x
P x m• N m
Cn N
(x=0,1,……)
当N很大,n较小时,超几何分布近似二项分 布。
.
第六节 泊松分布
一、公式:
P
x • e
x!
它是二项分布(n,p)的极限分布,只有一
个参数λ 。
.
二、泊松分布的性质
1、泊松分布为离散型随机变量分布,取值为0和一切正整 数。X=0,1,2,……
E()=0 ·q+1 ·p=p
D()= E(2) ( E)2=02 ·q+12 ·p p2= p p2
7、二分变量中取值0和1 只表示定类变量的编码,这种变
量又称虚拟变量。
.
第二节 排列不组合
一、排列
1、重复排列:
R
m n
n
n
2、非重复排列:
Pm
n nn1
3、全排列
P n n! n
.
n mn
.
第五节 超几何分布 1、适用条件:小群体研究 2、例: 设小组共有10名成员,7男3女。从中任
抽3名,求其中男性人数的概率分布。
.
超几何分布的概念及公式
设总体性质共分为两类:A类和非A类。总体总 数N。A类共有m个,从中任抽n个(nN-m), 则n中含有A类个数“”的概率分布为
C C x
.
续泊松分布的性质
4、泊松分布适合稀少事件的研究,也就是P值都 很小的情况。对于事件流,如果满足以下三个 条件: 1)稳定性:概率规律在时间上是不变的 2)独立性:在不相交的时间间隔内,发生两 个以上事件是 相互独立的 3)普遍性:在同一瞬间内,发生两个以上事 件是不可能的。 则:随机事件发生次数的概率分布满足泊松 发分布。
2、泊松分布的数学期望和方差
x
x 0 x!
D
2
E
E
x
x e 2
2
2
• x!
x0
泊松分布参数的实际内容为它是其分布的数学期望 或方 差。
应用:
设在填写居民身份证1000张卡片中,共发现错字300个, 问每张居民身份证出现错字数的概率分布如何?
.
续前
3、当P0.1,甚至在n不必很大的情况下, 这种近似也存在,当n10时,这种近似 程度就很好了
(1)其中有9人活到下年的概率为多少 (2)至少有9人活到下年的概率为多少 (3)至多有9人活到下年的概率为多少
.
第四节 多项分布
以三项分布作为研究对象,依此类推
三项分布: P x1 , x2 , x3 n! P P P 1 x1 2 2x 3 x3
x1! x2 ! x3!
因为:x1 x2 x3 n
1、全不吸烟 2、1人吸烟 3、至少2人吸烟 4、2-4人吸烟
.
三、二项分布的数学期望Enx•
P
n
x
x
x•
Cp q x
n••
nx
n
•
p
x 0
x 0
5、二项分布的方差等于
2
2
6、查表方法
.
例:
根据生命表,年龄为60岁的人,可望活 到下年的概率P=0.95。设某单位年龄为 60岁的人共有10人,问:
n! nn m m! 1
例:
任选5个数字,可组成多个编号?
30人的班级,任意安排2人担任正副班 长,有多少种排法?
5种户型的住房,分给5人,有多少种分 配方案?
.
二、组合:
Cm n
Pm n
Pm m
nn
1
m!
n
m
1 n! m!n
m!
例: 家庭成员共8人,问有多少对人际关系? (2人形成一对人际关系,且与方向无关)
.
第三节 二项分布
一、二项分布 1、与二点分布的区别
将同样的实验或观察,独立的重复n次 例:连续投掷硬币四次
2、推广:P x Cnx • P x • 1 P n x
3、二次分布的定义:n次实验中事件A出现次 数的概
率分布。简写为:Bn, p
(n:实验次数 P:A在每次实验中出现的概率)
.
.
例题
已知某校有5%的学生是贫困生,随机抽 出50人,求下列情况的概率:
1、至多2位贫困生 2、至少1位贫困生
.
解
设贫困生数为X,则X~b(50,0.05), n很大,p很小,近似服从泊松分布。
λ =50*0.05=2.5 1、查累积泊松分布表,p(x≤2)=0.5438 2、p(x≥1)=1-p(x=0)=0.9179
如:同一地点的交通事故。
.
例
某城市一交叉路口每年平均发生交通事 故5起,如果交通事故的发生服从泊松分 布,在指定的一年内以下交通事故发生 的概率是多少?
1、8次或以上 2、不多于2次 3、3-11之 间
.
P1 P2 P3 1 所以,三项分布也可写成:
Px1 , x2
n!
P P 1x1 2x2
1
P1
Pn 2
x
x
1
2
x1! x2 !n x1 x2
.
例:
1、某班有学员30名,其中兄弟民族 13 名。任抽5名,求其中兄弟民族 人数的概率分布。
2、一批产品共20件,其中6件不合 格。任抽3件,求不合格产品的概率 分布。
二、变量在某一取值区间的概率
1)A至多出现m次的概率
C p q m
P0 m
x
x nx
n• •
x 0
2)A至少出现m次的概率
C p q n
P mn
x
x
nx
n• •
x m
3)A出现次数不少于a不大于b的概率
C p q b
Pa b
x
x nx
n• •
x a
.
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
第四讲
二项分布及其它离散型随机变量的分布
.
第一节 二点分布
1、贝努里试验 指只有两个可能结果的随机试验。 在现实生活中许多随机现象只有两种结果, 如,男-女;出现-不出现;合格-不合格等。 关注的结果---“成功”;另一结果—“失败”
2、n重贝努里试验 如果试验在相同的条件下重复n次,并且每次 的试验结果相互独立,则称n重贝努里试验。