社会统计学(卢淑华)PPT培训课件

合集下载

社会统计学(卢淑华)_第六章

社会统计学(卢淑华)_第六章
第六章 参数估计
第一节 统计推论
一、统计推论:根据局部资料对总体特征进行推断 特点: 1、局部资料的特性在某种程度上能反映总体的特征 2、抽样结果不能恰好等于总体的结果
二、理论基础:概率论 三、内容:
1、通过样本对总体的未知参数进行估计(参数估计) 2、通过样本对总体的某种假设进行检验(假设检验)
第二节 名词解释
二、评价估计值的标准
1、无偏性:x 的均值等于待估参数μ
如果 Qˆ 是总体参数Q的估计值,且Qˆ 分布的均值有 E Qˆ 称 Qˆ 是Q的无偏估计。
Q,则
2、有效性:
1)方法:如果两个估计值Qˆ1 x1 x2 xn 及 Qˆ 2 x1 x2 xn ,它
都满足无偏性,那么当 Qˆ1 的方差比 Qˆ 2 的方差小时,则Q1 较 Q 2 更
有效。
2)增加样本容量可以有效的增加一次抽样接近待估参数的概率。
x 样本均值
2
的方差:Dx n

样本方差
S 2 的方差
:D2 S

4
n 2 1
3、一致性: 一个数的估计值要求随样本容量n的增大而以较
大的概率去接近被估计参数的值。
把样本容量为n时的估计值记作 Qˆ n ,如果 n
第五节 正态总体的区间估计
一、置信度、置信区间
如果用Qˆ x1 x2 xn 作为未知参数Q的估计值,那么区间
包含参数Q之概率为1
的关系表达式为

Q Q,
——置信区间(反映估计的准确性)
1
置信度(置信概率)(置信区间估计的可靠性)
显著性水平(置信区间不可靠的概率)

置信区间与置信度的关系:

社会统计学(卢淑华),第十章

社会统计学(卢淑华),第十章

调查过程不应给被调查者带来身体或心理 上的伤害,避免涉及敏感或隐私问题。
数据处理与分析中的伦理问题
数据真实性
在处理和分析数据时,应确保数 据的真实性和完整性,避免篡改
、伪造或选择性使用数据。
数据安全性
采取必要的技术和管理措施, 确保数据的安全存储和传输, 防止数据泄露、损坏或丢失。
数据分析的客观性
报告统计结果时,应提供足够的信息 和数据支持结论,避免选择性报告或 隐瞒不利结果。
避免过度解读
在解释统计结果时,应避免过度解读 或夸大其意义,以免误导读者或产生 不必要的恐慌。
尊重被调查者的权益
在报告统计结果时,应注意保护被调 查者的隐私和权益,避免泄露个人信 息或造成不必要的伤害。
THANK YOU
社会问题调查
通过问卷调查、访谈、观察等方 法收集数据,了解社会问题的现
状、原因和影响。
社会问题分析
运用统计分析方法对调查数据进 行处理和分析,揭示社会问题的
本质和规律。
社会问题解决方案
基于分析结果,提出针对性的解 决方案和建议,为政府和社会各
界提供参考。
社会政策的制定与评估
社会政策制定
01
运用统计数据和分析结果,为政府制定社会政策提供科学依据
04
因子分析
一种通过降维技术,将多个相关变量简化为少数几个 综合变量的统计分析方法。
05
聚类分析
一种根据样本或变量之间的相似性或距离,将其分为 不同类别的统计分析方法。
02
描述性统计方法
频数分布与图形表示
频数分布表
将数据进行分类,并统计各类别出现的次数,形成 频数分布表,以直观展示数据的分布情况。
SAS是一款高级统计分析软件 ,具有强大的数据处理、分析 和可视化功能,适用于大规模 数据处理和复杂统计分析。

社会统计学(卢淑华)-第三章

社会统计学(卢淑华)-第三章
A=该家庭订一份日报
B=该家庭有电视机 P(A)=0.60 P(B)=0.80 P(AB)=0.60*0.80=0.48
例题2
对同一目标进行3次射击,第一、二、三、 次射击命中的概率分别是:0.3,0.4,0.6,求 在这三次射击中恰有一次命中的概率。
答案
Ai=第i次射击命中 A=恰有一次命中 P(A)
x2
Px1 x2 x dx x1
概率密度 x 存在以下性质:
1)x 0
2)
xdx 1
3、分布函数
1)定义:F(x)=P( x) 意义:随机变量从最远的起点(- )到所研究的x点所有概率的总和。
2)对于离散型随机变量,则:依据概率的加法定理:例
F x P x P xi
1、离散型随机变量
方差:D E E 2 x E 2 Pi
ii
2、连续型随机变量
方差:D
x
E
2
xdx
标准差 : D
3、方差和标准差都反映了随机变量的可能值密集在数学 期望周围的程度。方差值越小,密集程度越高;反之则方
差值较大。
4、计算过程
① 利用公式求 E()=
② 求[ E()]2
例2:两名孕妇,生女婴的概率分布。
性质:1) Pk 0
2) PK 1 K 1
分布列表明全部概率在各可能取值之间的分布规律,全面描叙离散随机变量
的统计规律
2、连续型随机变量及其概率分布 ——概率密度函数
概率密度

x
P
lim
x 0
x
x 2
x
x
x
2
任意两点(X1,X2)之间的概率为:
三种情况:
1、不可能事件Ø 概率 P()=0 2、必然事件S 概率 P(S)=1 3、必然与不可能之间E 概率 0 P(E) 1

《社会统计学》PPT课件(110页)

《社会统计学》PPT课件(110页)

《社会统计学》PPT课件(110页)一、引言社会统计学是研究社会现象数量特征及其规律的学科,是社会学的重要组成部分。

本课件将带领大家深入了解社会统计学的定义、研究方法、数据来源以及在社会各个领域的应用。

二、社会统计学的定义社会统计学是一门应用统计学原理和方法,对社会现象进行数量分析和描述的学科。

它通过收集、整理、分析和解释社会数据,揭示社会现象的数量特征、变化规律和相互关系,为社会决策提供科学依据。

三、社会统计学的研究方法1. 调查研究法:通过问卷调查、访谈等方式,收集社会数据,了解社会现象的实际情况。

2. 实验研究法:在控制条件下,对研究对象进行实验,观察和记录实验结果,分析社会现象的因果关系。

3. 文献研究法:通过查阅相关文献,了解社会现象的历史、现状和发展趋势。

4. 案例研究法:选取具有代表性的社会现象,进行深入分析,揭示其内在规律。

5. 统计模型法:运用统计模型,对社会现象进行定量分析,预测社会现象的未来发展趋势。

四、社会统计学数据来源1. 政府统计部门:提供国家、地区和行业的社会经济数据。

2. 学术研究机构:发布学术研究报告,提供社会现象的定量分析结果。

3. 社会调查机构:开展社会调查,收集社会数据,为政府、企业和社会组织提供决策依据。

4. 新闻媒体:报道社会现象,提供社会数据的实时更新。

5. 公共图书馆和档案馆:保存历史文献,为研究社会现象提供数据支持。

五、社会统计学在社会领域的应用1. 社会经济领域:分析经济增长、就业、收入分配等社会经济现象,为国家制定经济发展政策提供依据。

3. 社会问题领域:分析社会问题,如贫困、犯罪、环境污染等,为解决社会问题提供科学依据。

4. 社会发展领域:研究社会发展规律,为推动社会进步提供理论支持。

5. 社会管理领域:分析社会管理现状,为提高社会管理水平提供数据支持。

社会统计学作为一门研究社会现象数量特征及其规律的学科,具有广泛的应用价值。

通过掌握社会统计学的定义、研究方法、数据来源及其在社会领域的应用,我们可以更好地了解社会现象,为政府、企业和社会组织提供决策依据,推动社会进步。

社会统计学模板.ppt

社会统计学模板.ppt

2019-10-18
感谢你的聆听
– 连续性数据,如身高。如果测量的单位可以达到无穷小的 话,理论上,任何两个数之间都有无穷多个数。尺度变量 的分布在统计表中予以详细说明。
2019-10-18
感谢你的聆听
18
第二章 单变量的描述统计分析 第一节 单变量的分布及其描述方法
二、统计表
• 表现数据分布的最常用方法是统计表。将数据按照一定的顺序排 列在由横行、纵列交叉结合而成的表格上。
邮电出版社,2006年4月。
2. 卢淑华,《社会统计学》(第三版),北京大学出版社,2005年5月。
3. 戴维.K.希尔德布兰德、加德曼.R.爱沃森、约翰.H.奥尔德里奇等著,
《社会统计方法与技术》,社会科学文献出版社,2005年6月。
4. 浙江大学数学系高等数学教研组编,《概率论与数理统计》,人民教
感谢你的聆听
7
第一章 绪论 第四节 变量的层次及统计分析方法的选择
一、变量的层次 按照变量的取值特征和统计分析时方法应用的特征,变量的层 次可以划分为类别变量和尺度变量等两大类。
(一)类别变量
1、无序类别变量( Nominal Variable )
也称为定类变量,是测量层次最低的变量。如职业、家庭类型、 婚姻状况、专业、人际关系类型、地区类别等等。
1、定距变量
无绝对零,若存在零,则这个零是个相对零。如使用摄氏温度 计测量的温度便是定距变量。
2、定比变量
定比测量是最高层次的测量,它不仅有相等的单位可以比较被 测事物间的数量差异。而且有了绝对0,这样就可以对被测事物 间的倍数进行比较。在社会学研究中,常用的有年龄、收入、 住房面积等等属于定比变量。
(核心家庭,0.707) (直系家庭,0.889)

社会统计学导论 ppt课件

社会统计学导论 ppt课件

定序测量(ordinal measurement)
一个变量如果能够依照操作定义界定的明确特征或属 性而排列等级高低、先后的次序,就适用于定序层次 的测量。
例:经济地位、文化程度、满意度和态度等。
使用的数字只显示等级顺序,除此之外,别无他意。 即:不显示属性的真正数量值,并且等级之间的间隔 也不一定相等。
定距测量(interval measurement)
不仅能将事物区别为不同的类别和等级,而且能确定 等级之间的间隔距离和数量差别。
每一等级之间的间距是相等的,可以用来相加或相减。 比如气温、IQ值。
定距测量上,没有绝对的零点,所以定距层次的数字 只能加减,相乘或相除都没有任何意义。
定比测量(ratio measurement)
“如果两性具有同样的价值观,则他们就可能结为伴 侣。”
若A,则可能有B,也可能有C,D……
表现为一种散点图。
案例:班级总体平均成绩和抽查的平均成绩。
(2) 统计规律性
不确定性只是随机现象的一个方面,另一方面则是它 潜在的统计规律性。
例如:婴儿性别比;离婚率等。
恩格斯:在表面上是偶然性在起作用的地方,这种偶 然性始终是受内部的隐蔽着的规律支配的,而问题只 是在于发现这些规律。
是测量中的最高层次,具有低层次测量的所有特征, 同时还有一个绝对零点。因而数字可以加减乘除,运 算结果都有实际意义。
例:年龄、身高、体重、收入等。
一个变量能否进行定比层次的测量,关键在于零点是 否是绝对的。检验办法是:零是否可被认为是“一无 所有”。
选择测量层次时,应当注意:
(1)社会现象大多只能以定类或定序尺度测量,有 时也可以将某些现象近似地视为定距或定比变量。
会想出办法 。(例如:电视节目中的调查)

社会统计学(卢淑华),第十一章

社会统计学(卢淑华),第十一章
向的修正,并分别给出了d yx 和 d xy 两个
系数。
d yx
ns nd ns nd n y
d
xy
ns nd ns nd nx
d yx :仅考虑在y方向的同分对 d xy :仅考虑在x方向的同分对
.
三、s值检验
H0: s 0
H1: s 0
统计量:
S
z —N(0,1)
Se
s ns nd
Y\x
10
1
12
4
32
2
22
4
23
4
32
2
12
1
12
5
.
4、 Gamma系数的PRE性质:
PRE ns nd ns nd 与G系数相同
5、当定序变量只有两种等级 G
n1 n4 n3 n2
不计符号时(方向)与Q系数相同
.
三、 Gamma系数的检验
H0: r0
H1: r0
统计量:
z G 1 G2
ns nd n
.
例:在某地选取409名已婚男人,研究他们对 母亲的感情会否影响他们对婚姻的适应,并问 是否有总体推论价值。
婚姻适应
丈夫对母亲的感情
平淡 不错 良好 很好

32 41 26 28 127
一般
28 47 41 22 138
很好
15 69 61 59 204
75 157 128 109 409
.
每对父子(女)作为一个观测单元,将其等 级写成一个集合:如(1,2)
将等级差平方后求和 其极值会是怎样?
.
r 1、相关系数 s
以等级差的平方和为基础来讨论等级相关。

社会统计学-导论精选.ppt

社会统计学-导论精选.ppt
量大。 (3)用较低层次收集的资料不能用较高层次的数学
运算来处理,反过来则可以。 (4)一个变量采用何种层次测量,取决于研究所要
求的精确性。
精选
23
资料收集方法
问卷法 访问法 观察法 量表与测验 实验法 文献法
精选
24
精选
25
资料收集 方法
自填式问 卷法
个别发送法 集中填答法 邮寄填答法 网络调查法
“如果两性具有同样的价值观,则他们就可能结为伴 侣。”
若A,则可能有B,也可能有C,D…… 表现为一种散点图。
案例:班级总体平均成绩和抽查的平均成绩。
精选
28
(2) 统计规律性
不确定性只是随机现象的一个方面,另一方面则是它 潜在的统计规律性。
例如:婴儿性别比;离婚率等。
恩格斯:在表面上是偶然性在起作用的地方,这种偶 然性始终是受内部的隐蔽着的规律支配的,而问题只 是在于发现这些规律。
结构式访 问法
当面访问法 电话访问法
精选
26
社会调查资料的特点(P7)
(1)随机性
客观现象可以分为确定性现象和非确定性现象。
“重力作用下的物体降落。” “水在常压下,加热到100℃必然沸腾。” A和B之间,存在确定的函数关系,即B=f(A)。
精选
27
非确定性现象是指在某种条件下可能发生也可能不发 生的现象。
精选
32
3 几个基本概念
概念与变量 概念(concept) 变量(variable):概念的一种类型。分为连续变量、离
散变量;解释变量(自变量 )、被解释变量(因变量 ),中介变量。
精选
33
元素:搜集信息的基本单位,即分析单位。既可以是 人,也可是家庭、组织、社区等。

社会统计学,卢淑华(第4版),第7,8章.pptx

社会统计学,卢淑华(第4版),第7,8章.pptx

假设检验的基本步骤
第1步:提出原假设和备择假设。 支持的命题为:备择假设 备择假设的对立面则为原假设 第2步:选择适当的检验统计量(test statistic) ,并 根据样本信息计算检验统计量的值
估计量-假设(H 0 )值 标准化检验统计量= 标准误差
第3步:选择显著性水平,确定临界值
总体参数的区间估计
用样本信息检验总体信息
第七章 假设检验 Hypothesis testing
一、假设检验的基本内容
(一)假设检验的基本思想 假设检验(hypothesis testing)是除参数估计之 外的另一类重要的统计推断问题。它的基本思想可以 用小概率原理来解释。所谓小概率原理,就是认为小 概率事件在一次试验中是几乎不可能发生的。也就是 说,如果对于总体的某个假设是真实的,那么不利于 或不可能支持这一假设的小概率事件A在一次试验中 几乎是不可能发生的,要是一次试验中事件A竟然发 生了,我们就有理由怀疑这一假设的真实性,拒绝这 一假设。
原假设 H0 原假设(null hypothesis)通常是研究 者想收集证据予以反对的假设,也称为 零假设,用表示。一般来说,原假设建 立的依据都是已有的、具有稳定性的, 从经验看,没有发生条件的变化,是不 会被轻易否定的。换句话讲,进行假设 检验的基本目的,就在于作出决策:接 受原假设还是拒绝原假设。
临界值计算 比较判断
由于 z 2.77 z 1.645
故不能拒绝原假设。
例6(P251) H0:μ≤20
右侧检验 H1:μ>20 假设设定
分析:正态总体,方差未知,小样本
统计量选择
统计量计算
23.5 20 t 3.5 s/ n 3/ 9
x 0

社会统计学(卢淑华),第十章ppt课件

社会统计学(卢淑华),第十章ppt课件
以下是老中青三代对某影片的抽样能否认为三代人对该影片评价有显著差异很高一般454739262122一变量间的相关1列联表中的频次分布情况不仅是检验是否存在关系的依据同时也是度量变量间关系强弱的依据
第十讲 列联表
第一节 概念 1、研究内容 1)研究两定类变量的关系 2)为研究y的分类是否与x之分类有关,将
可编辑课件
30
E1即为猜错人数之和。 推广:
E1 n*1 (1 n*1 ) n*2 (1 n*2 ) n*r (
n
n
n 1
n
r
2
n j1 * j
可编辑课件
31
知道x与y有关后:用y的条件分布来猜y值 当x=男生时 随机10人,猜对聊天的人数:10×10/50 猜错的人数:10-10×10/50 随机40人,猜对游戏的人数:40×40/50 猜错的人数:40-40×40/50 猜错二者相加:=(10-10×10/50)+(40-40×40/50)
在1,1之间。
可编辑课件
20
1、 系数
ad bc
a bc d a cb d
0 ——当两变量相互独立
1 —— b、c为零, 值最大1
a、d为零, 值最小-1
1 ——一般情况
前例中计算
可编辑课件
21
2、Q系数
Q ad - bc ad bc
当a、b、c、d中有一个是零时,则 Q 1
x2 i 1
ni Ei2 Ei
~
2
r 1
3、
4、比较
可编辑课件
16
例:以下是老、中、青三代对某影片的抽 样,能否认为三代人对该影片评价有显 著差异



很高

社会统计学(卢淑华),第十一章

社会统计学(卢淑华),第十一章


当全为同序对时:
a 取值:


1 当全为异序对时: 1
1,1

2、


b

当出现同分对时:


b
n n 1 1 nn 1 T nn 1 T 2 2
s d x y
T :变量x方向的全部同分对数
x

T :变量y方向的全部同分对数
y
1 Tx C t i (t i 1) 2 t i Txi TXiyj
活动能力名次 1 2 3 4 5 6 7 8 9 10
智商 110 110 105 95 120 94 100 105 105 110
第二节 Gamma等级相关

一、名词 1、同序对:x的变化方向与y的变化方向相 同。 2、异序对:x的变化方向与y的变化方向相 反。
3、同分对:存在相同等级 变量x具有相同等级 x同分对 变量y具有相同等级 y同分对 变量x、y都具有相同等级 x、y同分对
:异序对数目


不考虑同分对时,当数据均为同序对 G 1
不考 1,1

3、利用列联表中频次计算
n和 n
s
d
已知列联表,求同序、异序对
Y\x 10 12 32 1 4 2 23 32 12 4 2 1
22
4
12
5
4、 Gamma系数的PRE性质: PRE 与G系数相同 5、当定序变量只有两种等级
6 d i2
n
等级差的平方和为: 2 d i2 xi yi
则: rs 1

n n 1

i 1 2


外貌等级:1;2;3; 4;5;6;恋爱的6对 男女学生配对如表:

社会统计学课件

社会统计学课件

300.0
400.0
500.0
600.0
700.0
800.0
月总支出(元)
3、多边形图
将直方图中各矩形顶端的中点用直线连接起来而成的图形。
4、常用曲线:洛仑兹曲线和基尼系数
将一国总人口按收入由低到高排列,考虑收入最低任意百分比人口所得到的收入 百分比,这样得到的人口累计百分比(横轴)和收入累计百分比(纵轴)的对应关系图形 即洛仑兹曲线。
洛仑兹曲线中,不平等面积与完全不平等面积之比。基尼系数是衡量一 个国家贫富差距的标准。
G=A/(A+B),0≤G≤1 G:基尼系数,A:不平等面积,A+B:完全不平等面积
二、集中趋势测量法
(一)定类变量:众值
变量取值中出现次数最多的值。
(二)定序变量:中位数
将全部调查个案的变量取值按等级顺序排列后,位于中央位置的值。
Statistics
父亲 文化程 度
N
Valid
219
Missing
0
Median
2.00
Mode
2
1、根据原始资料求中位数
Md 位置=(n+1)/2 其中,若 n 为偶数,则将位于中央的两个数值的平均值作为中位数。 2、根据分组资料求中位数
(n − cf ↑)
Md = L + 2
(U Percent Valid Percent
16.0
16.0
36.1
36.1
21.9
21.9
15.5
15.5
10.0
10.0
.5
.5
100.0
100.0
Cumulative Percent 16.0 52.1 74.0 89.5 99.5 100.0

社会统计学(卢淑华版)ppt课件

社会统计学(卢淑华版)ppt课件
30
⑴自变量A的检验 检验统计量:
根据给定的显著性水平α,查出临界值 。如果

则不拒绝原假设。否则,拒绝原假设。
⑵自变量B的检验
检验统计量:
根据给定的显著性水平α,查出临界值 。如果

则不拒绝原假设。否则,拒绝原假设。 31
5、交互作用显著情况下,自变量A、B显著性的检验 交互作用显著情况下,自变量A、B的检验方法要根据变 量A和B的性质来确定。如果某变量的取值是固定的,则 该变量属于固定变量。如果变量所涉及的测试个体是随 机选择的,则该变量属于随机变量。根据A、B性质的不 同,可以分为三种模型: ⑴固定模型:A、B都是固定变量 对于固定模型,F检验分母项就用剩余误差项(RSS)的均方
• 若原假设(自变量对因变量没有影响)成立,组 间均方与组内均方的数值就应该很接近,它们的 比值就会接近1;若原假设不成立,组间均方会大 于组内均方,它们之间的比值就会大于1。当这个
比值大到某种程度时,就可以说不同水平之间存 在着显著差异,即自变量对因变量有影响。
• 三、方差分析的基本假定
• 1、每个总体都应服从正态分布
然后选择【确定】
第4步:当对话框出现时
在【输入区域 】方框内键入数据单元格区域
在【】方框内键入0.05(可根据需要确定) 在【输出选项 】中选择输出区域
22
• 例 三个地区家庭人口数的抽样调查如下表所示, 试问这三地区的平均家庭人口有没有显著差异?
家庭人口数
甲地
2 6 4 13 5 8 4 6
地区
5
第一节 方差分析的原理
• 对于因素的每一个水平,其观察值是来自服从正态 分布总体的简单随机样本。
• 2、各个总体的方差必须相同 • 各组观察数据是从具有相同方差的总体中抽取的。 • 3、观察值是独立的 • 四、问题的一般提法

社会统计学(卢淑华),第九章

社会统计学(卢淑华),第九章

双边: A
B
D0

3、统计量:
Z
xA xB D 0

4、拒绝域:
n n
2 A A
2 B B

单右:z z ; 单左:z z ; 双边:z z 2
二、大样本总体成数差检验
二项总体A与B,其总体成数分别为:
A:PA; B:PB。
A
B


nA、nB 足够大,PA 、PB 趋向正态分布。
大样本成数差检验的步骤

1、原假设 H 0 :P A PB D0

2、备择假设:H 1
单边:P P D 或 P P D
A B 0
A B 0

双边:PA PB D0

3、统计量: 4、拒绝域:
z
PA PB Do
xA xB u A uB t 1 1 s nA nB
2

~ tnA nB 2

3、小样本二总体方差比的检验

设有两总体A与B,满足正态分布:
2 总体A:N A , A2 总体B:N B , B


从两总体中分别独立各抽取一个随机样本,
总体A:S A2 ;nA 总体B:S B2 ;nB 根据抽样分布的讨论有

一、样本总体均值差检验 两个总体:A与B 参数为A: A , A2 B: B , B2 样本容量足够大(≥50), 大样本均值差检验的步骤: 1、原假设 H :
0 A


xA ,xB 趋向正态分布。


D0 B

2、备择假设:H 单边:

社会统计学(卢淑华),第十二章

社会统计学(卢淑华),第十二章

第五节 用回归方程迚行预测

求y的区间估计值
y1 a x1 e1
y2 a x2 …… e2 yn a xn en

e , e e 相互独立。都服从相同的正态分
1 2

ห้องสมุดไป่ตู้
N 0, 2
n
,则随机变量y的标准化:
y y
S y
tn 2 服从自由度为n-2的t分布
生的误差

3)回归平方和:通过回归直线解释 掉的误差。
RSS
n
i 1
yˆi y
2

3、统计量:
F
RSS ESS n2
F 1, n 2
TSS


2
x n 1
2
RSS

2
x 1
2
ESS

2
x n 2
2
如果 F F 拒绝 H 0 。

例:统计某城市家具销售额y(万元)与 新建住宅面积x(千平方米),得如下资 料:
当x x 0时,置信度为1 a的y区间估计为: [ yˆ0 t 2 S yˆ 0 , yˆ0 t 2 S yˆ 0 ]. 其中:
1 x 0 x S 1
2
S yˆ 0
n
L
S
y yˆ
2
xx
n2
L
xx
x i

x
2

表示x与y两变量观测值相对其各自均值 所造成的共同平均偏差。协方差的数量
可以作为变量线性相关程度的度量。

2、相关系数

x x y y xi x yi y
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例:
根据生命表,年龄为60岁的人,可望活 到下年的概率P=0.95。设某单位年龄为 60岁的人共有10人,问:
(1)其中有9人活到下年的概率为多少 (2)至少有9人活到下年的概率为多少 (3)至多有9人活到下年的概率为多少
第四节 多项分布
以三项分布作为研究对象,依此类推
三项分布: P x1 , x2 , x3 n! P P P 1 x1 2 2x 3 x3
x
x nx
n
xa
例:
教师中吸烟的比例为50%,随机抽查教 师10人,求概率:
1、全不吸烟 2、1人吸烟 3、至少2人吸烟 4、2-4人吸烟
三、二项分布的数学期望
E


n

x

P

n
x



x
x
Cp q x
n
nx

n

p
x 0
x 0
5、二项分布的方差等于
2
2
6、查表方法
3、二点分布----一次贝努里试验的概率分布; 二项分布----n次贝努里试验的概率分布;
4、二点分布是二项分布的特殊情况
5、二点分布 :
变量的取值只有两类 ;
x
0
p
q
代码:0、1 ;
1
p
分布列:
6、二点分布的性质 1)P(=0)>0 P(=1) >0 2)P(=0)+ P(=1)=q+p=1 3)二点分布的期望与方差
如:同一地点的交通事故。

某城市一交叉路口每年平均发生交通事 故5起,如果交通事故的发生服从泊松分 布,在指定的一年内以下交通事故发生 的概率是多少?
λ =50*0.05=2.5 1、查累积泊松分布表,p(x≤2)=0.5438 2、p(x≥1)=1-p(x=0)=0.9179
续泊松分布的性质
4、泊松分布适合稀少事件的研究,也就是P值都 很小的情况。对于事件流,如果满足以下三个 条件: 1)稳定性:概率规律在时间上是不变的 2)独立性:在不相交的时间间隔内,发生两 个以上事件是 相互独立的 3)普遍性:在同一瞬间内,发生两个以上事 件是不可能的。 则:随机事件发生次数的概率分布满足泊松 发分布。
2、一批产品共20件,其中6件不合 格。任抽3件,求不合格产品的概率 分布。
第五节 超几何分布
1、适用条件:小群体研究 2、例: 设小组共有10名成员,7男3女。从中任
抽3名,求其中男性人数的概率分布。
超几何分布的概念及公式
设总体性质共分为两类:A类和非A类。总体总 数N。A类共有m个,从中任抽n个(nN-m), 则n中含有A类个数“”的概率分布为
二、变量在某一取值区间的概率
1)A至多出现m次的概率
C p q m
P0 m
x
x nx
n
x 0
2)A至少出现m次的概率
C p q n
P mn
x
x
nx
n
xm
3)A出现次数不少于a不大于b的概率
C p q b
Pa b
2、泊松分布的数学期望和方差
x
x 0 x!
D
2
E
E

x
x e 2
2


2
x!
x0
泊松分布参数的实际内容为它是其分布的数学期望 或方 差。
应用:
设在填写居民身份证1000张卡片中,共发现错字300个, 问每张居民身份证出现错字数的概率分布如何?
x1! x2 ! x3!
因为:x1 x2 x3 n
P1 P2 P3 1 所以,三项分布也可写成:
Px1 , x2
n!
P P 1x1 2x2
1

P1

Pn 2
x

x
1
2
x1! x2 !n x1 x2
例:
1、某班有学员30名,其中兄弟民族 13 名。任抽5名,求其中兄弟民族 人数的概率分布。
C C x
n x
P x m N m
Cn N

(x=0,1,……)
当N很大,n较小时,超几何分布近似二项分 布。
第六节 泊松分布
一、公式:
P
x e
x!
Байду номын сангаас
它是二项分布(n,p)的极限分布,只有一
个参数λ 。
二、泊松分布的性质
1、泊松分布为离散型随机变量分布,取值为0和一切正整 数。X=0,1,2,……
3、全排列
P n n! n
例:
任选5个数字,可组成多个编号?
30人的班级,任意安排2人担任正副班 长,有多少种排法?
5种户型的住房,分给5人,有多少种分 配方案?
二、组合:
Cm n

Pm n
Pm m

nn
1
m!

n

m
1

n!
m!n
m!
例: 家庭成员共8人,问有多少对人际关系? (2人形成一对人际关系,且与方向无关)
续前
3、当P0.1,甚至在n不必很大的情况下, 这种近似也存在,当n10时,这种近似 程度就很好了
例题
已知某校有5%的学生是贫困生,随机抽 出50人,求下列情况的概率:
1、至多2位贫困生 2、至少1位贫困生

设贫困生数为X,则X~b(50,0.05), n很大,p很小,近似服从泊松分布。
E()=0 ·q+1 ·p=p
D()= E(2) ( E)2=02 ·q+12 ·p p2= p p2 7、二分变量中取值0和1 只表示定类变量的编码,这种变
量又称虚拟变量。
第二节 排列不组合
一、排列
1、重复排列:
R
m n

n

n


n
mn
2、非重复排列:
Pnm nn 1 n m 1nn!m!
社会统计学(卢 淑华)
第一节 二点分布
1、贝努里试验 指只有两个可能结果的随机试验。 在现实生活中许多随机现象只有两种结果, 如,男-女;出现-不出现;合格-不合格等。 关注的结果---“成功”;另一结果—“失败”
2、n重贝努里试验 如果试验在相同的条件下重复n次,并且每次 的试验结果相互独立,则称n重贝努里试验。
第三节 二项分布
一、二项分布 1、与二点分布的区别
将同样的实验或观察,独立的重复n次 例:连续投掷硬币四次
2、推广:P x Cnx P x 1 P n x
3、二次分布的定义:n次实验中事件A出现次 数的概
率分布。简写为:Bn, p
(n:实验次数 P:A在每次实验中出现的概率)
相关文档
最新文档