社会统计学第三讲

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Z=
X −µ
σ
~ N (0,1)
(C)2005 GUOH
34
标准正态分布表的使用
标准正态分布表见书附录4,标准正态分布表 见课本479页。 标准正态分布表的标识方式有多种,但一般都 包括Z值和Z值相对的标准正态分布曲线下的 面积。 课本中的标示方式为Z值和Z值左边在曲线下 的面积。
(C)2005 GUOH
(C)2005 GUOH 3
概率的基础知识
概率(Probability):用数量的形式表示随机 事件发生的可能性大小。 0≤P(E)≤1 某公司有100名员工,其中20名为已婚,现随 机抽取25人,其中至少有5人未婚的概率为多 少? 其中至少有21名已婚者的概率为多少?
(C)2005 GUOH 4
概率的基础知识
观察抛掷硬币国徽一面出现的频率,统计学家蒲丰和 皮尔逊做了相关的实验。 试验者 蒲丰 皮尔逊 皮尔逊 掷币次数 4040 12000 24000
(C)2005 GUOH
国徽面出现 频次n 2048 6019 12012
f(E) 0.5069 0.5016 0.5005
6
概率的基础知识
(C)2005 GUOH 8
概率的基础知识
古典法: 样本点与样本空间:随机试验中的每一个结果 称为一个样本点Ei 所有样本点的全体称为样本空间S 投掷一个骰子,随机试验的样本点是什么? 样本空间是什么? 随机事件是样本空间的某个子集。
(C)2005 GUOH 9
概率的基础知识
古典概型: 条件: 样本空间中的样本点有限; 每个样本点出现的可能性相同; 如果随机事件A包含m个样本点,则随机事件A的概率 为: P(A)=A中样本点的个数/样本点的总数=m/n 全班有九名同学,其中四名女生,求任抽一名为男生的 概率。
概率分布
连续随机变量的概率分布研究在某个区间ΔX 内的随机变量的取值在整个随机变量取值中所 占的比率,即连续随机变量的概率。
∆x ∆x P( x − ≤ξ ≤ x+ ) 2 2
(C)2005 GUOH 15
概率分布
对于连续的定距定比变量,,一般通过分组后 作直方图来表示。 连续随机变量同样可以用直方图来表示。 直方的面积为概率,直方的宽为ΔX; 则直方的高度为概率/ΔX, 也称为概率密度φ(X)
(C)2005 GUOH 13
概率分布
连续随机变量的概率的分布: 连续随机变量:定距层次以上的变量。 连续随机变量的取值范围在一个区间内是无限 的,则样本空间是无限的。 所以根据古典法计算某一个只有一个样本点的 随机事件A出现的概率: P(A)=1/∞→0 当ξ为连续随机变量时,P(ξ=X)=0
(C)2005 GUOH 14
(C)2005 GUOH
%↑ 95.05 90.32 84.13 74.22 63.68 36.32 25.78 9.68 4.95 2.28
%↓ 4.95 9.68 15.87 25.78 36.32 63.68 74.22 90.32 95.05 97.72
39
标准正态分布表的使用
计算两个Z值之间的面积: 已知某分布满足N(0,1),求 P(1.3≤ξ≤2.3)=0.0861 P(-2.3≤ξ≤-1.3)=0.0861 P(-2.3≤ξ≤1.3)=0.8925
(C)2005 GUOH 33
标准正态分布
将P(ξ=Xi)的概率分布改为 P(ξ=(X-μ)/σ)的概率分 布即可以将不同的正态分 布标准化。 经过计算Z的密度分布符合 N(0,1)。 Z被称为标准分,即变量中 的一个变量值与变量均值 的距离有多少个标准差。 每个Z值所对应的面积已经 计算出来,只需要查表就 可知道某个Z值所对应的面 积。
社会统计学
2006年 20日 2006年3月20日
主要内容
概率的基础知识 概率分布 期望与方差的概念 正态分布 标准正态分布 标准正态分布表的使用方法 中心极限定理 参考课本第三章(第一、二节),第五章(第一、二、 三节)
(C)2005 GUOH 2
概率的基础知识
概率的概念: 随机事件(Random Event):具有非确定性 的事件。 尽管随机事件具有偶然性,但在大量重复试验 和观察下可以发现其中的规律,即统计规律性。 如果能用数量的形式将随机事件发生的可能性 大小表示出来,则可以得到随机事件发生的概 率。
(C)2005 GUOH
40
标准正态分布表的使用
根据面积计算Z值: 已知P(│ξ│≥λ)=0.05, ξ~N(0,1),求λ值 P(│ξ│≥λ)=P(ξ≥λ)+P(ξ≤-λ) =2 P(ξ≥λ)=2[1-φ(λ)]=0.05 φ(λ)=0.975 λ=1.96
(C)2005 GUOH
41
标准正态分布表的使用
概率可以视为当观测次数N趋近无穷时相应的 频率n/N值
n P ( E ) = lim f ( E ) = lim N →∞ N →∞ N
(C)2005 GUOH
7
概率的基础知识
频率与概率的关系: 当观察次数足够大时(如N>1000),频率会稳定于概率。 也称为概率的频率定义。 普查中某种现象出现的频率就是该现象的概率。 生活中采用的大多数为抽样调查的样本数据,这时只 有某个随机现象出现的频率值,即统计值。 但通过计算,仍然可以得到该随机现象在总体中的概 率值,计算得到概率值称为理论值或参数值,可以与 样本值进行比较。
(C)2005 GUOH
20
概率分布
连续随机变量的概率密度性质: φ(X)≥0 P(-∞≤ξ≤∞)=1 所以在分布密度曲线下的总面积恒定为1。
(C)2005 GUOH
21
数学期望与总体方差
在频率分布中,使用均值表示变量的集中趋势。 在概率分布中,使用数学期望表示随机变量的 集中趋势。
E (ξ ) = x1 p1 + x2 p2 + ... + xn pn = ∑ xi pi
18
概率分布
在概率分布直方图中,两个区间中心点之间的 概率可以直接用两个区间中心点之间的直方面 积相加。 当Δx趋近于零时,则在分布中任意两个区间 变成了区间中的两个点,此时两者之间的概率 变为曲线下两个点之间的面积。
(C)2005 GUOH
19
概率分布
任意两个连续随机变量取值间(X1≤ξ≤X2) 的概率为两个点之间在曲线下的面积。
(C)2005 GUOH
16
概率分布
• 当Δx趋近0时, 直方的宽度会 变成一点; • 原来连结直方 顶点的折线会 变成平滑的曲 线。
(C)2005 GUOH
17
概率分布
概率密度:
∆x ∆x P( x − ≤ξ ≤ x+ ) 2 2 ϕ ( x) = lim ∆x → 0 ∆x
(C)2005 GUOH
(C)2005 GUOH
25
正态分布
正态分布的图形特 点: 单峰对称; 唯一对称轴,在对 称轴处三值和一; 渐近线与x轴无限接 近,但始终不会相 交。
(C)2005 GUOH 26
正态分布
决定正态分布图形的因素: μ,φ(x)在μ处达到峰值, μ决定了正态分布在x轴上的 位置; σ,当μ不变时,σ越大则 正态分布越“矮胖”;当σ 越小时,正态分布越“高 瘦”。 根据正态分布的概率密度表 达式可得正态分布的期望 E(ξ)=μ,D(ξ)=σ2 正态分布一般表示为 N(μ,σ2)
(C)2005 GUOH 27
正态分布பைடு நூலகம்
正态分布曲线下的面积: 连续随机变量的两个取值之间的概率为曲线下 两个取值所对应点之间的面积。 68-95-99规律: 经计算发现: P(μ-σ≤ξ≤μ+σ)=0.6827 P(μ-2σ≤ξ≤μ+2σ)=0.9545 P(μ-3σ≤ξ≤μ+3σ)=0.9973
(C)2005 GUOH
37
标准正态分布表的使用
Xi 5.05 6.10 7.00 8.05 8.95 11.05 11.95 13.90 14.95 16.00
(C)2005 GUOH 38
Z
%↑
%↓
标准正态分布表的使用
Xi 5.05 6.10 7.00 8.05 8.95 11.05 11.95 13.90 14.95 16.00 Z -1.65 -1.30 -1.00 -0.65 -0.35 0.35 0.65 1.30 1.65 2.00
(C)2005 GUOH 28
(C)2005 GUOH
29
正态分布
如果ξ≥μ+3σ或ξ≤μ-3σ,那么ξ出现的 概率会很小。 ξ越靠近μ,P(ξ)会越大;ξ越远离μ, P(ξ)会越小,即越不可能发生。
(C)2005 GUOH
30
标准正态分布
甲乙两人分别来自A、B两班,她们在某次数 学统考中的成绩都是80分,但A班的平均成绩 为70分,标准差为5分;B班的平均成绩为60 分,标准差为20分。 问谁在本班的成绩更好? 如果比较均值,乙在本班的成绩更好。 甲:80-70=10 乙:80-60=20
概率的基础知识
概率的计算方法: 频率法: 如果进行N次观察,发现随机事件E出现的次数 为n,则随机事件E在N次观察中出现的频率为 n/N,记为f(E)=n/N 0≤f(E)≤1 当观察的次数较少时,f(E)会各不相同,但当观 察次数N逐渐增大时,f(E)就会趋向于稳定。
(C)2005 GUOH 5
N
数学期望与总体方差
数学期望也称为总体均值。 数学期望与总体方差分别构成概率分布(总体 分布)的集中趋势与离散趋势。 E(ξ)与D(ξ)决定了概率分布的不同形态。
(C)2005 GUOH
24
正态分布
生活中的随机现象可以转变为各种分布。 最常见的一种为大量的现象集中出现在一个范 围内,超出这个范围出现的情况较少。 生活中的正态分布(Normal Distribution) 请思考生活中哪些变量的分布属于正态分布? 身高、体重、考试分数、寿命、收入水平等。
35
标准正态分布表的使用
计算标准正态分布中的问题要多配合图形理解, 尤其要抓住图形根据对称轴左右对称的特点; 不要忘记图形的曲线下面积也表示概率的大小。
(C)2005 GUOH 36
标准正态分布表的使用
根据分布的情况计算Z值和其对应的面积: 某次考试的分数分布的均值为10,标准差为3, 写出下列分数的Z值和在Z值之上和之下的面 积百分比。
已知IQ测试中的得分满足N(0,1),其分布的均 值为100,标准差为16,问90%的人的IQ分数 为多少? φ(Z)=0.90 Z=1.3 X=μ+Zσ=100+1.3*16=120.8
(C)2005 GUOH 10
概率分布
概率分布(Probability Distribution):随机现 象一共有多少种结果,以及每种结果出现的概 率是多少。 将随机现象视为一个变量ξ(Kesai),则随机 现象的各种结果为ξ的各种取值Xi,概率分布 可以表示为(Xi,pi) 投掷两枚硬币出现正反面的概率分布。
i =1
n
(C)2005 GUOH
22
数学期望与总体方差
当N足够大时,频率接近概率,则样本均值等 于数学期望。 频率分布的离散趋势用方差计算; 概率分布的离散趋势也使用方差。
D (ξ ) = E (ξ − E (ξ )) = ∑ [ xi − E (ξ )]pi
2 i =1
(C)2005 GUOH 23
(C)2005 GUOH
11
概率分布
频率分布与概率分布的区别: 频率分布称为随机变量的统计分布或经验分布; 概率分布称为随机变量的理论分布。 只有当观测次数很大时,随机变量取值的频率 接近概率,这时随机变量的频率分布才会与概 率分布相符。
(C)2005 GUOH
12
概率分布
离散随机变量的概率分布: P(ξ=Xi)=pi (i=1,2,…n) Xi为随机变量的可能结果,pi为该可能结果出 现的概率。 概率具有非负性; 随机变量的取值具有完备性。 男婴的出生概率为22/43,女婴的出生概率为 21/43,求两名孕妇生女婴的概率分布。
(C)2005 GUOH 31
标准正态分布
如果考虑到各班成绩的离散程度则: 甲:(80-70)/5=2 乙:(80-60)/20=1 甲在本班的成绩更好。 因为不同的总体有不同的概率分布,如果要进 行比较应该先将其标准化。
(C)2005 GUOH
32
标准正态分布
既然任何正态分布: P(μ-σ≤X≤μ+σ)=0.6827 P(μ-2σ≤X≤μ+2σ)=0.9545 P(μ-3σ≤X≤μ+3σ)=0.9973 则: P(-1≤(X-μ)/σ≤1)=0.6827 P(-2≤(X-μ)/σ≤2)=0.9545 P(-3≤(X-μ)/σ≤3)=0.9973
相关文档
最新文档