统计_正态分布_抽样误差

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


这些年的努力就为了得到相应的回报 。2021年1月2日星期 六9时6分6秒21:06:062 January 2021

科学,你是国力的灵魂;同时又是社 会发展 的标志 。下午9时6分6秒下午 9时6分 21:06:0621.1.2

每天都是美好的一天,新的一天开启 。21.1.221.1.221:0621:06:0621:06:06Jan-21
-3
-2
-1
01
1
22
3
43
5
6
7
1 < 2 < 3
-5 -4 -3 -2 -1 0 2 1 2
1 <2 <3
3
4
5
6
-5 - 2-.458 -3- 1.9-62 --1 0 1 + 2 + 1.936 4+ 2.585
68.3% 95.0% 99.0%
正态曲线下的面积分布图
7
当资料近似正正态分布时,可以 x 作为μ的估计值, 以S作为σ的估计值,估计正态曲线下面积的分布规 律
二、抽样误差及其应用
❖ 抽样误差的概念 ❖ 抽样误差的应用
参数估计 假设检验
16
抽样误差的概念
❖ 抽样误差
由抽样研究引起的样本统计量与总体参数间的差异 均数的抽样误差
❖ 两种表现形式
样本统计量与总体参数间的差异 样本统计量间的差异
❖ 抽样误差产生的原因
抽样研究 个体变异
17
标准误(standard error,SE)

加强自身建设,增强个人的休养。2021年1月 2日下 午9时6分21.1.221.1.2

精益求精,追求卓越,因为相信而伟 大。2021年1月 2日星 期六下 午9时6分6秒21:06:0621.1.2

让自己更加强大,更加专业,这才能 让自己 更好。2021年1月下午 9时6分 21.1.221:06Januar y 2, 2021
包含总体参数的可信程度为95% ❖ 95%的参考值范围中的95%是一个比例,即所求参考
值范围包含了95%的正常人。
31
标准差与标准误的区别与联系
❖ 标准差
意义:描述原始数据 的离散程度。衡量均 数对原始数据的代表 性
与n的关系
应用:
❖ 频数分布估计(医 学参考值范围估计)
❖ 标准误
意义:反映抽样误差大 小,衡量样本均数估计 总体均数的可靠性
加样本含量可以降低抽样误差
Байду номын сангаас
19
t分布的概念
❖ 设某一变量Xi服从正态分布N(,),则
Xi -
服从标准正态分布
❖即
X1, X 2 , X 3,...,服从正态分布N (, )
X1 - , X 2 - , X 3 - ,...,服从标准正态分布(0,1)
20
t分布的概念
❖ 从正态分布N(,)的总体中随机抽样并计算多个样
第三讲 正态分布 抽样误差
1
一、正态分布及其应用
➢ 正态分布
➢ 正态分布的概念 ➢ 正态曲线下面积的分布规律 ➢ 标准正态分布
➢ 正态分布的应用
➢ 估计频数分布 ➢ 估计参考值范围 ➢ 质量控制 ➢ 理论分布的基础
2
正态分布的概念
30 20 10
0 3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90
10
频数估计
•正态分布
x u s
•标准正态分布
u x - x
s
11
估计医学正常参考值范围
❖ 研究对象的选择
估计范围确定(80%、90%、95%、99%)
单双侧的确定
方法的选择
❖正态分布 ( X -1.96S, X +1.96S) ❖偏态分布 p2.5与p97.5
( X -1.645S ) ( X +1.645S )
26
区间估计
❖ 按一定的概率或可信度(1- )用一个区间估计总体参 数所在范围,这个范围称作可信度为1- 的可信区 间(confidence interval, CI),又称置信区间 。这种
估计方法称为区间估计。
27
均数的可信区间
❖ 总体均数的(1- )可信区间定义为
X
- t ,
s X
,
X
+ t ,
❖ t分布为一簇单峰分布曲线 ❖ t分布以0为中心,左右对称
❖ t分布与自由度有关,自由度越小,t分布的峰越低,而两
侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准 正态分布;当自由度为无穷大时,t分布就是标准正态分布
23
不同自由度下的t分布
24
参数估计(parameter estimation)
❖ 样本统计量的标准差称为标准误,用来衡量抽样误差的 大小。
❖ 标准误与个体变异 成正比,与样本含量n的平方根成反
比。
❖ 标准误理论值
X
n
18
标准误(standard error,SE)
❖ 实际工作中, 往往是未知的,一般可用样本标准
差s代替
❖ 标准误的估计值
s sX
n
❖ 因为标准差s随样本含量的增加而趋于稳定,故增
❖ 由样本信息估计总体参数
点估计(point estimation) 区间估计(interval estimation)
25
点估计
❖ 直接用样本统计量作为总体参数的估计值
方法简单,但未考虑抽样误差的大小 在实际问题中,总体参数往往是未知的,但它
们是固定的值,并不是随机变量值。而样本统 计量随样本的不同而不同,属随机的
与n的关系
应用:
❖ 总体均数估计)
x u s
x
t
s x
❖ 计算变异系数、标 准误
❖ 假设检验
❖ 联系
ss
x
n
32

生活中的辛苦阻挠不了我对生活的热 爱。21.1.221.1.2Satur day, January 02, 2021

人生得意须尽欢,莫使金樽空对月。21:06:0621:06:0621:061/2/2021 9:06:06 PM
p5或p95
12
正态分布的应用
❖ 质量控制 x 2s 作为上下警戒值
x 3s 作为上下控制值
❖ 统计方法的理论基础
u 检验、t 分布、F 分布、二项分布、χ2 分布等
13
常用u 值表
正常值范围(%) 80 90 95 98 99
单侧 0.842 1.282 1.645 2.054 2.326

做一枚螺丝钉,那里需要那里上。21.1.221:06:0621:06Jan- 212-Jan-21

日复一日的努力只为成就美好的明天 。21:06:0621:06:0621:06Satur day, January 02, 2021

安全放在第一位,防微杜渐。21.1.221.1.221:06:0621:06:06J anuar y 2, 2021
s X
❖ 当样本含量较大时,例如n>100,t分布近似标准正态分布, 此时可用标准正态分布代替t分布,作为可信区间的近似计
算。相应的100(1-)%可信区间为
X
- u
s X
,
X
+ u
s X
28
可信区间的确切涵义
❖ 可信度为95% 的可信区间的确切涵义是:每 100个样本所算得的100个可信区间,平均有 95个包含了总体参数 。
4
正态分布的特性
❖ 正态分布曲线的特点 集中性 对称性 均匀变动性 曲线的位置和形状与两个参数有关
,
5
正态分布的特性
❖ 正态分布曲线的参数
μ 为位置参数:σ恒定时,μ增大,曲线沿 横轴向右移动;μ减小,曲线沿横轴向左移 动
σ 为形状参数:μ恒定时,σ越大,曲线越 宽,表示数据越分散;σ越小,曲线越窄, 表示数据越集中
29
可信区间的两个要素
❖ 可靠性
反映为可信度1- 的大小
❖ 精确性
用区间长度CU-CL衡量
30
可信区间与参考值范围的区别
❖ 可信区间用于估计总体参数,总体参数只有一个 。 ❖ 参考值范围用于估计变量值的分布范围,变量值可能
很多甚至无限 。 ❖ 95%的可信区间中的95%是可信度,即所求可信区间
本均数 X j ,它们服从总体均数为,总体标准差
为 X 的正态分布,则
X j - 也服从标准正态分布。
X

X1, X 2 , X 3,...,服从正态分布N (, X )
X1 - , X 2 - , X 3 - ,...,服从标准正态分布(0,1)
X
X
X
21
t分布的概念
❖实际工作中, 由于
X
未知,则用 sX
代替,则
X -
s X
服从t分布
X - X -
t
sX
sn
❖t分布(t-distribution)主要用于参数估计及t检验。英国统 计学家W.S.Gosset于1908年在《生物统计》杂志上发表 该论文时用的是笔名“Student”,故t分布又称Student t 分布。
22
t分布的特征
140名成年男子的红细胞数的频数分布 3
正态分布的概念
❖ 频数分布概念 频数集中在均数周围,左右基本对称,离均数愈近 数据愈多,离均数愈远数据愈少 如果观察数不断增多,组距不断细分,直方图的边 线将逐渐接近一条光滑曲线 这条曲线数学上称为正态曲线—以均数为中心,两 侧对称并逐渐下降,永远不与横轴相交的一条钟型曲 线

相信命运,让自己成长,慢慢的长大 。2021年1月2日星期 六9时6分6秒Saturday, January 02, 2021

爱情,亲情,友情,让人无法割舍。21.1.22021年1月2日星 期六9时6分6秒21.1.2
谢谢大家!
xs
x 1.96s
x 2.58s
8
标准正态分布
❖ 标准正态分布:N( 0,1 )
❖ 数据经标准化后,使μ=0,σ=1时的正态分布
转换方式
u x-
u X-X S
❖ 任何一个正态分布,都可以通过变换,成为标 准正态分布
9
正态分布的应用
❖ 频数估计 ❖ 估计医学正常参考值范围
❖ 质量控制 ❖ 统计方法的理论基础
双侧 1.282 1.645 1.960 2.326 2.576
14
常用百分位数表
正常值范围(%) 单侧(低侧 高侧) 双侧
80
P20 P80 P10~ P90
90
P10 P90 P5~ P95
95
P5
P95
P2.5~ P97.5
98
P2
P98 P1~ P99
99
P1
P99
P0.5~ P99.5
15
相关文档
最新文档