正态分布抽样误差培训课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
频数估计
•正态分布
x u s
•标准正态分布
u x - x
s
11
估计医学正常参考值范围
❖ 研究对象的选择
估计范围确定(80%、90%、95%、99%)
单双侧的确定
方法的选择
❖正态分布 ( X -1.96S, X +1.96S) ❖偏态分布 p2.5与p97.5
( X -1.645S ) ( X +1.645S )
包含总体参数的可信程度为95% ❖ 95%的参考值范围中的95%是一个比例,即所求参考
值范围包含了95%的正常人。
31
标准差与标准误的区别与联系
❖ 标准差
意义:描述原始数据 的离散程度。衡量均 数对原始数据的代表 性
与n的关系
应用:
❖ 频数分布估计(医 学参考值范围估计)
❖ 标准误
意义:反映抽样误差大 小,衡量样本均数估计 总体均数的可靠性
26
区间估计
❖ 按一定的概率或可信度(1- )用一个区间估计总体参 数所在范围,这个范围称作可信度为1- 的可信区 间(confidence interval, CI),又称置信区间 。这种
估计方法称为区间估计。
27
均数的可信区间
❖ 总体均数的(1- )可信区间定义为
X
- t ,
s X
,
X
+ t ,

重规矩,严要求,少危险。2020年11月27日 星期五2时17分 40秒14:17:4027 November 2020

好的事情马上就会到来,一切都是最 好的安 排。下 午2时17分40秒 下午2时17分14:17:4020.11.27

每天都是美好的一天,新的一天开启 。20.11.2720.11.2714:1714:17:4014:17:40Nov-20
双侧 1.282 1.645 1.960 2.326 2.576
14
常用百分位数表
正常值范围(%) 单侧(低侧 高侧) 双侧
80
P20 P80 P10~ P90
90
P10 P90 P5~ P95
95
P5
P95
P2.5~ P97.5
98
P2
P98 P1~ P99
99
P1
P99
P0.5~ P99.5
15
❖ t分布为一簇单峰分布曲线 ❖ t分布以0为中心,左右对称
❖ t分布与自由度有关,自由度越小,t分布的峰越低,而两
侧尾部翘得越高;自由度逐渐增大时,t分布逐渐逼近标准 正态分布;当自由度为无穷大时,t分布就是标准正态分布
23
不同自由度下的t分布
24
参数估计(parameter estimation)
-3
-2
-1
01
1
22
3
43
5
6
7
1 < 2 < 3
-5 -4 -3 -2 -1 0 2 1 2
1 <2 <3
3
4
5
6
-5 - 2-.458 -3- 1.9-62 --1 0 1 + 2 + 1.936 4+ 2.585
68.3% 95.0% 99.0%
正态曲线下的面积分布图
7
当资料近似正正态分布时,可以 x 作为μ的估计值, 以S作为σ的估计值,估计正态曲线下面积的分布规 律
加样本含量可以降低抽样误差
19
t分布的概念
❖ 设某一变量Xi服从正态分布N(,),则
Xi -
服从标准正态分布
❖即
X1, X 2 , X 3,...,服从正态分布N (, )
X1 - , X 2 - , X 3 - ,...,服从标准正态分布(0,1)
20
t分布的概念
❖ 从正态分布N(,)的总体中随机抽样并计算多个样
p5或p95
12
正态分布的应用
❖ 质量控制 x 2s 作为上下警戒值
x 3s 作为上下控制值
❖ 统计方法的理论基础
u 检验、t 分布、F 分布、二项分布、χ2 分布等
13
常用u 值表
正常值范围(%) 80 90 95 98 99
单侧 0.842 1.282 1.645 2.054 2.326
❖ 由样本信息估计总体参数
点估计(point estimation) 区间估计(interval estimation)
25
点估计
❖ 直接用样本统计量作为总体参数的估计值
方法简单,但未考虑抽样误差的大小 在实际问题中,总体参数往往是未知的,但它
们是固定的值,并不是随机变量值。而样本统 计量随样本的不同而不同,属随机的
s X
❖ 当样本含量较大时,例如n>100,t分布近似标准正态分布, 此时可用标准正态分布代替t分布,作为可信区间的近似计
算。相应的100(1-)%可信区间为
X
- u
s X
,
X
+ u
s X
28
可信区间的确切涵义
❖ 可信度为95% 的可信区间的确切涵义是:每 100个样本所算得的100个可信区间,平均有 95个包含了总体参数 。
140名成年男子的红细胞数的频数分布 3
正态分布的概念
❖ 频数分布概念 频数集中在均数周围,左右基本对称,离均数愈近 数据愈多,离均数愈远数据愈少 如果观察数不断增多,组距不断细分,直方图的边 线将逐渐接近一条光滑曲线 这条曲线数学上称为正态曲线—以均数为中心,两 侧对称并逐渐下降,永远不与横轴相交的一条钟型曲 线
本均数 X j ,它们服从总体均数为,总体标准差
为 X 的正态分布,则
X j - 也服从标准正态分布。
X

X1, X 2 , X 3,...,服从正态分布N (, X )
X1 - , X 2 - , X 3 - ,...,服从标准正态分布(0,1)
X
X
X
21
t分布的概念
❖实际工作中, 由于
第三讲 正态分布 抽样误差
1
一、正态分布及其应用
➢ 正态分布
➢ 正态分布的概念 ➢ 正态曲线下面积的分布规律 ➢ 标准正态分布
➢ 正态分布的应用
➢ 估计频数分布 ➢ 估计参考值范围 ➢ 质量控制 ➢ 理论分布的基础
2
正态分布的概念
30 20 10
0 3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90
二、抽样误差及其应用
❖ 抽样误差的概念 ❖ 抽样误差的应用
参数估计 假设检验
16
抽样误差的概念
❖ 抽样误差
由抽样研究引起的样本统计量与总体参数间的差异 均数的抽样误差
❖ 两种表现形式
样本统计量与总体参数间的差异 样本统计量间的差异
❖ 抽样误差产生的原因
抽样研究 个体变异
17
Biblioteka Baidu
标准误(standard error,SE)

务实,奋斗,成就,成功。2020年11月27日 星期五2时17分 40秒Fr iday, November 27, 2020

抓住每一次机会不能轻易流失,这样 我们才 能真正 强大。20.11.272020年 11月27日星期 五2时17分40秒20.11.27
谢谢大家!
xs
x 1.96s
x 2.58s
8
标准正态分布
❖ 标准正态分布:N( 0,1 )
❖ 数据经标准化后,使μ=0,σ=1时的正态分布
转换方式
u x-
u X-X S
❖ 任何一个正态分布,都可以通过变换,成为标 准正态分布
9
正态分布的应用
❖ 频数估计 ❖ 估计医学正常参考值范围
❖ 质量控制 ❖ 统计方法的理论基础
29
可信区间的两个要素
❖ 可靠性
反映为可信度1- 的大小
❖ 精确性
用区间长度CU-CL衡量
30
可信区间与参考值范围的区别
❖ 可信区间用于估计总体参数,总体参数只有一个 。 ❖ 参考值范围用于估计变量值的分布范围,变量值可能
很多甚至无限 。 ❖ 95%的可信区间中的95%是可信度,即所求可信区间
与n的关系
应用:
❖ 总体均数估计)
x u s
x
t
s x
❖ 计算变异系数、标 准误
❖ 假设检验
❖ 联系
ss
x
n
32

踏实,奋斗,坚持,专业,努力成就 未来。20.11.2720.11.27Friday, November 27, 2020

弄虚作假要不得,踏实肯干第一名。14:17:4014:17:4014:1711/27/2020 2:17:40 PM

安全象只弓,不拉它就松,要想保安 全,常 把弓弦 绷。20.11.2714:17:4014:17Nov-2027-Nov-20

重于泰山,轻于鸿毛。14:17:4014:17:4014:17Friday, November 27, 2020

不可麻痹大意,要防微杜渐。20.11.2720.11.2714:17:4014:17:40November 27, 2020
X
未知,则用 sX
代替,则
X -
s X
服从t分布
X - X -
t
sX
sn
❖t分布(t-distribution)主要用于参数估计及t检验。英国统 计学家W.S.Gosset于1908年在《生物统计》杂志上发表 该论文时用的是笔名“Student”,故t分布又称Student t 分布。
22
t分布的特征
4
正态分布的特性
❖ 正态分布曲线的特点 集中性 对称性 均匀变动性 曲线的位置和形状与两个参数有关
,
5
正态分布的特性
❖ 正态分布曲线的参数
μ 为位置参数:σ恒定时,μ增大,曲线沿 横轴向右移动;μ减小,曲线沿横轴向左移 动
σ 为形状参数:μ恒定时,σ越大,曲线越 宽,表示数据越分散;σ越小,曲线越窄, 表示数据越集中

加强自身建设,增强个人的休养。2020年11月27日 下午2时 17分20.11.2720.11.27

追求卓越,让自己更好,向上而生。2020年11月27日星期 五下午2时17分 40秒14:17:4020.11.27

严格把控质量关,让生产更加有保障 。2020年11月 下午2时 17分20.11.2714:17November 27, 2020
❖ 样本统计量的标准差称为标准误,用来衡量抽样误差的 大小。
❖ 标准误与个体变异 成正比,与样本含量n的平方根成反
比。
❖ 标准误理论值
X
n
18
标准误(standard error,SE)
❖ 实际工作中, 往往是未知的,一般可用样本标准
差s代替
❖ 标准误的估计值
s sX
n
❖ 因为标准差s随样本含量的增加而趋于稳定,故增
相关文档
最新文档