统计学正态分布和参考值范围
正态分布与医学参考值范围
2021/8/17
6
① X 轴与正态曲线所夹面积恒等于 1 或 100%;
② 区间 的面积为 68.27%;
f(X)
③ 区间 1.96 的面积为 95.00%;
④ 区间 2.58 的面积为 99.00%。
m
X
2021/8/17
7
正态分布 μ±σ μ±1.96σ μ±2.58σ
2021/8/17
99.00%
0
1 1.96 2.58μ-2.58σ μ-1.96σ μ-σ
99.00%
μ
μ+σ μ+1.96σ
μ+2.58σ
标准正态分布 正态分布 面积或概率
-1~1
μ±σ
68.27%
-1.96~1.96 μ±1.96σ 95.00%
-2.58~2.58 μ±2.58σ 99.00%
2021/8/17
f ( X )称为概率密度函数(probability density function)
以f ( X )为纵坐标,X为横坐标,绘制的曲线就是
正态曲线(normal curve)
2021/8/17
4
二、正态曲线( normal curve )
图形特点:
f(X)
1. 钟型
2. 中间高
3. 两头低
4. 左右对称
2021/8/17
14
二、正态分布的应用
• 1、估计医学参考值范围 • 2、质量控制 • 3、正态分布是许多统计方法的理论基础
2021/8/17
15
第二节 医学参考值范围
临床上常用的参考值是指包括绝大多数正常人的人体 形态、机能和代谢产物等各种生理及生化指标,过去称正 常值。
03-医学统计学正态分布与医学参考值范围
1
ze
z2 2
dz
( X
)
2
标准正态分布的应用
实际应用中,经z变换可把求解任意一个正态分布曲线 下面积的问题,转化成标准正态分布曲线下相应面积的 问题。
欲求服从标准正态分布的随机变量在区间(-∞, z)(z≤0) 上曲线下的面积,可直接查表;对(z>0) 可根据对称性 算得,计算公式为:
正态分布的应用
• 制定医学参考值范围 • 质量控制 • 正态分布是很多统计方法的理论基础
医学参考值范围
概述
医学参考值范围(reference value range),指正常人 的解剖、生理、生化、免疫及组织代谢产物的含量等 各种数据的波动范围。
医学参考值范围,习惯上是包含95%的参照总体的 范围。
卫生部“十二五”规划教材
医学统计学
正态分布与医学参考值范围
正态分布
概述
正态分布(normal distribution),是 一种连续型随机变量常见而重要的分 布。
它首先由莫阿弗尔于1733年提出。 之后高斯对其进一步研究,使正态分 布广为人知。
A. de Moivre
Gauss
正态曲线 正态曲线(normal curve),是一条高峰位于中央,两侧逐 渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。
Φ(z) =1-Φ( -z ) z在区间( z1, z2 )取值概率的计算公式为:
P(z1<z<z2 ) = Φ(z2)- Φ(z1)
【例】由160名7岁男孩身高测量的数据算得样本均数为 122.6cm、样本标准差为4.8cm。已知身高数据服从正态分布, 试估计该地当年7岁男孩身高介于119cm到125cm范围所占的 比例。
正态分布与医学参考值范围
1. 基于临床实践,从个体角度, 作为临床上判定正常与异常的 参考标准,即用于划分界限或 分类。
2. 基于预防医学实践,从人群角 度,可用来评价儿童的发育水 平,如制订不同年龄、性别儿 童某项发育指标的等级标准。
确定95%参考值范围示意图
二、制订医学参考值范围的注意事项
1. 确定同质的参照总体 一般选择“正常”人,主要是排除了对研究指标
例3-1 若X~
,试计算X 取值在区间
上的概率。
Standard normal distribution
例3-2 已知某地140名正常成年男子红细胞计数近似 服从正态分布, =4.78×1012/L, =0.38×1012/L。 ①该地正常成年男子红细胞计数在4.0×1012/L以下 者占该地正常成年男子总数的百分比;
服从正态分布, =4.78×1012/L, =0.38×1012/L, 估计该地正常成年男子红细胞计数95%参考值范围。 近似正态分布资料可按正态分布法处理,因红细胞 计数值过大或过小均为异常,故应估计双侧95%参 考值范围:
即该地正常成年男子红细胞计数的95%参考值范围 为4.04×1012/L~5.52×1012/L。
查附表1
,表明该地成年男子红
细胞计数低于 4×102/L 者约占该地正常成年男子总
数的2.02%
Standard normal distribution ② 红细胞计数在4.0×1012/L~5.5×1012/L者占该地
正常成年男子总数的百分比
=
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
正态分布法要求资料服从或近似服从正态分布,优 点是结果比较稳定,在样本含量不是很大的情况下 仍然能够进行处理;若偏态分布资料经变量变换能 转换为正态分布或近似正态分布,仍可用正态分布 法。
医学统计学简答题
1、正态分布的特点及其应用性质:①以均数为中心,两头低中间高,左右完全对称的钟型曲线;②只有一个高峰,在X=μ,总体中位数亦为μ;③μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为形态参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;④对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布;⑤正态分布在μ±1σ处各有一个拐点;⑥正态曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒为1;区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
2、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布):3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散。
标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与n的关系:随着n增加,样本标准差稳定于总体标准差;随着n增加,样本标准误减少并趋于0。
正态分布及参考值范围估
整理课件
23
3.对数正态分布法(适于对数正态分布资料) (1-)的参考值范围: 双侧 :lg-1(xlgx±uslgx) 单侧 :< lg-1(xlgx+uslgx)
整理课件
25
• 例2:某市1974年为了解该地居民发汞的 基础水平,调查了留住该市一年以上,
无汞作业接触史的健康居民238人的发汞 含量如下表,试估计该市居民发汞值的
95%参考值范围。
• 发汞值的分布为偏态分布,过高为不正
常,故求单侧95%的上限,用百分位数
法,即求P95
整理课件
26
某市238名健康人发汞含量
整理课件
11
如:区间(2.58,∞)的面积=(-2.58)=0.005 区间(- ∞,2.58)的面积= (2.58)=1- (-2.58) P(︱u︱>1.96)=2 (-1.96)=0.05 P(︱u︱﹤2.58)=(+2.58)- (-2.58)=0.99 P(u<-1.645 或 u>1.645)= (-1.645)=0.05 P(u<-1 或 u>1)= (-1)=0.1587
整理课件
17
/2
/2
-u 0
u
+u
常用的u值 单侧
-u 0
双侧
u0.1
1.282
1.645
u0.05
1.645
1.96
u0.01
2.33
第3章正态分布与医学参考值范围
表2-4 某地630名正常女性血清甘油三酯含量(mmol/L)的频数表
甘油三脂
频数
累积频数
累积频率(%)
0.10~
27
27
4.3
0.40~
169
196
31.1
0.70~
167
363
57.6
1.00~
94
457
72.5
1.30~
81
538
85.4
1.60~
42580ຫໍສະໝຸດ 92.11.90~
28
608
96.5
0 .3 8
0 .3 8
= P (2.05z1.89)
1 1 . 8 9 2 . 0 5 1 0 . 0 2 9 4 0 . 0 2 0 2 0 . 9 5 0 4
表明红细胞计数在 4.0×1012/L ~ 5.5×1012/L者约占 该地正常成年男子总数的95.04%。
根据经验已知正常成年人的血铅含量近似对数正 态分布,因此首先对原始数据作对数变换,经正 态性检验可知对数值服从正态分布(P>0.50), 故编制对数值频数表,再利用正态分布法求95% 参考值范围。
44556677777888888899 10 10 10 10 10 10 10 10 11 11 11 12 13 13 13 13 13 13 13 13 13 13 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 22 22 22 23 24 24 25 25 26 26 26 27 27 28 28 29 30 30 31 31 32 32 32 33 35 41 44 50 51
正态分布和医学参考值范围1
4、制定正常值范围时,应根据指标的实际用途和特征来决定 取单或双侧正常值范围。 5.百分位数法应用广泛,计算较简单,故制定正常值范围时应 首选百分位数法。 6.近似正态分布资料以 X uS 法估计正常值范围,较百 分位数法稳定,受两端数据影响较小。
医学统计方法(试题分析)
二、选择题:
1、某资料的观察值呈正态分布,理论上有________的观察值落 在 x 1.96s 范围内。 a.68.27% b.90% c.95% d.99% e.45% 2、正态曲线下,从均数μ到μ+1.645σ的面积为 ________。 a.45% b.90% c.95% d.47.5% e.99% 3、标准正态分布是指_________正态分布。 a.μ=0 σ=1 b.μ=1 σ=0 c.μ=0 σ任意 d.μ任意 σ=1 e.以上都不对 X 1.960S X 1.645S 4、资料呈偏态分布,90%双侧正常值范围为_________。 a. x 1.96s b. x 1.64s c.P2.5~P97.5 d.P5~P95 e.0~P90
4)统一测量方法与条件,控制测量误差
测量方法与条件统一,是控制系统误差,测量误差,保证参 考值的可靠性与代表性的重要措施,如检验人员操作方法,熟 练程度相近,实验室条件一致,测试仪器型号相同这些要求应 该满足。
5)确定观察例数(样本含量)
在一般的情况下观察例数越多(抽取样本含量是够大)结果 越接近总体,如白细胞分类计数时,数的白细胞越多,分类计 数就越正确,变异程度较大指标,多一些观察例数是恰当的, 一般样本含量最好将在100例以上。
6、在正态分布资料中,95%的双侧正常值范围常用________ 表示。 a. X 1.960S b.P25~P97.5 X 2.58S d.P5~∞ c. e.P5~P95 7.用百分位数法确定正常值范围,适用于_________资料。 a.分布不对称或不知分布 b.正态分布 c.大样本资料 d.小样本资料 e.以上都对 8、标准正态分布曲线下中间 90%的面积所对应的横轴尺度 u 的范围是________。 a.-1.645到+1.645 b.-∞到+1.645 c.-∞到+2.282 d.-1.282到+1.282 X 1.96S e.-1.96到+1.96
正态分布及参考值范围
u x
0.8531
0.0655
78.0
u 78.0 73.9 3.9
0.1469
-1.51
0 1.05
Φ(-1.51)=0.0655,故P(X<68.0)=0.0655 Φ(-1.05)=0.1469,故P(X<78.0)=1-0.1469=0.8531
P(X≥78.0)=0.1468
(4)下结论。该地正常女子血清总蛋白含量 <68.0g/L者占总人数的6.55%, <78.0g/L者占总人 数的85.31%,≥78.0g/L者占总人数的14.69%。
内容
1 正态分布的特点
2 标准正态分布 正态分布的应用
3
35
30
25
人数
某地140名正常
20
成年男子红细
15 10
胞数(1012/L
5
) 频数分布图 观察人数不断
0
3.7
4.1 4.5 4.9 5.3 5.7
红细胞数(1012/L)
增加,组段不 断细分,直条 不断变窄
顶端逐渐接近一 条光滑的曲线
人数
解: (1)计算均数、标准差。
X 7982.0 73.(9 g / L) 108
S 591524.0 7982.02 /108 3.( 9 g / L) 108 1
(2)进行u转换
。此例样本量较
大,可用 X 代替
μ,S代替σ计算
。
68.0
73.9
u 68.0 73.9 3.9
(3)查附表1 标准正态分布表 ,(Φ(u)值 ,u≤0),计算 曲线下面积。
应用
➢估计医学参考值范围 ➢质量控制:临床检验、生物鉴定、食品卫生 监督 ➢其他许多统计方法的基础
统计学--正态分布和参考值范围
➢估计频数分布
➢制定参考值范围
➢质量控制
2020/8/8
➢统计方法的基础
2
一、正态分布
(一)正态分布的图形 例:某地7岁男童身高的
频数分布
2020/8/8
3
正态分布图形特点
▪ 正态分布 频数分布是中间(靠近均数)频数多, 两边频数少,且左右对称。
▪ 正态曲线 呈钟型:两头低中间高,左右对称
▪ 若指标X的频数分布图接近正态分布曲线, 则初步判断该指标服从正态分布。
2020/8/8
29
正态分布时:
▪ 偏度系数r1=0;峰度系数r2=0 非正态分布时:
▪ R1>0 正偏态; r1 <0 负偏态 ▪ r2 >0 尖峭峰; r2 <0 平阔峰
2020/8/8
30
作业 p31~32 三、计算分析题
题 1. 2. 3.
▪ 要求: *不必抄题目,只写明页数和题号 *能用spss计算的均用spss计算 *写出主要的命令和结果 如:weight case, frequencies
2020/8/8
8
正态曲线下面积的分布规律---续
▪ (-1, +1) 的面积占总面积的68.27% ▪ (-1.96, +1.96)的面积占总面积的95.00% ▪ (-2.58, +2.58)的面积占总面积的99.00%
2020/8/8
9
三、标准正态分布
▪ 标准正态分布与标准化变换 ▪ 标准正态分布表
压 ▪ >95mmHg :高血压
2020/8/8
23
参考值范围的确定
▪ 方法:正态近似法,百分位数法
▪ 95%参考值(正常值)范围
正态分布参考值
在金融领域的应用
资产收益率
股票、债券等金融资产的收益率通常呈现正态分布,这有助于投资 者进行资产配置和风险评估。
风险评估
基于正态分布,可以对金融风险进行量化评估,如计算VaR值(风 险价值)。
衍生品定价
衍生品(如期权、期货)的定价模型中,正态分布用于描述标的资产 的波动率。
在生物统计学中的应用
遗传学研究
总体比例的置信区间估计
总结词
总体比例的置信区间估计用于估计总体中某事件发生的 概率的可信范围。
详细描述
总体比例的置信区间可以通过样本比例和样本标准误差来 估计。常用的置信水平有95%和99%,对应的置信区间公 式分别为:π ± SE(π)(95%置信水平),π ± 2 * SE (π)(99%置信水平),其中π为总体比例,SE(π)为 样本比例的标准误差。
05
CHAPTER
正态分布的置信区间估计
总体均值的置信区间估计
总结词
总体均值的置信区间估计用于估计总体 均值的可信范围,是正态分布中常用的 统计推断方法。
VS
详细描述
在正态分布中,总体均值(μ)的置信区间 可以通过样本均值(x)和标准差(σ)来 估计。常用的置信水平有95%和99%,对 应的置信区间公式分别为:μ ± t * σ / √n (95%置信水平),μ ± 2 * σ / √n(99% 置信水平),其中n为样本量,t为t分布临 界值。
06
CHAPTER
正态分布在实际中的应用
在统计分析中的应用
描述性统计分析
正态分布用于描述数据的分布情况,如均值、中位数、众数等统 计指标。
概率计算
基于正态分布,可以计算某一数据点落在某个区间的概率,如置 信区间和预测区间。
3 医学统计学正态分布与参考值
…… 0.06 0.07 0.08 0.09 …… 0.0011 0.0011 0.0010 0.0010 …… 0.0015 0.0015 0.0014 0.0014 …… …… …… …… …… …… 0.0052 0.0051 0.0049 0.0048 …… …… …… …… …… …… 0.0250 0.0244 0.0239 0.0233 …… …… …… …… …… …… 0.4364 0.4325 0.4286 0.4247 …… 0.4761 0.4721 0.4681 0.4641
2. 计算法:常用偏度与峰度进行评定,其度 量指标分别为偏度系数和峰度系数。
Expected Normal Value Expected CumProb
Normal Q-Q Plot of BLOOD
90
80
70
60
60
70
80
90
Observed Value
图6-8 108个原始数据的Q-Q图
Normal P-P Plot of BLOOD
表6-2 108名正常成年女子血清总蛋白(g/L)频数分布
组段 ⑴
64.0~ 66.0~ 68.0~ 70.0~ 72.0~ 74.0~ 76.0~ 78.0~ 80.0~ 82.0~84.0 合计
频数,f ⑵
2 6 8 15 25 23 14 7 6 2 108
组中值,X ⑶
65.0 67.0 69.0 71.0 73.0 75.0 77.0 79.0 81.0 83.0 -
x越远离μ,f (x)值越小。
3. 位置参数μ,
f (x)
f (μ)
形态参数σ
4. μ±ϭ为拐点的横坐标
正态分布
17
(1)解:计算u值:
X X u s 130 123.02 1.46 4.79 X
查表9-8
-1.46
1.46
18
(2)解:计算u值:
u1 X1
X1 X s
120 123.02 0.63 4.79
0.10
0.80
0.10
则: 80%的男孩身高集中: (116.9cm,129.2cm)
X 1.28 s
20
三、参考值范围的估计
1. 医学参考值范围(reference range)定义:
又称正常值范围(normal range),是指特定健康状况
的人群的解剖、生理、生化等各种数据(绝大多数人)
正态分布和参考值范围估计
1
主要内容
一、正态分布的概念、曲线下面积分布规律及 其应用 二、参考值的定义、制订方法
重点:
1、正态分布的概念、曲线下面积分布规律
2、参考值的定义、制订方法
难点:正态分布概率函数值计算
2
一、正态分布:
3
1.定义:一组同质的观察值当样本含量足够大时,其
频数分布为中间高,两侧逐渐减少,左右对称,呈现
一条永不与横轴相交的曲线。
1 f( X ) e 2 ( X )2 22
, X
X ~ N ( , 2 ), 为X的总体均数, 为总体标准差
4
2. 正态曲线(normal curve)
正态曲线的特征:
(1) x=μ±σ处左右拐点, 使曲线表现为钟型
(2)关于x=μ对称 (3) x=μ处取最大值 (4)μ是其位置参数 (5)σ是其形状参数 (6)曲线下的面积为100%
3章 正态分布与医学参考值范围
u
19
标准正态分布(累积)分布函 数为:
(u )
u
-
1 e 2
u2 2
du
20
对于任何参数μ和σ的正态分布,都可以通过一个简单 的变量变换化成标准正态分布,即:
u
X
标准化
21
X1
u
X
u1
为了方便,统计学家编制了标准正态分布曲线下面
积分布表,通过查表可以得到u值左侧的面积。
(C.F.Gauss,1777-1855)
2
值广为人知。
高斯的肖像已经被印在从1989年至 2001年流通的10德国马克的纸币上。
3
一、正态曲线
图2-1
图3-1
图3-2
某地正常成年男子红细胞数的分布情况
4
正态曲线:是一条高峰位于中央,两侧逐渐下降并
完全对称,曲线两端永远不与横轴相交的钟型曲线。
-3
-2 -
+ +2 +3
-4
-3
-2
-1
0
1
2
3
4
10
正态曲线下的面积规律
1-S(- , +)=0.3174 1-S(-2 , +2)=0.0456 1-S(-3 , +3)=0.0026
-3
-2 -
+ +2 +3
-4
-3
28
第二节 医学参考值范围
一、医学参考值范围的概念
医学参考值范围(reference value range):指
正常人体的解剖、生理、生化、免疫及组织代谢产物 的含量等各种数据的波动范围。
医学统计学第3讲正态分布
86
146
百分
35.98326
61.08787
194 位数法 81.17155 212 实例 88.70293 228 234 95.39749 97.90795 98.32636
17~
19~21
111 2 239 0 95% 212 1 12.88 μ 235 P95 mol/kg 16 1 0 1 236 2 120 1 119 3 239 239 -
制定参考值范围
参考值范围又称正常值范围,医学上是指 绝大多数正常人的某指标值所在的范围。 参考值范围的意义
划分正异常
制定步骤
1. 2. 3. 4. 5. 6. 从“正常人”总体中抽样:明确研究总体 控制检测误差 判断是否需要分组(如性别、年龄)确定 根据专业知识决定单侧还是双侧 选择百分界值 确定可疑范围
单侧上限---过高异常 双侧---过高、过低均异常
单侧下限---过低异常
异常
正常
正常
异常
异常
正常
异常
单侧下限
单侧上限
双侧下限
双侧上限
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性 病人 假阳性
正常人与病人的数据分布重叠示意图(单侧)
正常人
假阴性率 病人 假阳性率
正常人与病人的数据分布重叠示意图(双侧)
N(, 2)
N(0,1)
0.6 0.5
f (X )
N (1,0.8 )
2
0.4 0.3 0.2 0.1 0
N (0,1 )
N (1,1.2 )
2
2
-4
-3
-2
-1
0
1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
F(-1.15)=0.1251;F(-0.63)=0.2643。
(1) 0.2643-0.1251=13.92%; (2) 110×13.92%=15。
07.06.2019
16
正态分布的特征
正态曲线呈钟型,在横轴的上方,均数位
置最高;
正态分布以均数为中心,左右对称; 正态分布有两个参数,即均数和标准差; 标准正态分布的均数为0,标准差为1; 正态曲线在±1 各有一拐点; 正态分布的面积分布有一定的规律性。
07.06.2019
7
二、正态曲线下面积的分布规律
F(X) 1
(X)2
e X 22 dX
2
F(X)为正态变量X的分布函数,即 对概率密度函数求积分
07.06.2019
8
正态曲线下面积的分布规律---续
(-1, +1) 的面积占总面积的68.27% (-1.96, +1.96)的面积占总面积的95.00% (-2.58, +2.58)的面积占总面积的99.00%
如果散点图几乎在一条直线上,可认为该 资料服从正态分布。
07.06.2019
28
正态性检验的计算法
矩法(method of moment):对偏度和峰度 进行检验。
偏度(skewness):反映分布的对称情况。 峰度(kurtosis):反映分布的尖峭程度。 分别用偏度系数r1(coefficient of skewness) 和峰度系数r2(coefficient of kurtosis)表示。
07.06.2019
25
例2 :某地调查110名健康成年男性的第 一秒肺通气量的均数为4.2(L),标准差 为0.7 (L)。请据此估计该地成年男子第 一秒肺通气量的95%参考值范围。
下限为:4.2-1.64×0.7=3.052 (L)
该地成年男性的第一秒肺通气量95%参考值范 围为:不低于3.052 (L)。 参考值范围 : > 3.052 (L)
07.06.2019
9
三、标准正态分布
标准正态分布与标准化变换 标准正态分布表
07.06.2019
10
标准化变换: u变换
x1.9s61.041.8936.58
这样可将所有不同均数和标准差的资料 都转换为均数为0,标准差为1的分布, 即标准正态分布。
07.06.2019Βιβλιοθήκη 11=O.3115。
07.06.2019
15
对于非标准正态分布,求曲线下任意(X1,X2)范 围内的面积
例 Mean=121.95,s=4.72㎝,n=110
(1) 估计界于116.5~119.0范围内7岁男童的比例 (2) (2) 估计界于116.5~119.0范围的男童人数。
u1=(116.5-121.95)/4.72=-1.15; u2=(119.0 -121.95)/4.72=-0.63。
98.0
43 ~
1
197
98.5
48 ~
1
198
99.0
53 ~
1
199
99.5
58~62
1
200
100.0
07.06.2019
No Image
27
SPSS下的正态性检验
正态性检验有两大类:图示法和计算法。
SPSS下可以采用图示法中的概率图进行 正态性检验;
概率图(probability-probability plot, P-P plot)或分位数图(quantile-quantile plot,Q-Q plot);
标准正态分布的累计函数
Φ ( u) 1 ueu22d u
2 σ 标准正态分布图形
-3 -2 -1 0 1 2 3
07.06.2019
12
标准正态分布表(P803附表1)把标准正态分
布曲线下的面积编制成工具表
列出标准正态曲线下从-∞到u范围内的面积 F(u)值。
而且F(u)= F(-u)。 -∞到u= - 0.50范围内的面积:
07.06.2019
29
正态分布时:
偏度系数r1=0;峰度系数r2=0 非正态分布时:
R1>0 正偏态; r1 <0 负偏态 r2 >0 尖峭峰; r2 <0 平阔峰
07.06.2019
30
作业 p31~32 三、计算分析题
题 1. 2. 3.
要求: *不必抄题目,只写明页数和题号 *能用spss计算的均用spss计算 *写出主要的命令和结果 如:weight case, frequencies
例 u1=-1.50,u2=-0.31,欲求标准正态 曲线下(-1.50,-0.31)范围内的面积。
(-∞,u1)的面积F(-1.50)= 0.0668; (-∞,u2) 的面积F(-0.31)=0.3783。 则(-1.50,-0.31) 的面积 D=F(u2)-F(u1)=0.3783-0.0668
07.06.2019
17
正态分布的应用
估计频数分布 制定参考值范围 质量控制 统计方法的基础
07.06.2019
18
估计频数分布
例出生体重低于2500 克为低体重儿。
若某项研究得出某地婴儿出生体重均数 为3200克,标准差为350克,估计该地 当年低体重儿所占的比例。
U=(2500-3200)/350= -2
F(-0.5)= 0.3085 -∞到u= 0.50 范围内的面积为多少呢
F(0.5) =1- F(-0.5) =1-0.3085=0.6915
07.06.2019
- 3 -2 -1 0 1 2 133
标准正态分布面积分布规律
-∞到u= - 2.58范围内的面积:0.0049
-∞到u= - 1.96范围内的面积:0.0250
估计频数分布
制定参考值范围
质量控制
07.06.2019
统计方法的基础
2
一、正态分布
(一)正态分布的图形 例:某地7岁男童身高的
频数分布
07.06.2019
3
正态分布图形特点
正态分布 频数分布是中间(靠近均数)频数多, 两边频数少,且左右对称。
正态曲线 呈钟型:两头低中间高,左右对称
量?尿铅? 选定适当的百分界限; 对资料进行正态性检验; 计算参考值范围。
07.06.2019
21
正常人与病人的分布有重叠
减少假阳性可选用95%或99%:鉴定诊断。 减少假阴性可选用80%或90%:筛选可疑者。
07.06.2019
22
正常人和病人的分布重叠较多
需要确定可疑范围。 如 舒张压 =<90mmHg:正常 >90mmHg 且 =<95mmHg :临界高血
正态分布和参考值范围的估计
《医学统计学》 供研究生用
07.06.2019 医学统计学----研究生用
1
第四节 正态分布
(normal distribution)
正态分布的概念和特征
正态分布
正态分布的两个参数
正态曲线下面积分布规律
标准正态分布
标准正态分布与标准化变换
标准正态分布表
正态分布的应用
压 >95mmHg :高血压
07.06.2019
23
参考值范围的确定
方法:正态近似法,百分位数法
95%参考值(正常值)范围
正态近似法 百分位数法
双侧 单侧下限 单侧上限
X ±1.96s X -1.64s X +1.64s
P2.5 ~ P97.5 P5 P95
07.06.2019
24
二、正态近似法
-∞到u= 0.00范围内的面积:0.5000
(-1, 1)
的面积占总面积的68.27%
(-1.96, 1.96)的面积占总面积的95.00%
(-2.58, 2.58)的面积占总面积的99.00%
07.06.2019
- 3 -2 -1 0 1 2 134
标准正态分布,求曲线下任意(X1,X2) 范围内的面积
关因素的同质人群。
应遵循一定步骤确定参考值范围。 计算方法有正态分布法和百分位数法。
07.06.2019
20
一、确定参考值范围基本步骤
从正常人总体中抽取足够含量的样本;n >100 控制测量误差下进行准确而统一的测定; 判定是否需要分组;有无年龄、性别差异等? 确定取单侧还是双侧范围值:红细胞?肺通气
07.06.2019
31
07.06.2019
26
三、 百 分 位 数 法
200名血铅频数表及P95计算表
组段
频数f
累计频数f
累计频率(%)
3~
36
36
18.5
8~
39
75
37.5
12 ~
47
122
61.0
18 ~
20
152
76.0
23 ~
18
170
85.0
28 ~
16
186
93.0
33 ~
3
189
94.0
38 ~
7
196
查标准正态表得: F( -2 )=0.0228
估计该地当年低体重儿所占的比例为
2.28%
07.06.2019
19
第五节 医学参考值范围的制定
reference ranges亦称正常值范围 绝大多数正常人某指标测定值所在的范围
绝大多数:90%、95%、99%等等。 正常人是指排除了影响所研究指标的疾病和有