正态分布、容许区间的求解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
>P 100α , < P 100-100α
【例3-13】调查得某市某年996名女大学 生月经初潮年龄分布如表3-5第1、2行。
(自学)
Px =L+i(nx%-∑fL)/ fx
3. 制定医学参考值范围的注意事项
(自学)
(1)按随机化方法从正常人总体中抽取样 本含量足够大的样本。(n>100)
(2)根据指标的实际用途,结合专业知识 来决定应取单侧还是双侧。
d正is态tri分bu布tion)Gauss分布
图形特点:钟形,两头低、 中间高,左右对称
分布特性:集中性,对称性, 均匀变动性
第四节 正态分布(normal distribution)
f(X)=
1 e(X)2/(22) (–∞< X <∞)
2
1. 正态分布的密度函数f(x) 的图形即正态曲线
2. 正态变量的分布函数F (x)
• ①使服从对数正态分布的资料正态化。 • ②标准差与均数成比例的资料。 • ③若方差不齐,但是变异系数接近甚至等于某一
常数的资料,可经对数变换以缩小各方差间的差 别,使资料达到方差齐性要求。 • ④使曲线直线化,常用于曲线拟合。
2.平方根反正弦变换
α= sin-1
p 或α= 2sin-1
p
原数据为百分数p且接近于0或1时,分布为偏态, 作平方根反正弦变换,可改善正态性和方差齐 性。
第七节 离群值(outlier)的取舍
测量数据中有时会有个别过大或过小,与 群体数据严重偏离的可疑数据,又极端值 (extreme value)。
局内值 局外值
1. 计量资料判断局外值
(1) x ± 3s 法
两个前提条件:
①资料在总体上服从正态分布:
②样本含量n较大。x ±3s法是在例数n = ∞的前 提下作出的,当n≥60时较好,当n较小时,此法 不适用,至少要n>10,当n≤10时,无论可疑值 是多大,它都不会超过( x ±3s)。
略?pz2zz21?pz2z21?pz2xz21?pz2xz21?z2z2?z2z2表示双侧z界值???x单侧时1容许区间计算公式推导略pzz1orpzz1???xpz1pxz1pxz1z???xpz1pxz1pxz1z当当和未知时可用大样本的和s分别作为和的估计值来计算的参考值范围
第四节 (normal
【例3-12】 若已知健康女大学生 血清总蛋白含量服从正态分布,用 大样本资料算出 =73.708 g/L, s =3.8759 g/L,求健康女大学生血 清总蛋白含量的95%参考值范围。
(2) 对数正态分布法
先将变量值作对数变换,计算对数值的均数与标准差后, 计算对数值的参考值范围,再求反对数,即得所求参考 值范围。
双侧95%的界限值为:
lg-1( x lg x±1.96slgx)
单侧95%的上限值为:
lg-1( x lg x +1.645slgx)
单侧95%的下限值为:
lg-1( x lg x –1. 645slgx)
(3)百分位数法
适用于偏态分布或分布型不明资料的参考 值范围估计。
双侧公式:
P 100α/2 <X < P 100-100α/2 单侧公式:
f (X)
15.86%
68.27%
15.86%
X
(2)一般正态曲线下面积的分布规律
f (X)
f (X)
99%
0.5%
0.5%
2.58
X 2.58
2.5%
95%
2.5%
X 1.96 1.96
【例3-11】若已知健康女大学生血清 总蛋白含量服从正态分布,均数
μ=73.8g/L,标准差σ=3.9g/L,试估 计168名健康女大学生血清总蛋白含 量在72.0~78.6g/L范围内的人数。
(2)Q 检验法(略)
Q=(x2-x1)/R Q=(xn-x n-1)/R 极差R=xn-x1
Q>1/3
DPS操作
【例3-14】研究一批人工培植人参中M物 质的含量(μg),54次测得的结果(略)
31 43 37 43 48 44 43 47 45 42 41 43 48 44 41 42 41 41 38 41 32 41 43 47 41 43 41 41 49 41 41 46 41 42 51 39 39 43 41 44 49 41 50 51 42 51 38 39 58 39 44 45 50 51
平方根,也可用于S形曲线或反S形曲线的 直线化。
第六节 容许区间与参考值范围
1. 容许区间(参考值范围)、医学参考值范围概念
(tolerance limit of population)又 称预测区间,指的 是总体中绝大多数 个体观察值可能出 现的范围。
标准正态变量的分布函数记为Ф(z)。
Ф(z)= P(Z<z)
z
=
(Z)dZ
= 1 zeZ2/2dZ
2
x
4. 标准正Z =态变 换:
式3-17
5.正态分布的特征
(1)正态分布具有集中性、对称性和均匀变动性. (2)正态分布的图形由参数μ和σ确定。 (3)任何均数为μ,标准差为σ的正态变量x,都 可通过式(3-17)变换为标准正态变量z。z~N (0,1)。 (4) 正态变量的分布有一定规律.
指“正常”人体和动物的各种生 理常数、体液、排泄物中各种 成分含量及人体对各种试验的 反应值,是一个范围。
95%参考值范围的含义是指样 本中有95%的个体其测定值在 所求的范围之内。
二、制定参考值范围的基本步骤(自学)
• 确定“正常人”对象的范围:即根据研究目的确定的未患被 研究疾病的个体。
• 统一测定标准:即检验用的试剂批号、仪器、人员、条件 等应相同。
双侧1-α容许区间计算公式的推导:(略)
• P(-zα/2< z <zα/2)= 1-α

P(-zα/2< x
<
zα/2)=
1-α

P(-zα/2σ< x-μ< zα/2σ)= 1-α

P(μ-zα/2σ< x < μ+zα/2σ)= 1-α

(μ-zα/2σ,μ+ zα/2σ)

μ±zα/2σ(zα/2表示双侧z界值)
7.正态分布的应用(P38)
8.统计推断和计算公式的推导中经 常应用到的正态变量性质(P39)
9.对数正态分布 (P39)
第五节 变量变换
变量变换即将原始数据转换成某种函 数值,目的是使变换后的数据达到统 计分析要求。
对数变换 平方根反正弦变换
1.对数变换
y=lgx或y=lnx
• 常用于: y=ln(x+k)、y=ln(x-k)
• 确定分组:一般需用年龄、性别等对“正常人”对象进行分 组,分组特征也可根据检验判断。
• 样本含量确定:一般来讲,正态分布资料所需的样本含量 应在100以上,偏态或未知分布时样本含量应更大。
• 确定参考值范围的单双侧:一般生理物质指标多为双侧、 毒物指标则多为单侧。
• 确定百分位点:一般取95%或99%。
例3-10 查表
6.正态分布规律
单侧:右侧尾部面积为α时的Z界值记为Zα,左侧尾部 面积为α时的Z界值为-Zα
P(Z<-zα)= P(Z > zα)=α P(Z>-zα)= P(Z< zα)= 1-α
例3-10 查表
α
界值-Zα
(2)一般正态曲线下面积的分布规律
求均数为μ方差为σ2的正态曲线下面积,先按标 准正态变换z =(x-μ)/σ求得x值对应的Z值,再用z值 查附表1,得Ф(z),即所求区间面积占总面积的比 例。
> μ-zασ
当μ和σ未知时,可用大样本的 的估计值,来计算的参考值范围。
< μ+zασ 和s分别作为μ和σ
2. 求参考值范围的方法
(1) 正态分布法
正态变量x的双侧(1-α)参考值范围计算公式为: ( x-zα/2s, x+zα/2s),缩写为 ±x zα/2s (3-30)
正态变量x的单侧(1-α)参考值范围为: >( x -zαs),或<( x +zαs) (3-31)
6.正态分布规律
(1) 标准正态变量的分布规律
随机变量概率分布的双侧尾部概率(或单侧尾部 概率)为α时,对应的变量值称为双侧(或单侧)临 界值,简称α界值或界值。
Ф(Z)= P(Z<z) P(Z > z)=1-Ф(z)
双侧:
6.正态分布规律
P(Z <-zα/2)= P(Z> Zα/2)=α/ 2 P(-zα/2< Z< zα/2)=1-α 即 P(│Z│< zα/2)=1-α
单侧时1-α容许区间计算公式推导(略)
P( z >-zα)= 1-α or P(z <zα)= 1-α
P(
x
>-zα)=
1-α
P(
x
< zα)= 1-α
P( x-μ>-zασ)= 1-α P( x-μ < zασ)= 1-α
P( x > μ-zασ)= 1-α
P( x < μ+zασ)= 1-α
F (x)= P (X<x)=
1 e dX X (X)2/(22)
2
正态变量在(-∞,x) 内取值的累计概率.
正态分布
3.标准正态分布的密度函数和分布函数
μ=0,σ=1的正态分布称为标准正态分布。
标准正态曲线的方程即标准正态密度函数,记为 (z)
(Z)=
1 ez2 / 2
2
,(–∞<Z<∞)
相关文档
最新文档