统计学教案习题03正态分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 正态分布
一、教学大纲要求
(一) 掌握内容
1.正态分布的概念和特征 (1)正态分布的概念和两个参数; (2)正态曲线下面积分布规律。 2.标准正态分布
标准正态分布的概念和标准化变换。 3.正态分布的应用 (1)估计频数分布; (2)制定参考值范围。 (二) 熟悉内容 标准正态分布表。 (三) 了解内容
1.利用正态分布进行质量控制 2.正态分布是许多统计方法的基础
二、教学内容精要
(一)正态分布 1.正态分布
若X 的密度函数(频率曲线)为正态函数(曲线)
2.正态分布的特征
服从正态分布的变量的频数分布由μ、σ完全决定。
(1)μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以x μ=为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。
(2)σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
(二)标准正态分布 1.标准正态分布是一种特殊的正态分布,标准正态分布的0=μ,12
=σ ,通常用u (或Z )表示服从标准正态分
布的变量,记为u ~N (0,2
1)。
2.标准化变换:σ
μ
-=X u ,此变换有特性:若X 服从正态分布),(2
σμN ,则u 就服从标准正态分布,故该
变换被称为标准化变换。
3. 标准正态分布表
标准正态分布表中列出了标准正态曲线下从-∞到u 范围内的面积比例()u Φ。 (三)正态曲线下面积分布
1.的概率(概率分布)。不同),(21X X 范围内正态曲线下的面积可用公式3-2计算。
)()(21
12)
22(2)(2
1
u u dx e
D X X X Φ-Φ==--⎰
σμπ
σ (3-2)
1212X X u u μ
μ
σ
σ
--=
=
其中, , 。
2.几个重要的面积比例
X 轴与正态曲线之间的面积恒等于1。正态曲线下,横轴区间σμ±内的面积为68.27%,横轴区间σμ64.1±内的面积为90.00%,横轴区间σμ96.1±内的面积为95.00%,横轴区间σμ58.2±内的面积为99.00%。
(四)正态分布的应用
某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式(3-2)估计任意取值12(,)X X 范围内频数比例。
2. 制定参考值范围
(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。 (2)百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
概率
(%) 双侧 单 侧 双侧
单侧
90 955~P P 10P 90P 95 S X 96.1± S X 64.1- S X 64.1+ 5.975.2~P P 5P 95P 99 S X 58.2±
S X 33.2-
S X 33.2+
~P P
1P
P
3. 质量控制:为了控制实验中的测量(或实验)误差,常以S X 2±作为上、下警戒值,以S X 3±作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
4.正态分布是许多统计方法的理论基础。t 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
三、典型试题分析
1.正态曲线下、横轴上,从均数到∞+的面积为( )。
A .95%
B .50%
C .97.5%
D .不能确定(与标准差的大小有关) 答案:B
[评析] 本题考点:正态分布的对称性
因为无论μ,σ取什么值,正态曲线与横轴间的面积总等于1,又正态曲线以μ=X 为对称轴呈对称分布,所以μ左右两侧面积相等,各为50%。
2.若X 服从以μ,σ为均数和标准差的正态分布,则X 的第95百分位数等于( )。 A .σμ64.1- B .σμ64.1+C .σμ96.1+ D .σμ58.2+ 答案:B
[评析]本题考点:正态分布的对称性和面积分布规律
正态分布曲线下σμ64.1±范围内面积占90%,则σμ64.1±外的面积为10%,又据正态分布的对称性得,曲线下横轴上小于等于σμ64.1+范围的面积为95%,故X 的第95百分位数等于σμ64.1+。
3.若正常成人的血铅含量X 近似服从对数正态分布,拟用300名正常人血铅值确定99%参考值范围,最好采用公式( )计算。(其中Y=logX ) A. S X 58.2±B . 2.33X S +
C .1
log ( 2.58)Y Y S -±D .)33.2(log 1
Y S Y +-
答案:D
[评析]本题考点:对数正态分布资料应用正态分布法制定参考值范围
根据题意,正常成人的血铅含量X 近似对数正态分布,则变量X 经对数转换后所得新变量Y 应近似服从正态分布,因此可以应用正态分布法估计Y 的99%参考值范围,再求反对数即得正常成人血铅含量X 的99%参考值范围。因血铅含量仅过大为异常,故相应的参考值范围应是只有上限的单侧范围。正态分布法99%范围单侧上限值是均数+2.33倍标准差。
4.正常成年男子红细胞计数近似正态分布,95%参考值范围为3.60~5.8412
(10/)L ⨯。若一名成年男子测得红细胞计数为3.10)/10
(12
L ⨯,则医生判断该男子一定有病。
[评析] 本题考点:参考值范围的涵义
该成年男子不一定有病。因为参考值范围是指绝大多数正常人的指标值范围,故不在此范围内的对象也可能是正常人。
5.假定正常成年女性红细胞数)/10(12
L ⨯近似服从均值为4.18,标准差为0.29的正态分布。令X 代表随机抽取的一名正常成年女性的红细胞数,求:
(1) 变量X 落在区间(4.00,4.50)内的概率; (2) 正常成年女性的红细胞数95%参考值范围。 [评析] 本题考点:正态分布的应用
(1)根据题意,变量X 近似服从正态分布,求变量X 落在区间(4.00,4.50)内的概率,即是求此区间内正态曲线下的面积问题,因此,可以把变量X 进行标准化变换后,借助标准正态分布表求其面积,具体做法如下:
4.00 4.18 4.50 4.18
(4.00 4.50)(
)0.290.29
X P X P μσ---<<=<<
)10.162.0(<<-=u P
)62.0()10.1(1-Φ--Φ-= 2676.01357.01--= 5967.0=
变量X 落在区间(4.00,4.50)内的概率为0.5967。
(2)问题属于求某个指标的参考值范围问题,因为正常成年女性红细胞数近似服从正态分布,可以直接用正态分布法求参考值范围,又因该指标过高、过低都不正常,所以应求双侧参考值范围,具体做法如下:
下限为: 1.96 4.18 1.96(0.29)X σ-=-=)/10(61.312
L ⨯ 上限为: 1.96 4.18 1.96(0.29)X σ+=+=)/10(75.412
L ⨯
95%的正常成年女性红细胞数所在的范围是)/10(75.4~61.312
L ⨯。
6.调查得成都市1979年996名女学生月经初潮年龄的分布如下,本资料宜用何法确定其双侧99%参考值范围?试估计之。
年岁 10~ 11~ 12~ 13~ 14~ 15~ 16~ 17~ 18~ 19~ 20~ 合计 人数 7 44 153 244 269 191 61 16 8 1 2 996 累计频率% 0.7 5.1 20.5 45.0 72.0 91.2 97.3 98.9 99.7 99.8 100.0 [评析] 本题考点:参考值范围的制定
解:本题所给资料明显属于偏态分布资料,所以宜用百分位数法估计其参考值范围。又因此指标过大、过小均属异常,故此参考值范围应是双侧范围。
(1)求5.0P 首先要找到第0.5百分位数所在组,根据累计频率第0.5百分位数在第1组,因此得
∑L
f
=0,
10=X L ,X f =7,X i =1