Use Normal Distributionsppt - McEachern High Schoo
合集下载
Chapter3 Normal distributionPPT课件
f(X)
Changing μ shifts the
distribution left or right.
Changing σ increases or decreases the σ spread.
μ
X
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc.
▪ Need to transform X units into Z units
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc.
Translation tostribution
The Normal Distribution
f(X)
σ X
-
μ
+
Mean = Median = Mode
Bell Shaped
Symmetrical
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc.
Many Normal Distributions
Business Statistics, A First Course (4e) © 2006 Prentice-Hall, Inc.
The Standardized Normal
▪ Any normal distribution (with any mean and standard deviation combination) can be transformed into the standardized normal distribution (Z)
医学统计学课件之正态分布(Normal Distribution)
“弃真”、“假阳性”、“误诊”
Ⅱ类错误 本质为不拒绝实际上不成立的H0 犯该类错误的最大概率为 “存伪”、“假阴性”、“漏诊”
两类错误此消彼长,欲同时减少他们的唯 一手段——增大样本含量
返回
严密的科研设计是保证假设检验结论正确性 的前提
选用合适的检验方法,必须以符合其适用条 件为前提
正确理解假设检验的统计意义
假设检验与可信区间的联系与区别
返回
计量资料的t检验 计量资料的ANOVA 计数资料的卡方检验 非参数的秩和检验
Example
从
总体中重复随机抽样10000次,
每次抽取n为9的样本
其中,2个样本的观测值及其均数和标准差:
身高观测值
均数 标准差
1 125 124 117 116 125 132 122 118 115 121.56 5.55
准差进行反映的,也叫标准误。
结论
只要抽样,则必定存在抽样误差
标准误越小,意味着抽样误差越小;反之,则大
抽样误差的大小反映的就是样本统计量对总体参 数的偏离程度
尽量减少抽样误差的最佳方法——增大样本含量 均为反映离散程度的统计指标
不同
定义 单个原始观测值对均数 样本均数对总体均数
正态分布(Normal Distribution)
u变换
标准正态变换
目的
标准正态分布曲线下面积规律
双侧95%或99%面积(1.96与2.58)
单侧95%或99%面积(1.645与2.32)
正态性检验(Normality test)
符合正态概率密度函数 矩法 偏度系数与峰度系数 W检验或D检验 原始目测法 P-P plot Q-Q plot
返回
可信区间
Ⅱ类错误 本质为不拒绝实际上不成立的H0 犯该类错误的最大概率为 “存伪”、“假阴性”、“漏诊”
两类错误此消彼长,欲同时减少他们的唯 一手段——增大样本含量
返回
严密的科研设计是保证假设检验结论正确性 的前提
选用合适的检验方法,必须以符合其适用条 件为前提
正确理解假设检验的统计意义
假设检验与可信区间的联系与区别
返回
计量资料的t检验 计量资料的ANOVA 计数资料的卡方检验 非参数的秩和检验
Example
从
总体中重复随机抽样10000次,
每次抽取n为9的样本
其中,2个样本的观测值及其均数和标准差:
身高观测值
均数 标准差
1 125 124 117 116 125 132 122 118 115 121.56 5.55
准差进行反映的,也叫标准误。
结论
只要抽样,则必定存在抽样误差
标准误越小,意味着抽样误差越小;反之,则大
抽样误差的大小反映的就是样本统计量对总体参 数的偏离程度
尽量减少抽样误差的最佳方法——增大样本含量 均为反映离散程度的统计指标
不同
定义 单个原始观测值对均数 样本均数对总体均数
正态分布(Normal Distribution)
u变换
标准正态变换
目的
标准正态分布曲线下面积规律
双侧95%或99%面积(1.96与2.58)
单侧95%或99%面积(1.645与2.32)
正态性检验(Normality test)
符合正态概率密度函数 矩法 偏度系数与峰度系数 W检验或D检验 原始目测法 P-P plot Q-Q plot
返回
可信区间
Normal Distribution 讲义 PPT
7% of the Computers Have a Lifetime Less Than the Guarantee Period
Figure 6-26
15
Example 8 – Solution
cont’d
If a computer system lasts fewer months than the guarantee period, a full-price refund will have to be made. The lifetimes requiring a refund are in the shaded region in Figure 6-26. This region represents 7% of the total area under the curve. We can use Table 5 of Appendix II to find the z value such that 7% of the total area under the standard normal curve lies to the left of the z value.
8
Example 7 – Solution
The corresponding areas under the x and z curves are shown in Figure 6-23.
cont’d
Corresponding Areas Under the x Curve and z Curve
Excerpt from Table 5 of Appendix II
Table 6-5
18
Example 8 – Solution
To translate this value back to an x value (in months), we use the formula x = z +
正态分布及其应用--ppt课件
➢ 有两个参数:位置参数 和变异度参数 。 一定, 越大,数据越分散,曲线越平坦; 一
定, 增大,曲线沿 X 轴向右平移。因此,不
同的 ,不同的 ,对应不同的正态分布。
PPT课件
5
不同均值正态分布示意图
PPT课件
6
1.5 1
不同标准差的正态分布示意图
PPT课件
7
➢ 正态曲线下面积的分布规律
➢估计频数分布。
➢制定医学参考值范围。
➢正态分布是许多统计方法的理论基础。
今后要讨论到的 分布t 、 分布F 与
分布 2等都是在正态分布的基础上推导 出来的。
ቤተ መጻሕፍቲ ባይዱPPT课件
9
第二节 标准正态分布及其应用
只要变量 X ~ N(, 2 ) ,就可经下式 转换为 0、 1的标准正态分布,记 作 u ~ N(0,1) 。此变换也称为标准化变换,
通过对密度函数积分我们可以知道正态曲线下, 横轴上所夹的面积为1。理论上:
范围内曲线下的面积占总面积的68.27%; 1.645 范围内曲线下的面积占总面积的90%; 1.96 范围内曲线下的面积占总面积的95%;
2.58 范围内曲线下的面积占总面积的99%。
PPT课件
8
➢四、正态分布的应用
正态分布及其应用
(normal distribution)
PPT课件
1
第一节 正态分布的概念和特征
➢一.概念 正态分布又称高斯(Gauss)分布,
是最常见、最重要的一种连续型分布, 医学资料中有许多指标的频数分布都呈 正态分布,如身高、体重、脉搏、血红 蛋白、血清总胆固醇等。
PPT课件
2
➢二.图形 正态分布密度函数
PPT课件
定, 增大,曲线沿 X 轴向右平移。因此,不
同的 ,不同的 ,对应不同的正态分布。
PPT课件
5
不同均值正态分布示意图
PPT课件
6
1.5 1
不同标准差的正态分布示意图
PPT课件
7
➢ 正态曲线下面积的分布规律
➢估计频数分布。
➢制定医学参考值范围。
➢正态分布是许多统计方法的理论基础。
今后要讨论到的 分布t 、 分布F 与
分布 2等都是在正态分布的基础上推导 出来的。
ቤተ መጻሕፍቲ ባይዱPPT课件
9
第二节 标准正态分布及其应用
只要变量 X ~ N(, 2 ) ,就可经下式 转换为 0、 1的标准正态分布,记 作 u ~ N(0,1) 。此变换也称为标准化变换,
通过对密度函数积分我们可以知道正态曲线下, 横轴上所夹的面积为1。理论上:
范围内曲线下的面积占总面积的68.27%; 1.645 范围内曲线下的面积占总面积的90%; 1.96 范围内曲线下的面积占总面积的95%;
2.58 范围内曲线下的面积占总面积的99%。
PPT课件
8
➢四、正态分布的应用
正态分布及其应用
(normal distribution)
PPT课件
1
第一节 正态分布的概念和特征
➢一.概念 正态分布又称高斯(Gauss)分布,
是最常见、最重要的一种连续型分布, 医学资料中有许多指标的频数分布都呈 正态分布,如身高、体重、脉搏、血红 蛋白、血清总胆固醇等。
PPT课件
2
➢二.图形 正态分布密度函数
PPT课件
正态分布和医学参考值范围课件
图3-5
图3-6
Standard normal distribution 文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。
三、标准正态分布
=0、σ =1的正态分布即为标准正态分布
z X z e 1 Nhomakorabeaz2
2
2
z
1
2
e z z2 2
dz
Standard normal distribution 文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。
正态分布由两个参数 和 σ 决定
是位置参数,决定着正态曲线在X轴上的位置
σ 是形状参数,决定着正态曲线的分布形状
正态曲线下的面积分布有一定的规律
Normal distribution 文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。
图3-3
图3-4
Normal distribution 文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。
1 .9 6 2
1 2 1 .9 6 1 2 0 .0 2 5 0 .9 5
Standard normal distribution 文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。
例3-2 已知某地140名正常成年男子红细胞计数近似
服从正态分布,X =4.78×1012/L,S =0.38×1012/L。
计算 z
z X X S
Standard normal distribution 文档仅供参考,不能作为科学依据,请勿模仿;如有不当之处,请联系网站或本人删除。
例3-1 若X~ N(,2),试计算X 取值在区间
13种常见的统计分布ppt课件
属性
✓ 连续型分布 ✓ 用于描述以方向、位置、周期性(环形)时间、角度等为测度
单位的数字特征
应用
✓ 医学领域内一些现象是以方向或时间度量,具有周期性特点, 如某疾病在一年内各月份的发生数、胎儿在一昼夜间各时点 分娩的频度
✓ 有些数据本身就是以角度来表示:如脑电阴图的上升角,气 象环境的风向玫瑰图
✓ 这些数据不能用通常的均数、标准差描述
1 二项分布 Binomial Distribution
应用 条件
✓ 各观察单位只能具有相互对立的一种结果,如阳性或阴 性,生存或死亡等,属于两分类资料
✓ 已知发生某一结果(阳性)的概率为π,其对立结果的概 率为1-π,实际工作中要求π是从大量观察中获得比较稳 定的数值。
✓ n次试验在相同条件下进行,且各个观察单位的观察结果 相互独立,即每个观察单位的观察结果不会影响到其他观 察单位的结果。如要求疾病无传染性、无家族性等。
9 F分布 F Distribution
属性
✓ 连续型分布 ✓ 用于方差Γ分布 Γ Distribution or Gamma Distribution
属性
✓ 连续型分布 ✓ 正偏态分布,常用于正偏态分布的拟合
11 圆形分布 Circular Distribution
5 均匀分布 Uniform Distribution
属性
✓ 连续型分布 ✓ 数值计算的误差分析 ✓ 任意分布的随机数
理解
✓ 均匀分布在自然情况下极为罕见,而人工栽培的有一定株 行距的植物群落即是均匀分布
✓ 均匀,表示可能性相等的含义
6 正态分布 Normal Distribution
属性
✓ 连续型分布 ✓ 自然界、人类社会、心理和教育中大量现象均按正态形式分布,
第二章正态分布课件
范围为-∞~x时所对应的正态曲线下的面积占
总面积的比例,F(x)实际上反映了随机变量X
取值范围为-∞~x的概率大小,因此,称该正
态分布为随机变量X的概率分布。
二、正态分布曲线下的面积
❖ 例 设某地成年男性身高的均数为170cm,标 准差为7cm,假设该地共有成年男性10 000人, 求该地身高不超过160cm者有多少人?又该地身 高在160cm~180cm之间者共有多少人?
X占的百
分比(%)
68.27
95.00
99.00
四、正态分布的应用
❖(一)估计频数分布 ❖(二)制定参考值范围 ❖(三)质量控制 ❖(四)正态分布是许多统计方法的理论基
础
四、正态分布的应用
❖(三)利用正态分布进行质量控制
❖
由于随机测量误差的分布符合以0为中
心的正态分布,假如对同一份样品采用同样的
❖ 男女身高的频数分布图形的比较:
❖
1.共同点:
❖
男女在不同身高的频数分布均为完全对称的钟
形分布,以均数所在处频数最多,两侧逐渐减少。
❖
2.不同点:
❖ ①位置不同,男性身高的均数大于女性,故图形 靠右;
❖ ②高低不同,男性身高的方差大于女性,故变量 值更分散,图形更低平。
医学上脑血管疾病的问题
临床发现脑中风病人在脑血流图 (CBF)指标偏低,正常人的CBF平 均为75,标准差为17,如CBF低于 40,认为有中风的危险。
如用CBF低于40为界限,问一个脑血流 图正常(无中风)被错误诊断中风的 概率为多少?
求:p(x≤40)的概率。
二、正态分布曲线下的面积
❖ 如果以曲线下的总面积为1,则从-∞至x 的面积可用下列积分公式求得:
卫生统计学课件---正态分布
χ±1.96s =10.1±1.96×0.93 即 8.28~11.92
kPa
95%参考范围(reference range)或正常 范围(normal range)仅仅告知95%健 康者的测定值在此范围之内,并非告知 凡在此范围之内皆健康,也非告知凡在 此范围之外皆不健康,所以不可将之作 为诊断标准。
-1.96~1.96部分的面积为0.95 (可以通过积分求得)。 也就是说|u|>1.96的面积为0.05,对任意的x,-x~x区 间面积为多少呢?统计学家已将此编制成了正态分布 界值表,不过表中的面积是指p(u<x), 也记作φ(x)。 当μ±σ时,该区间的面积与曲线所夹面积占总面积的 68.27%;当μ±1.96σ时,该区间的面积与曲线所夹面 积占总面积的95.00%;当μ±2.58σ时,该区间的面积 与曲线所夹面积占总面积的99.00%
χ±s 4.38~6.20 72 72.00 68.27 χ±1.96s 3.50~7.07 94 94.00 95.00 χ±2.58s 2.94~7.63 99 99.00 99.00
正态分布
(normal distribution)
一.概念
正态分布又称高斯(Gauss分布),是统 计学中最重要的分布,医学资料中有许 多指标如身高、体重、红细胞数、血红 蛋白、收缩压、脉搏数等频数分布都呈 正态分布。
二. 图形
正态分布密度函数
f (x)
e 1
2
(x)2
2 2
其中是μ总体均数,σ是总体标准差。记
N(μ,σ2)
三. 特征
1. 是单峰曲线,x=μ 2. 以均数μ为中心左右对称 3. 有2个参数,μ:位置参数,
σ:变异度参数 σ越大,数据越分散,曲线越平坦。 特别地 N(0,1)称为标准正态分布 (z分布、u分布)
kPa
95%参考范围(reference range)或正常 范围(normal range)仅仅告知95%健 康者的测定值在此范围之内,并非告知 凡在此范围之内皆健康,也非告知凡在 此范围之外皆不健康,所以不可将之作 为诊断标准。
-1.96~1.96部分的面积为0.95 (可以通过积分求得)。 也就是说|u|>1.96的面积为0.05,对任意的x,-x~x区 间面积为多少呢?统计学家已将此编制成了正态分布 界值表,不过表中的面积是指p(u<x), 也记作φ(x)。 当μ±σ时,该区间的面积与曲线所夹面积占总面积的 68.27%;当μ±1.96σ时,该区间的面积与曲线所夹面 积占总面积的95.00%;当μ±2.58σ时,该区间的面积 与曲线所夹面积占总面积的99.00%
χ±s 4.38~6.20 72 72.00 68.27 χ±1.96s 3.50~7.07 94 94.00 95.00 χ±2.58s 2.94~7.63 99 99.00 99.00
正态分布
(normal distribution)
一.概念
正态分布又称高斯(Gauss分布),是统 计学中最重要的分布,医学资料中有许 多指标如身高、体重、红细胞数、血红 蛋白、收缩压、脉搏数等频数分布都呈 正态分布。
二. 图形
正态分布密度函数
f (x)
e 1
2
(x)2
2 2
其中是μ总体均数,σ是总体标准差。记
N(μ,σ2)
三. 特征
1. 是单峰曲线,x=μ 2. 以均数μ为中心左右对称 3. 有2个参数,μ:位置参数,
σ:变异度参数 σ越大,数据越分散,曲线越平坦。 特别地 N(0,1)称为标准正态分布 (z分布、u分布)
标准正态分布演示课件.ppt
精选
计算
已知u~N(0,1),试求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
精选
计算
查附表1得: (1) P(u<-1.64)=0.05050 (2) P (u≥2.58)=Φ(-2.58)=0.024940 (3) P (|u|≥2.56) =2Φ(-2.56)=2×0.005234 =0.010468 (4) P (0.34≤u<1.53) =Φ(1.53)-Φ(0.34) =0.93669-0.6331=0.30389
P(x<μ-1.96σ)=P(x>μ+1.96σ)=0.025
精选
x落在(μ-2.58σ,μ+2.58σ)之外的双侧概率为 0.01,而单侧概率
P(x<μ-2.58σ)=P(x>μ+2.58σ)=0.005
精选
第二节
卡方分布 Chi-square Distribution
精选
定义
如果随机变量zi(i = 1, ..., n)为相互独
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0
样本平精均选 数的分布
定理
情况1. 如果总体服从正态分布,平均数为 ,方差为2,样本含量为n,则样本为:
正态分布 平均数等于 方差等于 2/n,SQRT( 2/n )称为平均
数的标准差(standard error of the mean), 或简称标准误
P(u1 u u2 )
1
u2
1u2
e2
du
2 u1
计算
已知u~N(0,1),试求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
精选
计算
查附表1得: (1) P(u<-1.64)=0.05050 (2) P (u≥2.58)=Φ(-2.58)=0.024940 (3) P (|u|≥2.56) =2Φ(-2.56)=2×0.005234 =0.010468 (4) P (0.34≤u<1.53) =Φ(1.53)-Φ(0.34) =0.93669-0.6331=0.30389
P(x<μ-1.96σ)=P(x>μ+1.96σ)=0.025
精选
x落在(μ-2.58σ,μ+2.58σ)之外的双侧概率为 0.01,而单侧概率
P(x<μ-2.58σ)=P(x>μ+2.58σ)=0.005
精选
第二节
卡方分布 Chi-square Distribution
精选
定义
如果随机变量zi(i = 1, ..., n)为相互独
1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0
样本平精均选 数的分布
定理
情况1. 如果总体服从正态分布,平均数为 ,方差为2,样本含量为n,则样本为:
正态分布 平均数等于 方差等于 2/n,SQRT( 2/n )称为平均
数的标准差(standard error of the mean), 或简称标准误
P(u1 u u2 )
1
u2
1u2
e2
du
2 u1
第二节正态分布-PPT精选
正态曲线(normalcurve)
二、正态曲线( normal curve )
图形特点:
f(X)
1. 钟型
2. 中间高
3. 两头低
4. 左右对称
5. 最高处对应 于X轴的值
就是均数
X 6. 曲线下面积
为1
7. 标准差决定 曲线的形状
N(1,0.82)
0.6 f (X )
0.5
0.4 N(0,12 )
(
X )2 2 2
,
X
=3.14159,exp是以2.72818为底的自然对数指数
X ~ N(, 2),为X的总体均数,为总体标准差
f (X)称为概率密度函数p(robability densityfunction)
以f (X)为纵坐标,X为横坐标,绘制的曲就线是
分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 工人 管理人员 农民 商业服务 无 知识分子 总计
18
2
0
0
0
3
0
5
20
9
2
6
10
18
0
45
22 28
7
10
24
70
11
150
24 50
0.3
N(1,1.22)
μ决定曲线的位置,σ0.决2 定曲线的“胖瘦”
0.1
0
-4
-3
-2
-1
0
1
2
3
4
X
三、标准正态分布
医学统计学. 正态分布及其应用ppt课件
准化变换。
ppt精选版
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
标准正态分布的密度函数为
(X ) 1 eZ2 2 2
ppt精选版
26
➢ 对上式求积分可得到标准正态变量Z的分布函 数。
➢ 由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由表 可查出曲线下某区间的面积。
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
f(x)
F
x
P(a
x
b)
b
a
f
(x)dx
?
x ab
ppt精选版
21
实际工作中,常需要了解正态曲
线下横轴上某一区间的面积占总
面积的百分数,以便估计该区间
的例数占总例数的百分数(频数
概率 29
查附表2时注意事项:
➢ 曲线下横轴上的总面积为100%或1; ➢ 表中曲线下面积为-∞到Z的面积;
➢ 对于服从正态分布的变量x,先进行标准 化变换(Z X ),然后借助标准正态分
布表可得到任意(x1, x2)范围内的面积或频 数比例。
ppt精选版
30
Z1 Z2
图4.7 查表法求标准正态曲线下面积示意图
X<μ范围内曲线下的面积相等,各占50%;
S(X,)=S(-,-X)
S(-,-X)
S(X,)
-X X
X轴
正态分布对称性
ppt精选版
15
二.正态密度函数曲线下的面积规律
ppt精选版
24
N(μ,σ2)
N(0,1)
从一般的正态分布转变为标准的正态分布
标准正态分布的密度函数为
(X ) 1 eZ2 2 2
ppt精选版
26
➢ 对上式求积分可得到标准正态变量Z的分布函 数。
➢ 由于积分计算繁琐,统计学家按标准正态分布
的累积概率分布函数(-Z)编制了附表2
(P315),标准正态分布曲线下的面积,由表 可查出曲线下某区间的面积。
20
曲线下的面积的计算
对于任意一个区间的曲线下面积,在知道变 量值x对应的概率密度函数f (x)后,都可以根 据微积分的方法求出其面积的大小
f(x)
F
x
P(a
x
b)
b
a
f
(x)dx
?
x ab
ppt精选版
21
实际工作中,常需要了解正态曲
线下横轴上某一区间的面积占总
面积的百分数,以便估计该区间
的例数占总例数的百分数(频数
概率 29
查附表2时注意事项:
➢ 曲线下横轴上的总面积为100%或1; ➢ 表中曲线下面积为-∞到Z的面积;
➢ 对于服从正态分布的变量x,先进行标准 化变换(Z X ),然后借助标准正态分
布表可得到任意(x1, x2)范围内的面积或频 数比例。
ppt精选版
30
Z1 Z2
图4.7 查表法求标准正态曲线下面积示意图
X<μ范围内曲线下的面积相等,各占50%;
S(X,)=S(-,-X)
S(-,-X)
S(X,)
-X X
X轴
正态分布对称性
ppt精选版
15
二.正态密度函数曲线下的面积规律
正态分布及其应用课件
市成年男性的血红细胞计数在3.5×1012个/升以 下者,估计约占1.92%。
表3.1 100名12岁男童血红细胞计数的实际分布与理论分布的比较
血红细胞计数 (1012个/升) 实际分布
X us X 1.00s X 1.96s X 2.58s
人数
百分数(%)
理论分布(%)
4.13~5.31
正态分布的重要性
医学上某些指标服从或近似服从正态分布; 很多统计方法是建立在正态分布基础上的; 很多其他分布的极限为正态分布。
(a )
(b )
( c)
(d )
图3.1 直方图逐渐接近一条光滑曲线
正态分布图形
.4
f (x)
.3
.2
.1
0
x
正态分布的数学形式
f (X ) 1 e
( X ) 2 2 2
2
为总体均数,为总体标准差 π为圆周率,e为自然对数的底
X为变量,代表横轴的数值,f(X)为纵轴数值。
正态分布的表示
用N(μ,σ2)表示均数为μ ,标准差为σ的正态
分布,可写作:
X~ N(μ,σ2)
例如: X ~ N(120,8.22)
X ~ N(5,32)
正态分布曲线的三个特点 集中性 对称性 均匀变动性
S(-, )=0.5 -3)=0.1587 -2 -1 )=0.0013 )=0.0228
S(-, +1 +3 +2 )=1 )=0.8413 )=0.9987 )=0.9772
-3 -2 -
+ +2 +3
-4
-3
-2
-1
0
1
表3.1 100名12岁男童血红细胞计数的实际分布与理论分布的比较
血红细胞计数 (1012个/升) 实际分布
X us X 1.00s X 1.96s X 2.58s
人数
百分数(%)
理论分布(%)
4.13~5.31
正态分布的重要性
医学上某些指标服从或近似服从正态分布; 很多统计方法是建立在正态分布基础上的; 很多其他分布的极限为正态分布。
(a )
(b )
( c)
(d )
图3.1 直方图逐渐接近一条光滑曲线
正态分布图形
.4
f (x)
.3
.2
.1
0
x
正态分布的数学形式
f (X ) 1 e
( X ) 2 2 2
2
为总体均数,为总体标准差 π为圆周率,e为自然对数的底
X为变量,代表横轴的数值,f(X)为纵轴数值。
正态分布的表示
用N(μ,σ2)表示均数为μ ,标准差为σ的正态
分布,可写作:
X~ N(μ,σ2)
例如: X ~ N(120,8.22)
X ~ N(5,32)
正态分布曲线的三个特点 集中性 对称性 均匀变动性
S(-, )=0.5 -3)=0.1587 -2 -1 )=0.0013 )=0.0228
S(-, +1 +3 +2 )=1 )=0.8413 )=0.9987 )=0.9772
-3 -2 -
+ +2 +3
-4
-3
-2
-1
0
1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Answer Now
h
10
Analyzing the data
What will be the miles per gallon for a Toyota Camry when the
average mpg is 23, it has a
z value of 1.5 and a standard deviation of 2?
h
6
Analyzing the data
Suppose SAT scores among college students are normally
distributed with a mean of 500 and a standard deviation of 100. If a student scores a 700, what would be her zscore?
z 700500 2 100
Her z-score would be 2 which means her score is two standard deviations above the mean.
h
7
Analyzing the data
• A set of math test scores has a mean of 70 and a standard deviation of 8.
4
Standard Normal Distribution
Mean is 0 and standard deviation is 1. This formula is used to find the z-scores which “Normalize” a data point to it’s exact number of standard deviations away from the mean it is.
(Z-score is the # of standard deviations away from the mean)
h
5
Analyzing the data
Suppose SAT scores among college students are normally distributed with a mean of 500 and a standard deviation of 100. If a student scores a 700, what would be her z-score?
x
Using the formula for z-scores:
z
1.5 x 23
3 x 2 3 x 2 6
2
The Toyota Camry would be expected to use 26
mpg of gasoline.
h
11
Analyzing the data
A group of data with normal distribution has a mean of 45. If one element of the data is 60, will the z-score be positive or negative?
h
9
Analyzing the data
What will be the miles per gallon for a Toyota Camry when the average mpg is 23, it has a z value of 1.5 and a standard deviation of 2?
To solve: Find the z-score for each test.
m athz-score=788 -70E n 1 glishz-score=78-74.25 16
The math score would have the highest standing since it is 1 standard deviation above the mean while the English score is only .25 standard deviation above the mean.
h
3
Empirical Rule (68 – 95 99.7)
Within 1 from the mean lies 68% of the data
Within 2 from the mean lies 95% of the data
Within 3 from the meahn lies 99.7% of the data
• A set of English test scores has a mean of 74 and a standard deviation of 16.
For which test would a score of 78 have a higher standing?
Answer Now
h
8
Analyzing the data A set of math test scores has a mean of 70 and a standard deviation of 8. A set of English test scores has a mean of 74 and a standard deviation of 16. For which test would a score of 78 have a higher standing?
7.4 Use Normal Distributions
p. 266
h
1
Warm-Up
1.) #9 2.) #11
From Page 261 (Homework.) You must show all of your work for credit
h
2
Normal Distribution
A bell-shaped curve is called a normal curve. It is symmetric about the mean. The percentage of the area in each standard deviation is shown above.