第6课 正态分布 概率论要点
正态分布概率
正态分布概率正态分布是统计学中最为常见的连续概率分布之一,也被称为高斯分布。
它在自然界、社会科学和工程领域中具有广泛的应用。
正态分布的最重要特征是其对称性和集中性,因此它经常被用来对观测数据的分布进行建模和分析。
正态分布的概率密度函数由以下公式给出:f(x) = (1 / (σ * √(2π))) * e^(-(x-μ)² / (2σ²))其中,f(x) 表示随机变量 X 的概率密度函数值,e 是自然对数的底数,μ 是分布的均值,σ² 是分布的方差。
概率密度函数描述了在给定均值和方差的情况下,随机变量 X 取某一特定值的概率。
正态分布具有一些重要的特性,其中最重要的是:1. 对称性:正态分布是对称的,也就是说,它的概率密度函数在均值处达到最大值,并且两侧的概率密度相等。
2. 峰度:正态分布具有尖峰且平滑的形状。
如果一个分布的峰度是零,则称该分布为正态分布。
峰度的绝对值越大,分布的形状就越陡峭或扁平。
3. 标准化:正态分布可以通过减去均值并除以标准差来进行标准化,从而得到标准正态分布。
标准正态分布的均值为0,方差为1。
4. 中心极限定理:中心极限定理是正态分布的一个重要特性,它指出如果随机变量是由大量独立同分布的随机变量之和形成的,那么这个随机变量的分布将趋近于正态分布。
正态分布的概率计算是统计学中重要的任务之一。
我们可以使用正态分布表或计算机软件来计算特定区域的概率。
下面将介绍一些常用的概率计算方法。
1. 区间概率:给定一个间隔 [a, b],我们可以计算在该区间内随机变量 X 取值的概率。
这可以通过计算概率密度函数在该区间上的积分来实现。
2. 尾概率:尾概率是指随机变量 X 取值超过给定阈值的概率。
对于正态分布,我们可以使用标准正态分布表或计算机软件来计算尾概率。
3. 百分位数:百分位数是指给定概率下的随机变量取值。
对于正态分布,我们可以使用标准正态分布表或计算机软件来计算百分位数。
正态分布知识点总结
4.正态分布 (1)正态分布的定义态变量概率密度曲线的函数表达式为22()2()x f x μσ--=,x ∈R ,其中μ,σ是参数,且0σ>,μ-∞<<+∞.式中的参数μ和σ分别为正态变量的数学期望和标准差.期望为μ、标准差为σ的正态分布通常记作2(,)N μσ.(2)正态曲线的性质①曲线位于x 轴上方,与x 轴不相交,与x 轴之间的面积为1; ②曲线是单峰的,它关于直线x =μ对称; ③曲线在x =μ处达到峰值1σ2π;④当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散. (3)正态总体在三个特殊区间内取值的概率值①P (μ-σ<X ≤μ+σ)=0.682__6;②P (μ-2σ<X ≤μ+2σ)=0.954__4;③P (μ-3σ<X ≤μ+3σ)=0.997__4.④正态变量在()-∞+∞,内的取值的概率为1,在区间(33)μσμσ-+,之外的取值的概率是0.3%,故正态变量的取值几乎都在距x μ=三倍标准差之内,这就是正态分布的3σ原则.5.(2017·西安调研)已知随机变量X 服从正态分布N (3,1),且P (X >2c -1)=P (X <c +3),则c =________.①P (X <a )=1-P (X ≥a );②P (X <μ-σ)=P (X ≥μ+σ).【训练4】 (2017·常德一模)已知随机变量X ~N (1,σ2),若P (0<X <2)=0.4,则P (X ≤0)=( ) A.0.6B.0.4C.0.3D.0.28.设随机变量X ~B (2,p ),随机变量Y ~B (3,p ),若P (X ≥1)=59,则P (Y ≥1)=________.7.假设每天从甲地去乙地的旅客人数X 是服从正态分布N (800,502)的随机变量,记一天中从甲地去乙地的旅客人数800<X ≤900的概率为p 0,则p 0=________.【例1】 某单位为绿化环境,移栽了甲、乙两种大树各2株.设甲、乙两种大树移栽的成活率分别为56和45,且各株大树是否成活互不影响.求移栽的4株大树中: ⑴至少有1株成活的概率;⑴两种大树各成活1株的概率1.(2019·广东省汕头市联考)在某市高中某学科竞赛中,某一个区4 000名考生的参赛成绩统计如图所示.(1)求这4 000名考生的竞赛平均成绩x -(同一组中的数据用该组区间的中点值作代表);(2)由直方图可认为考生竞赛成绩Z 服从正态分布N (μ,σ2),其中μ,σ2分别取考生的平均成绩x -和考生成绩的方差s 2,那么该区4 000名考生成绩超过84.81分(含84.81分)的人数估计有多少?(3)如果用该区参赛考生成绩的情况来估计全市参赛考生的成绩情况,现从全市参赛考生中随机抽取4名考生,记成绩低于84.81分的考生人数为ξ,求P (ξ≤3)(精确到0.001).附:①s 2=204.75,204.75=14.31;②Z ~N (μ,σ2),则P (μ-σ<Z ≤μ+σ)=0.682 7,P (μ-2σ<Z ≤μ+2σ)=0.954 5; ③0.841 354=0.501.3.(2019·合肥一模)已知某公司生产的一种产品的质量X (单位:克)服从正态分布N (100,4),现从该产品的生产线上随机抽取10 000件产品,其中质量在[98,104]内的产品估计有( )(附:若X 服从N (μ,σ2),则P (μ-σ<X <μ+σ)=0.682 7,P (μ-2σ<X <μ+2σ)=0.954 5) A.4 093件 B.4 772件 C.6 827件D.8 186件(2017·常德一模)已知随机变量X ~N (1,σ2),若P (0<X <2)=0.4,则P (X ≤0)=( ) A.0.6B.0.4C.0.3D.0.24.设每天从甲地去乙地的旅客人数为随机变量X ,且X ~N (800,502),则一天中从甲地去乙地的旅客人数少于900的概率为( )(参考数据:若X ~N (μ,σ2),有P (μ-σ<X <μ+σ)=68.3%,P (μ-2σ<X <μ+2σ)=95.4%,P (μ-3σ<X <μ+3σ)=99.7%) A.97.7% B.68.3% C.99.7%D.95.4%5.某班有50名学生,一次考试的数学成绩ξ服从正态分布N (100,102),已知P (90<ξ<100)=0.3,估计该班学生数学成绩不小于110分的人数为________.10.若随机变量X ~N (μ,σ2),且P (X >5)=P (X <-1)=0.2,则P (2<X <5)=________.14.设X ~N (1,1),其正态分布密度曲线如图所示,那么向正方形ABCD 中随机投掷10 000个点,试估计落入阴影部分的点的个数.(注:若X ~N (μ,σ2),则P (μ-σ<X <μ+σ)=68.3%,P (μ-2σ<X <μ+2σ)=95.4%)15.已知随机变量X ~B (2,p ),Y ~N (2,σ2),若P (X ≥1)=0.64,P (0<Y <2)=p ,求P (Y >4)的值. 1 某项大型赛事,需要从高校选拔青年志愿者,某大学生实践中心积极参与,从8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X ,求X 的分布列及均值.20.(本小题满分10分)在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布(70,100)N 。
正态分布知识点
正态分布知识点正态分布是统计学中最为重要的概率分布之一,也被称为高斯分布。
它在自然界、人类社会和经济现象中都有着广泛的应用。
正态分布是一种连续型概率分布,其概率密度函数呈钟形曲线,呈现出对称性和集中性。
正态分布的形状可以通过其期望值(均值)和标准差来描述。
期望值表示数据的中心位置,标准差表示数据的离散程度。
通常情况下,正态分布的均值、中值和众数(最常出现的值)是相等的,呈现出对称性。
正态分布的曲线在均值附近最高,在离均值越远的位置,曲线越低。
正态分布的曲线在均值两侧对称,这意味着大约68%的数据位于均值的一个标准差范围内,大约95%的数据位于均值的两个标准差范围内,大约99.7%的数据位于均值的三个标准差范围内。
这种统计规律被称为“68-95-99.7法则”。
正态分布可以用来描述许多自然现象,例如身高、体重、智力水平等。
在这些现象中,大多数个体集中在均值附近,而离均值越远的个体越少。
这也解释了为什么大多数人的身高在平均身高附近,而极矮或极高的个体数量较少。
正态分布在统计学中有许多应用。
首先,它可以用来进行数据分析和假设检验。
通过分析数据的分布情况,可以判断某个变量是否服从正态分布。
在假设检验中,可以利用正态分布假设来进行参数估计和推断。
其次,正态分布可以用来进行抽样推断。
根据中心极限定理,当样本容量足够大时,样本均值的分布接近于正态分布。
这意味着我们可以通过对样本数据进行统计分析,来推断总体的性质和特征。
正态分布还可以用于建立概率模型和预测。
在金融领域,股票价格的波动、汇率变动等都可以用正态分布进行建模。
在质量控制中,正态分布被用来评估生产过程的稳定性和规范性。
此外,正态分布的特点也对科学研究和实践有着重要意义。
在实验设计中,可以通过对因素的测量,了解数据是否服从正态分布,从而选择适当的统计方法和模型。
总之,正态分布作为统计学中的重要概率分布,具有许多重要的应用。
其形状对称、集中性强的特点,使得它成为了许多自然现象和实际问题的理想模型。
第6课 正态分布 概率论
上一讲我们已经看到,当 n 很大,p 接近 0 或 1 时,二项分布近 似泊松分布; 可以证明,如果 n 很大,而 p 不接近于 0 或 1 时, 二项分布近似于正态分布. 再看一个应用正态分布的例子
例8 公共汽车车门高度是按男子与车门顶头碰头机会在 0.01以 下来设计的. 若男子身高 X~N(170, 62), 问门高度应如何确定? 解 设车门高度为 h cm, 按设计要求应有 P(X≥h)≤0.01
定义4 (P147.) 设 X~N(0 , 1 ), 0 < < 1 , 则称 满足等式 P(X >u ) = 的数 u 为标准正态分布的上侧 分位数; 称满足等式 P(|X|>u/2 ) = 的数 u/2 为标准正态分布的双侧 (x) 分位数; (x)
O
/2
1 e 2
( x )2 2 2
, x
f (x)所确定的曲线叫作正态曲线.
正态分布密度的性质
(2) 正态分布的密度曲线位于 x 轴的上方, f (μ+c) ≤f (μ), f (μ-c)≤f (μ) 决定图形的中心位置; 且关于 x f对称, 且 f (μ += c)= (μ-c) 故 f (x)以μ为对称轴, 1 (3对密度函数求导: ) 密度曲线 y = f (x) 有拐点 ( , ); e) 2 ( x ) (x (x ) ( ) ( ) 2 x x 1 (4当 )f f (x ) x 轴为水平渐近线 0+, ; e e2 2 (x x ) 以 (e f 2 ) → ∞时, ( x ) → 3 2 2 2 2 2 2 2 ( x ) ( x 即曲线 y =N f( )1向左右伸展时 , 越来越贴近 x): 轴. 正态分布 (x , )的密度函数图形的特点 ( ) x 2 2 f ( x ) [e e ] 2 3 2 ,左右对称的 “峰” 状 两头低, 中间高 ( x ) 1 2 ( x )2 ] e 2 [ =0, 若固定 ,改变 的值, f ( ) , 反之亦然, 2 决定了图形中峰的陡峭程度 x =μ σ为 f (x) 的两个拐点的横坐标.
正态分布详解(很详细)PPT课件
能不能根据密度函数的表达式, 得出正态分布的图形特点呢?
f(x) 1 e , (x2 2)2 x
2
容易看到,f(x)≥0 即整个概率密度曲线都在x轴的上方;
f(x) 1 e , (x2 2)2 x
2
令x=μ+c, x=μ-c (c>0), 分别代入f (x), 可 得
f (μ+c)=f (μ-c)
1
t2
e 2 dt
n np(1p)
将上述结论推广到一般的正态分布,
Y~N(,2)时,
P(Y | |)0.6826
P(Y | |2)0.9544
P(Y | |3)0.9974
可以认为,Y 的取值几乎全部集中在
[3,3]区间内.
这在统计学上称作“3 准则”
(三倍标准差原则).
上一讲我们已经看到,当n很大,p接 近0或1时,二项分布近似泊松分布; 如果 n很大,而p不接近于0或1,那么可以证明, 二项分布近似于正态分布.
2
X的分布函数P(X≤x)是怎样的呢?
设X~ N(,2) , X的分布函数是
F(x) 1 xe(t2 2)2d,tx
2
正态分布由它的两个参数μ和σ唯 一确定, 当μ和σ不同时,是不同的正 态分布。
下面我们介绍一种最重要的正态分布 标准正态分布
三、标准正态分布
0,1的正态分布称为标准正态分布.
且 f (μ+c) ≤f (μ), f (μ-c)≤f (μ)
故f(x)以μ为对称轴,并在x=μ处达到最大
值:
f () 1
2
f(x) 1 e , (x2 2)2 x
2
当x→ ∞时,f(x) → 0,
这说明曲线 f(x)向左右伸展时,越来越 贴近x轴。即f (x)以x轴为渐近线。
正态分布完整ppt课件
使用如Shapiro-Wilk检验、Kolmogorov-Smirnov检验等方法,对 误差项进行正态性检验,以验证其是否符合正态分布。
方差分析中F分布应用
01 02
F分布的定义
F分布是一种连续型概率分布,常用于方差分析中的假设检验。在方差 分析中,通过比较不同组间的方差与组内方差,判断各因素对结果的影 响是否显著。
筛选方法
包括单变量分析和多变量分析等,结合临床 意义和统计学显著性进行生物标志物的筛选 。
社会科学调查数据分析
社会科学调查数据特点
大量、复杂、多维度的数据,往往需要进行统计分析和数据挖掘。
正态分布在社会科学调查数据分析中的应用
通过对调查数据进行正态性检验,选择合适的数据处理和分析方法,如参数检验、回归分析等。
有对称性和单峰性。
性质
对称性:正态分布曲线关于均值对称 。
单峰性:正态分布曲线只有一个峰值 ,位于均值处。
均值、中位数和众数相等。
概率密度函数在均值两侧呈指数下降 。
正态曲线特点
01
02
03
04
形状
钟形曲线,中间高,两边低。
对称性
关于均值对称,即左右两侧形 状相同。
峰值
位于均值处,且峰值高度由标 准差决定。
05
正态分布在金融学领域应用
风险评估及资产组合优化
风险评估
正态分布用于描述金融资产的收益和风险分布,通过计算均值和标准差来评估投资组合 的风险水平。
资产组合优化
基于正态分布假设,利用马科维茨投资组合理论等方法,构建最优资产组合以降低风险 并提高收益。
VaR(Value at Risk)计算
正态分布用于计算投资组合在一定置信水平下的最大可能损失(VaR),以衡量潜在风 险。
高考正态分布知识点
高考正态分布知识点在统计学中,正态分布是一种重要的概率分布,也被称为钟形曲线或高斯分布。
在高考数学中,正态分布是一个常见的考察点,学生需要了解和掌握与正态分布相关的概念、性质和应用。
下面将详细介绍高考正态分布的知识点。
一、正态分布的定义和性质1. 正态分布的定义:正态分布是指在数理统计中,如果随机变量X服从一个数学期望为μ、方差为σ²的正态分布,则记为X~N(μ, σ²),其中N表示正态分布。
2. 正态分布的性质:(1)正态分布是对称的,其均值、中位数和众数都相等,即μ=中位数=众数。
(2)正态分布的图像呈现出典型的钟形曲线。
(3)正态分布的曲线在均值两侧呈现出逐渐减小的趋势,但是永远不会到达横轴。
(4)正态分布的曲线关于均值μ对称。
(5)正态分布的标准差σ越大,曲线越矮胖;标准差σ越小,曲线越瘦高。
(6)约68%的数据落在均值±1个标准差范围内;约95%的数据落在均值±2个标准差范围内;约99.7%的数据落在均值±3个标准差范围内。
二、正态分布的概率计算1. 标准正态分布:标准正态分布是指均值为0,标准差为1的正态分布。
记为Z~N(0, 1)。
对于标准正态分布,我们可以通过计算标准正态分布表来得到对应的概率值。
2. 普通正态分布:当随机变量X服从正态分布N(μ, σ²)时,可以进行标准化处理,将X转化为一个服从标准正态分布的随机变量Z。
即Z=(X-μ)/σ,这样就得到了一个标准正态分布。
对于普通正态分布,可以通过标准正态分布表和标准化公式来计算相应的概率值。
3. 概率计算:对于正态分布,我们常常需要计算在某个区间范围内的概率值。
对于标准正态分布,可以利用标准正态分布表查找对应的概率值。
对于普通正态分布,可以将其转化为标准正态分布进行计算。
三、正态分布的参数估计1. 样本均值的抽样分布:在统计学中,我们经常需要对总体的均值进行估计。
对于正态分布,样本均值的抽样分布也是一个正态分布,并且其均值等于总体均值,方差等于总体方差除以样本容量的平方根。
第6课 正态分布 概率论
离散型 —— 分布列 P( X xk ) pk
f (x) 0
x
连续型 —— 密度函数 f (x) 非负特规征范
是判定一个函数是否为某随机变量X 的分布列或密度的充要条件.
0
x
分布函数 F ( x) pk 其图形是右连续的阶梯曲线
F(X)= P(X x)
F( x)
xxk
当 X=256 时,
P(X>256)
1
(
256166 93
)
0.169
这表明高于256分的频率应为0.169, 即成绩高于甲的人数应占考生
的16.9%, 排在甲前应有 1657 16.9% 280名, 甲大约排在281名.
故甲能被录取, 但成为正式工的可能性不大.
例11
设 X~N( , 2 ), 求 P(|X-| < k ) k=1,2,3 .
类似可得 (u/2 )= 1- /2 ,
可查表得值
若 X~N( , 2)时,要求满足 P(X >x0 )= 的 x0 :
(u )= 1- u
x0
u
x0 u
复习
随机变量 X
全部可能的取值 取值的概率分布
p(x)
至此,我们已介绍了两类重要的随机变量:
P
(
X
k
)
e
k k!
k 0,1, 2,,
x
f
(
t
)d
t
,
其图形是连续曲线
常见的分布
离散型
连续型
两点分布、二项分布、泊松分布 超几何分布、几何分布
2025高三重要必考点正态分布
1.正态分布(1)正态曲线函数f(x)=x∈R.其中∈R,>0为参数.我们称f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线.(2)正态分布若随机变量X的概率分布密度函数为f(x),则称随机变量X服从正态分布,记为X N(,).特别地,当=0,=1时,称随机变量X服从标准正态分布.(3)正态分布的均值和方差若X N(,),则E(X)=,D(X)=.3.正态曲线的特点(1)曲线位于x轴上方,与x轴不相交;(2)曲线是单峰的,它关于直线x=对称;(3)曲线在x=;(4)当|x|无限增大时,曲线无限接近x轴;(5)对任意的>0,曲线与x轴围成的面积总为1;(6)在参数取固定值时,正态曲线的位置由确定,且随着的变化而沿x轴平移,如图甲所示;(7)当取定值时,正态曲线的形状由确定,当较小时,峰值高,曲线“瘦高”,表示随机变量X的分布比较集中;当较大时,峰值低,曲线“矮胖”,表示随机变量X的分布比较分散,如图乙所示.4.3原则(1)正态总体在三个特殊区间内取值的概率P(-+)0.6827;P(-2+2)0.9545;P(-3+3)0.9973.(2)3原则在实际应用中,通常认为服从正态分布N(,)的随机变量X只取[-3,+3]中的值,这在统计学中称为3原则.历届高考题最新模拟题选做1.已知随机变量ξ服从正态分布N(0,σ2),P(ξ>2)=0.023,则P(-2≤ξ≤2)=()AA.0.954B.0.977C.0.488D.0.4772.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为(B)(随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)=68.26%,P(μ-2σ<ξ<μ+2σ)=95.44%)A.4.56%B.13.59%C.27.18%D.31.74%3.已知随机变量X~N(1,σ2),P(X≥0)=0.8,则P(X>2)=(A)A.0.2B.0.4C.0.6D.0.8[解析]由X~N(1,σ2),正态曲线关于X=1对称,∴P(X>2)=P(X<0)=1-P(X≥0)=0.2;故选A.3.已知三个正态密度函数φi(x)=−(x−μi)22σi2(x∈R,i=1,2,3)的图像如图所示,则()A.μ1=μ3>μ2,σ1=σ2>σ3B.μ1<μ2=μ3,σ1<σ2<σ3C.μ1=μ3>μ2,σ1=σ2<σ3D.μ1<μ2=μ3,σ1=σ2<σ3由题图中y=φi(x)的对称轴知:132u u u =,y=φ1(x)与y=φ2(x)(一样)瘦高,而y=φ3(x)胖矮,所以σ1=σ2<σ3.故选:D.4.已知随机变量X服从正态分布N(5,4),且P(X>k)=P(X<k-4),则k的值为(B) A.6B.7C.8D.9[解析]∵(k-4)+k2=5,∴k=7,故选B.5.随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=0.2,P(2<ξ<6)=0.6,则μ=(C) A.6B.5C.4D.3[解析]由题意可知P(ξ≥6)=1-P(ξ<2)-P(2<ξ<6)=0.2,∴P(ξ≥6)=P(ξ<2),∴μ=6+22=4.选C.6.已知随机变量ξ服从正态分布N(1,σ2),若P(ξ<4)=0.9,则P(-2<ξ<4)=(D) A.0.2B.0.4C.0.6D.0.8[解析]由正态曲线的对称性知P(-2<ξ<4)=2P(1<ξ<4)=212-P(ξ>4)=212-(1-P(ξ<4))=0.8.故选D.7.若随机变量X服从正态分布N(μ,σ2)(σ>0),则P(|X-μ|≤σ)≈0.6826,P(|X-μ|≤2σ)≈0.9544,P(|X-μ|≤3σ)≈0.9974.已知某校1000名学生某次数学考试成绩服从正态分布N(110,100),据此估计该校本次数学考试成绩在130分以上的学生人数约为(C)A.159B.46C.23D.13[解析]由题意,μ=110,σ=10,故P(X>130)=P(X>μ+2σ)=1-0.95442=0.0228.∴估计该校本次数学考试成绩在130分以上的学生人数约为1000×0.0228=22.8≈23.故选C.8.已知随机变量X ~N(2,1),其正态分布密度曲线如图所示.若在边长为1的正方形OABC 内随机取一点,则该点恰好取自黑色区域的概率为(D)附:若随机变量ξ~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)=0.6826,P(μ-2σ≤ξ≤μ+2σ)=0.9544.A .0.1359B .0.6587C .0.7282D .0.8641[解析]由题意P(0<X ≤1)=12×(0.9544-0.6826)=0.1359.正方形OABC 内取一点,则点恰好落在阴影部分的概率为P =1×1-0.13591×1=0.8641.选D.9.近年来中国进入一个鲜花消费的增长期,某农户利用精准扶贫政策,贷款承包了一个新型温室鲜花大棚,种植销售红玫瑰和白玫瑰.若这个大棚的红玫瑰和白玫瑰的日销量分别服从正态分布N(μ,302)和N(280,402),则下列选项正确的是(ABD)附:若随机变量X 服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.6826.A .若红玫瑰日销售量范围在(μ-30,280)的概率是0.6826,则红玫瑰日销售量的平均数约为250B .红玫瑰日销售量比白玫瑰日销售量更集中C .白玫瑰日销售量比红玫瑰日销售量更集中D .白玫瑰日销售量范围在(280,320)的概率约为0.3413[解析]对于选项A :μ+30=280,μ=250,正确;对于选项BC :利用σ越小越集中,30小于40,B 正确,C 不正确;对于选项D :P(280<X<320)=P(μ<X<μ+σ)≈0.6826×12≈0.3413,正确.故选ABD.10.已知某校高三年级有1000人参加一次数学模拟考试,现把这次考试的分数转换为标准分,标准分的分数转换区间为[60,300],若使标准分X 服从正态分布N(180,900).(参考数据:①P(μ-σ<X ≤μ+σ)=0.6827;②P(μ-2σ<X ≤μ+2σ)=0.9545;③P(μ-3σ<X ≤μ+3σ)=0.9973.则(BC)A .这次考试标准分超过180分的约有450人B .这次考试标准分在(90,270]内的人数约为997C .甲、乙、丙三人恰有2人的标准分超过180分的概率为38D .P(240<X ≤270)=0.0428[解析]这次考试标准分超过180分的约有500人,A 错;∵P(90<X<270)=P(μ-3σ<X<μ+3σ)=0.9973,∴标准分在(90,270)内的人数约为0.9973×1000≈997,∴B 正确.甲、乙、丙恰有2人超过180分的概率为C232×=38,∴C 正确;∵P(240<X<270)=P (90<X<270)-P (120<X<240)2=P (μ-3σ<X<μ+3σ)-P (μ-2σ<X<μ+2σ)2=0.9973-0.95452=0.0214,∴D 错误.故选BC .11.已知随机变量X~N 4,22,则P 8<X <10的值约为()附:若Y~N μ,σ2,则P μ−σ<Y <μ+σ≈0.6827,P μ−2σ<Y <μ+2σ≈0.9545,P μ−3σ<Y <μ+3σ≈0.9974A.0.0215B.0.1359C.0.8186D.0.9760【解题思路】由题意确定μ=4,σ=2,根据P8<X<10=12[Pμ−3σ<X<μ+3σ−Pμ−2σ<X<μ+ 2σ],即可得答案.由题意知随机变量X~N4,22,故μ=4,σ=2,故P8<X<10=12[Pμ−3σ<X<μ+3σ−Pμ−2σ<X<μ+2σ]≈12(0.9974−0.9545)=0.02145≈0.0215,故选:A.12.已知随机变量服从正态分布X~N(2,σ2),若P(X≤1−2a)+P(X≤1+a)=1,则a=()A.0B.2C.−1D.−2根据正态分布的性质可得P(X≥1−2a)=P(X≤1+a),即可得到1−2a、1+a关于x=2对称,从而得到方程,解得即可.解:因为P(X≤1−2a)+P(X≤1+a)=1,P(X≤1−2a)+P(X≥1−2a)=1,所以P(X≥1−2a)=P(X≤1+a),所以1−2a+1+a=2×2,解得a=−2.故选:D.13.已知随机变量X服从正态分布N6,σ,若P X<4+5P X>8=1,则P4<X<6=()A.16B.14C.13D.19根据正态分布的对称性可得:P X<4=P X>8,P4<X<6=12−P X<4,结合题意可求P X<4=16,进而可求P4<X<6.X~N6,σ,则P X<4=P X>8,∴P X<4+5P X>8=6P X<4=1,则P X<4=16,∴P4<X<6=12−P X<4=13,选:C.1.新型冠状病毒肺炎是一种急性感染性肺炎,其病原体是一种先前未在人类中发现的新型冠状病毒,即2019新型冠状病毒.2020年2月7日,国家卫健委决定将“新型冠状病毒感染的肺炎”暂命名为“新型冠状病毒肺炎”,简称“新冠肺炎”.患者初始症状多为发热、乏力和干咳,并逐渐出现呼吸困难等严重表现,基于目前流行病学调查,潜伏期为1~14天,潜伏期具有传染性,无症状感染者也可能成为传染源,某市为了增强民众防控病毒的意识,举行了“预防新冠病毒知识竞赛”网上答题,随机抽取10000人,答题成绩统计如图所示.(1)由直方图可认为答题者的成绩z服从正态分布N(μ,σ2),其中μ,σ2分别为答题者的平均成绩x-和成绩的方差s2,那么这10000名答题者成绩超过84.81分的人数估计有多少人?(同一组中的数据用该组的区间中点值作代表)(2)如果成绩超过56.19分的民众我们认为是“防御知识合格者”,用这10000名答题者的成绩来估计全市的民众,现从全市中随机抽取4人,“防御知识合格者”的人数为ξ,求P(ξ≤3).(精确到0.001)附:①s2=204.75,204.75=14.31;②z~N(μ,σ2),则P(μ-σ<z<μ+σ)=0.6826,P(μ-2σ<z<μ+2σ)=0.9544;③0.84134=0.501,0.84133=0.595.[解析](1)由题意知:x-=45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,因为z服从正态分布N(μ,σ2),其中μ=x-=70.5,σ2=D(ξ)=204.75,σ=14.31,∴z服从正态分布N(μ,σ2)=N(70.5,14.312),而P(μ-σ<z<μ+σ)=P(56.19<z<84.81)=0.6826,∴P(z≥84.81)=1-0.68262=0.1587,∴竞赛成绩超过84.81的人数估计为0.1587×10000=1587人.(2)由(1)知,成绩超过56.19的概率为1-0.1587=0.8413,而ξ~B(4,0.8413),∴P(ξ≤3)=1-P(ξ=4)=1-C44·0.84134=1-0.501=0.499.2.“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕,A市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,检测结果如频率分布直方图所示.(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数x-(同一组中数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值Z服从正态分布N(μ,σ2),利用该正态分布,求Z落在(14.55,38.45)内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于(10,30)内的包数为X,求X的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为σ=142.75≈11.95;②若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)=0.6826,P(μ-2σ<Z≤μ+2σ)=0.9544.[解析](1)所抽取的100包速冻水饺该项质量指标值的样本平均数x-为:x-=5×0.1+15×0.2+25×0.3+35×0.25+45×0.15=26.5.(2)①∵Z服从正态分布N(μ,σ2),且μ=26.5,σ≈11.95,∴P(14.55<Z<38.45)=P(26.5-11.95<Z<26.5+11.95)=0.6826,∴Z落在(14.55,38.45)内的概率是0.6826.②根据题意得每包速冻水饺中这种质量指标值位于(10,30)内的概率为213.02.0=+X ~X 的取值为0,1,2,3,4,P(X =0)=16121404=⎪⎭⎫ ⎝⎛C ;P(X =1)=41421⎪⎭⎫ ⎝⎛C =14;P(X =2)=42421⎪⎭⎫ ⎝⎛C =38;P(X =3)=43421⎪⎭⎫ ⎝⎛C =14;P(X =4)=44421⎪⎭⎫ ⎝⎛C =116.∴X 的分布列为X 01234P116143814116∴E(X)=4×12=2.(1)估计这100位学生的数学成绩的平均值(2)根据整个年级的数学成绩可以认为学生的数学成绩本的标准差s 的近似值为10,用样本平均数位学生,求他的数学成绩恰在64分到0().6827P X μσμσ≤≤+≈-,(2P μσ-(3)该年级1班的数学老师为了能每天督促学生的网络学习,提高学生每天的作业质量及学习数学的积极性,。
正态分布知识点总结2u
正态分布知识点总结2u一、正态分布的基本概念1. 概率密度函数正态分布的概率密度函数是一个钟形曲线,其数学表达式为:\[f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]其中,$x$是随机变量的取值,$\mu$是分布的均值,$\sigma$是分布的标准差。
这个函数在$x=\mu$处取得最大值,然后随着$x$的偏离而逐渐减小。
换句话说,正态分布的大部分数据集中在均值附近,并且随着偏离均值越远,密度越低。
2. 均值和标准差正态分布的均值$\mu$决定了分布的位置,而标准差$\sigma$决定了分布的扁平程度。
当$\sigma$较小时,数据集中在均值附近,曲线变得更加陡峭;当$\sigma$较大时,数据分布更广,曲线变得更加平缓。
3. 性质正态分布有许多重要的性质。
其中最著名的是“三西格玛定理”,它指出约有68%的数据在均值的一个标准差范围内,约有95%的数据在均值的两个标准差范围内,约有99.7%的数据在均值的三个标准差范围内。
这个性质使得正态分布在统计推断中非常有用,因为我们可以通过均值和标准差来判断数据的集中程度。
二、正态分布的应用1. 统计推断正态分布在统计推断中有着广泛的应用。
例如,我们可以利用正态分布的性质来进行假设检验,构建置信区间等等。
此外,许多统计模型的假设都是基于正态分布的形式,比如线性回归模型、方差分析模型等等。
2. 财务领域在财务领域,正态分布被广泛应用于风险管理、资产定价、投资组合优化等领域。
例如,资本资产定价模型(CAPM)假设资产的收益率服从正态分布,这使得我们可以通过对分布的均值和标准差进行估计,来评估投资组合的预期收益和风险。
3. 自然科学在自然科学中,许多自然现象都可以用正态分布来描述。
例如,地震的震级、雨量的分布、气温的变化等等都具有正态分布的特性。
这使得我们可以利用正态分布的概念来解释自然现象,并且进行相关的预测和分析。
知识讲解正态分布(理)资料讲解
2正态分布【学习目标】1. 了解正态分布曲线的特点及曲线所表示的意义。
2. 了解正态曲线与正态分布的性质。
【要点梳理】要点诠释: 要点一、概率密度曲线与概率密度函数 1 •概念:对于连续型随机变量 X ,位于x 轴上方,X 落在任一区间(a , b ]内的概率等于它与 x 轴、直线x a 与直线x b 所围成的曲边梯形的面积(如图阴影部分) ,这条概率曲线叫做 X 的概率密度曲线,以其作为图象的函数f (x)叫做X 的概率密度函数。
iX y■~工)> i2、性质:① 概率密度函数所取的每个值均是非负的。
② 夹于概率密度的曲线与 x 轴之间的 平面图形”勺面积为1要点二、正态分布(1)定义如果对于任何实数 a,b(a b)随机变量X 满足:P(a X b) 则称随机变量X 服从正态分布。
记为 X : N( , 2)。
(2 )正态分布的期望与方差若X : N( , 2),贝U X 的期望与方差分别为: EX 要点诠释:③ P(a Xb)的值等于由直线xa , xb 与概率密度曲线、x 轴所围成的平面图形”的面积。
1.正态变量的概率密度函数正态变量的概率密度函数表达式为: ,(x)其中x 是随机变量的取值; □为正态变量的期望; 2 .正态分布 (X )22 2e 2 (x是正态变量的标准差R),(0,,(x)dx ,DX(1 )正态分布由参数和确定。
参数是均值,它是反映随机变量取值的平均水平的特征数,可用样本的均值去估计。
标准差,它是衡量随机变量总体波动大小的特征数,可以用样本的标准差去估计。
(2 )经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.在现实生活中,很多随机变量都服从或近似地服从正态分布•例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.要点三、正态曲线及其性质:1. 正态曲线1 ■(^^如果随机变量X的概率密度函数为f(x)------------------- e 2(x R),其中实数和为参数V2(2 •正态曲线的性质:①曲线位于x轴上方,与x轴不相交;②曲线是单峰的,它关于直线x 对称;③曲线在x时达到峰值④当x 时,曲线上升;当x时,曲线下降•并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近⑤曲线与x轴之间的面积为1 ;⑥决定曲线的位置和对称性;当一定时,曲线的对称轴位置由确定;如下图所示,曲线随着的变化而沿x轴平移。
6-正态分布
100个产品尺寸的频率分布直方图
频率 组距
产品 尺寸 (mm) 25.235 25.295 25.355 25.415 25.475 25.535
200个产品尺寸的频率分布直方图
频率 组距
产品 尺寸 (mm) 25.235 25.295 25.355 25.415 25.475 25.535
样本容量增大时 频率分布直方图
( .) 1 (.) . ..
例如
x
x
4.分位点/分位数的概念
标准正态分布N (0,1) 的“上 分位点”通常记成 z
定义 若 P{ X z } ( x )dx , 0 1,
z
称z 为X的上分位点 .
1 1 yb fY ( y ) f x ( ) a a a
1 e 2
yb a
2
( 2 2 )
,
1 2 a
e
[ y( a b )]2 [ 2( a ) 2 ]
,
故 Y ~ N (a b, (a )2 ).
(2) 在(1)中取
标准正态分布的概率密度表示为
1 ( x) e 2π
x2 2
, x ,
标准正态分布的分布函数表示为
( x )
x
1 e 2π
t2 2
d t , x .
标准正态分布的图形
例1 已知 X ~ N (0,1), 求 P{1.25 X 2}. 解
例3 设X ~ N (500,602 ), 求 () P{ X }
( ) P{| X | }
( 3) 若P{ X x} 0.1, 求x.
概率论 正态分布
概率论正态分布概率论:正态分布第四章正态分布第一节第二节第三节第四节第五节正态分布的密度函数正态分布的数字特征正态分布的线性性质二维正态分布中心极限定理正态分布的密度函数正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,它在概率统计中占有特别重要的地位.比如,考察一群人的身高,个体的身高作为一个随机变量,其取值特点是:在平均身高附近的人较多,特别高和特别矮的人较少.一个班的一次考试成绩、测量误差等均有类似的特征.高斯在研究误差理论时曾用它来刻画误差,因此很多文献中亦称之为高斯分布. 进一步的理论研究表明,一个变量如果受到大量独立的因素的影响(无主导因素),则它一般服从正态分布,这是中心极限定理探讨的问题.一. 一般正态分布1. 定义若随机变量X的密度函数为1 2 2 f ( x) e 2其中 x ( x )2式中为实数, >0 .则称X服从参数为 ,2的正态分布,亦称高斯分布.记为N(, 2).可表为X~N(, 2). 图象见右上角正态分布有两个特性: (1) 单峰对称密度曲线关于直线x=对称1 f()=maxf(x)= 2(2) 的大小直接影响概率的分布越大,曲线越平坦; 越小,曲线越陡峻. 正态分布也称为高斯(Gauss)分布N ( 4,3 / 5)N ( 4,1)N ( 4,7 / 5)二. 标准正态分布参数=0,2=1的正态分布称为标准正态分布,记作X~N(0, 1)。
(x) 其密度函数为1 (x)2 ( x )x2 e 24 2 0(1) (0)=0.5( x ) P { X x}t2 x 1 e 2 2(2) (+∞)=1;dt , xf ( x) 1 e 2(3) (x)=1-(-x). 一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值.(P328附表1)如,若 X~N(0,1),(0.5)=0.6915, P{1.32正态分布的数字特征 (一) 一般正态分布N(, 2)( x)2 2 21 X ~ f (x) e 2, xE( X )xf ( x)dxt ( xt2 2 e dt 2x e 2( x )2 2 2D( X )) f ( x )dx(二)标准正态分布N(0, 1)X ~ f ( x)E( X )x2 e 2, xx2 e 2 dxxf ( x ) dx0(奇函数 )D( X ) E{[ X E ( X )] }2 x[ xE ( X )] f ( x)dxx2 e 2 dx三. 一般正态分布概率的计算若X~N(,2),>0,则有F ( x ) P { X x}x 1 e 2 (t ) 2 2 2x }F ( x) P{X x} P{ P{Z ( x ).} ( x ) /t2 1 e 2 dt 2一般地,有例1 设随机变量 X ~ N (1, 2 ) , 求 P{ 1.6 X 2.4} 解 P{ 1.6 X 2.4} P{ 1.6 1 X 1 2.4 1} P{ 2.6 X 1 1.4}P{ 2.6 / 2 ( X 1) / 2 1.4 / 2} P{ 1.3 ( X 1) / 2 0.7}(0.7) ( 1.3)(0.7) [1 (1.3)] 0.7580 [1 0.9032] 0.6612 .P{a X b} P{a X b } a b a Xb P{ } P{ Z } b a P{Z } P{Z } Z ~ N (0,1) b a( ) ( ) 2例2. 设 X N(,2),求P{-3解 P{ 3 X 3 } P{( 3 ) X( 3 ) } P{3 X 3 } P{ 3 X3 } P{ 3 ( X ) / 3} (3) ( 3)(3) [1 (3)] 2 (3) 1 0.9973本题结果称为3原则.在工程应用中,通常认为P{|X|≤3} ≈1,忽略{|X|>3}的值.如在质量控制中, 常用标准指标值±3作两条线,当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常.例 3 设随机变量 X ~ N ( 2, 2 ) , 且 P{2 X 4} 0 .3, 求 P{ X0}. 随机变量解 P{2 X 4} P{0 ( X 2) / 2 / } 标准化(2 / ) (0) 0.3, (2 / ) 0.3 (0) 0.8P{ X 0} P{( X 2) / 2 / } ( 2 / ) 1 (2 / ) 1 0.8 0.2 例 4 设随机变量 X ~ N ( 3, 4 ) , 且常数 C 满足 P{ X C } P{ X C }, 求常数 C . 解由P{ X C} P{ X C}, 即 1 P{ X C} P{ X C} 所以 P{ X C} 0.5 X 3 C 3 C 3 另一方面 , P{ XC} P{ } ( ) 0.5 2 2 2 C 3 0 , C 3. 2例 4(2021年) ( A)设 X ~ N (0 , 1), 对于给定的 (0,1), 数 ( B)满足 P{ X } . 若 P{ X x} , 则 x 等于( D) 1解 P { X x} P { x X x}1 P{ X x}2 故 x 1一种电子元件的使用寿命X(小时)服从正态分布N(100,152),某仪器上装有3个这种元件,三个元件损坏与否是相互独立的.求:使用的最初90小时内无一元件损坏的概率. 解:设Y为使用的最初90小时内损坏的元件数,则Y~90 100 ) (0.67) 0.2514 其中 p P{ X 90} ( 15P{Y 0} (1 p ) 3 0.4195 故2 (2021年) 设随机变量X ~ N ( 1 , 12 ), Y ~ N ( 2 , 2 ),且 P{ X 1 1} P{ Y 2 1}, 则必有 ( A) 1 2 . ( B ) 1 2 . (C ) 1 2 . ( B) 1 2 .第二节正态分布的数字特征一. 一般正态分布N(, 2)( x)2 2 21 X ~ f (x) e 2, xE( X )xf ( x)dxt ( xt2 2 e dt 2x e 2( x )2 2 2D( X )) f ( x )dx标准正态分布N(0, 1)X ~ f ( x)E( X )x2 e 2, xx2 e 2 dxxf ( x ) dx0(奇函数 )D( X ) E{[ X E ( X )] }2 x[ xE ( X )] f ( x)dxx2 e 2 dx例1 已知随机变量X的密度函数为 1 x 2 2 x 1 f ( x) e ,x 求 E ( X )、D ( X ) .f ( x)x 2 x 11 e2 (1/ 2)( x 1) 2 2(1/ 2 ) 21 故 1, 2例2 设X服从N(0,1)分布,求E(X2),E(X3)1 解 f (x) e2 x2 x2 2 E ( X 2 ) x 2 f ( x)dxe dx 2 2 2x de 2x 2x 2 eE( X )3 xf ( x) dxx2 x3 2 e dxx2 e 2 dx 12021年(数一) 设随机变量X的分布函数为F ( x) 0.3 ( x) 0.7 ( 其中 ( x)为标准正态分布函数, 则EX ( A)0. ( B )0.3. (C )0.7. ( D)1.x 1 ), 2分析 : EX xf ( x )dx ,因此先求随机变量 X的概率密度函数 f ( x ).解 f ( x ) F ( x ) [ 0 . 3 ( x ) 0 . 7 (0 .7 x 1 0 . 3 ( x ) ( ) 2 2于是 EXx 1 ) ] 2xf ( x ) dxx[0.3 ( x )0 .7 x 1 ( )]dx 2 20.7 x 1 0.3 x ( x)dx x ( )dx 2 21 0 .3 x e 20 .7 dx x 21 x 12 ( ) 2 21 x 12 ( ) 1 2 2 e dx 20 .7 1 x 2 e 21 x 12 ) ( 0 .7 1 2 2 dx dx x 2 e 2x 1 令 t , 则dx 2dt , x 2t 1. 代入上式得 20 .7 1 x 2 e 21 x 12 ) ( 2 20 .7 1 dx (2t 1) 2 e 21 0 .7 2t e2 22 dt0 .7 1 2 e 20. 7 10 2 e 22dt 0.7dt 0.7.设随机变量 X与 Y相互独立 , 且 X服从标准正态分布 ,1 Y的概率分布为 P{Y 0} P{Y 1} .记 FZ ( z )为随机变量2 Z XY 的分布函数 , 则函数 FZ ( z )的间断点个数为 ( A) 0 . ( B )1. (C ) 2 . ( D )3 .解 FZ (z) P{Z z} P{XY z}P{Y 0}P{XY z | Y 0} P{Y 1}P{XY z | Y 1}1 [ P{ XY z | Y 0} P{ XY z | Y 1}]2 1 [ P{ X 0z | Y 0} P{ X 1 z | Y 1}] 2 为什么? 1 [ P { X 0 z }P { X z }] 21 (1)当z 0时, FZ ( z ) [ P{ X 0 z} P{ X z}] 21 1 [ P( ) P{ X z}] [0 P{ X z}]2 21 1 P{ X z} ( z )2 2 1 (2)当z 0时, FZ ( z ) [ P{ X0 z P{ X z}] 21 1 [ P() P{ X z}] [1 P{ X z}]2 2所以 , z 0为函数 FZ ( z )的间断点 . ( B )正确 .1 [1 ( z )] 2例 3 某地抽样调查结果表明 , 考生的外语成绩 (百分制) 近似服从正态分布 , 平均成绩为 72 分, 而 96以上的考生占总数的 2.3%, 求考生的外语成绩在 60 分至 84 分之间的概率 . 解设 X —考生的外语成绩, 依题设知X ~ N ( , 2 ), 其中72, 下求方差 2 X 96 由题设 P{ X 96} 0.023 P{ } 0.023 X 96 96 1 P{ } 0.023, 即 1 ( ) 0.023) 0.977,96 96 72 2, 12 2 2于是 , P{60 X 84 } P{60 72 X 84 72 X 1} P{ } P{ 1 12 12(1) (1) (1) [1 (1)]2 (1) 1 2 0.841 1 0.682例 4 假设测量的随机误差 X ~ N ( 0,10 2 ).试求在 100 次独立重复测量中 , 至少有三次测量的绝对值大于 19 .6 的概率 ,并利用泊松分布求出的近似值 . 解先求每次测量误差的绝对值大于19.6的概率 p p P{ X 19.6} 1 P{ X19.6} 1 P{19.6 X 19.6}1 P{ 19.619.6 0 X 19.6 0 } 1 P{ 10 10 X1 P{ 1.96 1.96} 1 [ (1.96) ( 1.96)]1 [ (1.96) ( 1.96)] 1 (1.96) [1 (1.96)]2 2 (1.96) 2 2 0.975 2 1.95 0.0519.6设 Y — 100次测量中绝对值大于19.6, 则Y ~ B (100,0.05)于是所求的概率为 P{Y 3} 1 P{Y 0} P{Y 1} P{Y2}0 1 1 C100 (0.05) 0 (0.95)100 C100 (0.05)1 (0.95)99 2 C100 (0.05) 2 (0.95)98np 100 0 .05 5, 故由泊松分布得52 1 e (1 ) 1 e 5 (1 5 ) 0.87 2 2习作题 1.设随机变量X N(0,1),Y U(0,1),Z B(5,0.5),且 X,Y,Z独立,求随机变量U=(2X+3Y)(4Z-1)的数学期望答:27 E (U ) E (2 X 3Y ) E (4 Z 1) 22 设随机变量 X 1 ,..., X n 相互独立,且均服从 N ( , 2 )1 n 分布,求随机变量 X X i 的数学期望 n i 1 1 n 答: E ( X ) E ( X i ) n i 11. 设随机变量X B(12,0.5),Y N(0,1), COV(X,Y)=-1,求V=4X+3Y+1与W=-2X+4Y 的方差与协方差.2. 某单位招聘2500人,按考试成绩从高分到低分依次录用,共有10000人报名.假定报名者的考试成绩X 服从正态分布 N ( , 2 ), 现已知90分以上有359人, 60分以下的有1151人,求被录用者中的最低分数.第三节正态分布的线性性质一. 线性性质例1 设随机变量X服从标准正态分布,求随机变量 Y a X b ~ N (b, a2 ) Y=aX+b的密度函数,且有y b 解: Y=ax+b关于x严单,反函数为 h( y ) ay b fY ( y) f X ( ) h( y) 1 a 2E (Y )y b a 2 e( y b ) 2 2a2y e 2 a( y b ) 2 2a 2dyax b 2x2 e 2 dxD (Y ) E{[YE (Y )]2 } [ y E (Y ) ]2 f ( y ) dy( y b)2 2 a 2 2 e dy a 2 a 直接由Y的密度函数,可观察到Y的数学期望与方差1 2a2 , 由 f ( y) e 2 a 可知随机变量Y服从正态分布, ( y b) 2( y b)2而且 E (Y ) b , D (Y ) a 2定理1 设随机变量X 服从正态分布N(, 2),则X的线性函数 Y a b X 也服从正态分布,且有 Y a bX ~ N ( a b , a 2 2 )已知X N(,2),求 Y解 Y X 关于x严格单调,反函数为 h( y) y 故 fY ( y) f X [h( y)] | h( y) | f X (y )y 2你能用正态分布的线性性质求解吗?二. 正态分布的可加性定理2 设随机变量X1,X2 相互独立且Xi 服从正态分布N(i ,i2),i=1,2, 则 2 2 2 2 a1 X 1 a2 X 2 ~ N (a1 1 a2 2 , a1 1 a2 2 ) 定理3 设随机变量X1, X2,..., Xn独立且Xi 服从正态分布N(i ,i2),i=1,...,n, 则a i X i ~ N ( a i i , a i2 i2 )i 1 i 1例1. 设随机变量X与Y独立且均服从标准正态分布,求证:Z=X+Y服从N(0,2)分布.解依题设 X ~ N ( 0,1) , Y ~ N ( 0,1) ; 故有E ( X ) 0 , D ( X ) 1 , E (Y ) 0 , D (Y )于是由定理 2可知 X Y服从正态分布 , 且有E ( X Y ) E ( X ) E (Y ) 0 0 0D ( X Y ) D ( X ) D (Y ) 1 1 2,即 X Y ~ N (0 , 2 )例2. 设随机变量X与Y独立,且X~ N(1,2),Y~N(0,1). 求证:(1)Z=2X-Y+3的密度函数;(2)P{2D ( Z ) D ( 2 X Y 3) 4 D ( X )E (Y ) 8 1 9Z 2 X Y 3 ~ N (5,9) 2 Z 8 Z (2) P{2 Z 8} P{ } P{ 1 1} (1) (1) (1) [1 (1)] 即2 (1) 1 2 0.8413 1 0.6826一. 密度函数若随机变量(X,Y)的密度函数为f ( x, y )1 212 11 ( x 1 )2 ( x 1 )( y 2 ) ( y 2 ) 2 [ ] 2 22 2 1 2 2( 1 ) 2 1其中,1、2为实数,1>0、2>0、| |( X , Y ) ~ N ( 1 , 2 , , , )2 1 2 2二、边缘密度函数 2 设(X, Y)~f(x,y),(x,y)R ,则称 f X ( x) f ( x, y )dy 为(X,Y)关于X的边缘密度函数;同理,称 fY ( y ) f ( x,y )dx为(X, Y)关于Y的边缘密度函数。
正态分布ppt课件
从实际问题中收集相关数据,如某产品的质量指 标数据。
数据拟合
使用正态分布函数对数据进行拟合,判断数据是 否符合正态分布特征。
参数估计
采用最大似然估计等方法,估计出正态分布的均 值和标准差等参数值。
案例分析:某产品质量指标服从正态分布检验
案例背景介绍
介绍某产品的质量指标数据及其背景信息。
正态性检验
选举结果预测 在政治学中,选举结果的预测也往往基于正态分布模型, 通过分析选民的支持率和投票行为来预测选举结果。
经济金融数据中正态分布检验
在金融市场中,股票价格的波动往往呈现出正态分布 的特点,即大部分价格波动都集中在平均值附近,而
极端波动出现的概率很小。
输入 收益标率题分布
在投资组合理论和风险管理中,收益率的分布也往往 假设为正态分布,以便进行风险度量和资产配置。
连续型随机变量及其性质
均匀分布
均匀分布是描述在某一区间内取值的随机变量,其取值具有等可能性。
指数分布
指数分布是描述无记忆性的随机变量的概率分布,常用于可靠性分析 和排队论中。
正态分布
正态分布是描述连续型随机变量的最重要的一种分布,具有对称性和 集中性等特点,广泛应用于自然科学和社会科学领域。
其他连续型随机变量
概率分布的概念
概率分布用于描述随机变量取不同值 的概率规律,包括离散型概率分布和 连续型概率分布。
离散型随机变量的概率分布
离散型随机变量取值为有限个或可数 个,其概率分布通常用分布列表示。
连续型随机变量的概率分布
连续型随机变量取值充满某个区间, 其概率分布用概率密度函数表示。
期望与方差
期望的概念
方差的概念
利用正态分布性质,识别 并处理回归模型中的异常 值。
正态分布课件
矩估计
定义
矩估计法是利用样本矩估计总体矩的一种方法。
原理
基于概率论中的矩理论,通过样本矩来估计总体 矩。
方法
首先需要计算样本的一阶矩(均值)和二阶矩( 方差),然后用样本矩来估计总体矩。
贝叶斯估计
定义
01
贝叶斯估计法是通过贝叶斯定理来估计参数的方法。
原理
02
基于概率论中的贝叶斯定理,通过已知的先验概率和样本信息
应用
累积分布函数在统计学中 有广泛应用,如概率模拟 、置信区间的计算等。
正态分布的分位数函数
定义
正态分布的分位数函数是Φ(x) = (1/2) * [1 + erf(x / (√(2) * σ))] ,其中erf是误差函数。
解释
分位数函数描述了随机变量取值大于等于x的概率,即Φ(x) = P(X >= x)。
预测
正态分布还被用于时间 序列数据的预测,例如 在ARIMA模型中,差分 项通常假定服从正态分 布。
状态空间模型
在状态空间模型中,正 态分布被用于描述系统 扰动项的分布,以确保 模型的有效性和准确性 。
在金融风险管理中的应用
风险度量
正态分布被广泛用于金融风险度量,例如在计算VaR(风险价值 )时,通常假定回报率服从正态分布。
率密度函数为f(x)
=
(1/√(2πσ^2)) * exp(-(x-
μ)^2/(2σ^2)),其中μ为均值,σ
为标准差。
正态分布的特点
钟形曲线
正态分布的曲线呈钟形,左右对 称,最高点位于均值μ处,而标准 差σ则决定了曲线的宽度和扁平程
度。
连续性
正态分布是一种连续型概率分布, 其概率密度函数在全实数域上定义 。
概率论与数理统计正态分布
2 0.8413 1 0.6826 P( X 2) P( 2 X 2 ) F( 2 ) F( 2 )
(2) (2) 2(2) 1
2 0.9772 1 0.9544
• 正态分布标准化
非标准的正态分布可以通过标准化步骤
化为标准正态分布,具体如下:
令 t u,则t u,dt du,有
x
F(x)
1
e
(t )2 2 2
dt
x
1
e
2 2
du
(
x
)
2
2
即得标准化公式
F(x) ( x )
• 例2 已知随机变量X ~ N(1,4),求P(X 1.6)
• 例3 某电池的寿命X ~ N(, 2),其中 300
小时, 35小时,求电池寿命在250小时以
上的概率。
• 例4 某零件长度X服从正态分布X ~ N(50,0.752), 若规定零件长度在50 1.5mm之间为合格品, 某车间领来100个这种零件,问大约有几个 不能使用?
• 正态分布
• 正态分布的一般概念 • 标准正态分布 • 正态分布标准化
• 3 规则
• 正态分布的一般概念
定义9 若随机变量X的概率密度为
f (x)
1
e
(
x )2 2 2
2
( x )
其中 与为常数( 0),则称随机变量X服从参 数为 , 的正态分布,记作 X ~ N(, 2)。
P( X 3) P( 3 X 3 ) F( 3 ) F( 3 )
正态分布知识点
正态分布知识点在统计学中,正态分布是一种极其重要的概率分布,它在许多领域都有着广泛的应用。
让我们一起来深入了解一下正态分布的相关知识。
正态分布也被称为高斯分布,其概率密度函数呈现出一种独特的钟形曲线。
这条曲线左右对称,中间高,两边逐渐降低并且无限趋近于横轴。
为什么正态分布如此重要呢?首先,它在自然界和社会现象中大量存在。
比如,人的身高、体重,学生的考试成绩,产品的质量指标等,很多都近似服从正态分布。
这是因为在许多情况下,众多微小的、相互独立的随机因素共同作用,最终导致了总体呈现出正态分布的特征。
正态分布具有两个关键参数:均值(μ)和标准差(σ)。
均值决定了曲线的中心位置,也就是分布的中心;标准差则决定了曲线的“胖瘦”程度。
标准差越大,曲线越“胖”,数据的离散程度越大;标准差越小,曲线越“瘦”,数据越集中在均值附近。
我们来具体说一说正态分布的性质。
正态分布的概率密度函数在均值处达到最大值。
而且,大约 68%的数据落在均值加减一个标准差的范围内,大约 95%的数据落在均值加减两个标准差的范围内,约 997%的数据落在均值加减三个标准差的范围内。
这就是所谓的“68-95-997规则”,它为我们快速估计数据的分布范围提供了很大的便利。
正态分布的数学表达式看起来可能有些复杂,但理解其背后的意义是关键。
从实际应用的角度来看,正态分布为我们提供了一种方便的方式来描述和分析大量的数据。
比如在教育领域,学生的考试成绩通常近似服从正态分布。
教师可以通过分析成绩的分布情况,了解学生的整体学习水平和差异程度。
如果成绩分布过于集中,可能意味着教学难度不够,无法区分学生的能力;如果分布过于分散,则可能需要反思教学方法是否存在问题。
在工业生产中,产品的质量指标如尺寸、重量等也常常符合正态分布。
通过控制生产过程中的各种因素,使质量指标的分布尽可能接近正态分布,并将均值调整到目标值,同时减小标准差,可以提高产品的一致性和质量稳定性。
正态分布知识点
1. 正态分布的概念随机变量X 的概率密度22()2(),()x f x x μσ--=-∞<<+∞,称X 服从正态分布记作),(~2σμN X 。
标准正态分布(0,1)N,其概率密度221(),()x x ex ϕ-=-∞<<+∞,分布函数为221()t xx e dt φ--∞=⎰。
2. 设),(~2σμN X ,则{}x P X x μφσ-⎛⎫≤= ⎪⎝⎭,{}b a P a X b μμφφσσ--⎛⎫⎛⎫<≤=- ⎪ ⎪⎝⎭⎝⎭,()x φ的数值有表可查,特别有(0)0.5,()1,()1()x x φφφφ=+∞=-=-。
3. 设),(~2σμN X ,则2(),()E X D X μσ==。
4. 设),(~2σμN X ,则),(~22σμb b a N bX a Y ++=)0(≠b 。
若),(~211σμN X ,),(~222σμN Y ,X 与Y 相互独立,则),(~222121σσμμ+++N Y X 。
若12,,,nX X X 相互独立,),,2,1)(,(~2n i N Xi i i=σμ,则∑∑∑===n i ni n i i i i ni ii c c c c c N Xc 1121221)(,(~为常数),,, σμ5. 二维随机变量(,)X Y 服从二维正态分布,记作),,,,(),(γσσμμ222121~N Y X ,其中12(),()E X E Y μμ==,2212(),()D X D Y σσ==,(,)r R X Y =。
设(,)X Y 服从二维正态分布,则X 与Y 相互独立的充分必要条件是0r =。
6. 当n 充分大时,独立同分布的随机变量12,,,nX X X 的和1nii X =∑近似服从正态分布2(,)N n n μσ。
特别是当n 充分大时,若相互独立的随机变量12,,,nX X X 都服从“0-1”分布,则1nii X =∑服从二项分布(,)B n p ,近似服从正态分布(,)N np npq (1)q p =-,这时1n i i P a X b φφ=⎛⎫⎛⎫⎧⎫<≤≈-⎨⎬⎩⎭∑。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
若影响某一数量指标的随机因素很多, 每一因素独立, 但每个因素 所起的作用不大. 服从正态分布
正态分布的分布函数 若随机变量 X ~N( , 2 ), 则
f ( x) 1 2
( x )2 e 2 2
,
x
X 的分布函数 1 F ( x) 2
3. 正态分布 正态分布是应用最广泛的一种连续型分布. 德莫佛最早发现了二项概率的一个近似公式,这 一公式被认为是正态分布的首次露面. 十九世纪前叶,高斯加以推广得到正态 分布,所以通常称为高斯分布. 定义3 若连续型随机变量 X 的概率密度函数为
f ( x)
其中 - < <+ , > 0 为常数,则称 X 服从参数为 和 的正态分布, 记为 X~N( , 2 ).
e
x
( t )2 2 2
dt , x
下面我们介绍一种最重要的正态分布 ——标准正态分布பைடு நூலகம் = 0 , = 1 的正态分布称为标准正态分布. 其密度函数和分布函数常用 (x) 和 (x)表示: 1 x ( x) e 2, x 2 可查表
例6 某地区8月份降雨量 X 服从 =185mm , = 28mm 的正态分布,写出 X 的概率密度,并求该地区明年 8 月份降雨量 超过250mm的概率. ( x 185) 2 1 2 f ( x ) e 2282 , x 解 ∵ X~N (185 , 28 ), 28 2 所求概率为 P(X > 250) = 1- P(X 250) 1 ( 250 185 ) = 1-(2. 32) = 1- 0. 9898 = 0. 0102 .
1 e 2
( x )2 2 2
, x
f (x)所确定的曲线叫作正态曲线.
正态分布密度的性质
(2) 正态分布的密度曲线位于 x 轴的上方, f (μ+c) ≤f (μ), f (μ-c)≤f (μ) 决定图形的中心位置; 且关于 x f对称, 且 f (μ += c)= (μ-c) 故 f (x)以μ为对称轴, 1 (3对密度函数求导: ) 密度曲线 y = f (x) 有拐点 ( , ); e) 2 ( x ) (x (x ) ( ) ( ) 2 x x 1 (4当 )f f (x ) x 轴为水平渐近线 0+, ; e e2 2 (x x ) 以 (e f 2 ) → ∞时, ( x ) → 3 2 2 2 2 2 2 2 ( x ) ( x 即曲线 y =N f( )1向左右伸展时 , 越来越贴近 x): 轴. 正态分布 (x , )的密度函数图形的特点 ( ) x 2 2 f ( x ) [e e ] 2 3 2 ,左右对称的 “峰” 状 两头低, 中间高 ( x ) 1 2 ( x )2 ] e 2 [ =0, 若固定 ,改变 的值, f ( ) , 反之亦然, 2 决定了图形中峰的陡峭程度 x =μ σ为 f (x) 的两个拐点的横坐标.
2
2
2
1 e , x 2 (1) 在 x = 处取到最大值 f ( ) 1 ; 2 f ( x)
( x )2 2 2
令 x=μ+c, x=μ-c (c>0), 分别代入f (x), 可得
2
2
2
2
2
2
2
2
2
若固定 ,改变 的值,则密度曲线左右整体平移.
2
( x )
( x) 1 2
e
x
2 t 2
d t, x
得其值
? ( x ) 1 ( x)
x
x
例5 设 X~N(0 , 1 ), 求 P(X < 0. 5), P(X > 2. 5)及 P(-1.64 X < 0.82). 查表得 解 P(X < 0. 5)= F(0. 5) = 0. 6915 ; P(X > 2. 5)= 1-(2. 5) = 1 - 0. 9938 = 0. 0062 ; P(-1.64 X < 0.82) = (0. 82)- (-1. 64) = (0. 82)-[1- (1. 64)] = 0. 7434 ; s t d t ds 设 X~N ( , 2 ), 2 (t ) x x s2 1 1 2 x 2 d t = F ( x) e 2 ( ). d s e = 2 2 X Y 即若 X ~N( , 2 ) Y ~ N(0, 1) 标准正态分布的重要性在于,任何一个一般的正态分布都 可以通过线性变换转化为标准正态分布. 只需将标准正态分布的分布函数制成表,就可以解决正态分 a ) b a 布的概率计算问题. P (a X b) Y P (( b ) ( ) ) P ( X b) ( b
决定了图形的中心位置
用上海99年降雨量的数据画出了频 率直方图. 从直方图,我们可以初步 看出, 年降雨量近似服从正态分布. 下面是我们用某大学男大学生的身 高的数据画出的频率直方图. 可见, 男大学生的身高应服从正态分布.
拟合的正态 密度曲线 在自然现象和社会现象中大量的随机变
量都服从或者近似服从正态分布. 除了上面提到的年降雨量和某地区成年男 子的身高、体重外,正常条件下各种产品的 质量指标,如零件的尺寸;纤维的强度; 电子元器件的信号噪声、电压、电流; 农作物的产量,小麦的穗长、株高; 射击目标的水平或垂直偏差,测量误差, 生物学中同一群体的形态指标, 经济学中的股票价格、产品的销量等等,都服从 或近似服从正态分布. 有很多分布还可以用正态分布近似. 而正态分布自身还有很多良好的性质.