n维正态分布的定义及性质
正态分布的概念及应用
• 正态分布的简介 • 正态分布的性质 • 正态分布的应用场景 • 正态分布在数据分析中的应用 • 正态分布在机器学习中的应用 • 正态分布与其他统计分布的关系
01
正态分布的简介
正态分布的定义
01
正态分布是一种连续概率分布, 描述了许多自然现象的概率分布 形态,其概率密度函数呈钟形曲 线,且具有对称性。
贝叶斯推断
正态分布在贝叶斯推断中发挥了重要作用。通过贝叶斯定理,我们可以根据先 验知识和数据更新对未知参数的估计,而正态分布可以作为先验知识的分布形 式。
核方法和支持向量机
核方法
在支持向量机(SVM)等核方法中,正态分布作为核函数的一 种形式,用于将输入空间映射到高维特征空间,从而使得线性 不可分的数据变得线性可分。
在时间序列分析中,正态分布可用于描述时间序列数据的分布特征, 并建立预测模型。
05
正态分布在机器学习中的应用
概率模型和贝叶斯推断
概率模型
正态分布是一种常用的概率分布,在贝叶斯推断中,我们常常假设某些参数服 从正态分布,以便进行统计推断。例如,在朴素贝叶斯分类器中,特征的概率 分布被假设为正态分布。
考试成绩和测试评分
考试成绩和各种测试评分也经常呈现正态分布,因为大多数人的得分集中在平均分附近, 而高分和低分的人数较少。
气温、降雨量等气候数据
气温、降雨量等自然现象数据也可以用正态分布来描述,因为它们通常遵循类似的统计规 律。
科学研究和技术开发
01 02
实验结果和测量数据
在科学实验和测量中,很多数据呈现正态分布,如放射性衰变的半衰期、 化学反应速率等。这些数据反映了物质内部微观粒子的随机运动和相互 作用。
正态分布在统计学中的地位
n维正态分布的定义及性质讲课稿
因为变换后得到的正态分布的各随机变量之间的协方差为 0,即 bjk Cov X j , X k 0, j k ,这
说明两两相关,即得
X
1
,
X
2
,...,
X
n
独立(定理
4.64).
---------------------------------------------------------------------------------------------------------------------------------
b1n
b2n
b3n
...
bmn
...
. an
bn1 bn2 bn3 ... bnm ... bnn
---------------------------------------------------------------------------------------------------------------------------------
d1 0 ... 0
D
0 ... 0
d2 ... 0
... ... ...
0
... dn
这里, d1, d2 ,...d3 是 B 的特征值。若 B 得秩为 r ,则有 r 个特征值不为零。此处的U 是以特征向量
为列构成的正交阵。 把这里的U 作为定理 4.6.7 中的变换矩阵,即可证明该推论。 从推论一看出,若 B 得秩为 r n ,则正态分布退化到一个 r 维子空间上。 推论一说明,对于多维正态变量,可以进行正交变换,使其既保持正态性不变又让各分量独立,
1
2 n/ 2 det B1/ 2
正态分布知识点高考
正态分布知识点高考正态分布,又称为高斯分布,是一种常见的连续型概率分布。
它在高考中占据重要地位,因此我们有必要了解并掌握相关的知识点。
本文将从基本概念、特点、参数、性质和应用等方面,介绍正态分布相关知识。
一、基本概念正态分布是一种理想的连续型概率分布,其概率密度函数呈钟形曲线,两头低,中间高,左右对称。
它由两个参数完全确定,即均值μ和标准差σ,分别决定了曲线的位置和形态。
二、特点1. 对称性:正态分布曲线是关于均值μ对称的,即在μ左右等距离的两个点处曲线的取值相等。
2. 唯一性:给定均值μ和标准差σ,正态分布曲线是唯一确定的,即每个参数对应一个特定的曲线。
3. 演趋性:正态分布曲线随着距离均值的增加或减少而变得越来越平缓,曲线两端向横轴无限延伸但不与其相交。
三、参数1. 均值μ:正态分布曲线的对称轴,决定了曲线的位置。
2. 标准差σ:正态分布曲线的形状参数,决定了曲线的宽度。
标准差越大,曲线越宽。
四、性质1. 正态分布曲线下的面积总和为1,即概率密度函数的积分等于1。
2. 68-95-99.7法则:在正态分布曲线上,约68%的数据位于均值的一个标准差范围内,约95%的数据位于均值的两个标准差范围内,约99.7%的数据位于均值的三个标准差范围内。
3. 随机变量的线性组合仍然服从正态分布。
4. 标准正态分布是均值为0,标准差为1的正态分布。
五、应用正态分布广泛应用于各个领域,包括自然科学、社会科学和工程等。
在高考中,正态分布常被用来描述和分析一些量化问题,如考试成绩、身高体重等。
利用正态分布的特性,可以进行相关问题的计算和预测。
总结:正态分布是一种重要的概率分布,具有对称性、唯一性和演趋性等特点。
它由均值和标准差两个参数完全确定,广泛应用于各个领域。
在高考中,掌握正态分布的基本概念、特点、参数、性质和应用非常重要,能够帮助学生更好地理解和解答相关问题。
正态分布的概念和特征
正态分布的概念和特征一、正态分布的概念由表1.1的频数表资料所绘制的直方图,图3.1(1)可以看出,高峰位于中部,左右两侧大致对称。
我们设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图 3.1(3)。
这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。
由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。
图3.1频数分布逐渐接近正态分布示意图为了应用方便,常对正态分布变量X作变量变换。
(3.1)该变换使原来的正态分布转化为标准正态分布(standard normal distribution),亦称u分布。
u被称为标准正态变量或标准正态离差(standard normal deviate)。
二、正态分布的特征:1.正态曲线(normal curve)在横轴上方均数处最高。
2.正态分布以均数为中心,左右对称。
3.正态分布有两个参数,即均数和标准差。
是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。
是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。
通常用表示均数为,方差为的正态分布。
用N(0,1)表示标准正态分布。
4.正态曲线下面积的分布有一定规律。
实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。
正态曲线下一定区间的面积可以通过附表1求得。
对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。
查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X时先按式(3.1)求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数和标准差S分别代替μ和σ,按式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,-1.96)与区间(1.96,∞)的面积相等,④曲线下横轴上的总面积为100%或1。
高考正态分布知识点
高考正态分布知识点在统计学中,正态分布是一种重要的概率分布,也被称为钟形曲线或高斯分布。
在高考数学中,正态分布是一个常见的考察点,学生需要了解和掌握与正态分布相关的概念、性质和应用。
下面将详细介绍高考正态分布的知识点。
一、正态分布的定义和性质1. 正态分布的定义:正态分布是指在数理统计中,如果随机变量X服从一个数学期望为μ、方差为σ²的正态分布,则记为X~N(μ, σ²),其中N表示正态分布。
2. 正态分布的性质:(1)正态分布是对称的,其均值、中位数和众数都相等,即μ=中位数=众数。
(2)正态分布的图像呈现出典型的钟形曲线。
(3)正态分布的曲线在均值两侧呈现出逐渐减小的趋势,但是永远不会到达横轴。
(4)正态分布的曲线关于均值μ对称。
(5)正态分布的标准差σ越大,曲线越矮胖;标准差σ越小,曲线越瘦高。
(6)约68%的数据落在均值±1个标准差范围内;约95%的数据落在均值±2个标准差范围内;约99.7%的数据落在均值±3个标准差范围内。
二、正态分布的概率计算1. 标准正态分布:标准正态分布是指均值为0,标准差为1的正态分布。
记为Z~N(0, 1)。
对于标准正态分布,我们可以通过计算标准正态分布表来得到对应的概率值。
2. 普通正态分布:当随机变量X服从正态分布N(μ, σ²)时,可以进行标准化处理,将X转化为一个服从标准正态分布的随机变量Z。
即Z=(X-μ)/σ,这样就得到了一个标准正态分布。
对于普通正态分布,可以通过标准正态分布表和标准化公式来计算相应的概率值。
3. 概率计算:对于正态分布,我们常常需要计算在某个区间范围内的概率值。
对于标准正态分布,可以利用标准正态分布表查找对应的概率值。
对于普通正态分布,可以将其转化为标准正态分布进行计算。
三、正态分布的参数估计1. 样本均值的抽样分布:在统计学中,我们经常需要对总体的均值进行估计。
对于正态分布,样本均值的抽样分布也是一个正态分布,并且其均值等于总体均值,方差等于总体方差除以样本容量的平方根。
正态分布知识点范文
正态分布知识点范文正态分布是概率论和统计学中一种常见的连续概率分布,又被称为高斯分布。
它在很多实际问题中具有重要的应用,比如自然界中的身高、体重等。
正态分布具有以下几个知识点:1.定义与特征:正态分布由两个参数完全确定,即均值μ和标准差σ。
它的概率密度函数为:P(x) = 1 / sqrt(2πσ²) * exp(-(x-μ)² / (2σ²))正态分布具有对称的钟形曲线,均值μ是对称轴,标准差σ决定曲线的高矮胖瘦。
2.标准正态分布:当均值μ=0,标准差σ=1时,称为标准正态分布。
其概率密度函数为:φ(x) = 1 / sqrt(2π) * exp(-x² / 2)标准正态分布的特点是均值为0,标准差为1,其概率密度函数的图像呈现出对称的钟形曲线。
3.正态分布的性质:a.正态分布的曲线在均值μ处取得最大值,且关于均值对称。
b.68%的数据位于均值±1个标准差的范围内,95%的数据位于均值±2个标准差的范围内,99.7%的数据位于均值±3个标准差的范围内,这被称为"68-95-99.7规则"。
c.正态分布具有稳定性,即若随机变量X和Y独立且分布为正态分布,那么X+Y也服从正态分布。
d.正态分布的累积分布函数是一个积分形式,没有求解的解析表达式,可以利用数值方法或查表得到。
4.正态分布的应用:a.统计推断:正态分布在统计推断中有广泛的应用,比如参数估计、假设检验等。
利用正态分布的性质,可以进行参数的置信区间估计、显著性检验等。
b.质量控制:正态分布在质量控制中被广泛应用,比如生产过程中的产品尺寸、重量等可以被视为服从正态分布,利用正态分布的性质可以对质量进行控制。
c.金融领域:正态分布在金融领域中有重要的应用,比如股票价格、汇率等可以被建模为服从正态分布,利用正态分布的性质可以进行风险评估、期权定价等。
d.自然科学:正态分布在自然科学中也有重要的应用,比如天文学中的星等分布、地震学中的地震能量分布等都可以用正态分布进行建模。
正态分布详解很详细
?
?
? ? (b? ? )? ? (a? ? )
?
?
五、3 ? 准则
由标准正态分布的查表计算可以求得, 当X~N(0,1)时,
P(|X| ?1)=2? (1)-1=0.6826
P(|X| ? 2)=2? (2)-1=0.9544
P(|X| ?3)=2 ? (3)-1=0.9974
这说明,X的取值几乎全部集中在[- 3,3]区间 内,超出这个范围的可能性仅占不到0.3% .
除了我们在前面遇到过的年降雨量和 身高外,在正常条件下各种产品的质量指标, 如零件的尺寸;纤维的强度和张力;农作 物的产量,小麦的穗长、株高;测量误差, 射击目标的水平或垂直偏差;信号噪声等 等,都服从或近似服从正态分布 .
服从正态分布 N (? ,? 2 ) 的随机变量
X的概率密度是
f (x) ?
正态分布是应用最 广泛的一种连续型分布.
德莫佛最早发现了二项概 率的一个近似公式,这一公式 被认为是正态分布的首次露面.
正态分布在十九世纪前叶由 高斯加以推广,所以通常称为高 斯分布.
德莫佛
不知你们是否注意到街头的一种赌博 活动? 用一个钉板作赌具。
请看 街头
也许很多人不相信,玩这种赌博游 戏十有八九是要输掉的,不少人总 想碰碰运气,然而中大奖的概率实 在是太低了。
若硬币是均匀的, X~B(10000,0.5),
采用正态近似, np=5000, np(1-p)=2500,
即
X ? np X ? 5000 ?
np(1 ? p)
50
近似正态分布N(0,1).
X ? np np(1 ? p)
?
X
? 5000 50
近似正态分布N(0,1).
n维正态分布的概率密度_概述及解释说明
n维正态分布的概率密度概述及解释说明1. 引言1.1 概述在统计学和数据分析领域,正态分布是一种常用的概率分布模型。
它具有许多重要的性质,因此在各个领域中都得到广泛应用。
然而,随着数据维度的增加,我们需要考虑更复杂的概率分布模型来准确描述多维数据的特征。
n维正态分布便是其中一种常见且重要的扩展。
本文将对n维正态分布的概率密度进行详细介绍和解释说明。
首先,我们将回顾正态分布的基本概念,为后续理解n维正态分布打下基础。
随后,我们将给出n维正态分布的定义,并推导其概率密度函数及相关性质。
接着,我们将探讨解释说明n维正态分布概率密度在统计学应用、多元数据建模与预测以及数据分析与决策支持系统中所具有的意义。
1.2 文章结构本文共包含五个主要部分。
除了引言外,还包括“2. n维正态分布的概率密度”、“3. 解释说明n维正态分布概率密度的意义”、“4. n维正态分布中的特殊情况和相关论文研究”以及“5. 结论与展望”。
下面将对每个部分的内容进行简要介绍。
在第二部分,“2. n维正态分布的概率密度”,我们将首先回顾正态分布的基本概念,如均值、方差和标准差等。
然后,我们将详细定义n维正态分布,并推导其概率密度函数。
最后,我们还会讨论一些与概率密度函数相关的重要性质和特点。
在第三部分,“3. 解释说明n维正态分布概率密度的意义”,我们将具体阐述n 维正态分布概率密度在统计学应用、多元数据建模与预测以及数据分析与决策支持系统中所具有的意义。
我们将介绍其在描述随机事件和观测结果时所起到的作用,以及如何利用该概率密度进行数据建模和预测。
在第四部分,“4. n维正态分布中的特殊情况和相关论文研究”,我们将探讨n 维正态分布中的一些特殊情况,并介绍其中一些重要的相关论文研究。
具体而言,我们将讨论高斯混合模型及其扩展在n维正态分布中的应用,以及多元线性回归模型和罗吉斯螺旋模型在分类问题中的应用。
最后,在第五部分,“5. 结论与展望”,我们将对整篇文章的内容进行总结,并强调主要发现。
概率论与数理统计期末复习重要知识点及公式整理
概率论与数理统计期末复习重要知识点及公式整理2010-2011学年第一学期期末复习资料概率论与数理统计期末复习重要知识点第二章知识点:1.离散型随机变量:设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量XP{X x1}p,P{X x2}1p只有两个可能取值,且其分布为(0p1),则称X服从x1,x2处参数为p的两点分布。
两点分布的概率分布:两点分布的期望:(2)二项分布:P{X x1}p,P{X x2}1p(0p1) E(X)p;两点分布的方差:D(X)p(1p)若一个随机变量X的概率分布由式给出,则称X服从参数为n,p的二项分布。
记为X~b(n,p)(或B(n,p)).两点分布的概率分布:二项分布的期望:(3)泊松分布:P{x k}Cnp(1p)kkn kkkn k,k0,1,...,n. P{x k}Cnp(1p),k0,1,...,n. E(X)np;二项分布的方差:D(X)np(1p)kP{X k} e若一个随机变量X的概率分布为数为的泊松分布,记为X~P () k!,0,k0,1,2,...,则称X服从参P{X k} e泊松分布的概率分布:泊松分布的期望:4.连续型随机变量:kk!,0,k0,1,2,... E(X);泊松分布的方差:D(X)如果对随机变量X的分布函数F(x),存在非负可积函数F(x)P{X x}f(x),使得对于任意实数x,有xf(t)dt,则称X为连续型随机变量,称f(x)为X的概率密度函数,简称为概率密度函数。
2010-2011学年第一学期期末复习资料5.常用的连续型分布:(1)均匀分布:1,若连续型随机变量X的概率密度为f(x)b a 0,a x b其它,则称X在区间(a,b)上服从均匀分布,记为X~U(a,b)1,均匀分布的概率密度:f(x)b a0,a b2a xb 其它均匀分布的期望:(2)指数分布:E(X);均匀分布的方差:D(X)(b a)122e xf(x)0若连续型随机变量X的概率密度为x00,则称X服从参数为的指数分布,记为X~e ()x0e xf(x)0指数分布的概率密度:指数分布的期望:(3)正态分布:E(X)1;指数分布的方差:D(X)2f(x)(x)222x若连续型随机变量X的概率密度为则称X服从参数为和22的正态分布,记为X~N(,)(x)222f(x)正态分布的概率密度:正态分布的期望:E(X)xD(X)x22;正态分布的方差:(4)标准正态分布:0,21(x),2(x)xet22标准正态分布表的使用:(1)x0(x)1(x)2010-2011学年第一学期期末复习资料X~N(0,1)P{a x b}P{a x b}P{a x b}P{a x b}(b)(a)X~N(,),Y2(2)X(3)P{a X b}P{a~N(0,1),F(x)P{X x}P{X故b}(b)(a)x(x) Y2Y定理1:设X~N(,),则X~N(0,1)6.随机变量的分布函数:设X是一个随机变量,称分布函数的重要性质:0F(x) 1P{x1X x2}P{X x2}P{X x1}F(x2)F(x1)x1x2F(x1)F(x2)F()1,F()0F(x)P{X x}为X的分布函数。
概率论与数理统计:N维正态分布
n 维正态分布正太分布是最重要最常见的分布,如何由二维正态分布推广到n 维正态分布呢?n 维正态分布二维正态随机变量12(,)X X 的概率密度为22111122222221212()()()()122(1)12(,).x x x x f x x μμμμρσσρσσ⎡⎤------+⎢⎥-⎢⎥⎣⎦Cov(,){[()][()]}X Y E X E X Y E Y =--.12(,)X X 的协方差矩阵为11122122c c c c ⎛⎫= ⎪⎝⎭C 21122122σρσσρσσσ⎛⎫=⎪⎝⎭, 它的行列式()222121σσρ=-C ,逆矩阵2121221211σρσσρσσσ-⎛⎫-=⎪-⎝⎭C C另记12x x ⎛⎫=⎪⎝⎭X ,12μμ⎛⎫= ⎪⎝⎭μ,易验算211121211222221211()'()()x x x x μσρσσμμμρσσσ--⎛⎫-⎛⎫--=--⎪ ⎪--⎝⎭⎝⎭X C X C μμ22111122222221122()()()()121x x x x μμμμρρσσσσ⎡⎤----=-+⎢⎥-⎣⎦, 其中()'-μX 是()-μX 的转置.于是,二维正态随机变量12(,)X X 的概率密度可用矩阵表示为112221211(,)exp ()'()(2π)||2f x x -⎧⎫=---⎨⎬⎩⎭X C X C μμ.类似地,n 维正态随机向量12(,,,)n X X X ⋅⋅⋅的概率密度可用矩阵表示为11212211(,,,)exp ()'()2(2π)n n f x x x -⎧⎫⋅⋅⋅=---⎨⎬⎩⎭X C X Cμμ, 其中12n x x x ⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭X , 1122()()()n n E X E X E X μμμ⎛⎫⎛⎫⎪ ⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭μ, C 是12(,,,)n X X X ⋅⋅⋅的协方差矩阵. n 维正态随机变量12(,,,)n X X X ⋅⋅⋅具有如下重要性质:(1)n 维正态随机变量12(,,,)n X X X ⋅⋅⋅的每一个分量(1,2,,)i X in =⋅⋅⋅都是正态随机变量;反之,若12,,,n X X X ⋅⋅⋅都是正态随机变量,且相互独立,则12(,,,)n X X X ⋅⋅⋅是n 维正态随机变量.注:性质中若不具有相互独立性,则反之不一定成立.(2)n 维随机变量12(,,,)n X X X ⋅⋅⋅服从n 维正态分布的充分必要条件是12,,,nX X X ⋅⋅⋅的任意线性组合1122n n k X k X k X ++⋅⋅⋅+均服从一维正态分布(其中12,,,n k k k ⋅⋅⋅不全为零).(3)若12(,,,)n X X X ⋅⋅⋅服从n 维正态分布,设12,,,k Y Y Y ⋅⋅⋅是(1,2,,)j X j n =⋅⋅⋅的线性函数,则12(,,,)k Y Y Y ⋅⋅⋅服从k 维正态分布.注:这一性质称为正态随机变量的线性变换不变性.(4) 设12(,,,)n X X X ⋅⋅⋅服从n 维正态分布,则12,,,n X X X ⋅⋅⋅相互独立等价于12,,,n X X X ⋅⋅⋅两两不相关.例4.50 设(,)X Y 服从二维正态分布,且2()X D X σ=, 2()Y D Y σ=,求a 满足什么条件时,W X aY =-和V X aY =+相互独立.解 因为,W V 是二维正态随机变量(,)X Y 的线性组合,因而,W V 分别服从一维正态分布,(,)W V 服从二维正态分布.由n 维正态分布的性质知,,W V 相互独立的充分必要条件是,W V 不相关. 由于Cov(,)Cov[(),()]W V X aY X aY =-+2Cov(,)Cov(,)Cov(,)Cov(,)X X a X Y a X Y a Y Y =+--2222()()X Y D X a D Y a σσ=-=-. 因而, 当222XYa σσ=时,,W V 不相关,此时,W V 相互独立.。
正态分布与标准正态分布公式的详解整理
正态分布与标准正态分布公式的详解整理正态分布(Normal Distribution),又称高斯分布(Gaussian Distribution),是统计学中最重要的概率分布之一。
正态分布的形状呈钟型曲线,分布的中心对称,因此也被称为钟形曲线。
正态分布在各个领域的应用非常广泛,特别是在自然科学、社会科学及工程技术方面。
一、正态分布的定义与特点正态分布的定义如下:若一个随机变量X服从正态分布(记作X~N(μ,σ^2)),则其概率密度函数为:f(x) = (1/(sqrt(2π)*σ)) * exp(-((x-μ)^2)/(2σ^2))其中,μ是分布的均值,σ^2 是方差。
正态分布的特点如下:1. 正态分布的曲线是关于均值μ对称的,具有唯一的峰值,且下方与上方的面积相等。
2. 标准差越小,曲线越陡峭;标准差越大,曲线越平坦。
3. 正态分布的总体均值、中位数和众数都相等。
4. 正态分布的分布范围是(-∞, +∞),但在实际应用中,一般只考虑3倍标准差内的数据,这部分数据占据了整个分布曲线的99.7%。
二、标准正态分布标准正态分布,又称标准高斯分布,是正态分布的一种特殊情况,均值μ为0,方差σ^2为1。
标准正态分布的概率密度函数为:φ(x) = (1/√(2π)) * exp(-x^2/2)标准正态分布在统计学中有着重要的应用。
为了方便计算和比较,通常将实际数据转化为标准正态分布进行处理。
三、正态分布与标准正态分布的转化将正态分布的随机变量X转化为标准正态分布的随机变量Z,可以通过计算Z的值来实现。
这一过程称为标准化。
标准化的公式如下:Z = (X - μ) / σ其中,Z为标准化后的随机变量,X为原始随机变量,μ为正态分布的均值,σ为正态分布的标准差。
通过标准化,我们可以将不同均值和标准差的正态分布转化为标准正态分布,方便进行比较和计算。
四、标准正态分布的应用标准正态分布广泛应用于统计学和假设检验中,常用于计算正态分布中某个特定范围内的概率。
正态分布知识点
正态分布知识点在统计学中,正态分布是一种极其重要的概率分布,它在许多领域都有着广泛的应用。
让我们一起来深入了解一下正态分布的相关知识。
正态分布也被称为高斯分布,其概率密度函数呈现出一种独特的钟形曲线。
这条曲线左右对称,中间高,两边逐渐降低并且无限趋近于横轴。
为什么正态分布如此重要呢?首先,它在自然界和社会现象中大量存在。
比如,人的身高、体重,学生的考试成绩,产品的质量指标等,很多都近似服从正态分布。
这是因为在许多情况下,众多微小的、相互独立的随机因素共同作用,最终导致了总体呈现出正态分布的特征。
正态分布具有两个关键参数:均值(μ)和标准差(σ)。
均值决定了曲线的中心位置,也就是分布的中心;标准差则决定了曲线的“胖瘦”程度。
标准差越大,曲线越“胖”,数据的离散程度越大;标准差越小,曲线越“瘦”,数据越集中在均值附近。
我们来具体说一说正态分布的性质。
正态分布的概率密度函数在均值处达到最大值。
而且,大约 68%的数据落在均值加减一个标准差的范围内,大约 95%的数据落在均值加减两个标准差的范围内,约 997%的数据落在均值加减三个标准差的范围内。
这就是所谓的“68-95-997规则”,它为我们快速估计数据的分布范围提供了很大的便利。
正态分布的数学表达式看起来可能有些复杂,但理解其背后的意义是关键。
从实际应用的角度来看,正态分布为我们提供了一种方便的方式来描述和分析大量的数据。
比如在教育领域,学生的考试成绩通常近似服从正态分布。
教师可以通过分析成绩的分布情况,了解学生的整体学习水平和差异程度。
如果成绩分布过于集中,可能意味着教学难度不够,无法区分学生的能力;如果分布过于分散,则可能需要反思教学方法是否存在问题。
在工业生产中,产品的质量指标如尺寸、重量等也常常符合正态分布。
通过控制生产过程中的各种因素,使质量指标的分布尽可能接近正态分布,并将均值调整到目标值,同时减小标准差,可以提高产品的一致性和质量稳定性。
考研数学《概率论与数理统计》知识点总结
第一章 概率论的基本概念定义: 随机试验E 的每个结果样本点组成样本空间S ,S 的子集为E 的随机事件,单个样本点为基本事件.事件关系: 1.A ⊂B ,A 发生必导致B 发生. 2.A B 和事件,A ,B 至少一个发生,A B 发生. 3.A B 记AB 积事件,A ,B 同时发生,AB 发生. 4.A -B 差事件,A 发生,B 不发生,A -B 发生.5.A B=Ø,A 与B 互不相容(互斥),A 与B 不能同时发生,基本事件两两互不相容.6.A B=S 且A B=Ø,A 与B 互为逆事件或对立事件,A 与B 中必有且仅有一个发生,记B=A S A -=.事件运算: 交换律、结合律、分配率略.德摩根律:B A B A =,B A B A =.概率: 概率就是n 趋向无穷时的频率,记P(A).概率性质:1.P (Ø)=0.2.(有限可加性)P (A 1 A 2 … A n )=P (A 1)+P (A 2)+…+P (A n ),A i 互不相容. 3.若A ⊂B ,则P (B -A)=P (B)-P (A).4.对任意事件A ,有)A (1)A (P P -=.5.P (A B)=P (A)+P (B)-P (AB).古典概型: 即等可能概型,满足:1.S 包含有限个元素.2.每个基本事件发生的可能性相同. 等概公式: 中样本点总数中样本点数S A )A (==n k P . 超几何分布:⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛=n N k n D N k D p ,其中ra C r a =⎪⎪⎭⎫ ⎝⎛. 条件概率: )A ()AB ()A B (P P P =. 乘法定理:)A ()A B ()AB C ()ABC ()A ()AB ()AB (P P P P P P P ==.全概率公式: )B ()B A ()B ()B A ()B ()B A ()A (2211n n P P P P P P P +++= ,其中i B 为S 的划分. 贝叶斯公式: )A ()B ()B A ()A B (P P P P i i i =,∑==nj j j B P B A P A P 1)()()(或)()()()()()()(B P B A P B P B A P B P B A P A B P +=.独立性: 满足P (AB)=P (A)P (B),则A ,B 相互独立,简称A ,B 独立.定理一: A ,B 独立,则.P (B |A)=P (B). 定理二: A ,B 独立,则A 与B ,A 与B ,A 与B 也相互独立.第二章 随机变量及其分布(0—1)分布: k k p p k X P --==1)1(}{,k =0,1 (0<p <1).伯努利实验:实验只有两个可能的结果:A 及A .二项式分布: 记X~b (n ,p ),k n kk n p p C k X P --==)1(}{. n 重伯努利实验:独立且每次试验概率保持不变.其中A 发生k 次,即二项式分布.泊松分布: 记X~π(λ),!}{k e k X P k λλ-==, ,2,1,0=k .泊松定理: !)1(lim k e p p C k kn k knn λλ--∞→=-,其中λ=np .当20≥n ,05.0≤p 应用泊松定理近似效果颇佳.随机变量分布函数: }{)(x X P x F ≤=,+∞<<∞-x .)()(}{1221x F x F x X x P -=≤<.连续型随机变量: ⎰∞-=xt t f x F d )()(,X 为连续型随机变量,)(x f 为X 的概率密度函数,简称概率密度.概率密度性质:1.0)(≥x f ;2.1d )(=⎰+∞∞-x x f ;3.⎰=-=≤<21d )()()(}{1221x x x x f x F x F x X x P ;4.)()(x f x F =',f (x )在x 点连续;5.P {X=a }=0.均匀分布: 记X~U(a ,b );⎪⎩⎪⎨⎧<<-=其它,,01)(bx a a b x f ;⎪⎩⎪⎨⎧≥<≤--<=b x b x a a b a x a x x F ,,,10)(. 性质:对a ≤c <c +l ≤b ,有 a b ll c X c P -=+≤<}{指数分布:⎪⎩⎪⎨⎧>=-其它,,001)(x e x f x θθ;⎩⎨⎧>-=-其它,,001)(x e x F x θ. 无记忆性: }{}{t X P s X t s X P >=>+>. 正态分布: 记),(~2σμN X ;]2)(exp[21)(22σμσπ--=x x f ;t t x F xd ]2)(exp[21)(22⎰∞---=σμσπ.性质: 1.f (x )关于x =μ对称,且P {μ-h <X ≤μ}=P {μ<X ≤μ+h };2.有最大值f (μ)=(σπ2)-1. 标准正态分布:]2exp[21)(2x x -=πϕ;⎰∞--=Φxt t x d ]2exp[21)(2π.即μ=0,ζ=1时的正态分布X ~N(0,1)性质:)(1)(x x Φ-=-Φ.正态分布的线性转化: 对),(~2σμN X 有)1,0(~N X Z σμ-=;且有)(}{}{)(σμσμσμ-Φ=-≤-=≤=x x X P x X P x F . 正态分布概率转化: )()(}{1221σμσμ-Φ--Φ=≤<x x x X x P ;1)(2)()(}{-Φ=-Φ-Φ=+<<-t t t t X t P σμσμ.3ζ法则: P =Φ(1)-Φ(-1)=68.26%;P =Φ(2)-Φ(-2)=95.44%;P =Φ(3)-Φ(-3)=99.74%,P 多落在(μ-3ζ,μ+3ζ)内. 上ɑ分位点: 对X~N(0,1),若z α满足条件P {X>z α}=α,0<α<1,则称点z α为标准正态分布的上α分位点. 常用 上ɑ分位点: 0.001 0.005 0.01 0.025 0.05 0.10 3.0902.5762.3261.9601.6451.282Y 服从自由度为1的χ2分布:设X 密度函数f X (x ),+∞<<∞-x ,若Y=X 2,则⎪⎩⎪⎨⎧≤>-+=000)]()([21)(y y y f y f y y f X XY ,,若设X ~N(0,1),则有⎪⎩⎪⎨⎧≤>=--00021)(221y y e y y f y Y ,,π定理:设X 密度函数f X (x ),设g (x )处处可导且恒有g ′(x )>0(或g ′(x )<0),则Y=g (X)是连续型随机变量,且有⎩⎨⎧<<'=其他,,0)()]([)(βαy y h y h f y f X Y h (y )是g (x )的反函数;①若+∞<<∞-x ,则α=min{g (−∞),g (+∞)},β=max{g (−∞),g (+∞)};②若f X (x )在[a ,b ]外等于零,g (x )在[a ,b ]上单调,则α=min{g (a ),g (b )},β=max{g (a ),g (b )}.应用: Y=aX +b ~N(a μ+b ,(|a |ζ)2).第三章 多维随机变量及其分布二维随机变量的分布函数: 分布函数(联合分布函数):)}(){(),(y Y x X P y x F ≤≤= ,记作:},{y Y x X P ≤≤.),(),(),(),(},{112112222121y x F y x F y x F y x F y Y y x X x P +--=≤<≤<.F (x ,y )性质: 1.F (x ,y )是x 和y 的不减函数,即x 2>x 1时,F (x 2,y )≥F (x 1,y );y 2>y 1时,F (x ,y 2)≥F (x ,y 1).2.0≤F (x ,y )≤1且F (−∞,y )=0,F (x ,−∞)=0,F (−∞,−∞)=0,F (+∞,+∞)=1.3.F (x +0,y )=F (x ,y ),F (x ,y +0)=F (x ,y ),即F (x ,y )关于x 右连续,关于y 也右连续.4.对于任意的(x 1,y 1),(x 2,y 2),x 2>x 1,y 2>y 1,有P {x 1<X ≤x 2,y 1<Y ≤y 2}≥0.离散型(X ,Y ):0≥ij p ,111=∑∑∞=∞=ij j i p ,ij yy x x p y x F i i ∑∑=≤≤),(.连续型(X ,Y ):v u v u f y x F y xd d ),(),(⎰⎰∞-∞-=.f (x ,y )性质: 1.f (x ,y )≥0.2.1),(d d ),(=∞∞=⎰⎰∞∞-∞∞-F y x y x f .3.y x y x f G Y X P G⎰⎰=∈d d ),(}),{(. 4.若f (x ,y )在点(x ,y )连续,则有),(),(2y x f yx y x F =∂∂∂. n 维: n 维随机变量及其分布函数是在二维基础上的拓展,性质与二维类似. 边缘分布:F x (x ),F y (y )依次称为二维随机变量(X ,Y )关于X 和Y 的边缘分布函数,F X (x )=F (x ,∞),F Y (y )=F (∞,y ).离散型: *i p 和j p *分别为(X ,Y )关于X 和Y 的边缘分布律,记}{1i ij j i x X P p p ==∑=∞=*,}{1j ij i j y Y P p p ==∑=∞=*.连续型:)(x f X ,)(y f Y 为(X ,Y )关于X 和Y 的边缘密度函数,记⎰∞∞-=y y x f x f X d ),()(,⎰∞∞-=x y x f y f Y d ),()(.二维正态分布:]})())((2)([)1(21exp{121),(2222212121212221σμσσμμρσμρρσπσ-+-------=y y x x y x f . 记(X ,Y )~N (μ1,μ2,ζ12,ζ22,ρ)]2)(exp[21)(21211σμσπ--=x x f X ,∞<<∞-x .]2)(exp[21)(22222σμσπ--=y y f Y ,∞<<∞-y . 离散型条件分布律: jij j j i j i p p y Y P y Y x X P y Y x X P *=======}{},{}{. *=======i ij i j i i j p p x X P y Y x X P x X y Y P }{},{}{.连续型条件分布:条件概率密度:)(),()(y f y x f y x f Y Y X =||条件分布函数:x y f y x f y Y x X P y x F xY Y X d )(),(}{)(⎰∞-==≤=||| )(),()(x f y x f x y f X X Y =||y x f y x f x X y Y P x y F yX X Y d )(),(}{)(⎰∞-==≤=||| 含义:当0→ε时,)|(d )|(}|{||y x F x y x f y Y y x X P Y X xY X =≈+≤<≤⎰∞-ε.均匀分布: 若⎪⎩⎪⎨⎧∈=其他,0),(,1),(Gy x Ay x f ,则称(X ,Y)在G 上服从均匀分布. 独立定义:若P {X ≤x ,Y ≤y }=P {X ≤x }P {Y ≤y },即F (x ,y )=F x (x )F y (y ),则称随机变量X 和Y 是相互独立的. 独立条件或可等价为:连续型:f (x ,y )=f x (x )f y (y );离散型:P {X =x i ,Y =y j }=P {X =x i }P {Y =y j }.正态独立: 对于二维正态随机变量(X ,Y ),X 和Y 相互对立的充要条件是:参数ρ=0.n 维延伸: 上述概念可推广至n 维随机变量,要注意的是边缘函数或边缘密度也是多元(1~n -1元)的.定理:设(X 1,X 2,…,X m )和(Y 1,Y 2,…,Y n )相互独立,则X i 和Y j 相互独立.又若h ,g 是连续函数,则h (X 1,X 2,…,X m )和g (Y 1,Y 2,…,Y n )相互独立.Z=X+Y 分布: 若连续型(X ,Y )概率密度为f (x ,y ),则Z=X+Y 为连续型且其概率密度为⎰∞∞-+-=y y y z f z f Y X d ),()(或⎰∞∞-+-=x x z x f z f Y X d ),()(.f X 和f Y 的卷积公式:记⎰∞∞-+-==y y f y z f z f f f Y X Y X Y X d )()()(*⎰∞∞--=x x z f x f Y X d )()(,其中除继上述条件,且X 和Y相互独立,边缘密度分别为f X (x )和f Y (y ). 正态卷积:若X 和Y 相互独立且X ~N (μ1,ζ12),记Y ~N (μ2,ζ22),则对Z=X+Y 有Z ~N (μ1+μ2,ζ12+ζ22).1.上述结论可推广至n 个独立正态随机变量.2.有限个独立正态随机变量的线性组合仍服从正态分布. 伽马分布:记),(~θαΓX ,0>α,0>θ.⎪⎩⎪⎨⎧>Γ=--其他,,00)(1)(1x e x x f x θαααθ,其中⎰+∞--=Γ01d )(t e t tαα.若X 和Y 独立且X ~Γ(α,θ),记Y ~Γ(β,θ),则有X+Y~Γ(α+β,θ).可推广到n 个独立Γ分布变量之和.XYZ =:⎰∞∞-=x xz x f x z f X Y d ),()(,若X 和Y 相互独立,则有⎰∞∞-=x xz f x f x z f Y X X Y d )()()(.XYZ =分布: ⎰∞∞-=x x zx f x z f XY d ),(1)(,若X 和Y 相互独立,则有⎰∞∞-=xxz f x f x z f Y X XY d )()(1)(. 大小分布:若X 和Y 相互独立,且有M =max{X ,Y }及N =min{X ,Y },则M 的分布函数:F max (z )=F X (z )F Y (z ),N 的分布函数:F min (z )=1-[1-F X (z )][1-F Y (z )],以上结果可推广到n 个独立随机变量的情况.第四章 随机变量的数字特征数学期望: 简称期望或均值,记为E (X );离散型:k k k p x X E ∑=∞=1)(.连续型:⎰∞∞-=x x xf X E d )()(.定理: 设Y 是随机变量X 的函数:Y =g (X )(g 是连续函数).1.若X 是离散型,且分布律为P {X =x k }=p k ,则: k k k p x g Y E )()(1∑=∞=.2.若X 是连续型,概率密度为f (x ),则:⎰∞∞-=x x f x g Y E d )()()(.定理推广: 设Z 是随机变量X ,Y 的函数:Z =g (X ,Y )(g 是连续函数).1.离散型:分布律为P {X =x i ,Y =y j }=p ij ,则: ij j i i j p y x g Z E ),()(11∑∑=∞=∞=. 2.连续型:⎰⎰∞∞-∞∞-=y x y x f y x g Z E d d ),(),()(期望性质:设C 是常数,X 和Y 是随机变量,则:1.E (C )=C .2.E (CX )=CE (X ).3.E (X +Y )=E (X )+E (Y ). 4.又若X 和Y 相互独立的,则E (XY )=E (X )E (Y ).方差:记D (X )或Var(X ),D (X )=V ar(X )=E {[X -E (X )]2}.标准差(均方差): 记为ζ(X ),ζ(X )= . 通式:22)]([)()(X E X E X D -=. k k k p X E x X D 21)]([)(-∑=∞=,⎰∞∞--=x x f x E x X D d )()]([)(2.标准化变量: 记σμ-=x X *,其中μ=)(X E ,2)(σ=X D ,*X 称为X 的标准化变量. 0)(*=X E ,1)(*=X D .方差性质: 设C 是常数,X 和Y 是随机变量,则: 1.D (C )=0. 2.D (CX )=C 2D (X ),D (X +C )=D (X ).3.D (X +Y )=D (X )+D (Y )+2E {(X -E (X ))(Y -E (Y ))},若X ,Y 相互独立D (X +Y )=D (X )+D (Y ).4.D (X )=0的充要条件是P {X =E (X )}=1. 正态线性变换: 若),(~2i i i N X σμ,i C 是不全为0的常数,则),(~22112211i i n i i i n i n n C C N X C X C X C σμ∑∑+++== .切比雪夫不等式: 22}{εσεμ≤≥-X P 或221}{εσεμ-≥<-X P ,其中)(X E =μ,)(2X D =σ,ε为任意正数.协方差:记)]}()][({[),Cov(Y E Y X E X E Y X --=.X 与Y的相关系数:)()(),Cov(Y D X D Y X XY =ρ.D (X +Y )=D (X )+D (Y )+2Cov(X ,Y ),Cov(X ,Y )=E (XY )-E (X )E (Y ).性质: 1.Cov(aX ,bY )=ab Cov(X ,Y ),a ,b 是常数.2.Cov(X 1+X 2,Y )=Cov(X 1,Y )+Cov(X 2,Y ). 系数性质:令e =E [(Y -(a +bX ))2],则e 取最小值时有)()1(]))([(2200min Y D X b a Y E e XY ρ-=+-=,其中)()(00X E b Y E a -=,)(),Cov(0X D Y X b =.1.|ρXY |≤1.2.|ρXY |=1的充要条件是:存在常数a ,b 使P {Y =a +bX }=1.|ρXY |越大e 越小X 和Y 线性关系越明显,当|ρXY |=1时,Y =a +bX ;反之亦然,当ρXY =0时,X 和Y 不相关. X 和Y 相互对立,则X 和Y 不相关;但X 和Y 不相关,X 和Y 不一定相互独立. 定义: k 阶矩(k 阶原点矩):E (X k ). n 维随机变量X i 的协方差矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n c c c c c cc c c212222111211C ,),Cov(j i ij X X c ==E {[X i -E (X i )][X j -E (X j )]}. k +l 阶混合矩:E (X k Y l).k 阶中心矩:E {[X -E (X )] k }.k +l 阶混合中心矩:E {[X -E (X )]k [Y -E (Y )]l }.n 维正态分布:)}()(21exp{det )2(1),,,(1T 221μX C μX C ---=-n n x x x f π ,T21T 21),,,(),,,(n nx x x μμμ ==μX . 性质:1.n 维正态随机变量(X 1,X 2,…,X n )的每一个分量X i (i =1,2,…,n )都是正态随机变量,反之,亦成立. 2.n 维随机变量(X 1,X 2,…,X n )服从n 维正态分布的充要条件是X 1,X 2,…,X n 的任意线性组合l 1X 1+l 2X 2+…+l n X n 服从一维正态分布(其中l 1,l 2,…,l n 不全为零).3.若(X 1,X 2,…,X n )服从n 维正态分布,且Y 1,Y 2,…,Y k 是X j (j =1,2,…,n )的线性函数,则(Y 1,Y 2,…,Y k )也服从多维正态分布.4.若(X 1,X 2,…,X n )服从n 维正态分布,则“X i 相互独立”与“X i 两两不相关”等价.)(x D第五章大数定律及中心极限定理弱大数定理:若X1,X2,…是相互独立并服从同一分布的随机变量序列,且E(X k)=μ,则对任意ε>0有11lim1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμknknXnP或→μPX,knkXnX11=∑=.定义:Y1,Y2,…,Y n ,…是一个随机变量序列,a是一个常数.若对任意ε>0,有1}|{|lim=<-∞→εaYPnn则称序列Y1,Y2,…,Yn,…依概率收敛于a.记aY Pn−→−伯努利大数定理:对任意ε>0有1lim=⎭⎬⎫⎩⎨⎧<-∞→εpnfP An或0lim=⎭⎬⎫⎩⎨⎧≥-∞→εpnfP An.其中f A是n次独立重复实验中事件A发生的次数,p是事件A在每次试验中发生的概率.中心极限定理定理一:设X1,X2,…,X n ,…相互独立并服从同一分布,且E(X k)=μ,D(X k)=ζ2 >0,则n→∞时有σμnnXknk)(1-∑=N(0,1)或nXσμ-~N(0,1)或X~N(μ,n2σ).定理二:设X1,X2,…,X n ,…相互独立且E(X k)=μk,D(X k)=ζk2 >0,若存在δ>0使n→∞时,}|{|1212→-∑+=+δδμkknknXEB,则nknkknkBX)(11μ==∑-∑~N(0,1),记212knknBσ=∑=.定理三:设),(~pnbnη,则n→∞时,Npnpnpn~)1()(--η(0,1),knknX1=∑=η.第六章样本及抽样分布定义:总体:全部值;个体:一个值;容量:个体数;有限总体:容量有限;无限总体:容量无限.定义:样本:X1,X2,…,X n 相互独立并服从同一分布F的随机变量,称从F得到的容量为n的简单随机样本.频率直方图:图形:以横坐标小区间为宽,纵坐标为高的跨越横轴的几个小矩形.横坐标:数据区间(大区间下限比最小数据值稍小,上限比最大数据值稍大;小区间:均分大区间,组距Δ=大区间/小区间个数;小区间界限:精度比数据高一位).图形特点:外轮廓接近于总体的概率密度曲线.纵坐标:频率/组距(总长度:<1/Δ;小区间长度:频率/组距).定义:样本p分位数:记x p,有1.样本x i中有np个值≤x p.2.样本中有n(1-p)个值≥x p.箱线图:x p选择:记⎪⎩⎪⎨⎧∈+∉=++NnpxxNnpxxnpnpnpp当,当,][211)()()1]([.分位数x0.5,记为Q2或M,称为样本中位数.分位数x0.25,记为Q1,称为第一四分位数.分位数x0.75,记为Q3,称为第三四分位数.图形:图形特点:M为数据中心,区间[min,Q1],[Q1,M],[M,Q3],[Q3,max]数据个数各占1/4,区间越短数据密集.四分位数间距:记IQR=Q3-Q1;若数据X<Q1-1.5IQR或X>Q3+1.5IQR,就认为X是疑似异常值.抽样分布:样本平均值:iniXnX11=∑=样本方差:)(11)(11221212XnXnXXnSiniini-∑-=-∑-===样本标准差:2SS=样本k阶(原点)矩:kinikXnA11=∑=,k≥1 样本k阶中心矩:kinikXXnB)(11-∑==,k≥2经验分布函数:)(1)(xSnxFn=,∞<<∞-x.)(xS表示F的一个样本X1,X2,…,X n 中不大于x的随机变量的个数.自由度为n的χ2分布:记χ2~χ2(n),222212nXXX+++=χ,其中X1,X2,…,X n是来自总体N(0,1)的样本.E(χ2 )=n,D(χ2 )=2n.χ12+χ22~χ2(n1+n2).⎪⎩⎪⎨⎧>Γ=--其他,,)2(21)(2122yexnyfynn.χ2分布的分位点:对于0<α<1,满足αχχαχα==>⎰∞yyfnPn)(222d)()}({,则称)(2nαχ为)(2nχ的上α分位点.~ 近似的min Q1 M Q3 max当n 充分大时(n >40),22)12(21)(-+≈n z n ααχ,其中αz 是标准正态分布的上α分位点. 自由度为n 的t 分布:记t ~t (n ),nY Xt /=, 其中X~N (0,1),Y~χ2(n ),X ,Y 相互独立.2)1(2)1(]2[]2)1([)(+-+Γ+Γ=n n t n n n t h π h (t )图形关于t =0对称;当n 充分大时,t 分布近似于N (0,1)分布.t 分布的分位点:对于0<α<1,满足ααα==>⎰∞t t h n t t P n t )(d )()}({,则称)(n t α为)(n t 的上α分位点. 由h (t )对称性可知t 1-α(n )=-t α(n ).当n >45时,t α(n )≈z α,z α是标准正态分布的上α分位点.自由度为(n 1,n 2)的F分布:记F ~F (n 1,n 2),21n V n U F =,其中U~χ2(n 1),V~χ2(n 2),X ,Y 相互独立.1/F ~F (n 2,n 1)⎪⎩⎪⎨⎧>+ΓΓ+Γ=+-其他,,00]1)[2()2()](2)([)(2)(21211)2(221212111x n y n n n y n n n n y n n n n ψF 分布的分位点:对于0<α<1,满足αψαα==>⎰∞y y n n F F P n n F ),(2121d )()},({,则称),(21n n F α为),(21n n F 的上α分位点.重要性质:F 1-α(n 1,n 2)=1/F α(n 1,n 2).定理一: 设X 1,X 2,…,X n 是来自N (μ,ζ2)的样本,则有),(~2n N X σμ,其中X 是样本均值. 定理二:设X 1,X 2,…,X n 是来自N (μ,ζ2)的样本,样本均值和样本方差分别记为 X ,2S ,则有1.)1(~)1(222--n S n χσ;2.X 与2S 相互独立.定理三:设X 1,X 2,…,X n 是来自N (μ,ζ2)的样本,样本均值和样本方差分别记为X ,2S ,则有)1(~--n t nS X μ.定理四:设X 1,X 2,…,X n 1 与Y 1,Y 2,…,Y n 2分别是来自N (μ1,ζ12)和N (μ2,ζ22)的样本,且相互独立.设这两个样本的样本均值和样本方差分别记为 X ,Y ,21S ,22S ,则有1.)1,1(~2122212221--n n F S S σσ.2.当ζ12=ζ22=ζ2时,)2(~)()(21121121-++-----n n t n n S Y X w μμ,其中2)1()1(212222112-+-+-=n n S n S n S w,2w w S S =. 第七章 参数估计定义: 估计量:),,,(ˆ21n X X X θ,估计值:),,,(ˆ21nx x x θ,统称为估计. 矩估计法:令)(ll X E =μ=li n i l X n A 11=∑=(k l ,,2,1 =)(k 为未知数个数)联立方程组,求出估计θˆ.设总体X 均值μ及方差ζ2都存在,则有 X A ==1ˆμ,212212122)(11ˆX X n X X n A A i n i i n i -∑=-∑=-===σ. 最大似然估计法: 似然函数:离散:);()(1θθi n i x p L =∏=或连续:);()(1θθi ni x f L =∏=,)(θL 化简可去掉与θ无关的因式项.θˆ即为)(θL 最大值,可由方程0)(d d =θθL 或0)(ln d d =θθL 求得. 当多个未知参数θ1,θ1,…,θk 时:可由方程组 0d d =L i θ或0ln d d =L i θ(k i ,,2,1 =)求得. 最大似然估计的不变性:若u =u (θ)有单值反函数θ=θ(u ),则有)ˆ(ˆθu u=,其中θˆ为最大似然估计. 截尾样本取样: 定时截尾样本:抽样n 件产品,固定时间段t 0内记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ≤t 0)和失效产品数量. 定数截尾样本:抽样n 件产品,固定失效产品数量数量m 记录产品个体失效时间(0≤t 1≤t 2≤…≤t m ). 结尾样本最大似然估计:定数截尾样本:设产品寿命服从指数分布X~e (θ),θ即产品平均寿命.产品t i 时失效概率P {t =t i }≈f (t i )d t i ,寿命超过t m 的概率θm t m e t t F -=>}{,则)(}){()(1i m i m n m m n t P t t F C L =-∏>=θ,化简得)(1)(m t s m e L ---=θθθ,由0)(ln d d =θθL 得:mt s m )(ˆ=θ,其中s (t m )=t 1+t 2+…+t m +(n -m )t m ,称为实验总时间. 定时截尾样本:与定数结尾样本讨论类似有s (t 0)=t 1+t 2+…+t m +(n -m )t 0,)(01)(t s m e L ---=θθθ,mt s )(ˆ0=θ,. 无偏性: 估计量),,,(ˆ21nX X X θ的)ˆ(θE 存在且θθ=)ˆ(E ,则称θˆ是θ的无偏估计量. 有效性:),,,(ˆ211n X X X θ与),,,(ˆ212n X X X θ都是θ的无偏估计量,若)ˆ()ˆ(21θθD D ≤,则1ˆθ较2ˆθ有效. 相合性: 设),,,(ˆ21n X X X θθ的估计量,若对于任意0>ε有1}|ˆ{|lim =<-∞→εθθP n ,则称θˆ是θ的相合估计量. 置信区间:αθθθ-≥<<1)},,,(),,,({2121n n X X X X X X P ,θ和θ分别为置信下限和置信上限,则),(θθ是θ的一个置信水平为α-1置信区间,α-1称为置信水平,10<<α.正态样本置信区间: 设X 1,X 2,…,X n 是来自总体X ~N (μ,ζ2)的样本,则有μ的置信区间:枢轴量W W 分布 a ,b 不等式 置信水平 置信区间)1,0(~N n X σμ-⇒ασμα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-12z n X P ⇒)(2ασz n X ± 其中z α/2为上α分位点θ置信区间的求解: 1.先求枢轴量:即函数W =W (X 1,X 2,…,X n ;θ),且函数W 的分布不依赖未知参数. 如上讨论标注2.对于给定置信水平α-1,定出两常数a ,b 使P {a <W <b }=α-1,从而得到置信区间. (0-1)分布p 的区间估计:样本容量n >50时,⇒--∞→)1,0(~)1()(lim N p np np X n n {}⇒-≈<--αα1)1()(2z p np np X n P0)2()(222222<++-+X n p z X n p z n αα⇒若令22αz n a +=,)2(22αz X n b +-=,2X n c =,则有置信区间(a ac b b 2)4(2---,a ac b b 2)4(2-+-).单侧置信区间:若αθθ-≥>1}{P 或αθθ-≥<1}{P ,称(θ,∞)或(∞-,θ)是θ的置信水平为α-1的单侧置信区间.正态总体均值、方差的置信区间与单侧置信限(置信水平为α-1)待估 其他 枢轴量W 的分布置信区间单侧置信限一个正态总体μζ2已知 )1,0(~N nX Z σμ-=)(2ασz nX ±ασμz nX +=,ασμz nX -=μζ2未知 )1(~--=n t nS X t μ⎪⎭⎫ ⎝⎛±2αt n S X αμt n S X +=,αμt nSX -= ζ2μ未知)1(~)1(2222--=n S n χσχ⎪⎪⎭⎫⎝⎛---2212222)1(,)1(ααχχS n S n 2122)1(αχσ--=S n ,222)1(αχσS n -=两个正态总体μ1-μ2ζ12,ζ22已知 )1,0(~)(22212121N n n Y X Z σσμμ+---=⎪⎪⎭⎫ ⎝⎛+±-2221212n n z Y X σσα2221212122212121n n z Y X n n z Y X σσμμσσμμαα+--=-++-=-μ1-μ2ζ12=ζ22=ζ2 未知)2(~)()(21121121-++---=--n n t n n S Y X t w μμ()12112--+±-n n S tY X w α2w w S S =121121121121----+--=-++-=-n n S t Y X n n S t Y X w w ααμμμμ2)1()1(2122 22112-+-+-=nnS nSnSwζ12/ζ22μ1,μ2未知)1,1(~2122212221--=nnFSSFσσ⎪⎪⎭⎫⎝⎛-212221222211,1ααFSSFSSασσ-=1222122211FSS,ασσFSS122212221=单个总体X~N(μ,ζ2),两个总体X~N(μ1,ζ12),Y~N(μ2,ζ22).第八章假设实验定义:H0:原假设或零假设,为理想结果假设;H1:备择假设,原假设被拒绝后可供选择的假设.第Ⅰ类错误:H0实际为真时,却拒绝H0.第Ⅱ类错误:H0实际为假时,却接受H0.显著性检验:只对犯第第Ⅰ类错误的概率加以控制,而不考虑第Ⅱ类错误的概率的检验.P{当H0为真拒绝H0}≤α,α称为显著水平.拒绝域:取值拒绝H0.临界点:拒绝域边界.双边假设检验:H0:θ=θ0,H1:θ≠θ0.右边检验:H0:θ≤θ0,H1:θ>θ0.左边检验:H0:θ≥θ0,H1:θ<θ0.正态总体均值、方差的检验法(显著性水平为α)原假设H0备择假设H1检验统计量拒绝域1 ζ2已知μ≤μ0μ>μ0nXZσμ-=z≥zαμ≥μ0μ<μ0z≤-zαμ=μ0μ≠μ0|z|≥zα/22 ζ2未知μ≤μ0μ>μ0nSXt0μ-=t≥tα(n-1) μ≥μ0μ<μ0t≤-tα(n-1) μ=μ0μ≠μ0|t|≥tα/2(n-1)3 ζ1,ζ2已知μ1-μ2≤δμ1-μ2>δ222121nnYXZσσδ+--=z≥zαμ1-μ2≥δμ1-μ2<δz≤-zαμ1-μ2=δμ1-μ2≠δ|z|≥zα/24 ζ12=ζ22=ζ2未知μ1-μ2≤δμ1-μ2>δ1211--+--=nnSYXtwδ2)1()1(212222112-+-+-=nnSnSnSwt≥tα(n1+n2-2) μ1-μ2≥δμ1-μ2<δt≤-tα(n1+n2-2)μ1-μ2=δμ1-μ2≠δ|t|≥tα/2(n1+n2-2)5 μ未知ζ2≤ζ02ζ2>ζ02222)1(σχSn-=χ2≥χα2(n-1)ζ2≥ζ02ζ2<ζ02χ2≤χ21-α(n-1)ζ2=ζ02ζ2≠ζ02χ2≥χ2α/2(n-1)或χ2≤χ21-α/2(n-1)6 μ1,μ2未知ζ12≤ζ22ζ12>ζ222221SSF=F≥Fα(n1-1,n2-1) ζ12≥ζ22ζ12<ζ22F≤F1-α(n1-1,n2-1)ζ12=ζ22ζ12≠ζ22F≥Fα/2(n1-1,n2-1)或F≤F1-α/2(n1-1,n2-1)7 成对数据μD≤0 μD>0nSDtD-=t≥tα(n-1) μD≥0 μD<0 t≤-tα(n-1)μD=0 μD≠0 |t|≥tα-2(n-1)检验方法选择:主要是逐对比较法(成对数据)跟两个正态总体均值差的检验的区别,如上表即7跟3、4的区别,成对数据指两样本X和Y之间存在一一对应关系,而3和4一般指X和Y相互对立,但针对同一实体.关系:置信区间与假设检验之间的关系:未知参数的置信水平为1-α的置信区间与显著水平为α的接受域相同.定义:施行特征函数(OC函数):β(θ)=Pθ(接受H0).功效函数:1-β(θ).功效:当θ*∈H1时,1-β(θ*)的值.。
对正态分布的理解
对正态分布的理解正态分布是统计学中常用的概率分布,它描述的是一个变量的概率分布。
正态分布的特点是其概率分布分布是有限的,而且分布的形状是圆锥形的。
它被称为高斯分布、正太分布或正态曲线,它在自然科学、社会科学等不同领域中都有应用。
首先,我们来看一下正态分布的概念。
正态分布是一种概率分布,它表示一组数据中每个观测值出现的概率。
正态分布具有一定的参数,主要有:均值(μ)、标准差(σ)和频率(f)。
均值描述的是该概率分布的数据的中心位置,标准差描述的是数据分布的程度,而频率描述的是数据出现的次数或频率。
正态分布的图形是一条S形曲线,这条曲线的左右两侧都是对称的,曲线的位置取决于概率分布中观测值的均值和标准差,并且它的形状取决于参数μ和σ。
此外,正态分布还具有“钟形”轮廓,事实上,正态分布的图形可以表示为一个圆锥,而这种圆锥的顶点位于均值值μ,因此可以将其看作是一个“钟形”轮廓。
正态分布的参数μ和σ可以通过极大似然法来估计,这意味着通过可用数据估计出参数μ和σ,以便得到最大似然度。
此外,对于正态分布的参数μ和σ的估计,统计学家们也研究了有关的算法,比如最小方差估计、最大可能性估计和克尔分布估计等。
正态分布也有一些理论特性,比如,正态分布的概率分布具有稳定性、均值可用于估计数据中心、最大似然估计可以提高估计的精度等。
此外,在大多数情况下,研究者还可以利用正态分布的其他理论特性,比如T分布、F分布和卡方分布,而这些理论特性可以用来分析和解释复杂的数据特征。
正态分布的应用非常广泛,它可以用于用于金融、经济和市场分析等领域,也可以用于生物、天文、抽样统计、概率论等领域。
比如,在金融领域,投资者可以通过分析正态分布,来估计资产的集合风险;在生物学领域,正态分布可以用于研究人类基因组的分布特征;在天文学领域,它可以用来表示星系恒星分布的密度;在抽样统计中,它也可以用来估计样本容量和样本大小等;而在概率论中,正态分布也可以用来分析某一概率事件发生的概率。
附录:协方差矩阵及多元正态分布
附录:协方差矩阵及n 维正态分布1、设n 维随机变量),,,(21n X X X 的二阶混合中心矩n j i X E X X E X E X X Cov c j j i i j i ij ,,2,1,,)]}()][({[),( =--==都存在,则称矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n c c c c c c c c c 212222111211Σ 为n 维随机变量),,,(21n X X X 的协方差矩阵。
它是一对称矩阵。
2、n 维正态分布● 定义:若n 维随机变量),,,(21n X X X 的概率密度可以表示成以下的形式:()()⎭⎬⎫⎩⎨⎧---==-μx Σμx Σx 12/12/2121ex p )(det )2(1)(),,,(T n n f x x x f π 其中: Tn x x x ),,,(21 =x ,T n T n X E X E X E ))(,),(),((),,,(2121 ==μμμμ,Σ是),,,(21n X X X 的协方差矩阵,则称n 维随机变量),,,(21n X X X 为n 维正态随机变量,记为:),(~),,,(21∑=μN X X X X n ,),,,(21n x x x f 为n 维正态概率密度函数,。
●n 维正态随机变量的性质(1)n 维正态随机变量),,,(21n X X X 的每一个分量都是正态变量;反之,若n X X X ,,,21 都是正态随机变量,且相互独立,则),,,(21n X X X 是n 维正态随机变量 (2)n 维随机变量),,,(21n X X X 服从n维正态分布的充要条件是n X X X ,,,21 的任意的线性组合n n X l X l X l +++ 2211服从一维正态分布。
(3)若),,,(21n X X X 服从n 维正态分布,设k Y Y Y ,,,21 是),2,1(n j X j =的线性函数,则),,,(21k Y Y Y 也服从多维正态分布。
随机数学第1讲 第一章预备知识
c12 c 22 cn2
c1 n ⎞ ⎟ c2n ⎟ ⎟ ⎟ c nn ⎟ ⎠
为 n 维随机变量的 协方差矩阵 .
定理:( X 1 ,
当 ρXY = 0 时, X 和 Y 不相关.
, X n ) 的协方差阵B 是对称,非负定的。
证明:对任意
x Bx = ∑
T i =1 n n n
x T = ( x1 , x2 ,
(
))
)
⎡ n = E ⎢∑ ⎣ i =1
n
∑x x (X
j =1 i j
n
i
⎤ − EX i ) X j − EX j ⎥ ⎦
(
证明: 对任意的实数t,
E[ X + Yt ]2 = t 2 EY 2 + 2tE[ XY ] + EX 2 ≥ 0 Δ = b 2 − 4ac = ( 2 E[ XY ]) − 4 EY 2 EX 2 ≤φ( t ) = E (e itX ) = 1i e itc = e itc , t ∈ R. Ex.2 两点分布
X 0 1 PX 1-p p
X c PX 1
Ex.3 指数分布 f ( x ) = ⎨
⎧λ e − λ x , ⎪ ⎪0, ⎩
x ≥ 0; x < 0.
(λ > 0)
φ(t ) = E e itX = ∫ e itx λe −λx dx
0
( )
2
+∞
φ(t ) = E eitX
( )
= ∫0 λe − λx costxdx + i λ ∫0 e − λx sintxdx
=λ
=
+∞
+∞
= eit⋅0 (1 − p) + eit⋅1 p
n维正态分布的概率密度知乎
n维正态分布的概率密度知乎摘要:一、引言二、n 维正态分布的概率密度函数1.多元正态分布的定义2.n 维正态分布的概率密度函数的表达式三、n 维正态分布的概率密度函数的性质1.概率密度函数的积分为12.概率密度函数的形状四、结论正文:一、引言正态分布是一种常见的概率分布,它在统计学和概率论中有着广泛的应用。
在多维空间中,我们可以考虑多个变量,这些变量可以用一个d 维特征向量表示,其中d 是变量的数量。
对于这种多元情况,我们可以定义多元正态分布,并研究其概率密度函数的性质。
二、n 维正态分布的概率密度函数1.多元正态分布的定义多元正态分布是指具有多个变量的正态分布。
例如,在二维空间中,我们可以考虑两个变量x1 和x2,它们的联合概率分布可以表示为一个二维正态分布。
对于n 个变量x1, x2,..., xn,它们的联合概率分布可以表示为n 维正态分布。
2.n 维正态分布的概率密度函数的表达式对于n 维正态分布,其概率密度函数可以表示为:f(x) = (1 / (σ^d × (2π)^(d/2))) * exp(-1/2 * ∑(x_i - μ_i)^2 / σ_i^2)其中,x = (x1, x2,..., xn),μ = (μ1, μ2,..., μn) 是均值向量,σ = (σ1,σ2,..., σn) 是标准差向量,σ^d 表示所有标准差的乘积,(2π)^(d/2) 是正常化常数。
三、n 维正态分布的概率密度函数的性质1.概率密度函数的积分为1为了保证概率密度函数的合理性,我们需要证明其积分为1。
对于二维正态分布,我们可以通过以下方式证明:∫∫f(x1, x2) dx1 dx2 = ∫∫ (1 / (σ^2 × (2π)^(1/2))) * exp(-1/2 * (x1^2 + x2^2) / σ^2) dx1 dx2= (1 / σ^2 × (2π)^(1/2)) * ∫∫ exp(-1/2 * (x1^2 + x2^2) / σ^2) dx1 dx2= (1 / σ^2 × (2π)^(1/2)) * ∫ exp(-1/2 * x1^2 / σ^2) dx1 * ∫ exp(-1/2 * x2^2 / σ^2) dx2= (1 / σ^2 × (2π)^(1/2)) * (σ / √(2π)) * (σ / √(2π))= 1因此,对于n 维正态分布,其概率密度函数的积分也为1。
n维正态分布的分布函数
n维正态分布的分布函数
正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之
为钟形曲线。
若随机变量x服从一个数学期望为μ、方差为σ^2的正态分布,记为n(μ,σ^2)。
其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
当μ = 0,σ = 1时的正态分布是标准正态分布。
正态分布(normal distribution)又名高斯分布(gaussian distribution),就是一个
在数学、物理及工程等领域都非常关键的概率分布,在统计学的许多方面有著关键性的影
响力。
期望值μ=0,即为曲线图象对称轴为y轴,标准差σ=1条件下的正态分布,记作
n(0,1)。
标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为n(0,1)。
标准正态分布曲线下面积原产规律就是:在-1.96~+1.96范围内曲线下的面积等同于0.,在-2.58~+2.58范围内曲线下面积为0.。
统计学家还制订了一张统计数据用表中(自
由度为∞时),利用该表就可以估算出来某些特定u1和u2值范围内的曲线下面积。
n维正态分布的定义及性质
概率论
例8
(概率论基础(李贤平) ,Page161)
若 X 1 , X 2 服从二维正态分布,其密度函数为
f x, y
1 2 1 2
2 2 x a1 y a2 y a2 1 x a1 exp 2 2 2 2 2 1 2 2 1 2 1 1
1 其中, B bij n 是 n n 阶正定对称矩阵, det B 是它的行列式,而 B -1 是它的逆矩阵,记作 B -1 bij , n
n
n
a 为任意实值列向量,即如果我们用黑体的小写字母记列向量,以黑体的大写字母记矩阵,则有
a1 x1 x1 a1 b11 b12 a2 x2 x2 a2 . . . b b , B 21 22 a , X , X -a ... ... . . . b n1 bn 2 . . . a x x a 2 n n n
说明两两相关,即得 X 1 , X 2 ,..., X n 独立(定理 4.64).
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 2 of 3
由定理可知, n 维正态分布完全由它的前面二阶矩确定。 定理 4.6.4
X 1 , X 2 ,..., X n 独立的充要条件是它们两两不相关。 X X 1 , X 2 ,..., X n 服 从 n 维 正 态 分 布 N a , B 的 充 要 条 件 是 它 的 任 何 一 个 线 性 组 合
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由定理可知, n 维正态分布完全由它的前面二阶矩确定。 定理 4.6.4
X 1 , X 2 ,..., X n 独立的充要条件是它们两两不相关。 X X 1 , X 2 ,..., X n 服 从 n 维 正 态 分 布 N a , B 的 充 要 条 件 是 它 的 任 何 一 个 线 性 组 合
一个具有独立正态分布分量的随机向量,它的数学期望为 Ua ,而它的方差分量是 B 的特征值。 证明 从矩阵论知道,对于实对称矩阵 B ,存在正交阵 U ,使 UBU T D ,其中,
d1 0 D ... 0 0 d2 ... 0 0 0 ... ... ... d n ... ...
2 1 2 ,则 B 0 ,因此 Y1 , Y2 独立。这说明二元正态分布可经适当 2 12 2
的坐标旋转化为两个相互独立的正态分布之积。
推论二 在正交变换下, 多维正态变量保持其独立、 同方差性不变。 (证明见概率论与数理统计(周 概容),Page358)
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 3 of 3
a1 0 其中 a1 0 , a2 0 ,即有 a ,令 a 2 0 Y1 X 1 cos Y U X 2 2 sin sin X 1 X 1 cos X 2 sin , 0 2 cos X 2 X 1 sin X 2 cos
概率论
特别地, X j 服从一维正态分布 N a j , b jj 。 定理表明,多维正态分布的边缘分布还是正态分布。 定理 4.6.3 a 及 B 分别是随机向量 X 的数学期望及协方差矩阵,即
a j E X j ,
1 j n ; b jk CovX j , X k E X j a j X k ak , 1 j, k n
这里, d1 , d 2 ,...d 3 是 B 的特征值。若 B 得秩为 r ,则有 r 个特征值不为零。此处的 U 是以特征向量 为列构成的正交阵。 把这里的 U 作为定理 4.6.7 中的变换矩阵,即可证明该推论。 从推论一看出,若 B 得秩为 r n ,则正态分布退化到一个 r 维子空间上。 推论一说明,对于多维正态变量,可以进行正交变换,使其既保持正态性不变又让各分量独立, 这种方法在数理统计中十分有用。 因为变换后得到的正态分布的各随机变量之间的协方差为 0,即 b jk CovX j , X k 0, j k ,这
说明两两相关,即得 X 1 , X 2 ,..., X n 独立(定理 4.64).
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 2 of 3
bm3 ... bmm ... ... ... bnm
--------------------------------------------------------------------------------------------------------------------------------Reproduction Forbidden Page 1 of 3
2
cos sin
1 2
B
cos sin
sin 2 cos 2
1 2 1 2
cos sin
22
C
sin 2
2
cos sin
cos 2
22
由上式看出,二维正态随机变量 X 1 , X 2 经过坐标旋转而得到的随机变量 Y1 , Y2 仍然服从正态分 布。进一步,若选 使得 tan 2
T
~ a , a ,..., a a k1 k2 km
T
~ , B 为保留 B 的第 k1 , k 2 ,..., k m 行及第 k1 , k 2 ,..., k m 列所得的 m 阶矩阵。如
b13 b23 b33 ... ... bn 3 ... b1m ... b2 m ... b3m ... ... ... b1n ... b2 n ... b3n ... ... ... bmn ... ... ... bnn
T
立,当且仅当 a 是 0 向量。如果 B 正定,则 det B 存在,且 det B 0 ,且 B -1 也是正定矩阵(小写代数, 居于马,Page272) 。 定理 4.6.2
X 的任一子向量 X k1 , X k2 ,..., X km
~ ~, B m n 也服从正态分布,分布为 N a ,其中
2
n/2
1 1 T exp X a B 1 X a 1/ 2 det B 2
1 其中, B bij n 是 n n 阶正定对称矩阵, det B 是它的行列式,而 B -1 是它的逆矩阵,记作 B -1 bij , n
定 理 4.6.6
n n n Y l j X j 服从一维正态分布 N l a , l2 j j b jj j j 1 j 1 j 1
Hale Waihona Puke 利用定理 4.6.6 可以通过一维正态随机变量来研究多维正态变量, 在有些场合这提供了很大的方便。
定理 4.6.7 若 X X 1 , X 2 ,..., X n 服从 n 维正态分布 N a , B , 而 C 为任意的 m n 阵, 则 Y CX 服从 m 维正态分布, N Ca , CBC T . 定理 4.6.7 表明正态变量在线性变换下还是正态变量,这个性质简称为正态变量的线性变换不变 性。 推论一 若 X X 1 , X 2 ,..., X n 服从 n 维正态分布 N a , B , 则存在一个正交变换 U , 使得 Y UX 是
a1 b11 b12 a2 b21 b22 a 3 b b32 31 . ~ ~ a , B ... ... . bm1 bm 2 am ... ... . bn1 bn 2 a n
则 Y1 , Y2 的联合密度函数为:
f y1 , y 2
其中,
1 2 1 2
1 2 exp Ay12 2 By1 y 2 Cy 2 2 1 2 21 sin 2
2 2
A
cos 2
12 12
2 1
概率论
n 维正态分布的定义及性质
n 维正态分布的定义及性质(概率论基础(李贤平) ,Page234)
定义
称 n 维随机变量 X X 1 , X 2 ,..., X n 服从参数为 N a , B 的 n 维正态分布,记为 X ~ N a , B ,
如果他有密度
p x f x1 , x2 ,..., xn
n
n
a 为任意实值列向量,即如果我们用黑体的小写字母记列向量,以黑体的大写字母记矩阵,则有
a1 x1 x1 a1 b11 b12 a2 x2 x2 a2 . . . b b , B 21 22 a , X , X -a ... ... . . . b n1 bn 2 . . . a x x a 2 n n n
... b1n ... b2 n ... ... ... bnn
称矩阵 B 为对称的,如果 B B T ,即 bij b ji ; 称对称矩阵 B 为正定的,如果对于任意列向量 a a1 , a 2 ,..., a n R n ,有 a T Ba 0 ,其中等号成
概率论
例8
(概率论基础(李贤平) ,Page161)
若 X 1 , X 2 服从二维正态分布,其密度函数为
f x, y
1 2 1 2
2 2 x a1 y a2 y a2 1 x a1 exp 2 2 2 2 2 1 2 2 1 2 1 1