简单随机变量之和与正态分布

合集下载

正态分布及正态随机变量

正态分布及正态随机变量

正态分布及正态随机变量正态分布是连续型随机变量概率分布中的⼀种,你⼏乎能在各⾏各业中看到他的⾝影,⾃然界中某地多年统计的年降雪量、⼈类社会中⽐如某地⾼三男⽣平均⾝⾼、教育领域中的某地区⾼考成绩、信号系统中的噪⾳信号等,⼤量⾃然、社会现象均按正态形式分布。

正态分布中有两个参数,⼀个是随机变量的均值 µµ,另⼀个是随机变量的标准差σσ,他的概率密度函数 PDF 为:fX(x)=1√2πσe−(x−µ)2/(2σ2)fX(x)=12πσe−(x−µ)2/(2σ2)。

当我们指定不同的均值和标准差参数后,就能得到不同正态分布的概率密度曲线,正态分布的概率密度曲线形状都是类似的,他们都是关于均值 µµ 对称的钟形曲线,概率密度曲线在离开均值区域后,呈现出快速的下降形态。

这⾥,我们不得不专门提⼀句,当均值 µ=0µ=0,标准差σ=1σ=1 时,我们称之为标准正态分布。

还是⽼规矩,眼见为实,下⾯来观察两组正态分布的概率密度函数取值,⼀组是均值为 00,标准差为 11 的标准正态分布。

另⼀组,我们取均值为 11,标准差为 22。

代码⽚段:from scipy.stats import normimport matplotlib.pyplot as pltimport numpy as npimport seabornseaborn.set()fig, ax = plt.subplots(1, 1)norm_0 = norm(loc=0, scale=1)norm_1 = norm(loc=1, scale=2)x = np.linspace(-10, 10, 1000)ax.plot(x, norm_0.pdf(x), color='red', lw=5, alpha=0.6, label='loc=0, scale=1')ax.plot(x, norm_1.pdf(x), color='blue', lw=5, alpha=0.6, label='loc=1, scale=2')ax.legend(loc='best', frameon=False)plt.show()。

随机变量及其分布正态分布

随机变量及其分布正态分布
测量误差
在自然科学中,许多测量误差都被认为服从正态 分布。这种假设允许使用统计方法进行误差分析 和建模。
正态分布在社会科学中的应用
能力和智力测试
正态分布在能力和智力测试中经常被用作模型,因为许多测试得分都呈现出正 态分布的形态。这使得教育工作者和心理学家能够对学生的能力或受试者的智 力进行评估和比较。
02 示例
人的身高、体重等都是连续型随机变量的例子。
03 性质
连续型随机变量的概率密度函数(PDF)描述了 变量在某个区间内取值的概率。
随机变量的数学期望与方差
数学期望(均值)
描述了随机变量取值的“平均”水平。对于离散型随机变量 ,数学期望是各个可能取值与对应概率的加权和;对于连续 型随机变量,数学期望是概率密度函数与自变量乘积的积分 。
02
随机变量的分类与性质
离散型随机变量
01 定义
离散型随机变量是指其取值集合是可数集的随机 变量。
02 示例
抛硬币的正面次数、掷骰子的点数等都是离散型 随机变量的例子。
03 性质
离散型随机变量的概率质量函数(PMF)描述了 每个可能取值的概率。
连续型随机变量
01 定义
连续型随机变量是指其取值集合是连续统(不可 数集)的随机变量。
它由均值和标准差两个参数完全决定,呈现出钟 02 形的曲线。
正态分布在自然界和社会现象中广泛存在,如测 03 量误差、人口身高、考试成绩等。
正态分布的概率密度函数
01 概率密度函数:f(x) = (1 / (σ√(2π))) * e^(-((x μ)² / (2σ²))),其中μ为均值,σ为标准差。
总结与展望
正态分布在统计学中的重要性总结
基础地位

中心极限定理随机变量和的分布接近正态分布的极限理论

中心极限定理随机变量和的分布接近正态分布的极限理论

中心极限定理随机变量和的分布接近正态分布的极限理论中心极限定理是概率论中的一项重要理论,它表明在一定条件下,大量相互独立的随机变量的和的分布接近于正态分布。

本文将探究中心极限定理的基本原理、相关概念及其应用。

1. 中心极限定理的基本原理中心极限定理是由一系列随机变量和的分布逐渐接近于正态分布这一现象构成的。

具体来说,中心极限定理是指当独立随机变量 X1,X2, ... Xn 具有相同的期望值μ 和方差σ^2 时,当 n 足够大时,这些随机变量的和 S_n = X1 + X2 + ... + Xn 的分布逼近于均值为nμ,方差为nσ^2 的正态分布。

2. 相关概念为了更好地理解中心极限定理,有几个相关概念需要了解:2.1 独立性:指随机变量之间互相独立,即一个随机变量的取值不受其他随机变量的影响。

2.2 同分布性:指多个随机变量具有相同的概率分布。

2.3 期望值:随机变量 X 的期望值 E(X) 表示该变量取值的平均数,反映了随机变量的平均水平。

2.4 方差:随机变量 X 的方差 Var(X) 表示该变量取值与期望值之间的离散程度,反映了随机变量的不确定性。

3. 中心极限定理的应用中心极限定理在实际问题中有着广泛的应用,其中一些常见的应用领域如下:3.1 统计学:中心极限定理为推断统计的基础,例如通过对样本的分析来推断总体的特征。

3.2 金融学:金融市场中的随机波动往往可以使用正态分布来描述,其中中心极限定理被广泛应用于风险管理、期权定价等领域。

3.3 生物学:许多生物学现象可以用随机变量来描述,中心极限定理可以用来解释这些现象。

3.4 物理学:中心极限定理在粒子物理学、热力学、量子力学等领域中有着重要的应用,可以帮助研究人员理解和预测实验结果。

4. 应用实例为了更好地理解中心极限定理的应用,以下是一个简单的实际案例:假设某个城市的某个时间段内的公交车到达时间是一个随机变量,该随机变量的期望值为10分钟,方差为4分钟。

个数为随机的独立正态随机变量之和不是正态分布的例子

个数为随机的独立正态随机变量之和不是正态分布的例子

个数为随机的独立正态随机变量之和不是正态分布的
例子
题目:个数为随机的独立正态随机变量之和不是正态分布的例子
摘要:
正态分布是统计学中最为重要的分布之一,它具有对称性、峰度和尖峰度等特点,在实际应用中广泛被使用。

然而,个数为随机的独立正态随机变量之和并不一定满足正态分布的性质,本文将通过阐述有关个数为随机的独立正态随机变量之和的相关概念、定义以及推导等内容,给出一个典型的例子并解释其结果。

第一部分:引言
1.1 背景和重要性
1.2 目的和意义
第二部分:相关概念和定义
2.1 正态分布的特性
2.2 随机变量
2.3 独立性
2.4 独立正态随机变量之和
第三部分:为何个数为随机的独立正态随机变量之和不一定是正态分布
3.1 问题陈述
3.2 结果推导
第四部分:典型例子和解释
4.1 独立正态随机变量之和的例子
4.2 结果解释
第五部分:实际应用和意义
5.1 对统计学和概率论的贡献
5.2 实际案例分析
第六部分:结论和展望
6.1 结论
6.2 展望未来研究方向
本文将按照上述大纲详细阐述,进一步探讨个数为随机的独立正态随机变量之和不满足正态分布性质的原因,并通过典型实例进行验证和解释。

统计学中的样本分布与总体分布的关系

统计学中的样本分布与总体分布的关系

统计学中的样本分布与总体分布的关系统计学作为一门关于收集、分析和解释数据的学科,主要研究的是从一定的总体中选取样本,并通过对样本的统计分析得出总体的特征和规律。

在统计学中,样本分布与总体分布之间存在着密切的关系。

本文将探讨样本分布与总体分布之间的关系,从而更好地理解统计学中的重要概念。

一、什么是样本分布和总体分布在开始分析样本分布与总体分布的关系之前,我们需要明确这两个概念的含义。

1. 样本分布:样本分布是指从总体中选取的、具有一定规模的、代表性的样本数据的分布情况。

样本分布是对总体的一种估计,通过样本数据的统计量,如均值、方差等来描述样本的特征和变异程度。

2. 总体分布:总体分布是指包含了全部个体、观察值或测量值的分布情况。

总体分布是研究对象的全集,也是样本所在的基本框架。

总体分布是通过对全部数据的描述,如概率密度函数、频数分布等来表达总体的特征和形态。

二、样本分布与总体分布的关系在统计学中,样本分布与总体分布存在着紧密的关系,它们既有区别,又有联系。

具体表现在以下几个方面:1. 样本是总体的一部分:样本是从总体中抽取的部分数据,它们代表了总体的特征和规律。

在得到样本数据后,可以通过对样本的统计分析来推断总体的性质。

因此,样本分布与总体分布的性质和形态存在一定的关联。

2. 样本分布逼近总体分布:当样本容量增大时,样本分布的特征逐渐接近总体分布的特征。

这是由于大样本量的随机性逐渐减小,样本的均值、方差等统计量更能准确地反映总体的性质。

3. 样本分布与总体分布形态一致:在某些情况下,样本分布的形态与总体分布的形态一致。

例如,如果总体分布服从正态分布,那么当样本容量足够大时,样本分布也会趋近于正态分布。

这是由于中心极限定理的作用,即将多个独立同分布的随机变量之和的分布逼近于正态分布。

4. 样本分布可用于总体的推断:通过对样本的分析得到的统计量,如置信区间、假设检验等,可以进行对总体的推断。

样本的统计量通过与总体参数相比较,能够帮助我们判断总体的性质和规律。

第八讲:正态分布及随机变量函数的分布.

第八讲:正态分布及随机变量函数的分布.

一、分布函数(P27)定义(P27):设X是随机变量,对任意实数兀,事件{X <x}的概率P{X <x}称为随机变量X的分布函数.记为F(x),即F(x) =P{X <x}P(X < a) =F(a)P(X VQ)= lim F(x)x—>a分布函数的性质(P28)(1) 单调不减性:若Xl<x2,则F(X1)<F(X2);(2) 规范寸生:对任意实数x, 0<F(x)<1,且F(—oo) = lim F(x) = 0,F(4-OO) = lim F(x) = 1;X—>—CO X—►-Foo(3) 右连续性;R卩对于任意实数心有;F(x0 +0) = lim F(x) = F(x0).KT威若某函数满足上述3条性质,则它一定是某随机变最的分布函数一般地,对离散型随机变量,若P{X= x k}=p k, 其分布函数为F(x) = P{X <x}= 工以则X的分布函数为:F(x) = P{X <x} =+ "2二、离散型随机变量的分布函数一般结论:X X】x2・・设随机变量X的分布列为:_____________________________ k=l,2,X K7p i X V JC X 兀]V X V 兀?•XT? V X V 兀$连续型随机变(P30)定义(P31):对任意实数x,如果随机变量X的分布函数F (x)可以写成F(x)=P(X < 其时(x) > 0则称X为连续型随机变量,f(x)为X的概率密度函数,简称概率密度或密度函数.常记为X ~ (-oo<X<+oo)密度函数的性质(P31-32)(1) 非负性f(X)x), (-O0<x<o0);「+oo(2) 归一性j f(x)dx=l.⑶在f(x)的一切连续点处有F/(x)=/(x)(4)对任意实数6,连续型随机变量取该值的概率为零,即(-00<b<00),则P{X=b}=Oo连续型随机变量落入某区间的概 率等于 其密度函数在该区间上的积分或其分布函数在该区间“右端点” 处的值减去“左端点”处的值若随机变具们概率密度函数则称x 服从区间[a, b ]上的均匀分布。

正态分布ppt课件

正态分布ppt课件

1.已知某地区中学生的身高 X 近似服从正态分布 N 164, 2 ,若 P X 170 0.3 ,
则 P158 X 1706
D.0.8
解析: P158 X 170 2P164 X 170 2 0.5 P X 170 0.4 .
2. 已 知 随 机 变 量 X 服 从 正 态 分 布 N 1, 2 , 若 P(X 0) P(X 3) 11 , 则 10 P(2 X 3) ( )
A.0.1
B.0.2
C.0.3
D.0.4
解析:因为随机变量 X 服从正态分布 N 1, 2 ,
所以随机变量 X 的均值 1 ,
所以随机变量 X 的密度曲线关于 x 1 对称, 所以 P(X 0) P(X 2) , 又 P(X 0) P(X 3) 11 ,
10
所以 P(X 2) P X 2 P(2 X 3) 11 ,
为“可用产品”,则在这批产品中任取 1 件,抽到“可用产品”的概率约为 _____________.
参考数据:若 X N , 2 ,则 P X 0.6827 ,
P 2 X 2 0.9545, P 3 X 3 0.9973
解析:由题意知,该产品服从 X N(25,0.16) ,则 25, 0.4 ,
10
因为 P(X 2) P X 2 1,所以 P(2 X 3) 0.1
3.已知随机变量 X ~ N , 2 ,Y ~ B6, p ,且 P X 3 1 , E X E Y ,则 2
p ( )
1
1
1
1
A. 6
B. 4
C. 3
D. 2
解析:由于 X 服从正态分布 N , 2 ,且 P X 3 1 ,故其均值 E X 3 . 2

概率论与数理统计实践----正态分布

概率论与数理统计实践----正态分布

正态分布的性质及实际应用举例正态分布定义:定义1:设连续型随机变量的密度函数(也叫概率密度函数)为:式中,μ 为正态总体的平均值;σ 为正态总体的标准差; x 为正态总体中随机抽样的样本值。

其中μ 、σ 是常数且σ > 0,则称随机变量ξ 服从参数为μ 、σ 的正态分布,记作ξ ~ N(μ,σ).定义2:在(1)式中,如果μ = 0,且σ =1,这个分布被称为标准正态分布,这时分布简化为:(2)正态分布的分布函数定义3:分布函数是指随机变量X 小于或等于x 的概率,用密度函数表示为:标准正态分布的分布函数习惯上记为φ ,它仅仅是指μ = 0,σ =1时的值,表示为:正态分布的性质:正态分布的变量的频数分布由μ、σ完全决定。

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。

σ越小,曲线越陡峭;σ越大,曲线越扁平。

u变换:为了便于描述和应用,常将正态变量作数据转换。

μ是正态分布的位置参数,描述正态分布的集中趋势位置。

正态分布以X=μ为对称轴,左右完全对称。

正态分布的均数、中位数、众数相同,均等于μ。

σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。

也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

应用综述 :1. 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2. 制定参考值范围(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

(2)百分位数法 常用于偏态分布的指标。

表3-1中两种方法的单双侧界值都应熟练掌握。

正态分布——精选推荐

正态分布——精选推荐

正态分布维基百科,自由的百科全书跳转到:导航, 搜索此条目或章节需要精通或熟悉本主题的专家参与编辑请协助邀请适合的人士,或参照相关专业文献,自行改善这篇条目。

更多的细节与详情请参见条目讨论页。

概率密度函数绿线代表标准正态分布颜色与概率密度函数同正态分布(Normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:X∼N(μ,σ2),则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。

因其曲线呈钟形,因此人们又经常称之为钟形曲线。

我们通常所说的标准正态分布是μ = 0,σ = 1的正态分布(见右图中绿色曲线)。

目录∙ 1 概要o 1.1 历史∙ 2 正态分布的定义o 2.1 概率密度函数o 2.2 累积分布函数o 2.3 生成函数▪ 2.3.1 动差生成函数▪ 2.3.2 特征函数∙ 3 性质o 3.1 标准化正态随机变量o 3.2 矩(英文:moment)o 3.3 生成正态随机变量o 3.4 中心极限定理o 3.5 无限可分性o 3.6 稳定性o 3.7 标准偏差∙ 4 正态测试∙ 5 相关分布∙ 6 参量估计o 6.1 参数的极大似然估计6.1.1 概念一般化o 6.2 参数的矩估计∙7 常见实例o7.1 光子计数o7.2 计量误差o7.3 生物标本的物理特性o7.4 金融变量o7.5 寿命o7.6 测试和智力分布∙8 计算统计应用o8.1 生成正态分布随机变量∙9 参见∙10 引用条目∙11 外部连接[编辑]概要正态分布是自然科学与行为科学中的定量现象的一个方便模型。

各种各样的心理学测试分数和物理现象比如光子计数都被发现近似地服从正态分布。

尽管这些现象的根本原因经常是未知的,理论上可以证明如果把许多小作用加起来看做一个变量,那么这个变量服从正态分布(在R.N.Bracewell的Fourier transform and its application中可以找到一种简单的证明)。

认识简单的概率分布正态与均匀分布

认识简单的概率分布正态与均匀分布

认识简单的概率分布正态与均匀分布认识简单的概率分布——正态与均匀分布概率分布是概率论和统计学中的基本概念,用于描述随机变量在各个取值上出现的概率。

在实际问题中,我们经常会遇到某个随机事件的概率分布,进而通过对其分布进行分析和推断,来解决各种与概率相关的问题。

本文将介绍两种常见的概率分布——正态分布与均匀分布,以及它们的特性、应用和计算方法。

一、正态分布正态分布,又称高斯分布,是自然界中出现最为广泛的连续型概率分布之一。

它的概率密度函数(Probability Density Function,简称PDF)可以用以下形式表示:f(x) = (1 / (σ * √(2π))) * exp(-((x - μ)^2) / (2 * σ^2))其中,μ是均值(代表分布的中心位置),σ是标准差(代表分布的带宽)。

正态分布的图像呈钟形曲线,左右对称,均值处取得最大值。

正态分布的特性如下:1. 均值和中位数相等,对称于均值。

2. 标准差决定了分布的“平凡程度”和“尖峰程度”,标准差越小,曲线越陡峭。

3. 正态分布的面积分布可以由标准正态分布表得到,通过积分求得的面积对应了不同区间上的概率。

4. 大量独立同分布的随机变量的和,趋近于正态分布。

正态分布在实际中的应用广泛,许多自然现象和统计问题的建模都采用正态分布。

例如,人的身高、体重、智商等具有正态分布;在投资领域,股票收益率的变动常常近似服从正态分布;质量控制中的测量误差也常用正态分布进行模拟和分析。

计算正态分布相关的概率和统计量可以通过各种统计软件或标准正态分布表进行。

二、均匀分布均匀分布是最简单的概率分布之一,它假设随机变量在一个区间内的概率密度是相等的。

均匀分布的概率密度函数可以表示为:f(x) = 1 / (b - a) a ≤ x ≤ b其中,a和b是分布区间的上下界。

均匀分布的特性如下:1. 在分布区间内,概率密度恒定,为常数。

2. 均值为(a + b) / 2,方差为(b - a)^2 / 12。

第二章2.4正态分布最终版

第二章2.4正态分布最终版

类型二 正态分布的概率计算
【例2】 设X~N(1,22),求: (1)P(-1<X≤3); (2)P(3<X≤5); (3)P(X≥5). 【分析】 要求随机变量X在某一范围内的概率,只须借 助于正态密度曲线的图象性质及三个特殊区间内取值的概率.
【解】 ∵X~N(1,22),∴μ=1,σ=2. (1)P(-1<X≤3)=P(1-2<X≤1+2)=P(μ-σ<X≤μ+σ)=0.6827. (2)∵P(3<X≤5)=P(-3<X≤-1),
可取任意数,μ 反映随机变量取值的平均水平的特征数,即若 X~N(μ,
σ2),则 E(X)=μ. σ>0 且参数 σ 是衡量随机变量总体波动大小的特征
数,可以用样本的标准差去估计.
2.注意正态函数中两个参数的位置,其中 σ 这个参数在解析式中两次出现,
注意参数的一致性。设随机变量
X
的正态分布密度函数
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 4 x
观察上面的正态曲线,分析有什么特征?
探究 2:
知识点二 正态分布的性质
1.正态分布的性质 (1)曲线在 x 轴上方,与 x 轴不相交. (2)曲线是单峰的,关于直线 x=μ 对称.
1
(3)曲线在 x=μ 处达到峰值σ 2π .
第二章
随机变量及其分布
2.4 正态分布
[目标] 1.会分析正态分布的意义. 2.能借助正态曲线的图象理解正态曲线的性质及意义. 3.会根据正态曲线的性质求随机变量在某一区间的概率. [重点] 正态曲线的特点及其所表示的意义;
利用正态分布解决实际问题. [难点] 求随机变量在某一区间内的概率.
一、复习引入

随机变量和分布的基本概念及其应用

随机变量和分布的基本概念及其应用

随机变量和分布的基本概念及其应用前言在统计学上,随机变量是一种被广泛应用的概念。

随机变量不是固定的数值,而是可能取到多个不同数值的变量,这些变量通常被用于描述概率和统计分布,进而用于解决实际问题。

而分布则是用于描述随机变量取值的概率分布情况,对于我们了解和分析随机现象有重要的理论和实际应用价值。

在这篇文章中,我们将学习关于随机变量和分布的基本概念,并探讨它们在实际应用中的重要性。

一、随机变量随机变量是指在随机试验中随机过程的结果,可以是任何数值或者一组数值。

我们把它定义为一一个变量,因为它执行的值取决于随机试验。

在数学中,我们用大写字母来表示随机变量,例如“X”,“Y”和“Z”。

在随机的情况下,一个随机变量可以具有不同的概率分布。

这样的概率分布说明了在随机试验中每个可能取值的概率。

一个随机变量可以是离散的,也可以是连续的。

离散随机变量是在有限的集合内取值的随机变量。

换句话说,离散随机变量只能取一些特定的数值。

一个简单的例子是一个硬币的投掷结果。

一个硬币是正面或反面的。

我们可以定义这个随机变量为“X”,其中“X”等于1代表硬币正面朝上,“X”等于0代表硬币反面朝上。

这是一个二元离散随机变量。

连续随机变量是能够取任何值的随机变量。

这种类型的随机变量通常表示某些实际上是连续的变量,例如高度、重量和温度等。

一个连续随机变量具有一个密度函数来描述变量可能取到的取值范围,并且对于任何一个确定的取值,概率都是零。

一个简单的例子是身高,该随机变量在某个范围内有任意数量的可能值。

随机变量的期望值是指随机变量的预期平均值。

我们可以认为期望值代表随机变量的中心或均值。

期望值是用来计算随机变量的平均值,其值是各个取值乘以其相应的概率之和。

期望值可以在随机变量的概率分布情况下进行计算。

二、分布随机变量的分布是指随机变量所有可能取到的不同值和每个值的概率分布情况。

分布的概率密度函数描述了随机变量的概率分布情况,并可以预测随机变量未来的变化。

随机变量及其分布--正态分布

随机变量及其分布--正态分布

正态分布知识点一、正态曲线函数f(x)=12πσ22()2exμσ--,x∈R的图象如图所示x∈(-∞,+∞),其中实数μ,σ(σ>0)为参数,我们称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线.(2)正态曲线的性质①曲线位于x轴上方,与x轴不相交;②曲线是单峰的,它关于直线x=μ对称;③曲线在x=μ处达到峰值1σ2π;④曲线与x轴之间的面积为1;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,总体的分布越分散;σ越小,曲线越“瘦高”,总体的分布越集中,如图乙所示:二、正态分布bφμ,σ(x)d x,则称随机变量X服从正一般地,如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=⎠⎛a态分布.正态分布完全由参数μ和σ确定,因此正态分布常记作N(μ,σ2),如果随机变量X服从正态分布,则记为X~N(μ,σ2).三、3σ原则1.正态总体在三个特殊区间内取值的概率值(1)P(μ-σ<X≤μ+σ)=0.682 6;(2)P(μ-2σ<X≤μ+2σ)=0.954 4;(3)P(μ-3σ<X≤μ+3σ)=0.997 4.2.通常服从正态分布N(μ,σ2)的随机变量X只取(μ-3σ,μ+3σ)之间的值.题型一正态曲线的图象的应用【例1】如图所示是一个正态分布的图象,试根据该图象写出正态分布密度函数的解析式,求出随机变量总体的均值和方差.【过关练习】1.某次我市高三教学质量检测中,甲、乙、丙三科考试成绩的直方图如图所示(由于人数众多,成绩分布的直方图可视为正态分布),则由如图曲线可得下列说法中正确的一项是()A.甲科总体的标准差最小B.丙科总体的平均数最小C.乙科总体的标准差及平均数都居中D.甲、乙、丙的总体的平均数不相同2.若一个正态分布密度函数是一个偶函数,且该函数的最大值为142π,求该正态分布的概率密度函数的解析式.题型二利用正态分布求概率【例1】设X~N(1,22),试求:(1)P(-1<X≤3);(2)P(3<X≤5);(3)P(X>5).【过关练习】1.已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)等于()A.0.6 B.0.4 C.0.3 D.0.22.(1)已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)=()A.0.6B.0.4C.0.3 D.0.2(2)在某项测量中,测量结果服从正态分布N(1,4),求正态总体X在(-1,1)内取值的概率.3.设随机变量X~N(2,9),若P(X>c+1)=P(X<c-1).(1)求c的值;(2)求P(-4<x<8).题型三正态分布的应用【例1】有一种精密零件,其尺寸X(单位:mm)服从正态分布N(20,4).若这批零件共有5 000个,试求:(1)这批零件中尺寸在18~22 mm间的零件所占的百分比;(2)若规定尺寸在24~26 mm间的零件不合格,则这批零件中不合格的零件大约有多少个?【过关练习】在某次考试中,某班同学的成绩服从正态分布N(80,52),现已知该班同学成绩在80~85分的有17人,该班同学成绩在90分以上的有多少人?课后练习【补救练习】1.设两个正态分布N(μ1,σ21)(σ1>0)和N(μ2,σ22)(σ2>0)的密度函数图象如图2­4­2所示,则有()图2­4­2A.μ1<μ2,σ1<σ2B.μ1<μ2,σ1>σ2C.μ1>μ2,σ1<σ2D.μ1>μ2,σ1>σ22.若随机变量X的密度函数为f(x)=,X在区间(-2,-1)和(1,2)内取值的概率分别为p1,p2,则p1,p2的关系为()A.p1>p2B.p1<p2C.p1=p2D.不确定3.若随机变量X~N(μ,σ2),则P(X≤μ)=________.4.在某项测量中,测量结果X服从正态分布N(1,σ2)(σ>0),若X在(0,1]内取值的概率为0.4,则X 在(0,2]内取值的概率为________.5.如图2­4­3所示是一个正态曲线,试根据该图象写出其正态分布的概率密度函数的解析式,求出总体随机变量的期望和方差.图2­4­3【巩固练习】1.已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)=( )【导学号:95032208】A .0.6B .0.4C .0.3D .0.22.设X ~N ⎝ ⎛⎭⎪⎫-2,14,则X 落在(-3.5,-0.5]内的概率是( )A .95.44%B .99.73%C .4.56%D .0.26%3.已知某批零件的长度误差(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )(附:若随机变量ξ服从正态分布N (μ,σ2),则P (μ-σ<ξ<μ+σ)=68.27%,P (μ-2σ<ξ<μ+2σ)=95.45%.)A.4.56% B.13.59%C.27.18% D.31.74%4.工人制造的零件尺寸在正常情况下服从正态分布N(μ,σ2),在一次正常的试验中,取1 000个零件,不属于(μ-3σ,μ+3σ)这个尺寸范围的零件可能有__________________________________________________________个.5.在某次数学考试中,考生的成绩X服从一个正态分布,即X~N(90,100).(1)试求考试成绩X位于区间(70,110)上的概率是多少?(2)若这次考试共有2 000名学生,试估计考试成绩在(70,110)间的考生大约有多少人?【拔高练习】1.在如图2­4­4所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度曲线)的点的个数的估计值为()图2­4­4A.2 387B.2 718C.3 414 D.4 777附:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.682 7,P(μ-2σ<X≤μ+2σ)=0.954 5.2.已知一次考试共有60名同学参加,考生的成绩X~N(110,25).据此估计,大约应有57人的分数在区间()A.(90,110]内B.(95,125]内C.(100,120]内D.(105,115]内3.设随机变量X~N(μ,σ2),且P(X<1)=12,P(X>2)=p,则P(0<X<1)=________.4.已知正态总体的数据落在区间(-3,-1)里的概率和落在区间(3,5)里的概率相等,那么这个正态总体的数学期望为________.5.从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:图2­4­5(1)求这500件产品质量指标值的样本平均数x -和样本方差s 2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2.①利用该正态分布,求P (187.8<Z <212.2);②某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E (X ).附:150≈12.2.若Z ~N (μ,σ2),则P (μ-σ<Z <μ+σ)=0.682 7,P (μ-2σ<Z <μ+2σ)=0.954 5.。

概率与统计中的正态分布

概率与统计中的正态分布

概率与统计中的正态分布正态分布是概率与统计学中最为重要的概率分布之一。

它的形状对称、钟形曲线使得它在很多实际问题中都有着广泛的应用。

本文将介绍正态分布的定义、性质以及如何使用正态分布进行概率计算和统计推断。

一、正态分布的定义正态分布,又称高斯分布,是一种连续型的概率分布。

它的概率密度函数(probability density function, PDF)可以用以下公式表示:f(x) = (1 / σ√(2π)) * e^(-(x-μ)^2 / (2σ^2))其中,μ是正态分布的均值,σ是正态分布的标准差,e是自然对数的底数。

二、正态分布的性质正态分布具有许多重要的性质,以下是其中的几个:1. 对称性:正态分布的概率密度函数关于均值对称。

即当x接近μ时,f(x)的值趋近于最大值。

2. 峰度:正态分布的峰度是3,意味着它的尾部相对较重。

3. 范围:正态分布的取值范围是(-∞, +∞),即负无穷到正无穷。

4. 均值和标准差:正态分布的均值μ决定了分布的中心位置,标准差σ决定了分布的形状。

68%的数据在均值的一个σ范围内,95%的数据在两个σ范围内,99.7%的数据在三个σ范围内。

三、正态分布的应用正态分布在实际问题中有着广泛的应用。

以下是正态分布常见的几个应用场景:1. 抽样分布近似:中心极限定理表明,当样本容量足够大时,许多随机变量的抽样分布可以近似为正态分布。

2. 参数估计:在统计推断中,我们经常使用正态分布来估计未知参数的置信区间。

通过样本数据的均值和标准差,我们可以计算出参数估计的置信区间。

3. 假设检验:正态分布在假设检验中也有着重要的应用。

我们可以通过计算检验统计量并参考正态分布的分位数,判断某个假设是否成立。

4. 质量控制:正态分布在质量控制中常用于确定过程的稳定性。

通过统计过程得到的样本数据,可以进行正态性检验,判断过程是否受到特殊因素的影响。

四、正态分布的计算与推断在实际应用中,我们经常需要计算正态分布的概率值或进行统计推断。

正态分布

正态分布

正态分布正态分布(normal distribution)又名高斯分佈(Gaussian distribution),是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面有著重大的影響力。

若隨機變量X服從一個數學期望為μ、標準方差為σ2的高斯分佈,記為:則其概率密度函數為常態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。

因其曲線呈鐘形,因此人們又經常稱之為鐘形曲線。

我們通常所說的標準常態分佈是μ = 0,σ = 1的常態分佈(見右圖中綠色曲線)。

目录[隐藏]1 概要o 1.1 歷史2 正态分布的定義o 2.1 概率密度函數o 2.2 累積分佈函數o 2.3 生成函數▪ 2.3.1 動差生成函數▪ 2.3.2 特徵函數3 性質o 3.1 標準化正態隨機變量o 3.2 矩(英文:moment)o 3.3 生成正態隨機變量o 3.4 中心極限定理o 3.5 無限可分性o 3.6 穩定性o 3.7 標準偏差4 正態測試5 相關分佈6 參量估計o 6.1 參數的極大似然估計▪ 6.1.1 概念一般化o 6.2 參數的矩估計7 常見實例o7.1 光子計數o7.2 計量誤差o7.3 生物標本的物理特性o7.4 金融變量o7.5 壽命o7.6 測試和智力分佈[编辑]概要正態分布是自然科學與行為科學中的定量現象的一個方便模型。

各種各樣的心理學測試分數和物理現象比如光子計數都被發現近似地服從常態分佈。

儘管這些現象的根本原因經常是未知的,理論上可以證明如果把許多小作用加起來看做一個變量,那麼這個變量服從正态分布(在R.N.Bracewell的Fourier transform and its application中可以找到一種簡單的證明)。

正态分布出現在許多區域統計:例如, 採樣分佈均值是近似地正態的,既使被採樣的樣本總體並不服從正态分布。

另外,常態分布信息熵在所有的已知均值及方差的分佈中最大,這使得它作為一種均值以及方差已知的分佈的自然選擇。

标准正态分布随机变量

标准正态分布随机变量

标准正态分布随机变量标准正态分布是统计学中非常重要的概念,它在各个领域都有着广泛的应用。

在概率论和统计学中,正态分布是一种连续概率分布,它的概率密度函数呈现出钟形曲线,因此也被称为钟形曲线分布。

标准正态分布是正态分布的一种特殊情况,它的均值为0,标准差为1。

在本文中,我们将详细介绍标准正态分布随机变量的相关概念和性质。

首先,我们来看一下标准正态分布随机变量的定义。

设X是一个服从标准正态分布的随机变量,其概率密度函数为:f(x) = (1/√(2π)) e^(-x^2/2)。

其中,e是自然对数的底,π是圆周率。

这个概率密度函数描述了标准正态分布随机变量X的分布特征,其图像为钟形曲线,关于x=0对称。

接下来,我们来讨论标准正态分布随机变量的期望和方差。

由于标准正态分布的均值为0,因此其期望E(X)为0。

而方差Var(X)则描述了随机变量偏离其均值的程度,对于标准正态分布来说,其方差为1。

这表明标准正态分布随机变量相对于其均值的分散程度较小,大部分的取值都集中在均值附近。

此外,标准正态分布随机变量还具有一个重要的性质,即68-95-99.7法则。

根据这一法则,大约68%的数据落在均值附近的一个标准差范围内,约95%的数据落在两个标准差范围内,约99.7%的数据落在三个标准差范围内。

这一法则在实际应用中具有重要意义,可以帮助我们对数据的分布进行初步的判断和分析。

在实际应用中,标准正态分布随机变量经常被用来描述各种自然现象和社会现象,例如身高、体重、考试成绩等。

通过对这些现象进行测量和统计,我们可以得到符合标准正态分布的数据,从而进行更深入的分析和研究。

总之,标准正态分布随机变量是统计学中一个重要的概念,它具有许多重要的性质和应用。

通过对标准正态分布的深入了解,我们可以更好地理解和分析各种数据,为实际问题的解决提供有力的支持。

希望本文对您有所帮助,谢谢阅读!。

2001考研数三真题及解析

2001考研数三真题及解析

2001 年全国硕士研究生入学统一考试数学三试题一、填空题(1) 设生产函数为Q AL K αβ=, 其中Q 是产出量, L 是劳动投入量, K 是资本投入量,而A , α, β均为大于零的参数,则当Q =1时K 关于L 的弹性为(2) 某公司每年的工资总额比上一年增加20%的基础上再追加2 百万.若以t W 表示第t 年的 工资总额(单位:百万元),则t W 满足的差分方程是___(3) 设矩阵111111,111111k k A k k ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦且秩(A )=3,则k = (4) 设随机变量X ,Y 的数学期望都是2,方差分别为1和4,而相关系数为0.5.则根据切比雪夫不 等式{}-6P X Y ≥≤ .(5) 设总体X 服从正态分布2(0,0.2),N 而1215,,X X X 是来自总体X 的简单随机样本,则随机变量()221102211152X X Y X X ++=++服从___分布,参数为_______二、选择题(1) 设函数f (x )的导数在x =a 处连续,又'()lim1,x af x x a→=--则( ) (A) x = a 是f (x )的极小值点. (B) x = a 是f (x )的极大值点. (C) (a , f (a ))是曲线y = f (x )的拐点.(D) x =a 不是f (x )的极值点, (a , f (a ))也不是曲线y =f (x )的拐点.(2) 设函数0()(),xg x f u du =⎰其中21(1),012(),1(1),123x x f x x x ⎧+≤≤⎪⎪=⎨⎪-≤≤⎪⎩则g (x )在区间(0,2) 内( ) (A)无界 (B)递减 (C) 不连续 (D) 连续(3) 设1112131414131211212223242423222113132333434333231414243444443424100010100,,,00101000a a a a a a a a a a a a a a a a A B P a a a a a a a a a a a a a a a a ⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦210000010,01000001P ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦其中A 可逆,则1B -等于( ) (A)112A PP - (B)112P A P - (C)112PP A - (D)121P A P -.(4) 设A 是n 阶矩阵,α是n 维列向量.若秩0TA αα⎛⎫=⎪⎝⎭秩(A),则线性方程组( )(A)AX =α必有无穷多解 ()B AX =α 必有惟一解.()C 00TA X y αα⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭仅有零解 ()D 00T AX y αα⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭必有非零解.(5) 将一枚硬币重复掷n 次,以X 和Y 分别表示正面向上和反面向上的次数,则X 和Y 的相关系数等于( )(A) -1 (B) 0 (C)12(D) 1三 、(本题满分5 分)设u = f (x ,y ,z )有连续的一阶偏导数,又函数y =y (x )及z =z (x )分别由下列两式确定:2xy e xy -=和0sin ,x zx t e dt t -=⎰求dudx四 、(本题满分6 分)已知f (x )在(−∞,+∞)内可导,且lim '(),x f x e →∞=lim()lim[()(1)],xx x x c f x f x x c→∞→∞+=--- 求c 的值.五 、(本题满分6 分)求二重积分221()2[1]x y Dy xedxdy ++⎰⎰的值,其中D 是由直线y =x , y = −1及x =1围成的平面区域六、(本题满分7 分)已知抛物线2y px qx =+(其中p <0,q >0)在第一象限与直线x +y =5相切,且此抛物线与x 轴所围成的平面图形的面积为S.(1) 问p 和q 为何值时,S 达到最大? (2)求出此最大值.七、(本题满分6 分)设f (x )在区间[0,1]上连续,在(0,1)内可导,且满足1130(1)(),(1).x f k xe f x dx k -=>⎰证明:存在ξ∈(0,1), 使得1'() 2(1)().f f ξξξ-=-八、(本题满分7 分)已知()n f x 满足'1()()n x n n f x f x x e -=+(n 为正整数)且(1),n ef n=求函数项级数 1()ni fx ∞=∑之和.九、(本题满分9 分)设矩阵11111,1.112a A a a β⎡⎤⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦已知线性方程组AX =β有解但不唯一,试求: (1) a 的值;(2) 正交矩阵Q,使T Q AQ 为对角矩阵.十、(本题满分8 分)设A 为n 阶实对称矩阵,秩(A)=n,ij A 是()ijn nA a ⨯=中元素ij a 的代数余子式(i ,j=1,2,…,n ),二次型1211(,,).n nij n i j i j A f x x x x x A===∑∑(1) 记12(,,),n A x x x =把1211(,,).nnij n i j i j A f x x x x x A===∑∑写成矩阵形式,并证明二次型()f X 的矩阵为1A -;(2) 二次型()Tg X X AX =与()f X 的规范形是否相同?说明理由.十一、(本题满分8 分)生产线生产的产品成箱包装,每箱的重量是随机的,假设每箱平均重50 千克,标准差为5千克.若用最大载重量为5 吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于0.977. (Φ(2)=0.977,其中Φ(x ) 是标准正态分布函数).十二、(本题满分8 分)设随机变量X 和Y 对联和分布是正方形G ={(x ,y )|1≤x ≤3,1≤y ≤3}上的均匀分布,试求随机变量U ={X −Y } 的概率密度().p u2001 年全国硕士研究生入学统一考试数学三试题解析一、填空题 (1)【答案】αβ-【使用概念】设()y f x =在x 处可导,且()0f x ≠,则函数y 关于x 的弹性在x 处的值为()()Ey x x y f x Ex y f x ''== 【详解】由Q AL K αβ=,当1Q =时,即1AL K αβ=,有1,K A L αββ--=于是K 关于L 的弹性为:EK EL LK K'=11d A L L dLA Lαββαββ----⎛⎫ ⎪ ⎪⎝⎭=111A L L A Lαββαββααββ------=⋅=-(2)【答案】 11.22t W -+【详解】t W 表示第t 年的工资总额,则1t W -表示第1t -年的工资总额,再根据每年的工资总额比上一年增加20%的基础上再追加2百万,所以由差分的定义可得t W 满足的差分方程是:11(120)2 1.22t t t W W W --=+%+=+(3)【答案】-3【详解】方法1:由初等变换(既可作初等行变换,也可作初等列变换).不改变矩阵的秩,故对A 进行初等变换111111111111k k A k k ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦11111001(1)2,3,410101001kk k k k k k ⎡⎤⎢⎥--⎢⎥⨯-⎢⎥--⎢⎥--⎣⎦行分别加到行311101002,3,400100001k k k k +⎡⎤⎢⎥-⎢⎥⎢⎥-⎢⎥-⎣⎦列分别加到1列 可见只有当k =−3时,r (A )=3.故k =−3.方法2:由题设r (A )=3,故应有四阶矩阵行列式0A =.由111111111111kk A k k =11111001(1)2,3,410101001k k k k k k k --⨯-----行分别加到行311101002,3,400100001k k k k +---列分别加到1列3(3)(1)0,k k =+-= 解得 k =1或k = −3. 当k =1时,1111111111111111A ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦111100001(1)23400000000⎡⎤⎢⎥⎢⎥⨯-⎢⎥⎢⎥⎣⎦行分别加到,,行 可知,此时r (A )=1,不符合题意,因此一定有k =−3.(4)【答案】112【所用概念性质】切比雪夫不等式为:{}2()()D X P X E X εε-≥≤期望和方差的性质:()E X Y EX EY +=+;()2cov(,)D X Y DX X Y DY +=++ 【详解】 把X Y +看成是一个新的随机变量,则需要求出其期望和方差. 故 ()220E X Y EX EY +=+=-+=又相关系数的定义:(,)X Y ρ=则cov(,)(,(0.5)1X Y X Y ρ==-=-()2cov(,)12(1)43D X Y DX X Y DY +=++=+⨯-+=所以由切比雪夫不等式:{}{}2()316()663612D X Y P X Y P X YE X Y ++≥=+-+≥≤==(5)【答案】F ;(10,5)【所用概念】1. F 分布的定义:12Xn F Yn =其中21~()X n χ 22~()Y n χ2.2χ分布的定义:若1,,n Z Z 相互独立,且都服从标准正态分布(0,1)N ,则221~()ni i Z n χ=∑3. 正态分布标准化的定义:若2~(,)Z N u σ,则~(0,1)Z uN σ- 【详解】因为2(0,2)1,2,,15i X N i =,将其标准化有0(0,1)22i i X X N -=,从而根据卡方分布的定义2222221015111(10),(5),2222X X X X χχ⎛⎫⎛⎫⎛⎫⎛⎫++++ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭由样本的独立性可知,2210122X X ⎛⎫⎛⎫++ ⎪ ⎪⎝⎭⎝⎭与22151122X X ⎛⎫⎛⎫++ ⎪ ⎪⎝⎭⎝⎭相互独立. 故,根据F 分布的定义()22101221102222111515112210(10,5).2225X X X X Y F X X X X ⎡⎤⎛⎫⎛⎫++⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦++==⎡⎤++⎛⎫⎛⎫++⎢⎥⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦故Y 服从第一个自由度为10,第二个自由度为5的F 分布.二、选择题(1)【答案】 [ B] 【详解】 方法1:由'()lim1,x af x x a→=--知 lim '()x af x →()'()limx af x x a x a→=⋅--()'()lim lim x a x a f x x a x a →→=⋅--10=-⋅0=又函数()f x 的导数在x a =处连续,根据函数在某点连续的定义,左极限等于右极限等于函数在这一点的值,所以()0f a '=,于是有'()'()'()"()limlim 1,x ax a f x f a f x f a x ax a →→-===--- 即()0f a '=,()10f a ''=-<,根据判定极值的第二充分条件:设函数()f x 在0x 处具有二阶导数且0()0f x '=,0()0f x ''≠,当0()0f x ''<时,函数()f x 在0x 处取得极大值. 知x a =是()f x 的极大值点,因此,正确选项为(B).方法2:由'()lim1,x af x x a→=--及极限保号性定理:如果()0lim x x f x A →=,且0A >(或0A <),那么存在常数0δ>,使得当00x x δ<-<时,有()0f x >(或()0f x <),知存在x a =的去心邻域,在此去心邻域内'()0f x x a<-.于是推知,在此去心邻域内当x a <时()0f x '>;当x a >时()0.f x '<又由条件知()f x 在x a =处连续,由判定极值的第一充分条件:设函数()f x 在0x 处连续,且在0x 的某去心δ领域内可导,若()00,x x x δ∈- 时,()0f x '>,而()00,x x x δ∈ +时,()0f x '<,则()f x 在0x 处取得极大值,知()f a 为()f x 的极大值. 因此,选 (B).(2)【答案】(D)【详解】应先写出g (x )的表达式.当01x ≤<时, 21()(1)2f x x =+,有 ()g x ()0x f u du =⎰201(1)2x u du =+⎰3001162x x u u =+311,62x x =+当12x ≤≤时, 1()(1)3f x x =-,有0()()x g x f u du =⎰101()()xf u du f u du =+⎰⎰120111(1)(1)23x u du u du =++-⎰⎰1132010111116263x x u u u u =++-()221136x =+- 即 ()3211,0162()211,1236x x x g x x x ⎧+≤<⎪⎪=⎨⎪+-≤≤⎪⎩因为 311112lim ()lim 623x x g x x x --→→⎛⎫=+=⎪⎝⎭,()211212lim ()lim 1363x x g x x ++→→⎛⎫=+-= ⎪⎝⎭, 且 ()2212(1)11363g =+-=,所以由函数连续的定义,知()g x 在点1x =处连续,所以()g x 在区间[0,2]内连续,选(D).同样,可以验证(A)、(B)不正确,01x <<时,321111()06222g x x x x '⎛⎫'=+=+> ⎪⎝⎭,单调增,所以(B)递减错;同理可以验证当12x <<时,()()2211()110363g x x x '⎛⎫'=+-=-> ⎪⎝⎭,单调增,所以()()()02g g x g ≤≤,即()506g x ≤≤与选项(A)无界矛盾.(3)【答案】 (C)【详解】由所给矩阵,A B 观察,将A 的2,3列互换,再将A 的1,4列互换,可得B . 根据初等矩阵变换的性质,知将A 的2,3列互换相当于在矩阵A 的右侧乘以23E ,将A 的1,4列互换相当于在矩阵A 的右侧乘以14E ,即2314AE E B =,其中231000001001000001E ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦,140010********000E ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦由题设条件知114223,P E P E ==,因此21B AP P =.由于对初等矩阵ij E 有,1ij ij E E -=,故111122,P P P P --==.因此,由21B AP P =,及逆矩阵的运算规律,有()111111211212B AP P P P A PP A ------===.(4)【答案】 ()D【详解】由题设,A 是n 阶矩阵,α是n 维列向量,即Tα是一维行向量,可知0TA αα⎛⎫⎪⎝⎭是1n +阶矩阵. 显然有秩0T Aαα⎛⎫=⎪⎝⎭秩()A 1,n n ≤≤+ 即系数矩阵0TAαα⎛⎫⎪⎝⎭非列满秩,由齐次线性方程组有非零解的充要条件:系数矩阵非列或行满秩,可知齐次线性方程组00T A X y αα⎛⎫⎛⎫= ⎪⎪⎝⎭⎝⎭必有非零解.(5) 【答案】A【详解】 掷硬币结果不是正面向上就是反面向上,所以X Y n +=,从而Y n X =-, 故 ()DY D n X DX =-=由方差的定义:22()DX EX EX =-, 所以[]22()()()DY D n X E n X E n X =-=---222(2)()E n nX X n EX =-+--222222()n nEX EX n nEX EX =-+-+-22()EX EX DX =-=)由协方差的性质:cov(,)0X c = (c 为常数);cov(,)cov(,)aX bY ab X Y =1212cov(,)cov(,)cov(,)X X Y X Y X Y +=+)所以 cov(,)cov(,)cov(,)cov(,)0X Y X n X X n X X DX DX =-=-=-=- 由相关系数的定义,得 (,)1X Yρ===-三【变限积分求导公式】()[()][()]()f x x ag t dt g f x f x ''=⎰【详解】 根据复合函数求导公式,有.du f f dy f dz dx x y dx z dx∂∂∂=++∂∂∂ (*) 在2xye xy -=两边分别对x 求导,得()()0,xy dy dye y xy x dx dx+-+= 即.dy y dx x =- 在0sin x z xt e dt t-=⎰两边分别对x 求导,得 sin()(1),xx z dz e x z dx -=⋅-- 即()1.sin()x dz e x z dx x z -=--将其代入(*)式,得du dx f f dy f dz x y dx z dx ∂∂∂=++∂∂∂()1.sin()x f y f e x z f x x y x z z⎛⎫∂∂-∂=-+- ⎪∂∂-∂⎝⎭四 【详解】因为1lim(1)xx e x→∞+=lim()xx x c x c→∞+-2lim()x x x c c x c →∞-+=- (把x c +写成2x c c -+) 222lim()x c cx c x cx x c c x c-⋅-→∞-+=- (把x 写成22x c cx c x c -⋅-) 222lim (1)cx x cx ccx c x c --→∞⎡⎤=+⎢⎥-⎣⎦(利用幂函数的性质()mn m n a a =)222ln (1)lim cxx c x cc c x c x e--⎡⎤⎢⎥+-⎢⎥⎣⎦→∞= (利用对数性质ln ()()f x e f x =)222ln (1)lim x c c cx c x c x c x e-⎡⎤⎢⎥+--⎢⎥⎣⎦→∞= (利用对数性质()ln ()()ln ()g x f x g x f x =)222lim ln (1)x cc x cx c x c x c e-→∞⎡⎤⎢⎥+--⎢⎥⎣⎦= (利用x y e =函数的连续性,lim ()()lim x f x f x x ee→∞→∞=)222limlim ln (1)x c c x x cx c x c x c e-→∞→∞⎡⎤⎢⎥⋅+--⎢⎥⎣⎦=(当各部分极限均存在时,lim ()()lim ()lim ()x x x f x g x f x g x →∞→∞→∞⋅=⋅)222limln lim (1)x c c x x cx c x c x c e -→∞→∞⎡⎤⎢⎥⋅+--⎢⎥⎣⎦= (利用ln y x =函数的连续性,lim[ln ()]ln[lim ()]x x f x f x →∞→∞=)2ln c e e ⋅= (利用1lim(1)x x e x→∞+=)2c e = (ln 1e =)又因为()f x 在(),-∞+∞内可导,故在闭区间[1,]x x -上连续,在开区间(1,)x x -内可导,那么又由拉格朗日中值定理,有()(1)()[(1)](),1f x f x f x x f x x ξξξ''--=--=-<<左右两边同时求极限,于是lim[()(1)]lim '()x x f x f x f e ξ→∞→∞--==,因为1x x ξ-<<,x 趋于无穷大时,ξ也趋向于无穷大由题意,lim()lim[()(1)],x x x x c f x f x x c →∞→∞+=--- 从而2c e e =,故12c =五 【详解】 积分区域如图所示,可以写成11,1y y x -≤≤≤≤222211()()22[1],x y x y DDDy xedxdy ydxdy xyedxdy +++=+⎰⎰⎰⎰⎰⎰其中,111112(1);3y Dydxdy dy ydx y y dy --==-=-⎰⎰⎰⎰⎰ 221()2x y Dxyedxdy +⎰⎰22111()21x y yydy xedx +-=⎰⎰22111()2211()2x y yydy ed x +-=⎰⎰ 22111()22211[()]2x y yydy ed x y +-=+⎰⎰2211(1)21()y y ee dy +-=-⎰ 2211(1)2211()2y y e e dy +-=-⎰22111(1)222111122y y e dy e dy +--=-⎰⎰ 22111(1)2221111[(1)]22y y ed ye dy +--=+-⎰⎰22111(1)21112y y ee +--=-0= 于是221()22[1]3x y Dy xedxdy ++=-⎰⎰六【详解】方法1:依题意知,抛物线如图所示,令2()0y px qx x px q =+=+=,求得它与x 轴交点的横坐标为:120,.q x x p==-根据定积分的定义,面积S 为()3232203260q pq p q q p S px qx dx x x p --⎛⎫=+=+=⎪⎝⎭⎰(注:111n n x dx x C n +=++⎰) 因直线5x y +=与抛物线2y px qx =+相切,故它们有唯一公共点. 由方程组25x y y px qx+=⎧⎨=+⎩ 求其公共解,消去y ,得2(1)50px q x ++-=,因为其公共解唯一,则该一元二次方程只有唯一解,故其判别式必为零,即22(1)4(5)(1)200,q p q p ∆=+-⨯⨯-=++=解得 21(1).20p q =-+ 将p 代入S 中,得()S q 326q p =32216[(1)]20q q =-+34200.3(1)q q =+ 根据函数除法的求导公式,()S q '344342(200)[3(1)][3(1)](200)[3(1)]q q q q q ''⨯+-+⨯=+25200(3)3(1)q q q -=+ 根据驻点的定义,令()0S q '=,已知有0q >,得唯一驻点3q =.当13q <<时,()0S q '>;3q >时,()0S q '<. 故根据极值判定的第一充分条件知,3q =时,()S q 取唯一极大值,即最大值.从而最大值为225(3).32S S ==方法2:设抛物线2y px qx =+与直线5x y +=相切的切点坐标为00(,)x y ,切点既在抛物线上,也在直线上,于是满足方程有2000y px qx =+和005x y +=.抛物线与直线在切点处的切线斜率是相等的,即一阶导数值相等. 在2y px qx =+左右两边关于x 求导,得2y px q '=+,在5x y +=左右两边关于x 求导,得1y '=-,把切点坐标00(,)x y 代入,得021x x y px q ='=+=-⇒012q x p+=-由005x y +=⇒005y x =-,将两结果代入2000y px qx =+得22000011155()()()222q q q y x px qx p q p p p+++=-=--=+=-+- 整理得21(1).20p q =-+ 将p 代入S 中,得34200().3(1)q S q q =+ 根据函数除法的求导公式,()S q '344342(200)[3(1)][3(1)](200)[3(1)]q q q q q ''⨯+-+⨯=+25200(3)3(1)q q q -=+ 根据驻点(即使得一阶导数为零的点)的定义,令()0S q '=,已知有0q >,得唯一驻点3q =.当13q <<时,()0;S q '>3q >时,()0;S q '<故根据极值判定的第一充分条件知,3q =时, ()S q 取唯一极大值,即最大值.从而最大值为225(3).32S S ==七【详解】将要证的等式中的ξ换成x ,移项,并命1()()()x x f x f x xϕ-'=-问题转化为证在区间(0,1)内()x ϕ存在零点. 将1()()0x f x f x x-'-= 看成一个微分方程,用分离变量法求解. 由()1()df x x dx f x x-= 两边积分得()11(1)()df x x dx dx f x x x -==-⎰⎰⎰利用1ln dx x C x =+⎰及111nn x dx x C n +=++⎰,得 1ln ()ln f x x x C =-+⇒ln ()ln xCe f x x=⇒()x Ce f x x =,即 ()x xe f x C -=,命()()x F x xe f x -=. 由110(1)(),(1)x k f k xe f x dx k -=>⎰及积分中值定理(如果函数()f x 在闭区间[,]a b 上连续,则在积分区间[,]a b 上至少存在一个点ξ,使得()()()()baf x dx f b a a b ξξ=-≤≤⎰),知至少存在一点1(0,)[0,1]k η∈⊂,使1110(1)()()x k f k xe f x dx e f ηηη--==⎰且()()F e f ηηηη-=,1(1)(1)F e f -=. 把1(1)()f e f ηηη-=代入,则111(1)(1)()()()F e f e e f e f F ηηηηηηη----====那么()F x 在[,1]η上连续,在(,1)η内可导,由罗尔中值定理知,至少存在一点(,1)[0,1]ξη∈⊂,使得()()()0F e f e f ξξξξξξ--''=+=即 1() (1)().f f ξξξ-'=-八【详解】由已知条件可见1()()n x n n f x f x x e -'-=,这是以()n f x 为未知函数的一阶线性非齐次微分方程,其中1()1,()n xp x q x xe -=-=,代入通解公式()()()(())p x dx p x dxf x e q x e dx C -⎰⎰=+⎰得其通解为1(),ndx dx n x x n x f x e x e e dx C e C n --⎛⎫⎛⎫⎰⎰=+=+ ⎪ ⎪⎝⎭⎝⎭⎰由条件(1),n e f n =又1(1)n f e C n ⎛⎫=+ ⎪⎝⎭,得0C =, 故(),n x n x e f x n =111()n x n xn n n n x e x f x e n n ∞∞∞=====∑∑∑ 记1(),nn xS x n ∞==∑则1n a n =,111limlim 11n n n na n a nρ+→∞→∞+===,则其收敛半径为11R ρ==,收敛区间为(1,1)-. 当(1,1)x ∈-时,根据幂级数的性质,可以逐项求导,11111()1n n n n n n x x S x x n n x ∞∞∞-===''⎛⎫⎛⎫'====⎪ ⎪-⎝⎭⎝⎭∑∑∑,其中2111n x x x x =+++++-故根据函数积分和求导的关系()()f x dx f x C '=+⎰,得00()()()(0)xxS x dx S x S x S '==-⎰又由于21000(0)012n n S n ∞===++=∑,所以01()(0)()0ln(1)1x xS x S S x dx dx x x'=+=+=---⎰⎰, 即有 1ln(1),(1,1)nn x x x n∞==--∈-∑当1x =-时, 1(1)ln 2nn n ∞=-=-∑. 级数在此点处收敛,而右边函数连续,因此成立的范围可扩大到1x =-处,即1ln(1),[1,1)nn x x x n∞==--∈-∑ 于是 1()ln(1),[1,1)x nn fx e x x ∞==--∈-∑九【详解】(1) 线性方程组AX β=有解但不唯一,即有无穷多解()()3r A r A n ⇔=<=,将增广矩阵作初等行变换,得111111112a A a a ⎡⎤⎢⎥=⎢⎥⎢⎥-⎣⎦21112131()01100112a a a a a aa ⎡⎤⎢⎥-----⎢⎥⎢⎥----⎣⎦行行,行行倍 11123011000(1)(2)2a a a a a a ⎡⎤⎢⎥--⎢⎥⎢⎥--+-+⎣⎦行加到行()因为方程组AX β=有解但不唯一,所以()()3r A r A =<,故a =−2.(2) 由(1),有112121211A -⎡⎤⎢⎥=-⎢⎥⎢⎥-⎣⎦由112121211E A λλλλ---=-+---122,312111λλλλλ-+---列加到列 1121121111λλλ-+---提出列公因子1121(1)2,303303λλλ-⨯-+--行分别加到行(3)(3)0λλλ=+-=故A 的特征值为1230,3,3λλλ==-=.当10λ=时,112(0)121211E A --⎡⎤⎢⎥-=--⎢⎥⎢⎥--⎣⎦1121(1),20332,3033--⎡⎤-⎢⎥-⎢⎥⎢⎥-⎣⎦行的倍分别加到行1122033000--⎡⎤⎢⎥-⎢⎥⎢⎥⎣⎦行加到3行于是得方程组(0)0E A x -=的同解方程组为1232320330x x x x x +-=⎧⎨-=⎩ 可见,(0)2r E A -=,可知基础解系的个数为(0)321n r E A --=-=,故有1个自由未知量,选2x 为自由未知量,取21x =,解得对应的特征向量为1(1,1,1)T ξ=.当13λ=时,()2123151212E A -⎛⎫ ⎪-=-- ⎪ ⎪-⎝⎭1511,2212212--⎡⎤⎢⎥-⎢⎥⎢⎥-⎣⎦行互换 151212000--⎡⎤⎢⎥-⎢⎥⎢⎥⎣⎦3行-2行151********--⎡⎤⎢⎥⨯⎢⎥⎢⎥⎣⎦1行加到行 于是得方程组(3)0E A x -=的同解方程组为12325090x x x x -+-=⎧⎨=⎩ 可见,(3)2r E A -=,可知基础解系的个数为(3)321n r E A --=-=,故有1个自由未知量,选1x 为自由未知量,取11x =,解得对应的特征向量为2(1,0,1)T ξ=-.当13λ=-时,()4123111214E A --⎛⎫ ⎪--=--- ⎪ ⎪--⎝⎭11112412214---⎛⎫⎪-- ⎪ ⎪--⎝⎭,行互换 1111(4),2036036---⎛⎫- ⎪ ⎪ ⎪--⎝⎭行倍倍分别加到2,3行1112036000---⎛⎫⎪⎪ ⎪⎝⎭行加到3行 于是得方程组(3)0E A x --=的同解方程组为123230360x x x x x ---=⎧⎨+=⎩ 可见,(3)2r E A --=,可知基础解系的个数为(3)321n r E A ---=-=,故有1个自由未知量,选2x 为自由未知量,取22x =,解得对应的特征向量为3(1,2,1)T ξ=--.由于A 是实对称矩阵,其不同特征值的特征向量相互正交,故这三个不同特征值的特征向量相互正交,之需将123,,ξξξ单位化,3121231231111,0,2.111ξξξβββξξξ⎡⎤⎡⎤⎡⎤⎢⎥⎥⎢⎥======-⎢⎥⎥⎢⎥⎢⎥⎥⎢⎥-⎣⎦⎦⎣⎦其中,123ξξξ====令[]123,,0Q βββ== 则有 1300030.000T Q AQ Q AQ -⎡⎤⎢⎥==-⎢⎥⎢⎥⎣⎦十【详解】(1)由题设条件,1211(,,)||n nijn i j i j A f x x x x x A ===∑∑111111n nn nij i jiijji j i j A x x x A xA A ======∑∑∑∑112211()nii i in n i x A x Ax A x A==+++∑121211(,,,)nii i in i n x x x A AA Ax =⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭∑121211(,,,)n i i i in i n x x x A A A A x =⎛⎫ ⎪⎡⎤ ⎪=⎢⎥ ⎪⎣⎦⎪⎝⎭∑[]12111121221222121(,,,)(,,,)(,,,)n n n n n nn n x x x A A A x A A A x A A A Ax ⎛⎫ ⎪ ⎪=++ ⎪ ⎪⎝⎭11121121222212121(,,,)n n n n n nn n A A A x A A A x x x x AA A A x ⎡⎤⎛⎫⎪⎢⎥ ⎪⎢⎥=⎪⎢⎥ ⎪⎢⎥⎣⎦⎝⎭1212(,,,)T n n x x A x x x A x *⎛⎫ ⎪ ⎪= ⎪⎪⎝⎭TT A X X A *= 1()T X A X -*其中()*的理由:A 是可逆的实对称矩阵,故111()()T T A A A ---==,因此由实对称的定义知,1A -也是实对称矩阵,又由伴随矩阵的性质A A A E *=,知1A A A *-=,因此A *也是实对称矩阵,TAA **=,故()*成立.(2) 因为()()1111TT A AA A E A ----==,所以由合同的定义知A 与1A -合同.由实对称矩阵A B 与合同的充要条件:二次型T x Ax 与Tx Bx 有相同的正、负惯性指数.可知,()Tg X X AX =与()f X 有相同的正、负惯性指数,故它们有相同的规范形.十一【应用定理】(i) 期望的性质:()E X Y EX EY +=+;独立随机变量方差的性质:若随机变量X Y 和独立,则()D X Y DX DY +=+(ii)列维-林德伯格中心极限定理:设随机变量12,,,,n X X X 相互独立同分布,方差存在,记22(0)u σσ<<+∞与分别是它们共同的期望与方差,则对任意实数x ,恒有1lim )()ni n i P X nu x x →∞=⎫-≤=Φ⎬⎭∑ (通俗的说:独立同分布的随机变量,其期望方差存在,则只要随机变量足够的多,这些随机变量的和以正态分布为极限分布)(iii) 正态分布标准化:若2~(,)Z N u σ,则~(0,1)Z uN σ-【详解】设(1,2,)i X i n =是装运的第i 箱的重量(单位:千克), n 是所求箱数. 由题设可以将1,,i n X X X 视为独立同分布的随机变量,而n 箱的总重量12n n S X X X =+++是独立同分布随机变量之和.由题设,有()5i E X ==(单位:千克) 所以 1212()()50n n n E S E X X X EX EX EX n =+++=+++= 1212()()25n n n D S D X X X DX DX DX n =+++=+++=则根据列维—林德柏格中心极限定理,知n S 近似服从正态分布(50,25)N n n ,箱数n 根据下述条件确定{}5000n P S P ≤=≤ (将n S 标准化)0.977(2)≈Φ>=Φ由此得2,> 从而98.0199n <, 即最多可以装98箱.十二【详解】由题设条件X 和Y 是正方形{}(,):13,13G x y x y =≤≤≤≤上的均匀分布,则X 和Y 的联合密度为:1,13,13,(,)40,x y f x y ⎧≤≤≤≤⎪=⎨⎪⎩其他(二维均匀分布的概率密度为1面积) 由分布函数的定义:{}{}()F u P U u P X Y u =≤=-≤(1)当0u <时,()0F u =(因为X Y -是非负的,所以小于0是不可能事件)(2)当2u ≥时,()1F u =(因为X 和Y 最大为3,X 和Y 最小为1,所以X Y -最大也就只能为2,所以2X Y -≤是必然事件,概率为1)(3)当02u ≤<时,{}()F u P U u =≤相当于 阴影部分所占的概率大小. 如图所示:{}{}()F u P U u P X Y u =≤=-≤214(2)4S u S ⎡⎤==--⎣⎦阴影面积总面积 211(2)4u =--(二维均匀分布中各部分所占的概率,相当于用这部分的面积除以总面积,这里阴影部分面积是用总面积减去两个三角形的面积)于是随机变量U 的概率密度为:1(2),02,()'()20, u u p u F u ⎧-<<⎪==⎨⎪⎩其他。

随机变量及其分布-正态分布

随机变量及其分布-正态分布

正态分布知识点一、正态曲线函数f(x)=12πσ22()2exμσ--,x∈R的图象如图所示x∈(-∞,+∞),其中实数μ,σ(σ>0)为参数,我们称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线.(2)正态曲线的性质①曲线位于x轴上方,与x轴不相交;②曲线是单峰的,它关于直线x=μ对称;③曲线在x=μ处达到峰值1σ2π;④曲线与x轴之间的面积为1;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,总体的分布越分散;σ越小,曲线越“瘦高”,总体的分布越集中,如图乙所示:二、正态分布bφμ,σ(x)d x,则称随机变量X服从正一般地,如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=⎠⎛a态分布.正态分布完全由参数μ和σ确定,因此正态分布常记作N(μ,σ2),如果随机变量X服从正态分布,则记为X~N(μ,σ2).三、3σ原则1.正态总体在三个特殊区间内取值的概率值(1)P(μ-σ<X≤μ+σ)=0.682 6;(2)P(μ-2σ<X≤μ+2σ)=0.954 4;(3)P(μ-3σ<X≤μ+3σ)=0.997 4.2.通常服从正态分布N(μ,σ2)的随机变量X只取(μ-3σ,μ+3σ)之间的值.题型一正态曲线的图象的应用【例1】如图所示是一个正态分布的图象,试根据该图象写出正态分布密度函数的解析式,求出随机变量总体的均值和方差.【过关练习】1.某次我市高三教学质量检测中,甲、乙、丙三科考试成绩的直方图如图所示(由于人数众多,成绩分布的直方图可视为正态分布),则由如图曲线可得下列说法中正确的一项是()A.甲科总体的标准差最小B.丙科总体的平均数最小C.乙科总体的标准差及平均数都居中D.甲、乙、丙的总体的平均数不相同2.若一个正态分布密度函数是一个偶函数,且该函数的最大值为142π,求该正态分布的概率密度函数的解析式.题型二利用正态分布求概率【例1】设X~N(1,22),试求:(1)P(-1<X≤3);(2)P(3<X≤5);(3)P(X>5).【过关练习】1.已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)等于()A.0.6 B.0.4 C.0.3 D.0.22.(1)已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<2)=()A.0.6B.0.4C.0.3 D.0.2(2)在某项测量中,测量结果服从正态分布N(1,4),求正态总体X在(-1,1)内取值的概率.3.设随机变量X~N(2,9),若P(X>c+1)=P(X<c-1).(1)求c的值;(2)求P(-4<x<8).题型三正态分布的应用【例1】有一种精密零件,其尺寸X(单位:mm)服从正态分布N(20,4).若这批零件共有5 000个,试求:(1)这批零件中尺寸在18~22 mm间的零件所占的百分比;(2)若规定尺寸在24~26 mm间的零件不合格,则这批零件中不合格的零件大约有多少个?【过关练习】在某次考试中,某班同学的成绩服从正态分布N(80,52),现已知该班同学成绩在80~85分的有17人,该班同学成绩在90分以上的有多少人?课后练习【补救练习】1.设两个正态分布N(μ1,σ21)(σ1>0)和N(μ2,σ22)(σ2>0)的密度函数图象如图2­4­2所示,则有()图2­4­2A.μ1<μ2,σ1<σ2B.μ1<μ2,σ1>σ2C.μ1>μ2,σ1<σ2D.μ1>μ2,σ1>σ22.若随机变量X的密度函数为f(x)=,X在区间(-2,-1)和(1,2)内取值的概率分别为p1,p2,则p1,p2的关系为()A.p1>p2B.p1<p2C.p1=p2D.不确定3.若随机变量X~N(μ,σ2),则P(X≤μ)=________.4.在某项测量中,测量结果X服从正态分布N(1,σ2)(σ>0),若X在(0,1]内取值的概率为0.4,则X 在(0,2]内取值的概率为________.5.如图2­4­3所示是一个正态曲线,试根据该图象写出其正态分布的概率密度函数的解析式,求出总体随机变量的期望和方差.图2­4­3【巩固练习】1.已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)=( )【导学号:95032208】A .0.6B .0.4C .0.3D .0.22.设X ~N ⎝ ⎛⎭⎪⎫-2,14,则X 落在(-3.5,-0.5]内的概率是( )A .95.44%B .99.73%C .4.56%D .0.26%3.已知某批零件的长度误差(单位:毫米)服从正态分布N (0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )(附:若随机变量ξ服从正态分布N (μ,σ2),则P (μ-σ<ξ<μ+σ)=68.27%,P (μ-2σ<ξ<μ+2σ)=95.45%.)A.4.56% B.13.59%C.27.18% D.31.74%4.工人制造的零件尺寸在正常情况下服从正态分布N(μ,σ2),在一次正常的试验中,取1 000个零件,不属于(μ-3σ,μ+3σ)这个尺寸范围的零件可能有__________________________________________________________个.5.在某次数学考试中,考生的成绩X服从一个正态分布,即X~N(90,100).(1)试求考试成绩X位于区间(70,110)上的概率是多少?(2)若这次考试共有2 000名学生,试估计考试成绩在(70,110)间的考生大约有多少人?【拔高练习】1.在如图2­4­4所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(0,1)的密度曲线)的点的个数的估计值为()图2­4­4A.2 387B.2 718C.3 414 D.4 777附:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.682 7,P(μ-2σ<X≤μ+2σ)=0.954 5.2.已知一次考试共有60名同学参加,考生的成绩X~N(110,25).据此估计,大约应有57人的分数在区间()A.(90,110]内B.(95,125]内C.(100,120]内D.(105,115]内3.设随机变量X~N(μ,σ2),且P(X<1)=12,P(X>2)=p,则P(0<X<1)=________.4.已知正态总体的数据落在区间(-3,-1)里的概率和落在区间(3,5)里的概率相等,那么这个正态总体的数学期望为________.5.从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:图2­4­5(1)求这500件产品质量指标值的样本平均数x -和样本方差s 2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2.①利用该正态分布,求P (187.8<Z <212.2);②某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E (X ).附:150≈12.2.若Z ~N (μ,σ2),则P (μ-σ<Z <μ+σ)=0.682 7,P (μ-2σ<Z <μ+2σ)=0.954 5.。

随机变量及其分布正态分布

随机变量及其分布正态分布

03
社会科学
在社会科学领域,有些数据的分布也 呈现出正态分布的特点,例如人类的 考试分数、人口数量等。
04
正态分布的数学表达与计 算
正态分布的概率密度函数
正态分布的概率密度函数表达式为:f(x) = 1 / (σ√(2π)) * exp(- (x - μ) ^ 2 / (2σ^2)),其中μ是均值,σ是标准差。
随机变量及其分布正态分布
2023-11-03
contents
目录
• 随机变量及其分布 • 正态分布 • 正态分布的应用场景 • 正态分布的数学表达与计算 • 正态分布的统计特性与参数估计 • 正态分布的假设检验与模型评估
01
随机变量及其分布
离散随机变量及其分布
伯努利分布
离散型概率分布,成功概率为p,失败概率为1-p。
指数分布
连续型概率分布,表示某个事件在单位时间内发生的概率,其中平均发生率为 λ。
均匀分布与指数分布
均匀分布:连续型概率分布,表示在某个区间内随机变量以相同的概率取值。 指数分布与泊松分布在一定条件下可以相互转换。
02
正态分布
正态分布的定义
定义
如果一个随机变量的概率密度函数是具有均值μ和标准差σ的高斯函数,则称 该随机变量服从正态分布,记作N(μ, σ²)。其中,μ是均值,σ²是方差。
05
正态分布的统计特性与参 数估计
均值与方差
均值
正态分布的平均值,描述了分布的中心位置。
方差
衡量分布的离散程度,描述了分布的宽度。
偏度与峰度
偏度
描述分布的不对称性,正态分布一般为对 称分布。
VS
峰度
描述分布的尖锐程度,正态分布的峰度为 3。

正态分布的概念与计算

正态分布的概念与计算

正态分布的概念与计算正态分布(Normal Distribution),也称高斯分布(Gaussian Distribution),是概率论与统计学中非常重要的一种连续型概率分布。

它在自然界和人类社会的各个方面都有广泛应用,是描述随机变量分布的重要工具。

本文将介绍正态分布的概念,并说明如何计算正态分布。

一、正态分布的概念正态分布由其概率密度函数来定义,符号表示为:N(N, N²),其中N为均值,N²为方差。

概率密度函数的形式为:N(N) = 1 / (N√2N) * N^(-((N−N)² / (2N²)))特点:1. 正态分布的图像呈钟形,中心对称,左右两边曲线对称,均值、中位数和众数相等,即N。

2. 在均值处有最高点,随着离均值的距离增加,曲线下降缓慢。

3. 标准差N的大小决定了曲线的陡峭程度,标准差越大,曲线越平缓。

二、正态分布的计算1. 概率密度计算:对于给定的正态分布N(N, N²),可以通过概率密度函数计算任意N处的概率密度值。

例如,计算某个值N的概率密度,可以使用如下公式:N(N) = 1 / (N√2N) * N^(-((N−N)² / (2N²)))其中,N(N)表示N处的概率密度值。

2. 累积概率计算:对于给定的正态分布N(N, N²),可以计算N≤ N的累积概率N(N≤ N)。

此时,可以使用标准正态分布表格或统计软件来查找概率值。

3. 标准化与反标准化:在实际计算过程中,常常需要将正态分布转化为标准正态分布,即N(0, 1)。

标准正态分布的均值N为0,方差N²为1。

标准化公式如下:N = (N−N) / N其中,N表示标准化后的值。

反标准化则是将标准正态分布转化为任意正态分布。

反标准化公式如下:N = N + NN4. 百分位数计算:对于给定的正态分布N(N, N²),可以计算N对应的百分位数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

简单随机变量之和与正态分布
本文将笼统,随意的讲解,为什么多随机变量之和可以认为服从正态分布。

首先我们建立一个简单的随机变量之和的模型。

假设我们手里有一枚硬币,我们认定硬币的正面为1,反面为0,那么抛一次硬币的情况就是0或1且他们的概率都是50%。

如果我不写概率也是写概率的比例,那么这个比例可以写为1:1。

现在我们抛两次硬币,那么这个结果有四种,00,01,10,11。

相信你知道我在说什么。

那么正同我们提到的,我们要的是随机变量之和,所以我们有0,1,2。

且他们的比例可以很容易的得到,是1:2:1。

那么如果抛三次硬币呢?可能的结果就是0,1,2,3,而他们的比例是1:3:3:1。

也许你已经发现这个规律了,也许你没有,但我会告诉你的。

假如你抛2N次硬币,并且求和,那么其结果就是0,1,2……2N,共2N+1种可能。

这2N+1种可能的比例服从组合数C2N i。

你可以代入刚才抛三次的情况,C30:C31:C32:C33就是我们得到的1:3:3:1。

至于为什么这个比例符合组合数,抛两次硬币那里举了个例子,就不重复了。

这里简单的定义以下,每个随机变量称作X i他们的和称作Y,也就是:
2N
Y=∑X i
1
(为什么突然变成了抛2N次而不是抛N次,因为我想保证我抛的是偶数次,这样Y的均值就是N了,你会发现抛两次的时候,Y的均值就是1,但是如果你抛三次,Y的均值就会是1.5,我想避免这个小数。


所以接下来我们就要说明,组合数的分布规律为什么就成了正态分布。

那么首先,你相信这个结论吗?让我们从抛多次到抛少次,来看一下正态分布和这个组合数分布到底有多像。

从Y的取值范围你也能猜出,这里分别是N取5,10,15,20的情况,实际上除了N 取5,也就是抛10次的时候,你还能看得清楚红线和蓝线,当N取10也就是抛20次以后,两线其实非常吻合了。

你还可以看一下他们之间的误差,其峰值也是逐渐减小的。

有了直观图形,我们就得意识到,Y 从某种角度上确实也服从正态分布,尽管它其实是我们通过组合数构造出来的。

我们来看一下正态分布有个什么特点。

我们都知道正态分布是:
f (x )=1(x −μ)2
2σ2) 我认为,这个函数的本质其实就是:exp⁡(−x 2)。

你可以对它取以下对数,那么他就成了二次函数−x 2,如果你愿意再对他求导,那么它就会变成−2x ,也就是线性函数。

即使你考虑了我所忽略的那几个东西,也不会改变这个函数的本质,那就是它取对数后,应该是二次项系数为负的二次函数,且既然是二次函数,求导,就是一次的了。

既然Y 的分布规律和它很相似,那么组合数也应该有类似的结论。

所以我们对组合数先取个对数,得到: ln (C 2N x )=∑ln⁡(i)2N
2N−x+1−∑ln⁡(i)x 1
(这里作为自变量习惯性的用字母x 表示,但是它的涵义是2N 个随机变量之和Y )
然后我们需要对这个东西关于x 求导,但是它是离散的,没有导数,只能求差分。

(你对二次函数求差分其结果也还是一次的,所以这里用差分对比之前二次函数求微分,是没有关系的。


ln (C 2N x )−ln (C 2N x−1)=∑ln (i )2N
2N−x+1−∑ln (i )x 1−∑ln (i )2N 2N−x+2+∑ln (i )x−11
=ln (2N −x +1)−ln (x )
这个函数在x=N 附近的线性度非常的好。

我取N 为15,也就是抛30次硬币的情况下。

为什么呢,你可以对上式再求个导:
1x −2N −1−1x =2N +1x(x −2N −1)
因为我们说多个简单实验,所以N 应该比较大,不妨忽略了这个2N+1中的1,然后我们把这个函数左移N 个单位。

现在我们得到的就是:
2N x(x −2N)⁡⁡⁡⁡⁡⁡⁡x=x+N → ⁡⁡⁡⁡⁡2N (x +N)(x −N)=2N N 2−x 2
终于,一切豁然开朗了起来,这个函数的分母N 2−x 2在N 足够大,而x 又相对较小的时候,x 2就成了可以忽略的无穷小项,这样上式就成了一个常数,因为我们平移过,所以实际上这个函数近似的在N 的附近是一个常数。

这里继续取N 为15,看一下这个函数。

那么远离中心N的数,他们不能近似为常数怎么办呢?我的理解是,无论是正态分布,还是前面组合数这样的分布,远离中心的那些结果,都是概率极低事件,可以不去关心他。

所以最后的结论就是,由于组合数的这种分布方式,其在中心的附近的分布律可以和和正态分布一样,取对数后变化成二次函数,所以组合数的这种分布律可以很好的服从正态分布的。

有点不足的是,这里考虑抛硬币作为最基本模型,它的概率分布非常简单。

如果基本事件的分布律不是二元的而是多元的甚至是连续的,或基本事件的分布律不是这样对称的,那
么他们求和又是为什么能服从正态分布呢?那就再说吧= =。

相关文档
最新文档