随机变量及其分布
随机变量及其分布正态分布
在自然科学中,许多测量误差都被认为服从正态 分布。这种假设允许使用统计方法进行误差分析 和建模。
正态分布在社会科学中的应用
能力和智力测试
正态分布在能力和智力测试中经常被用作模型,因为许多测试得分都呈现出正 态分布的形态。这使得教育工作者和心理学家能够对学生的能力或受试者的智 力进行评估和比较。
02 示例
人的身高、体重等都是连续型随机变量的例子。
03 性质
连续型随机变量的概率密度函数(PDF)描述了 变量在某个区间内取值的概率。
随机变量的数学期望与方差
数学期望(均值)
描述了随机变量取值的“平均”水平。对于离散型随机变量 ,数学期望是各个可能取值与对应概率的加权和;对于连续 型随机变量,数学期望是概率密度函数与自变量乘积的积分 。
02
随机变量的分类与性质
离散型随机变量
01 定义
离散型随机变量是指其取值集合是可数集的随机 变量。
02 示例
抛硬币的正面次数、掷骰子的点数等都是离散型 随机变量的例子。
03 性质
离散型随机变量的概率质量函数(PMF)描述了 每个可能取值的概率。
连续型随机变量
01 定义
连续型随机变量是指其取值集合是连续统(不可 数集)的随机变量。
它由均值和标准差两个参数完全决定,呈现出钟 02 形的曲线。
正态分布在自然界和社会现象中广泛存在,如测 03 量误差、人口身高、考试成绩等。
正态分布的概率密度函数
01 概率密度函数:f(x) = (1 / (σ√(2π))) * e^(-((x μ)² / (2σ²))),其中μ为均值,σ为标准差。
总结与展望
正态分布在统计学中的重要性总结
基础地位
随机变量及其分布函数
随机变量及其分布函数将随机事件以数量来标识,即用随机变量描述随机现象的研究方法,它是定义在样本空间上具有某种可预测性的实值函数。
分布函数则完整的表述了随机变量。
一、 随机变量与分布函数(1) 随机变量:取值依赖于某个随机试验的结果(样本空间),并随着试验结果不同而变化的变量,称之为随机变量。
分布函数:[1] 定义:设X 是一个随机变量,对任意实数x ,记作(){}F x P X x ≤=,称()F x 为随机变量X 的分布函数,又称随机变量X 服从分布()F x ,显然,函数()F x 的定义域为(),-∞+∞,值域为[0,1]。
[2] 性质:❶()F x 单调非降。
❷()0F -∞=、()1F +∞=。
❸()(0)F x F x =+,即()F x 一定是右连续的。
❹对于任意两个实数a b <,{}()()P a X b F b F a <≤=-❺对于任意实数0x ,000{}()()P X x F x F x ==-- ❻000{}1{}1()P X x P X x F x >=-≤=- ❼000{}{)lim }(x x P X x P X x x F →-=≤<=-❽000{}1{}1()P X x P X x F x ≥=-<=-- 二、 离散型随机变量与连续型随机变量(1) 离散型随机变量[1] 概念:设X 是一个随机变量,如果X 的取值是有限个或者无穷可列个,则称X 为离散型随机变量。
其相应的概率()i i P X x p ==(12)i =、……称为X 的概率分布或分布律,表格表示形式如下:[2] 性质:❶0i p ≥❷11nii p==∑❸分布函数()i i x xF x p ==∑❹1{}()()i i i P Xx F x F x -==-(2) 连续型随机变量[1] 概念:如果对于随机变量的分布函数()F x ,存在非负的函数 ()f x ,使得对于任意实数x ,均有:()()xF x f x d x-∞=⎰则称X 为连续型随机变量,()f x 称为概率密度函数或者密度函数。
随机变量及其分布
记
p(xi)P{Xxi}, i1, 2,
(21)
则称{p(xi) i1 2 }为X的概率分布 有时也将p(xi)记为pi 用
下列表格形式来表示 并称之为X 的概率分布表
4
概率分布的性质
任何一个离散型随机变量的概率分布{p(xi)}必然满足下 列性质
1 p(xi)0 i1 2
(22)
((22))ii pp((xxi)i)11
事件的概率与密度函数的关系
(1)连续型随机变量X落于区间(a b]上的概率为
b
P{a X b} F(b) F(a)a f (x)dx
(2)连续型随机变量X落于点x上的概率为
P{Xx}0
(212)
(213)
19
例28 设X是在[a b]上等可能投点的位置 其分布函数为
0, F (x) bx1,aa ,
x
x
F(x) 0 F() lim F(x)1
若函数Fx)满足上述三
x
条性质 则它一定是某个随
(3)右连续性 F(x0)F(x) 机变量X的分布函数
10
三、分布函数
定义24(分布函数) 设X是一随机变量 则称函数
F(x)P{Xx} x( )
(29)
为随机变量X的分布函数 记作X ~F(x)
分布函数的性质 随机变量的分布函数必然满足下列性质
0 x1, x1.
14
四、离散型随机变量的分布函数
离散型随机变量的分布函数F(x)的共同特征是 F(x)是一 个阶梯形的函数 它在X的可能取值点处发生跳跃跳跃高度 等于相应点处的概率 而在两个相邻跳跃点之间分布函数值 保持不变
反过来 如果一个随机变量X的分布函数F(x)是阶梯型函 数 则X一定是一个离散型随机变量 其概率分布可由分布函 数F(x)惟一确定 F(x)的跳跃点全体构成X的所有可能取值 每 一跳跃点处的跳跃高度则是X在相应点处的概率
概率论与数理统计-随机变量及其分布
解
直接对上式求导有
二、连续型随机变量函数的分布
81
例 18
解
二、连续型随机变量函数的分布
82
定理 1
定理 2
83
总结/summary
离散型随机变量:分布律
分 二项分布、泊松分布、几何
随 布 分布
机 变
函 数
连续型随机变量:密度函数
量 均匀分布、指数分布、正态
分布
随机变量函数的分布
84
谢谢观赏
46
47
目录/Contents
2.1 随机变量及其分布 2.2 常用的离散型随机变量 2.3 常用的连续型随机变量 2.4 随机变量函数的分布
48
目录/Contents
2.3 常用的连续型随机变量
一、均匀分布 二、指数分布 三、正态分布
一、均匀分布
49
一、均匀分布
50
一、均匀分布
51
一、均匀分布
15
定义3
(1)非负性 (2)规范性
三、离散型随机变量及其分布律
16
换句话说,如果一个随机变量只可能取有限个 值或可列无限个值, 那么称这个随机变量为(一维) 离散型随机变量.
一维离散型随机变量的分布律也可表示为:
三、离散型随机变量及其分布律
17
例2
求
三、离散型随机变量及其分布律
18
解
四、连续型随机变量及其密度函数
2.1 随机变量及其分布 2.2 常用的离散型随机变量 2.3 常用的连续型随机变量 2.4 随机变量函数的分布
73
目录/Contents
2.4 随机变量函数的分布 一、离散型随机变量函数的分布 二、连续型随机变量函数的分布
随机变量及其分布
• 则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称 概率密度或者密度函数.
• 下面给出概率密度函数f(x)的性质: • (1)f(x)≥0 • (2)由分布函数的性质易得
下一页 返回
• 二、离散型随机变量的分布函数
• 设离散型随机变量X的分布律为:
上一页 下一页 返回
2. 3随机变量的分布函数
• 其中 • 则随机变量X的分布函数仿照例1可得
• 如图2一1所示,F(x)为阶梯函数,分段区间为半闭半开区间,并且右 连续
上一页 返回
2. 4连续型随机变量及其概率密度
• 一、连续型随机变量及其概率分布
上一页 返回
2. 2离散型随机变量及其分布律
• 一、离散型随机变量
• 在某些试验中(例如 2. 1中的例1,例2,例3),随机变量的取值是有 • 限个或者无穷可列个.这一类随机变量通常称为离散型随机变量,下
面我们给出离散型随机变量的精确定义: • 定义1若随机变量X的所有可能取值为x1,x2,…,xn…,并且其 • 对应的概率分别为p1, p2,…,p n,…,即
• 注:实值单值函数指的是每一个。仅存在唯一一个实数X (ω)与之对应, 其中X (ω)是一个关干样本点的函数,值域为实数集.
• 随机变量可以根据它的取值分为离散型随机变量与非离散型随机变量, • 其中非离散型随机变量又可以进一步分为连续型随机变量与混合型随
机变量.在本书中我们主要学习的是离散型与连续型随机变量.
• 则称X为离散型随机变量,并且式(2.均称为随机变量X的概率分布, 又称分布律或分布列.
下一页 返回
随机变量及其分布
f ( x) lim
x 0
xLeabharlann x xlim P{x X x x} lim x
f (x)dx .
x 0
x
x 0
x
故 X的密度 f(x) 在 x 这一点的值,恰好是 X落在区间 (x,x+△x] 上的概率与区间长度 △x之比的极限. 这里,如果把概率理解为质 量, f (x)相当于线密度.
f (x)
a
ba
当x b时,
x
a
b
x
F (x) f (t)dt f (t)dt f (t)dt f (t)dt 1.
a
b
因此X ~ U(a, b)的分布函数为:
0
F ( x)
P( X
x)
x b
a
a 1
xa a xb
xb
例1 长途汽车起点站于每时的10分、25分、55分发
车,设乘客不知发车时间,于每小时的任意时刻随
解: 设X表示400次独立射击中命中的次数,则
X~B(400, 0.02),故 P{X2}=1- P{X=0}-P {X=1} =1-0.98400-(400)(0.02)(0.98399) =0.9972
例5 设有80台同类型设备,各台工作是相互独立的, 发生故障的概率都是0.01, 且一台设备的故障只能 由一个人处理. 考虑两种配备维修工人的方法,其一 是由4人维护,每人负责20台;其二是由3人共同维护 30台.试比较这两种方法在设备发生故障时不能及 时维修的概率大小.
称A为几乎不可能事件,B为几乎必然事件.
(4) 若x是f(x)的连续点,则 dF(x) F(x) f (x)
dx
设随机变量X的分布函数
F
随机变量及其分布
X
x1
x2
xn
P
p1
p2
pn
表4-2
由概率的定义可知,分布列中的pk 满足下列性质:
(1)pk 0 k 1,2 ,… 。
∞
(2) pk 1 。 k 1
下面介绍几种常见的离散型随机变量的分布。
1.两点分布(又称0–1分布)
引例3 一批产品共100件,其中有3件次品。从这批产品中任
取一件,考察取出的产品是正品还是次品,试用随机变量 描述试验的结果,并写出其概率分布。
特别地,当n 1时的二项分布就是0-1分布。
例1 某射手射击一次,命中靶心的概率为0.7,现该射手向靶心 射击5次,试求: (1)命中靶心的概率;(2)有3次命中靶心的概率。
解 设该射手命中靶心的次数为X,X的所有可能取值为0,1,2,3,
4,5。根据二项分布的定义X ~B(n,p) ,这里n 5, p 0.7 。 (1)可用{X 0} 表示事件{命中靶心},由互逆事件的概率公 式及二项概率公式得
1.2 离散型随机变量及其分布
定义2 设X是一个随机变量,如果X的所有可能取值是可数的, 则称X为离散型随机变量。
定义3 设X是一个离散型随机变量,其可能取的值为 xk ( k 1,2 , ) ,则称
P X xk pk k 1,2 ,
为X的概率分布,简称分布列或分布。
离散型随机变量X的概率分布也可以用表4-2的形式来表示。
pk P{X k} Ckn pk qnk (k 0 ,1,2 , ,n)
n
n
显然 pk 0 ,且 pk Ckn pk qnk p qn 1 。
k 0
k 0
如果随机变量X的概率分布为 P{X k} Ckn pk qnk (k 0 ,1,2 , ,n) ,其中 0 p 1,q 1 p,则称X服从参数为 的二项分布,记作 X ~B(n,p)。
随机变量及其分布
随机变量及其分布在我们的日常生活和科学研究中,常常会遇到各种各样的不确定现象。
比如,明天的天气是晴是雨,一场考试的成绩是高是低,或者在生产线上产品的质量是否合格等等。
为了更好地理解和描述这些不确定的情况,数学中引入了一个重要的概念——随机变量。
那么,什么是随机变量呢?简单来说,随机变量就是一个将随机试验的结果与实数对应起来的函数。
它的取值是由随机试验的结果决定的,并且具有不确定性。
举个例子,假设我们进行一次掷骰子的试验。
如果我们关心掷出的点数,那么可以定义一个随机变量 X ,它的值就是掷出的点数。
在这个例子中,随机变量 X 可能的取值就是 1、2、3、4、5、6 。
随机变量可以分为离散型随机变量和连续型随机变量。
离散型随机变量的取值是可以一一列举出来的,就像上面掷骰子的例子。
而连续型随机变量的取值则是在某个区间内连续变化的,比如测量一个人的身高,身高可以在一定的范围内取任意实数值。
了解了随机变量的类型,接下来我们看看它们的分布。
分布描述了随机变量取不同值的概率情况。
对于离散型随机变量,我们通常用概率分布列来描述它的分布。
概率分布列就是列出随机变量的所有可能取值以及对应的概率。
比如,对于上面掷骰子的随机变量 X ,它的概率分布列为:X : 1 2 3 4 5 6P : 1/6 1/6 1/6 1/6 1/6 1/6这个概率分布列清楚地告诉我们,掷出每个点数的概率都是 1/6 。
连续型随机变量的分布则通常用概率密度函数来描述。
概率密度函数并不是直接给出随机变量取某个值的概率,而是给出概率在某个区间内的分布情况。
比如说,正态分布就是一种常见的连续型分布,它的概率密度函数是一个钟形曲线。
在实际应用中,随机变量及其分布有着广泛的用途。
比如在保险行业,保险公司需要根据投保人的风险情况(可以用随机变量来表示)以及风险的分布来制定合理的保险费率;在质量控制中,通过对产品质量指标(随机变量)的分布进行分析,可以判断生产过程是否稳定,是否需要进行调整;在金融领域,股票价格的波动可以看作是一个随机变量,对其分布的研究有助于投资者做出合理的决策。
概率论与数理统计-随机变量及其分布-随机变量与分布函数
7
01 随机变量
如何描述随机变量的统计规律呢 ?
无论是离散型随机变量,还是连续型随机变量以及其他类型 的随机变量,都需要一种统一的描述工具.
对一个样本空间,当建立了随机变量后,我们感兴趣的随机 变量落在某区间或等于某特定值的概率. 为此给出分布函数的概 念.
8
本讲内容
01 随机变量 02 分布函数
02 分布函数 定义 设 X 为随机变量,x 是任意实数,称函数 为 X 的分布函数.
x
如果将 X 看作数轴上随机点的坐标,那么分布函数 F(x) 的
值就表示 X 落在区间
的概率.
10
02 分布函数
用分布函数计算 X 落在( a ,b ] 里的概率:
因此,只要知道了随机变量X的分布函数, 它的统计特性 就可以得到全面的描述.
分布函数是一个普通的函数,正是通过它,我们可以用数 学分析的分布函数
分布函数的性质
(1) F ( x ) 单调不减,即
(3) F ( x ) 右连续,即 如果一个函数具有上述性质,则一定是某个随机变量X 的分 布函数. 也就是说,性质(1)--(3)是鉴别一个函数是否是某随机变 量的分布函数的充分必要条件.
01 随机变量
随机变量 ( random variable ) 定义 设 S 是试验E的样本空间, 若
按一定法则
ω.
X(ω)
R
4
01 随机变量
随机变量通常用
X,Y,Z或 , ,等表示
随机事件可以通过随机变 量的关系式表达出来 例如 某人每天使用移动支付的次数——随机变量X {某天至少使用1次移动支付} {某天1次也没有使用}
12
02 分布函数
例 解
随机变量及其分布
随机变量及其分布随机变量及其分布随机变量及其分布一、随机变量的概念前一章建立了随机事件及其概率的概念。
我们发现有些试验的结果,直接表现为数量。
比如,在抽样检验产品中,出现废品的个数;在供电问题中,人们关心的是在某段事件内,同时工作的车床数目;射击时弹着点与目标的距离等。
尽管有些试验的结果没有直接表现为数字,但我们仍然可以用数字来表示它。
比如,一次试验中,试验成功记为1,试验失败记为0;产品检验中,优质品记为2,次品记为1,废品记为0等等。
由此可见,对于任何一个试验的各种基本结果,都可以用数量与之对应。
尽管由于随机因素的作用,试验的结果有多种可能性,但是对于试验的每一个结果ω,都可以用一个实数x(ω)来表征:试验的结果不同,x(ω)可能取不同值,因而是一个变量,故x(ω)是试验结果的函数.我们称这种变量x(ω)为随机变量,简记为x.随机变量作为样本点的函数,有两个基本特点,一是变异性:对于不同的试验结果,它可能取不同的值,因此是变量而不是常量;二是随机性:由于试验中究竟出现哪种结果是随机的,因此该变量究竟取何值是在试验之前,事先无法确定的,直观上,随机变量就是取值具有随机性的变量。
根据取值情况随机变量可以分为两大类:离散型和非离散型。
离散型随机变量的所有可能取值为有限个或至多无穷可列个;非离散型随机变量的情况比较复杂,它的所有可能取值不能够一一列举出来。
其中的一种对于实际应用最重要,称为连续型随机变量,其值域为一个或若干个有限或无限区间。
今后我们主要研究离散型和连续型两种随机变量。
二、离散型随机变量的概率分布定义2.1:如果随机变量x只可能取有限个或至多可列个值,则称x为离散型随机变量。
定义2.2:设x为离散型随机变量,它的一切可能取值为x1,x2,……,xn,……,记p=p{x=xn},n=1,2……(2.1)称(2.1)式为x的概率函数,又称为x的概率分布,简称分布。
离散型随机变量的概率分布有两条基本性质:(1)pn≥0n=1,2,…(2)∑pn=1对于集合{xn,n=1,2,……}中的任何一个子集a,事件“x在a中取值”即“x∈a”的概率为p{x∈a}=∑pn特别的,如果一个试验所包含的事件只有两个,其概率分布为p{x=x1}=p(0 p 1)p{x=x2}=1-p=q这种分布称为两点分布。
随机变量及其分布
随机变量及其分布
定义2.1
设随机试验的样本空间为 e,X X e 是定义在样本
空间 Ω 上的实值单值函数,称之为随机变量(Random variable)。
定义2.2
设 X 是随机变量,x 为任意实数,函数
F x PX x
称为 X 的分布函数(Distribution function)。
3.
F lim F x 0,F lim F x 1 。
x
x
4. F x为右连续,即
F
x0
Hale Waihona Puke 0limx x0
F
x0
F
x0
,x0
R
概率论主要是利用随机变量来描述和研究随机现象,而利用 分布函数就能很好地表示各事件的概率。例如,
PX a 1 PX a 1 Fa PX a Fa 0 PX a Fa Fa 0
对于任意实数 x1,x2 x1 x2 ,有
Px1 X x2 PX x2 PX x1 F x2 F x1 (2.1)
因此,若已知 X 的分布函数,我们就能知道 X 落在任一区
间 x1,x2 上的概率。从这个意义上说,分布函数完整地描述
了随机变量的统计规律性。
如果将 X 看成是数轴上的随机点的坐标,那么,分布函数F x
概率学与数理统计
Pa X b PX b PX a Fb 0 Fa
Pa X b PX a Pa<X b
Fa Fa 0 Fb Fa
Fb Fa 0
随机变量的分类:
1. 离散型随机变量:随机变量只取数轴上的有限个或可列个点。 2. 连续型随机变量:随机变量的可能取值充满数轴上的一个或 若干区间。 3. 奇异型随机变量:既不是离散型随机变量,也不是连续型随 机变量。在理论上很有价值,而实际问题中很少有应用。
随机变量及其分布公式
随机变量及其分布公式可以用二项分布来描述。
二项分布是一种离散型概率分布,它描述了在n次独立重复试验中,恰好发生k次某事件的概率。
3,二项分布的概率分布:设某事件在一次试验中发生的概率为p,不发生的概率为1-p,则在n次独立重复试验中,恰好发生k次这个事件的概率为P(x=k)=C(n,k)p^k(1-p)^(n-k)其中,C(n,k)表示从n个不同元素中取出k个元素的组合数,即C(n,k)=n!/k!(n-k)!4,二项分布的性质:1)二项分布是离散型概率分布;2)二项分布的期望值为np,方差为np(1-p)。
1.二项分布:在n次独立重复试验中,事件A发生的概率为p,事件A恰好发生k次的概率为P(X=k)=C(n,k)p^k(1-p)^(n-k),记作X~B(n,p)。
其中,p为成功概率,k为发生次数,n为试验次数。
2.离散型随机变量的均值:如果离散型随机变量X的分布列为p1,p2.pn,则随机变量X的均值或数学期望为E(X)=Σ(xi*pi),即所有取值与对应概率的乘积之和,反映了离散型随机变量取值的平均水平。
3.均值的性质:如果Y=aX+b,其中a和b是常数,X是随机变量,则Y也是随机变量,且有E(aX+b)=aE(X)+b。
4.常用分布的均值:1) 两点分布:E(X)=1*p+0*(1-p)=p。
2) 二项分布:E(X)=np。
3) 超几何分布:E(X)=nM/N。
5.离散型随机变量的方差:离散型随机变量X的方差D(X)描述了随机变量X与其均值E(X)的平均偏离程度,其算数平方根σX为随机变量X的标准差。
方差的计算公式为D(X)=Σ[(xi-E(X))^2*pi],即所有偏离程度的平方与对应概率的乘积之和。
6.方差的性质:1) 常数的方差为0.2) 随机变量与常数之和的方差等于这个随机变量的方差本身。
3) 随机变量与常数之积的方差等于这个常数的平方与这个随机变量方差的积。
7.常用分布的方差:二项分布的方差为D(X)=np(1-p)。
随机变量及其分布
也可以是等式或是不等式。 X ∈ L 也可以是等式或是不等式。
如在掷骰子试验中,用X表示出现的点数,则 如在掷骰子试验中, 表示出现的点数, A=“出现偶数点”可表示为: X=2} X=4} X=6} A=“出现偶数点”可表示为:{X=2}∪ {X=4} ∪{X=6} 出现偶数点 B=“出现的点数小于4 可表示为: 4} {X≤ B=“出现的点数小于4”可表示为:{X< 4}或{X≤3} 出现的点数小于
F(x) = P( X ≤ x)
为随机变量X的分布函数 随机变量X
F(x)是一个 F(x)是一个 普通的函数! 值域为 值域为 [0,1]。
定义域为 定义域为
(-∞,+ ); (- ,+∞); ,+
分布函数的性质
单调不减性 右连续性 非负有界性 规范性
若x1 < x2 , 则F ( x1 ) ≤ F ( x2 )
2)
∑p
k =1
∞
k = 1, 2,
k
=1
设离散型随机变量X的分布律为 例3 设离散型随机变量 的分布律为 P(X= xi) = pi i = 1、2、… ( 、 、 其中 0 < p <1 ,求 p 值。
解:
1= ∵ ∑ P ( X = xi )
i =1
+∞
p =∑p = 1 p i =1
i
一般地, 一般地,对离散型随机变量 X~P(X= xk)= k, k=1, 2, … ~ ( )=p = 其分布函数为
F ( x) = P ( X ≤ x ) =
k : xk ≤ x
∑
pk
分布律确定事件的概率 例2中,得到 的分布律为 中 得到X的分布律为
随机变量及其分布
随机变量(random variable)表示随机试验各种结果的实值单值函数。例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数等等,都是随机变量的实例。
所谓随机变量,就是试验结果和实数之间的一个对应关系,这与函数概念本质上是相同的,只不过在函数概念中,函数f(x)的自变量是实数x,而在随机变量的概念中,随机变量X的自变量是试验结果。
(1)恰好有三家煤矿必须整改的概率;
(2)至少关闭一家煤矿的概率。(精确到 )
粒种子分种在甲、乙、丙 个坑内,每坑 粒,每粒种子发芽的概率为 ,若一个坑内至少有 粒种子发芽,则这个坑不需要补种;若一个坑内的种子都没发芽,则这个坑需要补种。
(1)求甲坑不需要补种的概率;
(2)求 个坑中需要补种的坑数 的分布列;
设随机变量 服从标准正态分布 ,若 ,则 ()
A. B. C. D.
设随机变量 ,且 ,则c等于()
设 的概率密度函数为 ,则下列结论错误的是()
(A) (B)
(C) 的渐近线是 (D) ~
设随机变量 服从正态分布 ,记 ,则下列结论不正确的是()
A. B.
C. D.
在某校举行的数学竞赛中,全体参赛学生的竞赛成绩近似服从正态分布 。已知成绩在90分以上(含90分)的学生有12名。
特殊的离散型随机变量:
1.两点分布
如果随机变量X的分布列为:
X
1
0
P
p
q
其中0<p<1,q=1-p,则称离散型随机变量X服从参数为P的两点分布。
两点分布也称为(0—1)分布。也即是伯努利实验的分布。
篮球运动员在比赛中每次罚球命中得1分,罚不中得0分,已知他命中的概率为0.7,求他罚球一次得分的分布列。
随机变量及其分布总结
随机变量及其分布总结一、随机变量随机变量(Random Variable)是概率论中的重要概念,它是表示一个随机实验的可能结果及这些结果发生的概率的指标,是随机现象中的重要解释指标。
随机变量由它的取值所确定,特点是:(1)它是一类不能确定的数,因此不能被直接测量,但是可以用概率来描述它;(2)它表示了实验结果的取值;(3)它可以表示有一定规律的实验结果,也可以表示没有规律的实验结果;(4)它用其取值及概率分布表示一个随机实验的结果,即实验结果的不确定性;(5)它可以用来描述随机实验中各可能结果对概率的影响,从而探究随机现象的规律性。
二、随机变量的分类根据随机变量的取值类型,随机变量可分为定型随机变量和随机变量。
(1)定型随机变量定型随机变量也称为离散型随机变量,它会取值完全可以确定的一组可数的取值。
其具体分类包括:(a)伽玛分布(Gamma Distribution):它是一种对数正态分布,可用来模拟某些自然现象,如系统失效时间的分布。
(b)指数分布(Exponential Distribution):这是一种特殊的定型随机变量,它可以用来模拟服从指数分布的概率分布函数或者指数函数,常用来描述生存分析中系统的衰减过程。
(c)伯努利分布(Bernoulli Distribution):这是一种概率分布,它是一种若干独立实验中,某个事件出现的概率。
(d)泊松分布(Poisson Distribution):它是描述某一时间段内发生的事件的概率分布,可用来模拟客流量等自然现象中的随机变量。
(2)随机变量随机变量又称为连续型随机变量,它的取值范围是无限的,其取值受随机实验影响,其取值不能确定,但可以描述它的概率分布。
具体分类包括:(a)正态分布(Normal Distribution):正态分布具有非常广泛的应用,它可用来描述许多现实世界中的现象,如智力、体重等。
(b)卡方分布(Chi-square Distribution):卡方分布是在实验设计中非常常见的概率分布,它包含了有关实验结果的统计量,如样本均值、样本方差等。
随机变量及其分布正态分布
03
社会科学
在社会科学领域,有些数据的分布也 呈现出正态分布的特点,例如人类的 考试分数、人口数量等。
04
正态分布的数学表达与计 算
正态分布的概率密度函数
正态分布的概率密度函数表达式为:f(x) = 1 / (σ√(2π)) * exp(- (x - μ) ^ 2 / (2σ^2)),其中μ是均值,σ是标准差。
随机变量及其分布正态分布
2023-11-03
contents
目录
• 随机变量及其分布 • 正态分布 • 正态分布的应用场景 • 正态分布的数学表达与计算 • 正态分布的统计特性与参数估计 • 正态分布的假设检验与模型评估
01
随机变量及其分布
离散随机变量及其分布
伯努利分布
离散型概率分布,成功概率为p,失败概率为1-p。
指数分布
连续型概率分布,表示某个事件在单位时间内发生的概率,其中平均发生率为 λ。
均匀分布与指数分布
均匀分布:连续型概率分布,表示在某个区间内随机变量以相同的概率取值。 指数分布与泊松分布在一定条件下可以相互转换。
02
正态分布
正态分布的定义
定义
如果一个随机变量的概率密度函数是具有均值μ和标准差σ的高斯函数,则称 该随机变量服从正态分布,记作N(μ, σ²)。其中,μ是均值,σ²是方差。
05
正态分布的统计特性与参 数估计
均值与方差
均值
正态分布的平均值,描述了分布的中心位置。
方差
衡量分布的离散程度,描述了分布的宽度。
偏度与峰度
偏度
描述分布的不对称性,正态分布一般为对 称分布。
VS
峰度
描述分布的尖锐程度,正态分布的峰度为 3。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 随机变量及其分布§2.1 随机变量一、 概念对于随机试验:E: },,,{AB B A B A B A S =,X 表示射击中靶的次数,对应的取值为;0,1,2。
定义:随机变量是定义在样本空间S={ω}上的一个单值实函数,记作X=X(ω),简记为X 。
二、 分类1、 离散型随机变量2、 非离散型随机变量§2.2离散型随机变量一.离散型随机变量的分布设离散型随机变量可能取的值为:,,,21 x x 取这些值的概率为P(X=i )= p i ,i=1,2,... (2.1) 称(2.1)式为离散型随机变量X 的分布律。
(2.1)式也可以用表格的形式表示如下:上述表格称为离散型随机变量X 的分布列,分布列也可以表示成下列矩阵的形式:⎪⎪⎭⎫ ⎝⎛ i i p p p x x x 2121离散型随机变量的分布律,分布列(以及下一节介绍的分布函数)统称为离散型随机变量的概率分布,简称为离散型随机变量的分布。
根据概率的性质,可知离散型随机变量的分布律具有下列性质(1)p i ≥0,i=1,2,...(2)1=∑iip常见的几种分布 1、 单点分布例: 若随机变量X 只取一个常数值C ,即P(X=C)=1,则称X 服从单点分布。
(也叫退化分布。
)2、0-1分布例:若随机变量X只能取两个数值0或1,其分布为0<p< 1,q=1-p,或记为P(kX=)=p k q1-k ,k=0,1 则称X 服从参数为p 的两点分布或参数为p的0-1分布。
3、几何分布例:一射手每次打靶射击一发子弹,打中的概率为p(0<p<1),不中的概率为q=1-p.今向靶作独立重复射击,直到中靶为止,则消耗的子弹数X 是一个离散型随机变量,其分布为或记为P(k X=)=pq k1-, k=1,2, ...则称X服从参数为p的几何分布。
4、超几何分布例:设一批同类型的产品共有N件,其中次品有M 件。
今从中任取n(假定nN-M)件,则这n 件中所含的次品数X 是一个离散型随机变量,其分布为nNm n MN m M C C C m X P --==)(,m=0,1…,k ,k=min(M,n)则称X 服从超几何分布。
(二) 二项分布在n 重伯努利试验中,事件A 发生的次数X 是一个离散型随机变量,其分布为P( X= k )=kn kk nq p C -,k=0,1,2,⋯,n,称X 服从参数为n ,p 的二项分布。
记为),(~p n B X 。
例2:P39. 例3:P40.在电脑上,应用相应的数学或统计分析软件,这些概率是很容易计算出来的,所以,还有必要用逼近的方法吗?泊松分布1. 定义若离散型随机变量X 的分布为λλ-==e k k X P k!)(,k=0,1,2,⋯其中常数λ>0,则称X 服从参数为λ的泊松分布,记为)(~λπX 。
2. 泊松Poisson 定理P41,设有一列二项分布X ~B(n p n ,),n=1,2, ...,如果λ=∞>-nn np lim , λ为与n 无关的正常数,则对任意固定的非负整数k ,均有{}λλ--∞→∞→=-==e k p p C k X P k kn n kn k n n n n !)1(lim lim证略。
例5:P43.例6:P44,自学。
§2.3随机变量的分布函数一、概念定义2.1设X 是一随机变量(不论是离散型还是非离散型),对任意的实数,令 )()(x X P x F ≤= (2.11) 则称F ()为X 的分布函数。
例1:(书上例2.8)设X 服从参数为p 的(0-1)分布,即:k q p k X P k-==1)(,k =0,1,其中0<p<1,q=1-p.求X 的分布函数F(). 例: 设R.V. X 的分布函数为⎪⎪⎩⎪⎪⎨⎧≥<≤<≤--<=31318.0114.010)(x x x x x F 求X 的概率分布。
二、性质性质1 若1<2,则F(1)F(2).即F()是的单调不减函数。
性质2对任意的实数,均有0 F() 1 (2.15) 且0)(l i m =-∞→x F x (2.16) 1)(l i m=+∞→x F x (2.17)性质3对任意的实数0,有)()(0lim 0x F x F x x =+→ (2.18)即F()在轴上处处右连续。
证明见P-44.性质4若F()在X=0处连续,则P(X=0)=0 性质5P(a<X ≤b)=F(b)-F(a) 例: 设R.V.X 的分布为⎩⎨⎧<>-=-0,00,)(3x x e A x F x 确定A ,且求P(-1<≤2)§2.4连续型随机变量一、 定义2.2设随机变量X 的分布函数为F(),如果存在一个非负可积函数f(),使对任意的实数,均有 F()=⎰∞-x dt t f )( (2.20) 则称X 是连续型随机变量,称f()是X 的概率密度或密度函数,简称密度。
二、图形分布函数dte x F t x222)(21)(σμσπ--∞-⎰=图形:data normal;do x=-3to 5by 0.01;y=PROBNORM(x);output ; end ; run ;procgplot data =normal; plot y*x=1;symbol1v =none i =join r =1c =black; run;三、性质性质1f()0 (2.21)性质2⎰∞∞-=+∞=1)()(F dx x f (2.22) 性质3 P(a<Xb)=F(b)-F(a)= ⎰b adx x f )((2.23)性质4在f()的连续点处,有 )(x f =)(x F '(2.24)性质5在f()的连续点处,当x ∆>0,且很小时,有P(<X)=+x ∆⎰∆+∆≈xx x x x f dt t f )()( 几点说明:1. 由5可以看出f()值的大(小)反映R.V .X 在邻域概率的大(小)。
2. 连续型随机变量X 取任一点0的概率为零。
即:P(X=0)=0。
3. 连续型随机变量X 的密度函数为f(),则它取值于区间(a,b )、(a,b]、[a,b )、[a,b]上的例:(第一版)已知随机变量⎪⎩⎪⎨⎧>-<+=0,210,21)(~x e B x e A x F X xx (1) 确定A 和B ;(2)求)(x f ;(3)求)21(≤<-X P 二、均匀分布例:设R.V.⎩⎨⎧≤≤=其它,0,)(~b x a k x f X ,称X 在[a ,b]上服从均匀分布。
(1)确定k 。
(2)求P(α<X α+s)(a<α<α+s<b)。
(3)写出X 的分布函数F()。
定义:若随机变量X 的概率密度为⎪⎩⎪⎨⎧≤≤-=其他01)(b x a ab x f 则称X 在[b a ,]上服从均匀分布,记为X ~U[a,b],相应的分布函数为⎪⎩⎪⎨⎧≤<≤--<=x b bx a ab a x a x x F 10)( 一般地,设D 是轴上一些不相交的区间之和,若X 的概率密度为⎪⎩⎪⎨⎧∉∈=D x D D x f 01)(的长度则称X 在D 上服从均匀分布。
如果],[~b a U X ,则对于满足b d c a ≤<≤的任意的d c ,,有dx ab d Xc P dc⎰-=≤≤1)(=)(1c d a b -- (2.32) 三、指数分布若随机变量X 的概率密度为⎩⎨⎧<≥=-00)(x x e x f xλλ(2.33)其中常数0>λ,则称X 服从参数为的指数分布,相应的分布函数为⎩⎨⎧<≥-=-001)(x x e x F xλ (2.34)例:(第一版书上例2.12)经过长期的观测,对某些电子元件的寿命可作如下假定:在已使用了th 的条件下,在以后的th 内损坏的概率为)(0t t ∆+∆λ,其中是不依赖于t 的常数;电子元件寿命为零的概率是零,求电子元件在内损坏的概率。
略 四、正态分布1、定义:若随机变量X 的概率密度为222)(21)(σμσπ--=x ex f , +∞<<∞-x (2.35)其中σμ,都为常数且0>σ,则称X 服从参数为σμ,的正态分布,记为),(~2σμN X ,有时也简称X 为正态随机变量。
X 的分布函数为dte x F t x222)(21)(σμσπ--∞-⎰=(2.36)2、 验证dt e t x dx e F t x 22)(2222121)(-∞+∞---∞+∞-⎰⎰==-=+πσμσπασμ令 12212122=∙==⎰∞+∞--πππdt e t 3、 作出)(x f 的图形10)(21)('222)(3=--=--σμμσπx e x x f ,得驻点μ=x , 0201)(21)(''222)(223=⎥⎦⎤⎢⎣⎡--=--σμσμσπx e x x f 得0≠=μx , 03lim±∞→x 0)(=x f作图SAS 程序:data normal;do i=-3to 3by 0.01;z0=exp(-i**2/2)/sqrt(2*(3.1415926)); output ; end ; run ;procgplot data =normal; plot z0*i=1;symbol1v =none i =join r =1c =black;run;注意:一定要和由正态随机数区别开来。
如下面产生的是正态随机数。
data normal;retain _seed_ 0; do _i_ = 1to 1000;z = 0 + 1 * rannor(_seed_); output ; end ;drop _seed_ ; run ;procgplot data =normal; plot z*_i_=1 ;symbol1v =none i =join r =1c =black; run ;4、 性质:(1) f(x)的图形是关于直线x=μ对称的曲线 (2)σπμ21)(=f 为最大值,当x 远离μ时,f(x)→0(3) 当μ固定而变化时对图形的影响,↓小↑)(x f 大,分布曲线在μ=x 形成陡峭的高峰。
↑大↓)(x f 小,分布曲线在μ=x 变成缓峰。
μ=2, =0.5, 1, 2data normal;do i=-2to 6by 0.01;z0=exp(-(i-2)**2/2)/sqrt(2*(3.1415926));z1=exp(-(i-2)**2/(2*0.25))/(0.5*sqrt(2*(3.1415926))); z2=exp(-(i-2)**2/(2*4))/(2*sqrt(2*(3.1415926))); output ; end ;procgplot data =normal;plot z0*i=1z1*i=1z2*i=1/overlay ; symbol1v =none i =join r =1c =black; run;μ=2, =0.5, 1, 2, 5, 10图形:data normal;do i=-5to 9by 0.01;z0=exp(-(i-2)**2/2)/sqrt(2*(3.1415926));z1=exp(-(i-2)**2/(2*0.25))/(0.5*sqrt(2*(3.1415926))); z2=exp(-(i-2)**2/(2*4))/(2*sqrt(2*(3.1415926))); z3=exp(-(i-2)**2/(2*25))/(5*sqrt(2*(3.1415926))); z4=exp(-(i-2)**2/(2*100))/(10*sqrt(2*(3.1415926))); output ; end ; run ;procgplot data =normal;plot z0*i=1z1*i=1z2*i=1z3*i=1z4*i=1 /overlay ; symbol1v =none i =join r =1c =black; run;(4) 当固定而当μ变化时对图形的影响是分布曲线形状不变,仅曲线左、右平移。