概率密度和分布函数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解:用超几何分布模型计算:
N 40, k 3, n 5
p h i; 40,5,3 C 3 1 C 37 4 C 3 2 C 37 3 C 3 3 C 37 2 C 40 5
i 1 3
0.3376
超几何分布
多项分布
分布模型条件(二项分布的一种扩充模型 ):
(1)每次观测可以有k种可能的结果出现: r 1 , r2 , 结果都相互排斥。
, rk

,而各种
(2)各种结果出现的概率分别为常数: p1 ,
p2 ,
, pk
(3)每一次观测均为独立,即每次观测的结果不受其他任何一次观
测的影响。
多项分布
x1 次 r1, x2 次 r2,…,xk 次 rk 的概 则n次试验的结果,出现:
率系多项分布,表示为:
m x1 ,
C n x1 , x2 ,
, xk ; p1 ,
x2 , xk p1x1 p2
, pk , n
pkxk
n! x2 p1x1 p2 x1 ! x2 ! xk !
pkxk
负二项分布
分布模型条件: (条件与二项试验相仿,考虑问题的角度相反 )
(1)由多次独立观测构成的试验。
(2)每次观测只有“是”和“非”两种可能的结果出现。
(3)结果为“是”的概率为常数p。
得到k次“是”所需的观测次数x的概率系负二项分布:
nb x; k , p C x 1 k 1 p 1 p
k


xk
x 1! x k p k 1 p k 1! x k !
[1]算术平均值 总体:
pi xi 离散 , pxdx 连续
一阶原点矩
(随机变量取值可能 性最大的位置)
样本:
x
x
i 1
n
i
n
n
0 1
一阶原点矩的 样本估计值
随机变量及其分布:
概率分布的数字特征
[2]方差
总体:
2 2 N f jxj f jxj j j 2 N N 1 2 2 2 px dx pxdx
三阶中心矩和 二阶中心矩的 3/2次幂的商
(曲线偏离对称的程度)


样本:3
xi x
3
/n
2
xi x n

3 2
n 3
3
2
3 2
样本估计值
随机变量及其分布:
概率分布的数字特征
[4]峭度或峰态
(4)每一次观测均为独立的,即每次观测的结果不受其
它任何一次观测的影响。
二项分布
在n次观测中“是”出现x次的概率呈二项分布,模型:
b x; n, p C n x p 1 p
x
n x
n x n! n x n x x p 1 p p 1 p x ! n x ! x
超几何分布的数字特征:
nk np N N n 2 np 1 p N 1
x 5, p 0.01
g 5;0.01 0.01 0.99 0.0096
4
超几何分布
是二项分布的一种变型,其条件为:
(1)对象为有限的N个物体,其中k件为“是”,N-k为“非”。 ( 2 )从 N 个物件中,随机地逐个取出 n 件,且每次取出后没有替换。
则在n件中出现“是”的次数x系超几何分布,其模型描述为:
C 7 1 5 1 0.6 0.4
5


7 5
0.1866
负二项分布
负二项分布的数字特征为:
k p
k 1 p p2
2
3
2 p k 1 p
6 1 p p 2 4 3 1 p
几何分布
这是负二项分布当 k 1 时的一个特例,即:得到第一次 “是”所需要的试验次数为x时的概率。设,出现“是” 的概率为p,几何分布的模型描述为:
总体:
四阶中心矩和二阶 中心矩平方的商
(一阶原点矩附近的斜率, 和偏离后斜率的变化率)


4 样本:
xi x / n
4 i
xi x 2 i n
2
n 4
4 2 2
样本估计值
随机变量及其分布:
x 0,1, 2, ,n
C(n|x)表示组合数,即从n个事物中拿出x个的方法数.
二项分布
二项分布的数字特征:
x z1 z2
总体平均值
zn
ቤተ መጻሕፍቲ ባይዱ
其中 z i 可以是0或1,表示“非”或 “是”。
对 z i 的方差
i
n E x E zi E z1 E z2 i 1
将上表数据从 x 1.0 到 x 1.9 取级宽0.1分为9级
分级频数分布图
级频数
0.3 0.25 0.2
频率
16 12 8 4 0
0.15 0.1 0.05 0 1 1.2 1.4 级中值 1.6 1.8
级频数
频率
概率密度
为了使分布图有更好的泛化可以性,将相对频数除以级 宽,得到概率密度:
g x; p p 1 p
几何分布的数字特征为:
x 1
, x 1, 2,3,

1 p
2
1 p p2
2 p 3 1 p
9 1 p p 2 4 1 p
几何分布
[例] 由统计结果已知某生产过程平均每 100件产品中有 1 件废品。随机检查到第5件产品,发现废品的概率为多少? 解:这是几何分布, ,则
h x; N , n, k
C k xC N k n x C N n


k ! N k !n ! N n ! x ! k x ! n x ! N k n x ! N !
超几何分布
[例] 某车间生产的元件按40个装箱后进行质量检验,其步骤为:从 每箱随机检查5个元件,若出现二等品,则把该箱退回车间返装。现 若车间采取每40个元件中允许有3个二等品的质量控制标准,则返装 的概率p为多少?
观测数据的分析与处理
随机变量及其分布:概率密度和分布函数
重点: 介绍有关随机变量和概率分布的基本概念,讨论各种常见的 有实用价值的分布函数。
[例]设某工厂产品中成分A的含量受不可控的随机因素影 响而有波动。工厂每2小时测量一次A的百分含量,记为x。 下表是一个时间段的数据。
日期 1 2 3 4 5 1.40 1.46 1.70 1.46 1.58 1.28 1.50 1.62 1.38 1.38 1.36 1.58 1.58 1.42 1.34 1.38 1.54 1.62 1.38 1.28 产品中成分A的百分含量数据 1.44 1.50 1.76 1.60 1.18 1.40 1.48 1.68 1.44 1.08 1.34 1.52 1.68 1.46 1.36 1.54 1.58 1.66 1.28 1.50 1.44 1.52 1.62 1.34 1.46 1.46 1.46 1.72 1.38 1.28 1.80 1.42 1.60 1.24 1.18 1.44 1.58 1.62 1.36 1.28
, x k , k 1, k 2,
负二项分布
[例] 由统计知道某药剂的有效率为 60%,将该药剂用于 一组病人。当用到第7名病人时,累计有效的病人数增加 到5名的概率为多少?
解:除了最后一次按题意必须成功之外,其余(7-1)次
中有(5-1)次成功的方式共有 C 6 4 种,因此,满足要 求的概率为:
2 2
np 1 p
3
1 2 p np 1 p
1 6 p 1 p np 1 p
4 3
二项分布
[ 例] 已知某厂生产某 A产品的合格率75%,现进行一试验,随机地检 查3个产品,看它是否合格。定义不合格产品为“是”,则试验结果为 “是”的次数x作为随机变量,可取:0,1,2,3中一个值。
离散 , 连续
二阶中心矩
(随机变量的变异程度)


2 s 样本:
x x
i 1 i
n
n 1

n x xi
2 i i
2 n 2 2
n n 1
二阶中心矩的 样本估计值
随机变量及其分布:
概率分布的数字特征
[3]偏斜度
3 f x / N j j j 3 3 2 2 f j xj / N 总体: j 3 p x dx 3 3 2 2 p x d x
2 k k 1 1 2 E x u x j ; k x j x j k j 1 12 2 2
1 k k 1 E x u x j ; k x j x j k j 1 2 j 1
2 2
E zn p
z2n
p np
总体的方差为
2 z2 z2
1 2
z2 E zi E zi E zi p
E zi2 2 pE zi p 2 p 1 p E zi2 p 2 1 p 0 p 1 p 2
随机变量及其分布:
概率密度和分布函数
级宽或段宽
x j xb xa j
(将随机变量x的整个取值范围分成有限个区段,每个级 段的取值范围即为级宽或段宽)
级频数
Fj
(每个级段中数据值出现的次数)
相对频数或频率
f j Fj / SF
SF Fj
(将级频数被样本中数据总个数相除,相当于x取值在该 级段的概率。)
离散型随机变量的概率分布
客观世界很多随机过程经分析后可以用某种数学模型表 示。不同的物质现象有可能用类似的模型描述。 重点:介绍若干重要的随机分布模型。 离散均匀分布 二项分布 多项分布 负二项分布 几何分布 超几何分布 扩充几何分布 泊桑分布
离散均匀分布
分布模型条件: (1)每次试验可以有k种结果: x1 , x2 , , xk (2)每种结果出现的概率均相等。 1 数学模型: u x; k , x x1 , x2 , , xk k 均匀分布的数字特征:
pj
级宽取微量:
Fj / SF x j

f j
x j
df p dx
概率密度p对x的曲线称为概率密度分布曲线,简称概率 分布曲线、分布曲线等。
随机变量及其分布:
概率分布的数字特征
不同性质事物对象具有各种不同形状的分布,为了定量 地区别各种分布的特征,通常采用的一组判别指标,称 为分布的数字特征。
4 f x / N j j j 4 2 2 f j xj j N 4 p x dx 4 2 2 p x dx
k
3 0
0.6 3k 7 4 2 4 4 2 k x j / x j 2 2 k 1 j 1 j 1
k k 2 2
二项分布
分布模型条件:
(1)设试验系由n次观测组成。 (2)每次观测只有“是”和“非”两种可能的结果出现。 ( 3 )观测结果中出现“是”的概率为常数 p ,而出现 “非”的概率为q=1-p。
相关文档
最新文档