测量值和随机误差的概率分布

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总之σ决定了正态分布曲线的形状,曲线形状则生 动直观地表明了测量值的离散程度(见图2-4)
相同
2 1
f (x)
1
2
x
图2-4 与正态分布曲线的形状
• 由于正态分布曲线完全决定于µ和σ ,一旦它们 确定之后,正态分布曲线就完全确定了,所以 正态分布记为
N (, 2)
• 测量及其统计处理的最终目的是为了较正确地 估计出这两个参数
第二章
测量值和随机误差的 概率分布
• 随机误差服从一定的统计规律。
• 随机误差的波动变化将导致测量值的波动变化, 所以在多次测定中,测量值与随机误差一样,也 服从一定的统计规律。
• 这种统计规律称为测量值和随机误差的概率分布。
§2-1测量值的分布
2-1-1 频率分布(requency distribution) • 在相同条件下,重复测定某合成反应产物的百分
f (u)
0.4 0.3 0.2 0.1
-3 -2 -1 0 1 2 3 u
图2-7标准正态分布曲线
§2-4 积分概率
2-4-1总概率
• 已知直方图中所有矩形面积的总和为1,恰好
等于样本中所有测量值出现的总频率。由此
类推,正态分布曲线与横轴所围的面积为1
一 总体中所有测量值出现的总概率为1
f (x)dx 1
f ( x) 1 e(x )2 / 2 2
2
1
u2
f (x)
e2
2
• 由 x u
•得 •则 •即 •故
dx du
f (x)dx
1
u 2
e 2 du
2
f (x)dx f (u)du
f (u)
1
u2
e2
2
(2-18)
随机误差的正态分布密度,正态分布的正态密度函数 u为以标准偏差为单位的随机误差
2
说明测量值落在µ的邻域内的概率最大,表明了测 量值向µ集中的趋势。
(3)曲线左右两侧快速单调下降,并分别以横轴为 渐近线
说明测量值落在µ两侧各点邻域内的概率依次快速 减小,且极大和极小的测量值出现的概率极小, 表明了测量值的分散程度。
• 总之,测量值既分散,又向µ集中,µ决定了正态 分布曲线在横轴上的位置(见图2-2)。

时, r=0
f (r) 1
2
• 曲线的形状仅随σ而变(见图2-5),此正态分布记为
N (0, 2 )
相同
f (r)
2
1 2 2
1
O
r
图2-5随机误差的正态分布曲线
2-2-3 N ( , 2 )与N (0, 2 )的比较
• 对于n个测定结果 (n )
x1,x2 ,------,xn
• 由于 r x
相同
f (x)
1 2
1 2
x
图2-2 与正态分布曲线的位置
2 总体标准偏差 (1)正态分布曲线上的两个拐点到对称轴
x 的距离均为
f (x)
x
图2-3正态分布曲线的两个拐点
(2)σ小(精密度高),两拐点间距小,曲线左右两 侧收得拢,显得“瘦高”,测量值比较集中
(3)σ大(精密度低),两拐点间距大,曲线左右两 侧张得开,显得“矮胖”,测量值比较分散
2
(2-12)
• 以f(x)对x作图,得到测量值的概率分布曲线,又 称为正态分布曲线。
• 不仅是测量值,弹着点,产品质量,农作物产量, 人体身高、体重,开门时的脚迹、手迹---,都符 合正态分布。
• 它是概率论中较重要的一种分布。
1 总体平均值µ (1)正态分布曲线以直线 x=µ为对称轴 (2)当x=µ时,是分布曲线的最高点 f (x) 1
•令 •即
f (r)
1
r2
e 2 2
2
f (x)dx f (r)dr
(2-15)
• f(r)为随机误差的正态分布密度函数,r为随机 误差
2-2-2 正态分布
• 因为
1
lim n n
1
ri
lim
n
n
(xi )
lim 1 n n
xi
0
(2-16)
• 即随机误差的总体平均值为0
• 所以正态分布曲线的位置是确定的,在曲线最高
• 此时纵坐标由相对频率转化为相对概率,即微小 区间 xi , xi x 上的平均概率密度(或对应小区间为 单位长度时的概率)。
•令
lim ni x0 n x
f
(xi )
• 则 f (xi ) 即为点xi上的概率密度
1 概率密度的一般定义式
lim p dp f ( x ) x0 x dx
• 式中: p lim ni n n
(2-8)
• 视为概率在微小区间 xi , xi x 上的增量
2 由概率密度定义推论 (1)点上的概率为零
f (x) dx f (x) 0 0
某点的概率密度大,则测量值在该点附近的概率大
(2)无穷小区间上的概率
dp f (x)dx
(2-9)
(3)区间(a,b)上的概率
b
P(a,b) a f (x)dx
§2-2 随机误差的分布
2-2-1 随机误差的正态分布密度函数
• 将测量值x换做单次测量的偏差r
•令 •则 • 变为
r x
f ( x) 1 e(x )2 / 2 2
2
f (x)
1
r2
e 2 2
2
• 由r x
得 dr dx
•故
f (x)dx
1
r2
e 2 2 dr
2
(2-13) (2-14)
• 频数曲线已初步形象地表明了测量值既分散又集中 的分布规律
2-1-2 正态分布(Normal distribution) 一 概率密度
• 相对频率分布直方图上,矩形面积表示频率,而 频率的稳定值就是概率。
• 测量次数无限多(n→∞),组分得无限细(x→0), 相对频率分布直方图就转化为概率分布曲线。
原 ××.××
现 ××.×××
• 组中值:两边界值的平均值,有效数字位数与测 量值相同
四 数出各组的频数,求出频率和相对频率
• 频数:测量值落在各组内的个数 ni

频率:频数与样本容量之比
ni n
• 相对频率:频率与组距之比
ni n x
• 计算结果见表2-2
表2-2频数、频率和相对频率计算结果
计算。幂级数公式为:
ex 1 x x2 x3 x4 2! 3! 4!
u2
u2 u4
u6
u8
e 2 1
2 2!22 3!23 4!24
• 所以
P(0,u) u 0
1
2
e
u 2
2
du
1 [ u 1 ( u )3 1 ( u )5 1 ( u )7 1 ( u )9 ]
2 3 2 5 2! 2 7 3! 2 9 4! 2
Si
ni nx
x
ni n
(2)所有矩形面积之和等于频率的总和1
S
Si
ni nx
x
ni n
1
2 形状与分布规律
(1)频数曲线在横轴上跨越的范围就是测量值分布 的范围
这个范围并不小,说明测量值是分散的
(2)频数曲线两边低,中间高,
说明较大或较小的值,即偏离较远的值,出现的频 率小;
中间值,即趋近于样本平均值(60.78)的值,出现的 频率大,说明测量值又是集中的
60.55 61
61.31 61.07 60.65 60.7 61.31 60.32 60.64 60.77 60.76 60.38 60.12 60.77 61.62 60.8 60.58 61.03 60.99 60.43 60.81 60.9
60.17 60.57 60.62 61.12 60.65 60.47 61.83* 60.98 60.76 61.14 60.89 59.98 60.91 60.33 61.01 60.61 60.57
2-3-2 标准正态分布N (0,1)
• 由于
lim 1 n n
u lim 1 n n
x
1(lim
1 n
x

1( ) 0
(2-19)
• 故以u表示的随机误差的总体平均值为0
• 不管µ和σ的大小如何,随机误差的正态分布都归 于总体平均值为0,标准偏差为1的u的同一正态分 布 (见图2-7),记为N (0,1)
(2-10)
(4)区间 (, ) 上的概率
f (x)dx 1
(2-11)
• 如果知道了f(x)的表达式,即可求任意区间的概率 P(a,b)值
二 正态分布
• 德国数学家,天文学家,物理学家高斯(C.F.Gauss 1777-1855)找出了f(x)的数学表达式:
f ( x) 1 e(x )2 / 2 2
组序
1 2 3 4 5 6 7 8 9 10
分组
59.835-60.035 60.035-60.235 60.235-60.435 60.435-60.635 60.635-60.835 60.835-61.035 61.035-61.235 61.235-61.435 61.435-61.635 61.635-61.835
组中值
59.94 60.14 60.34 60.54 60.74 60.94 61.14 61.34 61.54 61.74
ni
ni n
2
0.018
5
0.046
11
0.100
22
0.200
26
0.236
20
0.182
13
0.118
7
0.064
3
0.027
1
0.009
110ຫໍສະໝຸດ Baidu
1
ni nx
0.090 0.230 0.500 1.000
60.9 59.88* 60.77 61.17 60.64 60.41 61.25 61.3 60.97 60.65 61.52 61.06 60.76 60.94 61.1 60.63 60.57 61.04 60.63 60.66 60.14 60.83
61.58 60.22 60.54 60.92 60.63 60.58 60.42 60.25 60.53 60.5 61.41 60.37 60.35 60.7 60.4 60.92 60.62 61.06 60.76 60.78 60.63 60.99
1.180 0.910 0.590 0.320 0.135 0.045
五 频数曲线
• 以相对频率对组界作 图,得相对频率分布
ni n x
直方图;
• 将各组中值用直线联 结起来,构成频数曲 线
图2-1相对频率直方图 和频数曲线
1 面积与频率
(1)直方图中每个矩形的面积恰好等于测量值落在 该矩形所对应的组内的频率
(2-20)
二 所有各种大小的随机误差出现的总概率为1
•或
f (r)dr 1
f (u)du 1
(2-21) (2-22)
2-4-2 区间上的概率
• 随机变量在区间(a,b)上出现的概率,等于曲 线与横轴在该区间所围的面积,对应的积分为:
P(a, b)
b
f (u)du
a
(2-23)
• 这种任意区间上的积分,可利用幂级数进行近似
一 U=1 时 • 取前五项
P(0,1) 0.34135
• 取项越多,结果越准
二 标准正态分布表
• 同样可求其它同类区间上的概率,构成标准正 态分布表
• 又称为u值表
标准正态分布表(u值表)
u
P(0,u) 0 f (u)du
u0 1 2 3 4 5 6 7 8 9 0.0 0000 0040 0080 0120 0160 0199 0239 0279 0319 0359 0.1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0753 0.2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141 --- --3.0 4986 4987 4987 4988 4988 4988 4989 4989 4990 4990
• 前两条是一般统计检验的理论根据和出发点。 • 第三条说明增加测定次数可以减小直至消除随机
误差。
§2-3 标准正态分布(u分布)
2-3-1正态分布的正态密度
• 为了使用一个变量来表示随机误差的函数式, 引入一个新变量
•令
u x
(2-17)
• 即将随机误差以标准偏差为单位来表示,代入 式(2-12)中可得
含量,得110个测量结果 表2-1某合成反应产物的含量(%)
60.04 61.22 60.37 61.25 60.86 60.64 61.02 61.2 60.67 60.82 60.46 60.74 60.5 60.53 61.05 60.58 60.59 61.15 60.65 60.76 61.38 60.54
• 可求出 r1,r2,------,rn • 根据标准偏差简化计算式(1-16)
x r
(精密度相同)
• 因此两曲线形状完全相同,只是在横轴上平移了µ 个单位(见图2-6)
f (x)
f (r)
x
0r
图2-6测量值的正态分布曲线与随机误差的正态分布曲线
2-2-4 随机误差的性质 一 单峰性
绝对值小的误差出现的概率大 绝对值大的误差出现的概率小 二有界性 绝对值很大的误差出现的概率极小 三 对称性(抵偿性) 绝对值相等的正、负误差出现的概率相等
61 60.92 60.92 60.97 60.07
一 求出极差
R=61.83-59.88=1.95
二 根据样本大小分组
• n<50时,分为5~6组;n>50时,分为10~20组
• 组数:K=10
三 确定组距、组界和组中值
• 组距:Δx=R/K
x 1.95 0.195 0.20 10
• 组界:避免数据“骑墙”,组界的精度提高一位
相关文档
最新文档