unit 9 随机误差的统计学基本分析
测绘工程专业英语课文翻译
Unit 9 Basic Statistical Analysis of Random Errors (随机误差的统计学基本分析)Random errors are those variables that remain after mistakes are detected and eliminated and all systematic errors have been removed or corrected from the measured values.(随机误差是在错误被察觉【detect】和消除【eliminate】后,并且所有系统误差被从测量值中移除或修正后,保留下的那些变量【variable变量、变化n.】)They are beyond the control of the observer.(它们是观测者无法控制的)So the random errors are errors the occurrence of which does not follow a deterministic pattern.(因此随机误差是不遵循某个确定性【deterministic 确定性的】模式【pattern】而发生的误差)In mathematical statistics, they are considered as stochastic variables, and despite their irregular behavior, the study of random errors in any well-conducted measuring process or experiment has indicated that random errors follow the following empirical rules:(在数理统计【mathematical statistics】中,它们被当成随机变量【stochastic variable】,尽管它们的行为无规律,在任一正确的【well-conducted原意为品行端正的,这里指测量实验和活动是无误的】测量活动和实验中,对的随机误差的研究显示【indicate】随机误差遵循以下经验法则【empirical rule】:)⑴A random error will not exceed a certain amount.(随即误差不会超过一个确定的值)⑵Positive and negative random errors may occur at the same frequency.(正负误差出现的频率相同)⑶Errors that are small in magnitude are more likely to occur than those that are larger in magnitude.(误差数值【magnitude量值、大小】小的比数值大的误差出现可能性大【be likely to 可能】)⑷The mean of random errors tends to zero as the sample size tends to infinite.(当【as】样本大小【sample size】趋近于无穷【infinite】时,随机误差的平均值趋近于0)In mathematical statistics, random errors follow statistical behavioral laws such as the laws of probability.(在数理统计中,随机误差遵循统计学的【statistical】行为【behavioral行为的】规律,如概率法则)A characteristic theoretical pattern of error distribution occurs upon analysis of a large number of repeated measurements of a quantity, which conform to normal or Gaussian distribution.(发生在一个量的大量重复观测分析【analysisn.】中的误差分布的一个特征理论模式,遵照【conform to遵照】正态或高斯分布)【在对一个量进行大量重复观测分析后,得到一个误差分布的理论特征——正态或高斯分布】The plot of error sizes versus probabilities would approach a smooth curve of the characteristic bell-shape.(误差大小与【versus与、与……的关系、与……相对】概率的关系图,接近一条光滑的特有的【characteristic 特有的】钟形曲线。
随机误差的统计规律
随机误差的统计规律实验目的(1) 通过一些简单测量,加深对随机误差统计规律的认识 (2) 学习正确估算随机误差、正确表达直接测量结果的一般方法 (3) 了解运用统计方法研究物理现象的简单过程实验方法原理对某一物理量在相同条件下进行n 次重复测量(n>100),得到n 个结果,,,,21n x x x 先找出它的最小值和最大值,然后确定一个区间[]x x ''',,使这个区间包含了全部测量数据。
将区间[]x x ''',分成若干个小区间,比如K个,则每个小区间的间隔∆为 Kx x '-''=∆,统计测量结果出现在各个小区间的次数M (称为频数)。
以测量数据为横坐标,只需标明各区间的中点值,以频数M 为纵坐标,画出各小区间及其对应的频数高度,则可得到一组矩形图,这就是统计直方图。
直方图的包络表示频数的分布,它反映了测量数据的分布规律,也即随机误差的分布规律。
实验步骤(1) 用钢卷尺测量摆线长。
(2) 用游标卡尺测量摆球直径。
(3) 当摆长不变,摆角(小于5o)保持一定时,摆动的周期是一个恒量,用数字秒表测量单摆的周期至少100次,计算测量结果的平均值T 和算术平均值的标准差)(x S 。
(4) 保持摆长不变,一次测量20个以上全振动的时间间隔,算出振动周期。
数据处理990.0=l m 03364.0=d m 00682.12=+=dl L m2044.40='T s051.21001001==∑=i ixT s0067240110012.)()()(=--=∑=n n x xx S i is)01.005.2()(2±=±=x S T T s022.22044.40=='T s 222/2910.94s m L T g T ==π222/5594.94s m L T g T ='='π20/80891.9s m g =%28.5%1000=⨯-=g g g E T T%54.2%1000=⨯-='g g g E T T思考1. 什么是统计直方图? 什么是正态分布曲线?两者有何关系与区别?答:对某一物理量在相同条件下做n 次重复测量,得到一系列测量值,找出它的最大值和最小值,然后确定一个区间,使其包含全部测量数据,将区间分成若干小区间,统计测量结果出现在各小区间的频数M ,以测量数据为横坐标,以频数M 为纵坐标,划出各小区间及其对应的频数高度,则可得到一个矩形图,即统计直方图。
误差的统计概念
误差的统计概念一. 随机误差的正态分布1. 正态分布随机误差的规律服从正态分布规律,可用正态分布曲线(高斯分布的正态概率密度函数)表示:(13)式中:y—概率密度;m—总体平均值;s—总体标准偏差。
正态分布曲线依赖于m和s两个基本参数,曲线随m和s的不同而不同。
为简便起见,使用一个新变数(u)来表达误差分布函数式:(14)u的涵义是:偏差值(x-m)以标准偏差为单位来表示。
变换后的函数式为:(15)由此绘制的曲线称为“标准正态分布曲线” 。
因为标准正态分布曲线横坐标是以s为单位,所以对于不同的测定值m及s,都是适用的。
图1:两组精密度不同的测定值图2:标准正态分布曲线的正态分布曲线“标准正态分布曲线”清楚地反映了随机误差的分布性质:(1)集中趋势当x=m时(u=0),,y此时最大,说明测定值x集中在m附近,或者说,m是最可信赖值。
(2)对称趋势曲线以x=m这一直线为对称轴,表明:正负误差出现的概率相等。
大误差出现的概率小,小误差出现的概率大;很大误差出现的概率极小。
在无限多次测定时,误差的算术平均值极限为0 。
(3)总概率曲线与横坐标从-μ到+μ在之间所包围的面积代表具有各种大小误差的测定值出现的概率的总和,其值为1(100%)(16)用数理统计方法可以证明并求出测定值x 出现在不同u 区间的概率(不同u 值时所占的面积)即x 落在m±us区间的概率:置信区间置信概率u = ± 1.00x = m± 1.00 s68.3%u = ± 1.96x = m± 1.96 s95.0%u = ± 3.00x = m± 3.00 s99.7%二. 有限数据随机误差的t 分布在实际测定中,测定次数是有限的,只有和S,此时则用能合理地处理少量实验数据的方法—t分布1. t分布曲线(实际测定中,用、S 代替m、s)t分布曲线与标准正态分布曲线相似,纵坐标仍为概率密度,纵坐标则是新的统计量t(17)无限次测定,u一定?P就一定;有限次测定:t一定?P随n (自由度)不同而不同。
误差分析—误差的统计检验(试验设计与数据处理课件)
xp -x 10.82-10.45 0.37 0.32
故10.82这个测定值应该被剔除。
(2)检验10.52
剔除10.82之后,重新计算平均值及标准偏差s ,此时10.52偏差最大,故检验之。
x ' 10.40, s ' 0.078
查秩和临界值表: 根据显著性水平和n1,n2,可查得R1的上下限T2和T1 。
检验: ➢ 如果R1>T2 或R1 <T1,则认为两组数据有显著差异,若一组数据无系统误差,则另一
组数据有系统误差。 ➢ 如果T1<R1<T2,则两组数据无显著差异,若一组数据无系统误差,则另一组数据也无
系统误差。
(3)例1-12: 设甲、乙两组测定值为: 甲:8.6,10.0,9.9,8.8,9.1,9.1 乙:8.7,8.4,9.2,8.9,7.4,8.0,7.3,8.1,6.8 已知甲组数据无系统误差,试用秩和检验法检验乙组测定值是否有系统误差。(=0.05)
该检验法适用于试验次数较多或要求不高时 3s为界时,要求n>10; 2s为界时,要求n>5
例1-13: 有一组分析测试数据:0.128,0.129,0.131,0.133,0.135,0.138,0.141,
0.142,0.145,0.148,0.167,问其中偏差较大的0.167这一数据是否应被舍 去? (=0.01)
① 计算统计量: ❖ 两组数据的方差无显著差异时
t x1 x2 n1n2 s n1 n2
服从自由度 df n1 n2 2 的t分布
s——合并标准差,计算公式为 s (n1 1)s12 (n2 1)s22 n1 n2 2
❖ 两组数据的精密度或方差有显著差异时 t x1 x2 s12 s22 n1 n2
随机误差的统计分布实验报告
一、实验目的1. 了解随机误差的基本概念和统计分布规律。
2. 通过实验验证随机误差的统计分布特性。
3. 掌握利用统计方法分析随机误差的方法。
二、实验原理随机误差是指由于测量条件难以完全控制而引起的偶然性误差。
在物理测量中,当重复测量次数足够多时,随机误差通常服从或接近正态分布。
正态分布是一种连续型概率分布,其概率密度函数呈钟形曲线,具有以下特点:1. 有界性:随机误差的绝对值(幅度)均不超过一定的界限。
2. 单峰性:绝对值(幅度)小的随机误差总要比绝对值(幅度)大的随机误差出现的概率大。
3. 对称性:绝对值(幅度)等值而符号相反的随机误差出现的概率接近相等。
4. 抵偿性:当等精度重复测量次数足够大时,所有测量值的随机误差的代数和为零。
本实验通过测量时间间隔,利用统计方法分析随机误差的分布规律。
三、实验仪器与设备1. 电子秒表或毫秒计2. 摆钟或节拍器等具有固定周期事件的装置3. 数据处理软件(如Excel、Origin等)四、实验步骤1. 检查实验仪器是否能正常工作,秒表归零。
2. 将摆钟或节拍器上好发条使其摆动,用秒表测量节拍器四个周期所用时间,在等精度条件下重复测量150-200次,记录每次的测量结果。
3. 将测量数据输入数据处理软件,进行数据处理。
4. 绘制测量数据的直方图,观察其分布规律。
5. 利用数据处理软件拟合正态分布曲线,并与直方图进行比较。
6. 分析随机误差的分布规律,验证正态分布特性。
五、实验结果与分析1. 直方图分析将实验数据输入数据处理软件,绘制直方图,观察其分布规律。
根据直方图,可以得出以下结论:(1)随机误差的绝对值(幅度)均不超过一定的界限,符合有界性。
(2)随机误差的分布呈现单峰性,绝对值(幅度)小的随机误差出现的概率较大。
(3)随机误差的分布对称,符合对称性。
2. 正态分布拟合利用数据处理软件拟合正态分布曲线,并与直方图进行比较。
根据拟合结果,可以得出以下结论:(1)随机误差的分布基本符合正态分布,其概率密度函数呈钟形曲线。
随机误差PPT课件
x3 2000.60mm, sx3 0.10mm
求:各组测量结果的权、加权算术平均值、加权算术 平均值的实验标准偏差。
解:
111
1
1
1
p1 : p2 : p3 sx21 : sx22 : sx23 (0.05)2 : (0.20)2 : (0.10)2 16 : 1 : 4
综上所述: (1)算术平均值是处理等权测量数据的一个最佳估计量; (2)一般按贝塞尔公式计算 s 和 s(x) s / n,样本数 n 1 时 只能用最大误差法计算 s ; (3)算术平均值的极限误差一般按 tp (n 1)s(x) 确定。
第22页/共24页
思考与练习题
3-1 如果测量完全正相关,以测量次数为2的简单情形,试 证明其算术平均值的标准差仍与单次测量的标准差相同。 3-2 什么是残差?常用什么符号表示?它与误差的定义有何 不同?试验证如下两条性质:(1)残差之和等于零;(2)
第18页/共24页
3、小样本标准差已知的情形
置信区间半宽度为(单次测量)
(x) tp s
置信区间半宽度为(n次测量)
x ~ t( )
s
(x) tp s / n
▪自由度 n 1 ,n为样本容量
x ~ t( )
sn
▪ tp 值可通过查 t 分布表得到,p 为置信水平
第19页/共24页
x
m
pi
v
2 xi
i 1
m
(m 1) pi
i 1
3 0.52 2 (0.4)2 5 (0.1)2 (3 1) (3 2 5)
0.24m
第13页/共24页
第四节 置信区间
知识笔记-2.2 随机误差的分析1-随机误差的统计处理
§ 2.2随机误差的分析§ 2.2.1随机误差的统计处理1、测量值的数学期望:对某一被测量进行n 次等精度测量,得到x 1,x 2...x n ,其算数平均值为:11ni i x x n ==∑,也称为样本平均值。
当测量次数n →∞时,样本平均值x 的极限称为测量值的数学期望。
2、方差:当n →∞时,测量值与期望值之差的平方的统计平均值,可写为:2221111lim ()lim n n i x i n n i i x E n n σδ→∞→∞===-=∑∑ 3、标准差:211lim n i n i n σδ→∞==∑ 标准差反映了测量的精密度。
4、正态分布根据概率论中的中心极限定理和随机误差的性质可知,在多数情况下,随机误差服从正态分布。
其分布密度可以写为如下公式:22-(x -E )1(x )=exp[]2σ2πσi x i ϕ 测量值x i 的分布曲线如图所示:可以看出,测量值对称的分布在数学期望的两侧。
根据随机误差的正态分布曲线,可以得出以下结论:☆ δ愈小、Φ(δ)愈大,说明绝对值小的随机误差出现的概率大;☆随着δ的加大, Φ(δ)很快趋于0,即超过一定界限的随机误差实际上几乎不出现(有界性;☆ σ愈小,正态分布愈尖,表明测得值愈集中,精密度高;☆ 大小相等符号相反的误差出现的概率相等 (对称性、补偿性)。
5、残差:i i u x x =-注意两点:☆ 残差的代数和等于0.☆当测量次数趋于无穷时,残差等于随机误差.6、有限次测量的标准差:贝塞尔公式:∑-==∧σn u i i n 1112 用极差法求标准差:=σCR x ˆ 其中R 为测量结果中的最大值和最小值之差。
C 为极差系数,可以通过查表得到。
7、算术平均值的标准差:当n 为有限次测量时,平均值的标准差课表示为:=σσn x /ˆˆ 有缘学习更多+谓ygd3076考证资料或关注桃报:奉献教育(店铺)。
误差理论与数据处理随机误差PPT课件
在等权测量条件下,对某被测量进
行多次重复测量,得到一系列测量
值x1, x2,..., xn ,常取算术平均值
x
1 n
n i 1
xi
作为测量结果的最佳估计。
第21页/共69页
3- 21
无限多次测量算术平均值作为真值的理论依 据
因为
n
n
i xi nx0
i 1
i 1
n
n
xi i
x0
i 1
n
i1 n
a
▪ p 1置 信概率(或置信水
平),简记为符号 p
bx
概率密度函数的几何意义
▪ 显著性水平(又称显著度或危险率)
第7页/共69页
一、随机误差产生的原因
零部件配合的不稳定性、零部件的变形、零件表面油膜不均匀、摩擦等。
放置测量主机和被 测试样的隔震台不 能很好消除外界的 低频震动
测量装置方面的因素
仪器所在实验 室气流和温度 的波动
第1页/共69页
数学期望
定义
E( X ) xf (x)dx
▪一阶原点矩,它表示随
机变量分布的位置特征。
它与真值之差即为系统
误差,如果系统误差可
以忽略,则 就是被测
量的真值 ▪数学期望代表了测量
1
2 3
的最佳估计值,或相对 三条测量值分布曲线的精密度
真值的系统误差大小 相同,但准确度不同。
无条件获取大样本数据的情形
▪必须依据小样本的测量数据以及可能了解 到的有关测量信息,合理给出代表测量总体 的测量结果,包括其最佳估计值及其标准差、 置信区间等
3- 19
第19页/共69页
三、 算术平均值
本部分主要介绍算术平均值的意义 以及如何计算算术平均值的标准差。
随机误差
第二节 随机误差的分布
一、正态分布
随机误差概率分布密度函 数表达式为:
f ( ) 1
2 2 2
图2-4
2
e
数学期望 方 差
标准偏差
E(δ )=0 D(δ )=σ2
D( )
二、均匀分布
均匀分布又称等概率分布, 其概率密度函数为:
1 f ( ) 2a 0
第一节 随机误差概述
一、随机误差产生的原因
随机误差是由人们不能掌握,不能控制,不 能调节,更不能消除的微小因素造成。这些因素 中,有的是尚未掌握其影响测量准确的规律;有 的是在测量过程中对其难以完全控制的微小变化, 而这些微小变化又给测量带来误差。
例题
举例:某台激光数字波面干涉仪,对其进行准确度考 核,在相同测量条件下对某标准平晶的表面面形进行 150次重复测量获得面形峰谷值数据。通过实验分析, 查询有关的技术资料和其他信息,可知随机误差来源 结论:对具体测量问题具体分析,从所用的设备、人 员、测量方法等资源以及环境等要素中去分析寻找主 要的随机误差来源。
i2
i 1
nnLeabharlann 1 [ (0.04 30 0.01 40 0.09 20 0.25 3 0.00 50 0.01 44 260
0.1611 0.1610 0.04 29 0.251 0.09 22)]
260
数据特点
数据列表明,各次测值不尽相同,这说
明各次测量中含有随机误差,这些误差 的出现没有确定的规律,即前一个数据 出现后,不能预测下一个数据的大小。 但就数据整体而言,却明显具有某种统 计规律,这个规律可以用统计直方图来 表示。
误差分析随机过程教程PPT演示文稿
1 n2
2 i
1 n
单次测量 标准差
上式表明,当测量次数n愈大,算术平均值 的标准差愈小,即愈接近真值。可见,增加测 量次数取其算术平均值表示测量结果,是减小 随机误差的一种途径。
20
10次算术平均值与单次测量的分布关系
如右图所示, 10次测量的算术平 均值与单次测量的 总体分布关系,可 以更全面而形象的 说明这样一个事实, 即两个的分布类型 和峰值位置未发生 变化,只是分散性 不同。
11
第二节 随机误差的分布
2.1 正态分布 随机误差统计直方图提供了随机误差的分布,
即随机误差符号和绝对值的分布情况。因为绘制 图形时的测量次数是有限的(150次),所以此 时提供的只是大致的情况。为了准确的反映随机 误差的分布,必须经过充分多次的测量,使测量 次数趋近于无穷,并将误差区间划分的充分小, 此时直方图上各个矩形边缘形成一条曲线。这条 连续的、对称的曲线称为随机误差的正态分布概 率密度曲线。
7
1.2 随机误差的特性特征
1、随机误差特性 随机误差的特性可归纳为三个方面:具有随机性、产生 在测量过程中、与测量的次数有关,重复性条件下增加 测量次数可减小随机误差对测量结果的影响。
2、随机误差的本质特征 (1)随机误差的表述
设被测量的真值为x0,一系列测量值为 xi ,如果各次测量
值中不含有系统误差,则根据对随机误差 i 的定义,有:
也不同。
13
服从正态分布的随机误差的特征 (1)单峰性:小误差出现的概率比大误差出现 的概率大。 (2)对称性:正误差出现的概率与负误差出现 的概率相等。 (3)有界性:在一定条件下绝对值不会超过一 定界限。 (4)抵偿性:随测量次数增加,随机误差算术 平均值趋于零。
误差及数据分析的统计处理
99%
1
6.31
12.71
63.66
2
2.92
4.30
9.93
3
2.35
3.18
4.60
5
2.02
2.57
4.03
6
1.94
2.45
3.71
7
1.90
2.37
3.50
8
1.86
2.31
3.36
20
1.73
2.09
2.85
∞
1.64
1.96
2.58
由t的定义式可衍生得:在一定置信度下,对于
例 测定某溶液浓度(mol·L-1),得结果: 0.1014, 0.1012, 0.1016, 0.1025, 问: 0.1025是否应弃 去?(置信度为90%)
0.1025 0.1016 Q计算 0.1025 0.1012 0.69 Q0.90(4) 0.76
0.1025应该保留.
判断其精密度的差异。
两组数据平均偏差相同,但数据离散程度不同。乙 更分散,说明有时候平均偏差不能 反应客观情况,
而是用标准偏差来判断。
解:平均值: x 甲= 3.0 平均偏差:d甲=0.08 标准偏差:S甲=0.08
x 乙=3.0
d乙=0.08
s乙=0.14
精密度是指在确定条件下将测试方法实施多次求出所得 结果之间的一致程度,其大小常用偏差来表示。也可用重复性 和再现性来表示。
3. 过失误差
粗枝大叶、不按操作规程办事等造成的,完全可以避免的
4.误差的减免 (1) 系统误差的减免
(1) 方法误差—— 采用标准方法,对比实验 (2) 仪器误差—— 校正仪器 (3) 试剂误差—— 作空白实验
《误差统计分析》PPT课件
20
正态分布曲线
概率论:
相互独立的大量微小随机变量,其总和的分布是符合正态 分布的。
在机械加工中,用调整法加工一批零件,其尺寸误差是有 很多相互独立的随机误差综合作用的结果,如果其中没有 一个是起决定作用的随机误差,则加工后零件的尺寸将近 似于正态分布。
正态分布曲线
概率密度函数表达式为
y
1
1 xu 2
0.90
0.3159
0.92
0.3212
0.94
0.3264
0.96
0.3315
0.98
0.3365
z
F(z)
1.00
0.3413
1.05
0.3531
1.10
0.3643
1.15
0.3749
1.20
0.3849
1.25
0.3944
1.30
0.4032
1.35
0.4115
1.40
0.4192
1.45
0.4265
非正态分布
30
表6-3 不同分布的e、k值
分布特征 正态分布 三角分布
分布曲线
E
0
k
1
0 1.22
均匀分布
0 1.73
偏态分布 瑞利分布
外尺寸 内尺寸
-0.28 1.14
0.26 1.17
-0.26 1.17
31
分布图分析应用
1 判别加工误差性质 2 确定工序能力及其等级 3 估算合格品率或者不合格品率
参考答案
解:
1)收 集 数 据 :取n 100, xmax 54um, xmin 16um。 2)确 定 分 组 数k、 组 距d、 各 组 组 界 和 组 中 值
随机误差及数据处理
•概率密度函数
当随机变量为连续时,定义f(Δ)= dp(x)
d
为概率密度 函数
(p.494)
•意义:随机变量的值落入某一值附近无限小区间的 概率等于
变量取该值时的概率密度与此无限小误差区间的乘积。
归一化条件:
f ( )d 1
9
(3)随机误差的统计分布 p495
随机误差服从的统计分布规律有:高斯分布、二项式分布、 泊松分布、均匀分布……t分布。 • 高斯分布 p495/13
dA d1 dA d2 dA
dn dA
∵ Δi= x i-A
∴ di 1
dA
∴ d ln f 1 d ln f 2 d ln f n 0
d1
d 2
d n
13
•高斯分布函数的推导
或:
d
ln f 1
1d1
1
d ln f 2
f h exp h22 10
•高斯分布函数的推导
对某物理量(x)作n次等精度测量
x1,x2,x3,……,xn
Δ1,Δ2,Δ3, …… ,Δn
设真值为A, Δi=xi-A
测量误差分布于Δi~ Δi + dΔ的概率取决于f (Δi) 及
即
p(Δi)=f (Δi) dΔ
∴误差出现于Δ1~ Δ1 +dΔ的概率 p(Δ1)=f (Δ1) dΔ
t
变量之二: t = x A sx
n) t n1e dt
0
T分布曲线的特征:*也是左右对称; *比高斯分布曲线“矮胖些
同样概率水平所对应的误差区间要更大些
24
高斯分布
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Unit 9 Basic Statistical Analysis of Random Errors(随机误差的统计学基本分析)Random errors are those variables that remain after mistakes are detected and eliminated and all systematic errors have been removed or corrected from the measured values.(随机误差是在错误被察觉【detect】和消除【eliminate】后,并且所有系统误差被从测量值中移除或修正后,保留下的那些变量【variable变量、变化n.】)They are beyond the control of the observer.(它们是观测者无法控制的)So the random errors are errors the occurrence of which does not follow a deterministic pattern.(因此随机误差是不遵循某个确定性【deterministic确定性的】模式【pattern】而发生的误差)In mathematical statistics, they are considered as stochastic variables, and despite their irregular behavior, the study of random errors in any well-conducted measuring process or experiment has indicated that random errors follow the following empirical rules:(在数理统计【mathematical statistics】中,它们被当成随机变量【stochastic variable】,尽管它们的行为无规律,在任一正确的【well-conducted原意为品行端正的,这里指测量实验和活动是无误的】测量活动和实验中,对的随机误差的研究显示【indicate】随机误差遵循以下经验法则【empirical rule】:)⑴A random error will not exceed a certain amount.(随即误差不会超过一个确定的值)⑵Positive and negative random errors may occur at the same frequency.(正负误差出现的频率相同)⑶Errors that are small in magnitude are more likely to occur than those that are larger in magnitude.(误差数值【magnitude量值、大小】小的比数值大的误差出现可能性大【be likely to 可能】)⑷The mean of random errors tends to zero as the sample size tends to infinite.(当【as】样本大小【sample size】趋近于无穷【infinite】时,随机误差的平均值趋近于0)In mathematical statistics, random errors follow statistical behavioral laws such as the laws of probability.(在数理统计中,随机误差遵循统计学的【statistical】行为【behavioral行为的】规律,如概率法则)A characteristic theoretical pattern of error distribution occurs upon analysis of a large number of repeated measurements of a quantity, which conform to normal or Gaussian distribution.一个误差分布的典型理论模式出现于对某一量的大量重复观测中,这些重复观测遵从【conform to遵照】正态分布或高斯分布【在对一个量进行大量重复观测分析后,得到一个误差分布的理论特征——正态或高斯分布】The plot of error sizes versus probabilities would approach a smooth curve of the characteristic bell-shape.(误差大小与【versus与、与……的关系、与……相对】概率的关系图,接近一条光滑的特有的【characteristic 特有的】钟形曲线。
)This curve is known as the normal error distribution curve.(这条曲线被称为正态分布曲线)It is also called the probability density function of a normal random variable.(也叫做正态随机变量【normal random variable】的概率密度【probability density】函数)It is important to notice that the total area of the vertical bars for each plot equals 1.(需特别注意的是,每个图的条形图总面积为1。
)This is true no matter the value of n (the number of single combined measurements), and thus the area under the smooth normal error distribution curve is equal to 1.无论【no matter】n(【独立观测数】)是多少,在光滑的误差正态分布曲线下的面积都是1。
If an event has a probability of 1, it is certain to occur, and therefore the area under the curve represents the sum of all the probabilities of the occurrence of errors.(如果一件事的概率为1,它一定会发生,因此曲线下方的面积代表了所有误差发生的概率。
)A number of properties that relate a random variable and its probability density function are useful in our understanding of its behavior.随机变量的大量属性和其概率密度函数,有助于我们对其行为的理解。
Mean and standard deviation are two most popular statistical properties of a random variable.均值和标准差就是随机变量的两个最常用的统计属性Generally, a random variable which is normally distributed with a mean and standard deviation can be written in symbol form as N(μ,σ2).(一般地,一个通常由平均值和标准偏差描述的随机变量可以用符号【symbol】表示为N(μ,σ2)。
They can be explained as follows.(【它们可以】解释如下)Mean: The most commonly used measure of central tendency is the mean of a set of data (a sample).(平均值:应用最普遍的中心趋向的估计【measure】就是一系列数据(一个样本)的平均值)The concept of mean refers to the most probable value of the random variable.(平均值的概念【concept】涉及到随机变量的最或是值)It is also called by any of the several terms—expectation, expected value, mean or average.(还可以由其它几个术语来称呼它——期望、期望值、平均值或平均值)The mean is defined as(平均值定义为)……公式……Where xi are the observations, n is the sample size, or total number of observations in the sample, and x is the mean which is also called most probable value (MPV).(xi是观测值,n是样本大小,或者叫样本内观测值的总数,x是平均值,经常被称为最或是值(MPV)The MPV is the closest approximation to the true value that can be easily achieved from a set of data.(MPV是最接近真值的近似值【approximation】,可以很容易由一系列数据得到。
)It can be shown that the arithmetic mean of a set of independent observations is an unbiased estimate of the meanμof the population.(可以看出【It can be shown that】一系列独立【independent】观测值的算数平均值【arithmetic mean】是一个样本【population】的期望值μ的无偏估计【unbiased estimate】。
)Standard deviation is a numerical value indicating the amount of variation about a central value.(标准偏差是一个数值【numerical value】,它指示【indicate】相对于中值的偏离)In order to appreciate the concept upon which indices【index的复数】of precision devolve one must consider a measure that takes into account all the values in a set of data.(考虑一系列数据的所有值精度指标必需顾及一个量,这个量考虑到【takes into account考虑】一组【a set of】数据的所有值)Such a measure is the deviation from the mean x of each observed value xi i.e. (xi- x), and the mean of the squares of the deviations may be used, and this is called the varianceσ2,(这个量是每个观测值xi相对于平均值x 的离差【deviation】,也就是,(xi- x),离差的平方的平均值被采用,称之为方差σ2)……公式……Where μis the mean (expectation) of the population.(这里μ是对象总体【样本】的平均值(期望值)。