实验数据分析中的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验数据分析中的 误差、概率和统计
§1 实验测量及误差
§2 粒子物理实验的测量数据 §3 粒子物理实验的数据分析
§1 实验测量及误差
大量科学问题(自然科学、社会科学)的研究与解决依赖于实验或测量数据(包括统计数据)。
§1.1 实验测量的目的及分类 》目的:
得到一个或多个待测量的数值及误差(确定数值); 确定多个量之间的函数关系(寻找规律,确定分布)。
》分类:
1. 测量方式
直接测量 - 用测量仪器直接测得待测量 (尺量纸的长度) 间接测量 -
直接测量量为x ,待测量为
y ,y 是x 的函数 ()y f x =
例如待测量为大楼高度h , 实测量为距离和仰角,x θ, 则tan h x θ=。
绝大部分问题是间接测量问题。
2. 测量过程
静态测量 - 待测量在测量过程中不变
多次测量求得均值
动态测量 - 待测量在测量过程中变化 例雷达站测离飞行气球的距离
多次测量求得气球的运动轨迹
3. 测量对象
待测量 - 固定常量 待测量 - 随机变量
例放射源单位时间内的计数 (假定寿命极长) 每次测量值不一定相同。
错误!文档中没有指定样式的文字。 ·251·
粒子物理实验数据分析中处理的都是间接、动态、随机变量的测量和处理问题。
随机变量――
一次测量所得的值是不确定的,
无穷多次测量,一定测量值的概率是确定的。(统计规律性) 离散随机变量――测量值是离散的分立值(掷硬币和扔骰子试验) 二项分布、泊松分布、多项分布。 连续随机变量――测量值一个区间内的所有值
均匀分布、指数分布、正态分布、2
χ分布、F 分布、t 分布。 描述随机变量的特征量――概率分布或概率密度
非负性、 可加性、 归一性
()0.f x ≥ 2
33
1
2
1
()()().x x x x x x f x dx f x dx f x dx +=⎰⎰⎰ () 1.f x dx Ω
=⎰
()0.i P x ≥ ()()().i j i j P x x P x P x ⋃=+ 1
() 1.n
i i P x ==∑
期望值(概率意义上的平均值)
离散型
()()i i i
E X x p x μ==∑
连续型 ()xf x dx Ω=
⎰
方差(标准离差σ的平方)
离散型 2()
()(),i i i
V X x p x μ=-∑
连续型 2()()().V X x f x dx Ω
μ=-⎰
§1.2 测量误差及其分类
1.报导误差的重要性
• 物理量的测量值及其误差是衡量其可靠性及精度的依据。 • 没有误差的结果是没有意义的,因而是无法引用的。 • 要改正只给测量中心值、不给误差的坏习惯。
·252· 实验物理中的概率统计
2.误差分类
• 过失误差(粗差)-过失造成的误差
操作、记录、运算中的错误,测量条件的突然改变…。 • 统计误差(随机误差)- 待测量为随机变量,服从某种概率分布 统计误差一般为待测量(随机变量)的标准差。
x μσ=±,x σσμ
+
-
+-=。
μ
一般理解为期望值。
• 系统误差 - 测量仪器、方法、理论模型的误差 测量环境变化导致的误差 测量仪器、测量方法的误差
测量所依据的理论模型、(经验公式)的误差 ……
导致系统误差的因素一般可分为带有随机性质和不带有随机性质的两类。 带有随机性质的系统误差由其分布的标准差决定。
不带随机性质的系统误差,由于有多种来源,每种来源导致的误差大小和符号不易确定,
通常只能一起处理,考虑为一个随机变量。
系统误差的分析是一件特别复杂的、细致的工作,只能针对具体问题具体分析。 系统误差的分析是一件特别费时的工作, 往往占分析工作70%以上的时间
• 系统误差的随机性质--
许多情况下,测量仪器或设备对一个常数值的物理量的测定过程中包含了许多随机过程,对同一个常数值的物理量的多次测定成为一个分布,即测定值成为一个随机变量。
李雅普诺夫中心极限定理: 设相互独立的随机变量12,,,n X X X 有有限的数学期望和方差,当n 很大时,随机
变量1n
i
i X =∑近似地服从正态分布。
在许多物理量测量中,系统误差是由许多相互独立的随机因素合成的,根据该定理可知,系统误差近似地服从正态分布。
例如单能光子束射入碘化钠晶体(NaI(T1)),用光电倍增管测量晶体中的闪烁荧光,光电倍增管的输出电信号经过放大器等电子学线路,最后测量出脉冲幅度谱。这一测量中涉及一系列相互独立的随机过程,如 :
光子在晶体中的能量损失,
错误!文档中没有指定样式的文字。
·251·
(电子对效应,康普顿效应,光电效应,电离能损,…) 能量损失转化为不同波长光的概率分布, 光在晶体中的透射率率随光波长的概率分布, 光在晶体中的透射率随不同路程长度的概率分布, 晶体表面的反射折射系数随光波长的概率分布, 光在倍增管窗玻璃中的穿透率随光波长的概率分布,
光子在光电倍增管阴极上产生光电子的量子效率的波长分布, 光子在光电倍增管阴极上产生光电子的量子效率随击中 位置的分布, 电子的倍增过程中倍增系数的涨落, ……
因此,最后测到的全能峰的脉冲幅度近似于正态分布。―
测量值报导
st sys μσσ±±
μ
:通过测量得到的对待测量真值的估计
st
st
sys σσμ
σ+-+-±, sys
sys
st σσ
μσ+-+-±,
sys
st st sys
σσσσμ
+
+--++--。 系统误差与统计误差从来源知相互独立
t σ=
t
μσ±,
t t σσμ
+
-+-。
§1.3 测量数据表示及运算
1.数据位数
• 误差应与测量精度一致, 测量值末位应与误差末位相同;
7.550.03,± 7.60.1,± 7.550.1,± X 7.60.03,± X 。 • 需要对多个测量数据进行运算以得到结果,可将测量值多写一个估计位数字,
珠峰高度 8848.430.21± 米。
• 误差最多只能写两位有效数字
8.630.25±, 8.6320.246± X • 直接测量值(原始数据)误差必须有根据。
直接测量值是以后一切运算、推断的基础,其测量(中心)值及其误差必须给得准确,有根据。