试验检测数据的分析与处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)计算∣xk - x ︱,如果 ∣xk - x ∣≥g0(α,n)σ(σ未知时以s代
替σ) 则可将Xk剔除,否则保留。
应用判断准则时应注意以下几点:
(1)剔除可疑数据时,首先应对样本观测值中的最小值和最 大值进行判断,因为这两个值极有可能是可疑数据。
(2)可疑数据每次只能剔除一个,然后按剩下的样本观测 值,重新计算平均值和标准偏差σ,再做第二次判断,如 此逐个地剔除,直到所有剩下的值不再是可疑数据为止。 不允许一次同时剔除多个样本观测值。
2.相关图及回归分析 (1)相关图。相关图又称散布图或散点图,它是将有对应关系
的两种数据点在一张坐标图上所得。 ①相关图的种类。相关图的类型很多,一般可归纳为以下几种
形式 : a.强正相关。 b.弱正相关。 c.强负相关。 d.弱负相关。 e.不相关。 f.非线性相关。
②相关图的作图方法。 (1)数据收集分组:将两组特性数据集中,对应分组(一般应
图示法的基本要点为:
①坐标纸的大小与分度的选择应与测量数据的精度相适应。
②坐标轴应注明分度值的有效数字和名称、单位,必要时还要 标明试验条件,坐标的文字书写方向应与该坐标轴平行,在 同一图上表示不同数据时应该用不同的符号加以区别。
③测量数据往往是分散的,如果用短线连接各点得到的就不是 光滑的曲线,而是折线,需要对曲线进行平滑处理。
在30组以上),填入表中。 (2)定坐标。以要因作为x轴,结果(特征)作为y轴。 (3)数据打点入座。对应描出纵横坐标交点。 (4)说明。在图中适当的位置标明数据的个数、采集时间、工
程部位、制图人和制图日期。
(2)回归分析。
若两个变量x和y之间存在一定的关系,并通过试验获得x和y的一
系列数据,用数学处理的方法得出这两个变量之间的关系式, 这就是回归分析 。
(xi x)2
i 1
n 1
n 1
Cv (%)
_
100
(x 5)变异系数。标准偏差是反映样本数据的绝对波动
状况。
Cv (%)
_
100
x
【例2-5】若甲路段沥青混凝土面层的摩擦系数测得摆值的算术
平均值为55.2,标准偏差为4.13;乙路段的摩擦系数测得摆值
的算术平均值为60.8,标准偏差为4.27。则两路段的变异系数
R xmax xmin
【例2-3】例2-1中的检测数据的极差为
R FBmax FBmin 61 48 13 (BPN)
(4)标准偏差。也称标准离差、标准差或称均方差,它是衡量 样本数据波动性(离散程度)的指标。
n
S (x1 x) 2 (x2 x) 2 ... (xn x) 2
(3)采用不同准则对可疑数据判断时,可能会出现不同的 结论,此时要对所选用准则的适用范围、给定的检验水平 的合理性,以及产生可疑数据的原因等作进一步的分析。
实例:2-8 见教材37页。
(2)计算∣xk - x ︱,如果 ∣xk - x ∣ ≥kxσ(σ未知时以s代替σ)
则可将Xk剔除,否则保留。 上式中kx是与样本容量n有关的系数,可查表。
3、格拉布斯准则
设:x1、x2…xk…xn是从总体中抽取的样本,其中xk 为过大或过小值。判断方法如下:
(1)计算数据的平均值,如总体标准偏差σ未知时, 可求出样本标准偏差s;
1.检测数据的来源
检测数据就其本身的特性来说,可以分为计量值数据和计数值数 据。
(1)计量值。计量值数据是可以连续取值的数据,如长度、厚 度、直径、强度等质量特征。可以表示大小和单位,一般都 带有小数。
(2)计数值。计数值数据的特点是不连续,如不合格品数、缺 陷的点数等,它们一般没有单位,只有大小且只能用整数或 百分数表示。
1 n
n i 1
xi
n i 1
yi
Lxx
n
(xi
i1
x)2
n
i1
xi 2
1( n n i1
xi )2
相关系数----线性关系的显著检验
回归直线方程求得后,还须解决一个问题:x与y是否有线性关 系?或者说x与y的线性相关程度如何?为了回答这个问题, 需要建立一个检验法,即相关系数检验法。统称计量r为样本 相关系数,用下式表示:
现原因。 (3)对于不能确定哪一测值是坏值的情况下,可在数理
统计的基础上进行判断予以剔除。
几种主要的判断方法
1、拉依达准则(3σ或3s准则)(适用于n>50的情况) 设为:过x1、大x或2…过x小k…值xn。是从总体中抽取的样本,其中xk (1)计算数据的平均值和标准差,如果总体标准差
未知是,可求出样本标准偏差s;
第二章 试验检测数据的分析与处理
学习要求: 熟悉数理统计特征值及抽样检验,掌握数
据修约法则,熟悉数据的表达方法;会进行一 元线性回归分析,能运用相关法则对特异数据 的取舍判断。
第一节 数据的统计特征及抽样检验 第二节 数据的处理与表达方法
wenku.baidu.com
第一节 数据的统计特征及抽样检验
一、数据的统计特征及表达
1.总体与样本 2.数据的统计特征量
(2)计算∣xk - ︱, 如果: ∣xk - ︱>3σ
则将xk剔除,否x 则保留。
x
该方法的优点是计算方便、迅速,不用查表,但是判断过 于粗糙,只适用于样本容量n>50的情况。
2、肖维纳特准则
设:x1、x2…xk…xn是从总体中抽取的样本,其中xk 为过大或过小值。判断方法如下:
(1)计算数据的平均值和标准偏差σ,如总体标准 偏差σ未知时,可求出样本标准偏差s;
(3)经验公式法。
常把与曲线对应的公式称为经验公式,在回归分析中则称之为 回归方程。
根据一系列测量数据,建立函数关系式的基本步骤可以归纳如 下:
①描绘曲线。以自变量为横坐标,函数量为纵坐标,将测量数 据点绘在坐标纸上,并把数据点描绘成测量曲线。
②对描绘的曲线进行分析,确定函数关系式的基本形式。 ③曲线直化。 ④确定回归方程中的常量。 ⑤检验所确定公式的准确性。
2.数值修约进舍规则
四舍六入五考虑,五后非零则进一,五后为零视奇偶,奇升偶舍 要注意,修约一次要到位。
第二节 数据的处理与表达方法
一、数据的表达方法和数据分析
1.数据的表达方法:表格法、图示法和经验公式法等。 (1)表格法。 当无须获得自变量的函数关系或为了便于计算,
可将数据列成表格。 表格法简单方便,应用广泛,但有下列缺点:
r
Lxy Lxx Lyy
Lyy
n i1
( yi
y)2
n
i1
yi 2
1( n n i1
yi )2
检验结论的判定:︱r︱=1为完全线性相关;︱r︱=0时,完 全线性无关;当0< ︱r︱<1时线性相关介于中间状态。此时
要根据给定的置信度α在相关系数的临界值表。若r> r0,则 说明线性相关关系显著;若r≤ r0,则线性相关关系不显著。
为:
甲路段:
Cv
4.13 55.2
7.48%
乙路段:
Cv
4.27 60.8
7.02%
从标准偏差看,S甲 S乙 。但从变异系数分析,Cv甲 Cv乙 ,说明甲路 段的摩擦系数相对波动比乙路段的大,面层抗滑稳定性较差。
二、抽样检验基础
其有效性取决于检验的可靠性,与以下因素相关:
(1)质量检验手段的可靠性。 (2)抽样检验方法的科学性。 (3)抽样检验方案的科学性。
①表格法不能清晰的反映出数据之间的关系; ②表格法不易看出变量之间的变化规律; ③表格法对试验数据不能进行数学解析。 当自变量的函数关系无须获得,或为了便于计算,才将数据
列成表格,若想得出未测定的某个值时,可用内插法估计。
(2)图形法。
从图形上易看出函数的变化规律,但对图形解析困难,从图形 上得到某点函数值时,误差会很大。
如果两变量x和y之间的关系是线性关系,就称为一元线性回归。
如果两变量之间的关系是非线性关系,则称为一元非线性回 归或称曲线拟合。
线性回归分析的表达式为:y=a十bx 式中:a称为常数项,b称为回归系数。
b Lxy L xx
a y b x
Lxy
n
(xi
i 1
x)( yi
y)
n i 1
xi yi
F B (58 56 60 53 48 54 50 61 57 55) /10 55.2
(BPN)
(2)中位数。
在一组数据x1、x2、…、xn中,按其大小次序排序,以排在
正中间的一个数表示总体的平均水平,称之为中位数,或 称中值,用表示。
x n 1
~
x
1
2
2
(xn
2
x n 1)
二、检测数据的误差分析
1.误差的产生与种类 误差=测定值-真值
真值可表达为理论真值、约定真值、相对真值、近似真值。 误差可分为绝对误差和相对误差。 2.误差的来源 1)实验装置误差:标准器误差、仪器误差、附件误差。 2)环境误差: 3)人员误差: 4)方法误差: 3、误差的分类: 1)系统误差:可以采取适当的措施消除或校正。 2)随机误差:无法消除其影响。 3)过失误差:认真操作,可以避免。
2
(n为奇数) (n为偶数)
【例2-2】检测值同例2-1,求中位数。
解:检测值按大小次序排列为:61、60、58、57、56、55、
54、53、50、48(BPN),n=10,则中位数为:
FB
FB(5) 2
FB(6)
56
2
55
55.5
(BPN)
(3)极差。在一组数据中最大值与最小值之差,称为 极差,记作:
(1)算术平均值。
x
1 n
( x1
x2
xn )
1 n
n i 1
xi
【例2-1】某路段沥青混凝土面层抗滑性能检测,摩擦系数的检
测使用摆式仪法,测得的摩擦摆值FB(BPN)(共10个测点)
分别为:58、56、60、53、48、54、50、61、57、55。求摩擦
系数的算术平均值。
解:摩擦系数的算术平均值:
1.抽样检验的类型
总的来说,抽样检验可分为非随机抽样和随机抽样两大类。
2.随机抽样的方法
随机抽样的方法有多种,适合于公路工程质量检验的随机抽样方法一般有 以下4种:
(1)单纯随机抽样。 (2)分层抽样。 (3)两级取样。 (4)系统抽样。
3.抽样检验的评定方法 4.抽样检验的意义
三、数据的修约法则
4.测定值的精密度、准确度和精确度
(1)精密度:表示测量结果中随机误差大小的程度。 (2)准确度:表示测量结果中系统误差大小的程度。 (3)精确度:是测量结果中随机误差与系统误差的总和结果。
(a)精密度
(b)精准度
(c)精确度
三、特异数据的取舍原则和方法
在进行数据分析之前,一般应对数据判断和处理: (1)首先检查是否有过失误差存在。 (2)如果有条件,可在误差较大处增加测定次数,以发
相关文档
最新文档