03 试验检测—数据的统计计算与分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
取3S的理由是:根据随机变量的正态分布规律,在多次试验
中,测量值落在X-3S与X+3S之间的概率为99.73%,出现在此范围
之外的概率仅为0.27%。 舍弃可疑值后,应重新计算平均值、标准差、变异系数等 统计量,并分析测量值出现异常的原因,对路基路面质量检测出
现异常测量值的测点及区域进行妥善处理。
99.87%时, Za=3.0。
②服从t分布数据的代表值 当限定上限时,代表值X的评定标准为:
当限定下限时,代表值x的评定标准为:
t分布中ta的数值不仅与保证率a有关,还随测点数N的不同而变,因其计算 复杂,有专用表格可査用。
(3)代表值及评定标准
在公路工程质量检验与评价中,对有些指标限定下限,例如压实度、路 面结构层厚度、半刚性基层和底基层材料强度;对有的指标限定上限,例如 弯沉值。 利用检测数据的测点数N、平均值X和标准差S分别代替正态分布或t分布 置信区间公式中的n、μ 与σ ,即可得到代表值的计算式。 一般来说,对于测点数N大于30时,按正态分布计算试验检测数据的代表 值,测点数N较少时,则按t分布计算代表值。
①服从正态分布数据的代表值 当限定上限时,代表值X的评定标准为:
X=X+ZɑS≤U(U为指标高限)
当限定下限时,代表值x的评定标准为: X=X-ZɑS≥L(L为指标低限)
当保证率为90%时,Za=1.282;当保证率 为93%时,Za=1.5;当保证率为95%时,Zɑ=1.645;
当保证率为97.72%时,Zɑ=2.0;当保证率为
n
S
i 1
2 ( x x ) i
n 1
(3)变异系数CV 标准偏差是反映样本数据的绝对波动状况,当测量较大的量 值时,绝对误差一般较大;测量较小的量值时,绝对误差一般较 小。 因此,用相对波动的大小,即变异系数更能反映样本数据的 波动性。变异系数用CV表示
Cv
★例:甲路段 CV = 4.13/52.2 =7.48%
乙路段 CV =4.27/60.8 =7.02%
ቤተ መጻሕፍቲ ባይዱ
S x
S甲=4.13
S乙=4.27
从标准偏差看, S甲< S乙。但从变异系数分析,CV甲>CV乙,说明甲路段的 摩擦系数相对波动比乙路段的大,面层抗滑稳定性较差。
(4)中位数
在一组数据,按其大小次序排序,以排在正中间的一个数 表示总体的平均水平,称之为中位数,或称中值,用 ~ x 表示。
σ 越小,曲线高而窄,观测值落在 μ 附近的概率越大,观测值越集中。
(2)t分布
t分布的概率密度函数为:
(1)当n→∞时,t分布趋于 正态分布; (2)一般说来,当n>30时, t分布与标准正态就非常接近了。 (3)但对较小的n值, t分 布与正态分布之间有较大的差异, 即在t分布的尾部比在标准正态 分布的尾部有着更大的概率。
1.数据的统计量计算 (1)算术平均值
算术平均值是表示一组数据集中位置最有用的统计特征量 ,经常用样本的算术平均值来代表总体的平均水平。
样本的算术平均值则用
x 表示。
1 n x xi n i 1
(2)标准差S
标准差有时也称标准离差、标准偏差或称均方差,它是 衡量样本数据波动性(离散程度)的指标。 在质量检验中,总体的标准偏差(σ )一般不易求得。 常用样本的标准偏差S。
n 为奇数时,正中间的数只有一个; n为偶数时,正中间的数有两个,取这两个数的平均值作为 中位数.
x n1 (n为奇数) 2 ~ x 1 ( x n x n1 )(n为偶数) 2 2 2
(5)极差
只反映产品的平均水平是不够的,需了解数据波动范围的
3.代表值
数理统计是以概率论为基础,通过对统计资料进行分析研究,验证它 是否符合某种数学模型,从而做出有用的推断。 在质量管理中,数理统计是研究一定总体中所抽子样的某些特征数字 ,从而推断总体的统计特征。 代表值的确定与测定值的概率分布有关。 实践表明,公路路基路面工程试验检测项目的测定值的大小所出现的 频率分布大多服从正态分布或t分布。
大小,可用极差表示,表示在一组数据中最大值与最小值之差, 记作 R
R xmax xmin
2.可疑数据的剔除
在一组条件完全相同的重复试验中,个别的测量值可能会
出现异常,如测量值过大或过小,这些过大或过小的测量数据是 不正常的,或称为可疑的。 对于这些可疑数据应该用数理统计的方法判别其真伪,并决 定取舍。 当试验次数较多时,可简单地用3倍标准差(3S)作为确定 可疑数据取舍的标准。当某一测量值Xi与其测量结果的平均值 X之差大于3倍标准差时,即出现|Xi-X|>3S的情况,则该测量值 Xi应舍弃。
(1)正态分布
正态分布的概率密度函数为:
Y f ( x) 1 2 e
( x )2 2 2
( x )
平均值μ 是f(x)曲线的位置参数, 它决定曲线最高点的横坐标。 标准偏差σ 是f(x)曲线的形状参 数,它的大小反映了曲线的宽窄程度。 σ 越大,曲线低而宽,说明观测值 落在μ 附近的概率越小,观测值越分散。
数据的统计计算与分析
总体——统计分析中所要研究对象的全体。 个体——组成总体的每个单元称为个体。 样本——从总体中抽取一部分个体,称为样本。
用来表示统计数据分布及其某特性的特征量分为两类: (1)一类表示数据的集中位置,如算术平均值、中位数等 (2)一类表示数据的离散程度,主要有极差、标准偏差等 两类的联合:变异系数等