统计基础课件——抽样误差

合集下载

第3章抽样误差陆

第3章抽样误差陆
图 正态分布N(5.00,0.502)总体分布
结论 1
各样本均数未必等于总体均数; 样本均数间存在差异;
由抽样实验所得的100个样本作出其均数分布 直 方 图 如 图 4.1 。 曲 线 是 对 抽 样 得 到 的 100 个 数据拟合的分布曲线。
Fraction
1 .9 .8 .7 .6 .5 .4 .3 .2 .1 0
的分X 布服从正态分布;
■样本均数的均数为 μ;
■样本均数的标准差为
x

n
中心极限定理
不同类型的总体分布,对于统计量分布有何影响?
正态分布总体 偏三角分布总体 均匀分布总体 指数F分布总体 双峰分布总体
中心极限定理
(二)从非正态(nonnormal)分布总体(均数为μ, 方差为σ)中随机抽样(每个样本的含量为n),可 得无限多个样本,每个样本计算样本均数,则 只要样本含量足够大(n>50),样本均数也近似服 从正态分布。
■样本均数的均数为 μ;
■样本均数的标准差为
x
n

3.标准误
standard error
抽样误差 中心极限定理 标准误 分布
标准误(standard error)
样本统计量的标准差称为标准误。样本均数的标准 差称为均数的标准误。
均数的标准误表示样本均数的变异度。
x
n
当总体标准差未知时,用样本标准差代替,
t-distribution
抽样误差 中心极限定理 标准误 分布
正态分布的标准化变化
若 X ~ N(μ,σ) , 则
X ~ N (0,1。)

X ~ N (, X ),则 u
X
~
N (0,1)。

[实用参考]抽样误差.ppt

[实用参考]抽样误差.ppt
第七章 参数估计
Sampling Error & Estimation of Parameter
南方医科大学生物统计学系
Department of Biostatistics Southern Medical University
主要内容
抽样误差与标准误 t分布 可(置)信区间
变异
“世界上没有两片完全相同的叶子” ----植物学家
问题:如何度量抽样误差的大小?
抽样误差
由表1可见,各个样本均数`Xi 并不等于相应的
总体均数5.00,相互间也不完全相同。
由数理统计可证明,这些样本均数服从均数为
μ(本例为5.00),标准差为σ X的正态分布。
其中,σX的计算公式为:
X


n
一种统计量
抽样误差
标准误( Standard Error, SE)
方法
方法来控制。
SE 统计量的标准差 表示抽样误差大小
增大样本含量可减少
算式
X 2 X 2 / n
S
n 1
用途
随n 增大
求参考值范围 渐趋于稳定
S S/ n X 求可信区间 渐趋于0
t分布
t Distribution
t分布的发现
早在1875年,德国天文学家、测 量学家F.R.Helmert 就在数学上
频数 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
450
400
与n成反比,n↑,S`X↓;
350 300 250
200
n→∞时, S`X →0,而S
150 100 50

抽样误差和可信区间-幻灯片(1)

抽样误差和可信区间-幻灯片(1)

均数之差可信区间的计算
正常组
肝炎组
1=?
2=? 1- 2 =?
均 数:273.18ug/dL 标准差:9.77ug/dL
均 数: 231.86ug/dL 标准差:12.17ug/dL
X1X242.32
合并方差与均数之差的标准误
❖ 合并方差(方差的加权平均)
sC 2 (n11n)1s 12 n2(n 221)s22
❖ 每一自由度下的t分布曲线都有其自身分布规律。t界值 表。
t分布曲线下的面积
f (x)
nn21n1
x2 n
n12
2
-t 0 t
t界值表
单侧:
P(t <-tα,ν)= α或 P(t >tα,ν)= α 双侧:
-t 0 t
P(t <-tα/2,ν)+ P(t >tα/2,ν)= α 即:P(-tα/2,ν<t <tα/2,ν)= 1-α [例] 查t界值表得t值表达式
可信区间的定义
❖ 按一定的概率或可信度(1-α)用一个区间 来估计总体参数所在的范围,该范围通 常称为参数的可信区间或者置信区间 (confidence interval,CI),预先给定的概 率(1-α)称为可信度或者置信度 (confidence level),常取95%或99%。
❖ 可信区间(CL, CU )是一开区间 CL、CU 称 为可信限
❖ 这里的95%,指的是方法本身!而不
是某个区间! ❖ 总体参数虽未知,但却是固定的值,
而不是随机变量值 。
95%可信区间的含义
按这种方法 构建的可信区 间,理论上平 均每100次,有 95 次 可 以 估 计 到总体参数。

5.2 抽样误差

5.2  抽样误差
【3】某仓库有某种零配件10000套,随机抽取400 套,发现32套不合格。求合格率的抽样平均误差 μ p
1、解
2、解:
3、解: 已知N=10000,n=400,
p=368/400=92%,求 μ p 重复抽样:
不重复抽样:
【4】某校随机抽选400名学生,发现戴眼镜的学生有 80人。根据样本资料推断全部学生中戴眼镜的学生所 占比重时,抽样误差为多大?
x
2
nn
0.9 0.045 400
抽样平均误差μ
(一)平均数的抽样平 均误差x
1.重复抽样条件下
x
x2
n
sx2 n
2.不重复抽样条件下
x
sx2 (1 n )
n
N
抽样平均误差μ
(二)成数的抽样平均 误差 p
1.重复抽样条件下
p
p2
n
sp2 n
p(1 P) n
2.不重复抽样条件下
4、解:样本p=n1/n=80/400=20%
5、重复抽样时:
x
2
nn
0.9 0.045 400
6、不重复抽样时: 重复抽样时:
思维导图
实践任务
对济宁职业技术学院在校大学生每月消费支出情 况,选择合适的组织形式进行抽样调查,并计算 总体的抽样平均误差。
统计基础与应用
谢谢
aggregative index
【5】已知:样本单位数400户,样本平均满意度3.68 ,样本满意度的标准差0.9,我们采取的是重复抽样的 方式,计算抽样平均误差。
【6】某灯泡厂对10000个产品进行使用寿命检验,随 机抽取2%样本进行测试,按规定,灯泡使用寿命在 1000小时以上者为合格品,测得样本数据如下:灯泡 平均使用时间 x=1057小时,灯泡使用时间标准差为 s=53.63小时,合格品率为p=91.5%,试根据资料计算 平均寿命和合格品率抽样误差。

正态分布及抽样误差PPT课件

正态分布及抽样误差PPT课件


➢20 ~ 29岁正常成年男子尿酸浓度
➢求双侧95%的参考值范围:
x 350.24(mol / L), s 32.97
➢下限
➢上限
x 1.96s 350.24 32.97 285.62(mol / L)
x 1.96s 350.24 32.97 414.86(mol / L)
第32页/共73页
3 1 2
第9页/共73页
均数相等、方差不等的正态分布图 示
2
1 3
第10页/共73页
正态分布的特征
➢ 正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。 ➢ 高峰在均数处; ➢ 均数两侧完全对称。 ➢ 正态曲线下的面积分布有一定的规律。
第11页/共73页
正态曲线下的面积规律
➢X轴与正态曲线所夹面积恒等于1 。 ➢对称区域面积相等。
S(-, -X)
S( +X,)=S(-, -X)
X
第12页/共73页
正态曲线下的面积规律
➢ 对称区域面积相等。
S(-x1, -x2)
S(x1,x2)=S(-x2,-x1)
-x1 -x2
x2 x1
第13页/共73页
正态曲线下的面积规律
1
第1页/共73页
正态分布的背景-一个街头赌博游戏
为什么如此摆放奖品? 平时,我们很少有人会去关心小球下 落位置的规律性,人们可能不相信它是 有规律的。
高尔顿钉板试验
2
第2页/共73页
正态分布的背景-高尔顿钉板试验
x -8 -7 -6 -5 -4 -3 -2 -1 O1 2 3 4 5 6 7 8
这条曲线就是我们将要介绍的正态分布曲线。 3 第3页/共73页

抽样误差与假设检验培训课件(PPT49页)

抽样误差与假设检验培训课件(PPT49页)

抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt
抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt
t-分布
t-distribution
抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt 抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt
抽样误差的概念
定义:由抽样引起的样本统计量与总体参数 间、以及样本统计量与样本统计量之间的差 别。
原因:个体变异+随机抽样 表现:
• 样本统计量与总体参数间的差别 • 不同样本统计量间的差别
抽样试验
➢ 假设一个已知总体,从该总体中重复抽取样本 量相等(为m)的样本n次,对每个样本计算样 本统计量(均数、方差等),观察n个样本统计量 的分布规律--抽样分布规律。
抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt
抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt
例,2000年某研究者随机调查某地健康 成年男子27人,测其血红蛋白量均数为 125 g /L,标准差为15 g /L。试估计该样 本均数的抽样误差。
抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt
抽样误差与假设检验培训课件(PPT49页)培 训课件 培训讲 义培训ppt教程 管理课 件教程ppt
标准误的概念(standard error)
样本均数的标准差称为均数的标准误。 ➢ 均数的标准误表示样本均数的变异度。

抽样误差和假设检验t检验PPT讲稿

抽样误差和假设检验t检验PPT讲稿

样本均数的标准差,也称为标准误 ,反映了样本均数间的离散程度, 也反映了样本均数与总体均数的差 异。
例4.1 某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差 6.85cm,计算标准误。
sx
s 6.85 0.685(cm) n 100
当前你正在浏览到的事第五页PPTT,共六十七页。
p(t / 2( )
x
sx
t / 2( ) )
1
• 对上式进行变换,得置信度为1-α的总体均数可信区间
的通式为:
x t / 2( ) sx x t / 2( ) sx
• 习惯将上式写成:
(x t /2( ) sx , x t /2( ) sx )
当前你正在浏览到的事第二十页PPTT,共六十七页。
(3) 越小,则
越大,t值越分散,和N(0, 1)
s 相比,集中在这部分的比例越少,尾部翘得越
高。
x
当前你正在浏览到的事第十页PPTT,共六十七页。
第四章 抽样误差与假设检验
当前你正在浏览到的事第十一页PPTT,共六十七页。
第四章 抽样误差与假设检验
t 分布(与u 分布 比较的特点)
当前你正在浏览到的事第十二页PPTT,共六十七页。
• 反证法:当一件事情的发生只有两种可能A和B,为
了肯定其中的一种情况A,但又不能直接证实A,这 时否定另一种可能B,则间接的肯定了A。
• 小概率事件原理: 小概率事件在一次抽样中不可能发生.
• 概率论:事件的发生不是绝对的,只是可能性大小而已。
即,带有风险性的推断.
当前你正在浏览到的事第三十二页PPTT,共六十七页。
一、点估计
第四章 抽样误差与假设检验

抽样误差与参数估计-38页PPT文档资料

抽样误差与参数估计-38页PPT文档资料
• 在n确定的情况下,准确度↑,精确度↓;
• 在兼顾准确度和精确度时,一般取95%可信 区间;
• 在可信度确定的情况下,增加样本例数,可 提高精确度;
两样本均数之差的分布与标准误
• 从两个正态总体 N (1, 1 2),N (2, 2 2)
中随机抽样,分别得n1、X 1 、s1和 n2、X 2 、s2 则:
Parameter estimation
Hypothesis testing
Point estimation
Interval estimation
• 点估计(point estimation):就是用样本指 标直接地估计总体指标。
• 总体均数

X
• 总体率

p
• 即样本均数和样本率分别是总体均
X/2 XX/2 X
P(/2X /2)1 X
X/2/ n
n足够大,用样本标准 差S来估计σ
• 例7-4:已知某样本的 X 5.03 ,s=0.52, n=10,试计算该总体正常成年男子平均红细 胞计数的95%可信区间。
• 解:v=9,α=0.05(双侧),查t界值表,得
S X S / n 0 .5 2 / 1 0 0 .1 6 4
/ n 0 .5 0 /1 0 0 .1 5 8 X
• 实际工作中,只能根据一份样本计算出 一个标准误说明抽样误差的大小,即 估计μ的可靠程度
• 例7-3: 2019年,在某地20岁应征男青 年中随机抽取85人,平均身高为171.2cm, 标准差为5.3cm,计算当地20岁应征男青 年身高的标准误。
1. 未知时,按t分布的原理
tt/2,和 tt/2,的概率之和为α
P ( t/2 ,tt/2 ,) 1

抽样误差与抽样分布概述ppt(48张)

抽样误差与抽样分布概述ppt(48张)

表 4-2 样本量为 25 从 N(72.5,6.32)共随机抽取 10 个样本

样 样 最最抽

本 本 小大样

n=9
均 标 值值误

数准


1 65 68 68 76 84 6480 63 84 72.4 8.6 63 84 -0.10
2 74 61 65 75 67 78 72 70 67 69.9 5.4 61 78 -2.60
每次抽取10000个样本并计算各自的样本均 数
以10000个样本均数作为一个新的样本制作 频率密度分布图
72 74 74 73 66 67 80 73 64 75 78 69
4 74 80 76 64 66 71 82 78 67 79 56 64 6571.6 7.1 56 83-0.90
69 74 64 66 62 75 71 80 83 77 76 71
5 75 72 79 74 76 65 80 71 74 75 79 74 7373.5 4.4 65 80 1.00
72 81 60 76 77 69 73 74 76 71 76 79
10 79 82 75 64 77 74 73 67 67 84 79 78 7373.9 6.8 60 84 1.40
80 83 78 76 60 80 79 72 72 66 61 69
6
x
1 10
10 i 1
xi
1 10
7 74 67 71 77 70 61 66 70 73 69.9 4.8 61 77 -2.60
8 62 73 80 64 84 66 74 69 76 72.0 7.4 62 84 -0.50
9 73 68 62 73 73 69 76 71 68 70.3 4.1 62 76 -2.20

《抽样误差》课件

《抽样误差》课件

抽样误差的控制方法
1
增加样本容量
通过增加样本容量来减小随机误差,使样本更能代表整体总体。
2
提高调查质量
采用合适的调查方法和严格的调查流程,减小系统误差的发生。
3
优化抽样方案
选择合适的抽样方法和样本设计,以减小误差并提高整体调查质量。
案例分析
对比不同抽样方法的误差
通过对不同抽样方法的误差进行对比分析,选择最 适合的方法。
如何选择合适的抽样方法
根据调查的目的和样本特点,选择合适的抽样方法 以减小误差。
总结
1 抽样误差的重要性
2 如何有效地控制抽样误差
了解抽样误差的特点和影响,可以保证研究和调 查的有效性和可靠性。
通过增加样本容量、提高调查质量和优化抽样方 案,可以有效地控一些与抽样误差相关的经典论文,深入了解抽样误差理论和方法。
《抽样误差》PPT课件
抽样误差是研究和调查中不可避免的问题。本课程将介绍抽样误差的背景、 常见的抽样方法、误差类型以及控制方法,并通过案例分析进行进一步探讨。
概述
抽样误差的定义
抽样误差是由于从一个样本中得出结论,而这个样 本只是整体总体的一个子集,因此存在一定的误差。
抽样误差的产生原因
抽样误差的产生主要受样本选择方式、样本大小和 样本的代表性等因素的影响。
常见的抽样方法
1 简单随机抽样
2 分层抽样
从总体中随机选择样本,使每个个体都有相等的 概率被选中。
将总体分为几个层次,然后在每个层次内进行随 机抽样。
3 整群抽样
4 系统抽样
将总体分为若干个不相交的群体,然后从选择的 群体中抽取样本。
在总体中选择一个初始样本,然后按照一定的规 则选择后续的样本。

第4章抽样误差与假设检验ppt课件

第4章抽样误差与假设检验ppt课件

治疗前后血清甘油三酯疗效的无效假设和备择假
设分别为
H : 0
0
d
H : 0
1
d
检验水准 是预先规定的拒绝域的概率值,实
际中一般取 0.05 。
[说明] :备择假设有双侧和单侧两种情况。双侧
检验指不论正方向还是负方向的误差,若显著地超出
检验水准则拒绝H0,H1
:
μ d
0即为双侧检验;单侧
检验指仅在出现正方向或负方向误差超出规定的水准
第一节 均数的抽样误差与标准误
一、均数的抽样误差
在医学研究中,绝大多数情况是由样本信息研 究总体。由于个体存在差异,因此通过样本推论 总体时会存在一定的误差,如样本X均数 往往不 等于总体 均数 ,这种由抽样造成的样本均数与总 体均数的差异称为抽样误差。对于抽样研究,抽 样误差不可避免。
二、抽样误差的分布
对上面问题可以作如下考虑:
治疗前后甘油三
酯的变化(差值)
d
样本
n 30 S 0.76 d 1.38 d
0? d
问题归纳: 样本疗效
药物作用 + 机遇
d 1.38
μ 0? d
问题:| d 0 | 究竟多大能够下“有效”的结论?
假定治疗前后血清甘油三酯检测结果的差值服从正态分
布,若 H : 0 则 t d 0 服从t 分布。
上限: X u/2.SX 4.77 1.96 0.38/ 140 4.83(1012 / L)
ቤተ መጻሕፍቲ ባይዱ
三、模拟实验
模拟抽样成年男子红细胞数。设定:
4.75, 0.39,n 140
产生100个随机样本,分别计算其95%的可信区间, 结果用图示的方法表示。从图可以看出:绝大多数 可信区间包含总体参数 4.75 ,只有6个可信区间 没有包含总体参数(用星号标记)。

均数的抽样误差与t检验培训教材经典课件(PPT31页)

均数的抽样误差与t检验培训教材经典课件(PPT31页)
本X =例1中21已g/L知,一s=个48总.8体g/L0。= 136g/L,一个样本:n=25,
现有的样本均数和总体均数不同,什么是造成其差的 原因?
为识别原因,我们对其做假设检验。
一是检验假设(hypothesis to be tested),亦称原 假设或无效假设(null hypothesis),记为H0 ;
间。当未知时,相应的总体均数1-可信区间为:
( X –z S x , X +z S x )
例10-9 随机抽取某地25名正常成年男子,测得该样本的脉 搏均数为73.6次/分,标准差为6.5次/分,求该地正 常成年男子脉搏总体均数95%的可信区间。
本例自由度=25-1=24,经查表得t0.05,24=2.064,则
0.1
-4
-3
பைடு நூலகம்-2
-1
0
1
2
3
4
图10-4 自由度分别为1、5、∞时的t分布
t分布的特征:
1. t分布为一簇单峰分布曲线,以0为中心,左右 对称;
2. t分布与自由度有关,自由度越小,t分布的峰
越低,而两侧尾部翘得越高;
3. 自由度逐渐增大时,t分布逐渐逼近标准正态分 布;当自由度趋向无穷大时,t分布趋近标准正 态分布,故标准正态分布是t分布的特例。
标准误和标准差是区别的,标准差用来描 述个体间的变异程度,用1.96s可以估计95% 的正常值范围;而标准误是样本均数的标准差 ,用来描述抽样误差的大小,用( t0.05,vS )估 计总体均数95%可信区间。
一、均数的抽样误差与标准误
t分布曲线
f(t)
=∞(标准正态曲线)
=5
=1
0.3
0.2

《均数的抽样误差》PPT课件

《均数的抽样误差》PPT课件
若仅知样本均数及标准误的估计值,且样本较小 时,用标准误的估计值来代替标准误,误差较大 ,需要改用t值来推算可信区间。
精选ppt
6
二、t值与t分布 样本均数与总体均数间的差如以均数标准误 的估 计值的倍数来表示,此倍数即为t值
t x
Sx
从正态分布总体中抽取若干个样本含量相同的样 本,每个样本各计算一个t值,如抽取的样本很多 时,可发现t值的分布是以0为中心,两侧对称的 类似正态分布的一种分布。即t distribution。
t分布曲线的峰度kurtosis:受n的影响。当n小时, 曲线低平;n越大越接近正态分布。即t 分布曲线 是随自由度的大小而有规律地变动的。
精选ppt
7
degree of freedom: ν=n-1 (读:nu)
t分布曲线不是一条曲线而是一簇曲线
t 分布曲线与横轴间的面积有规律:
两侧外部面积为5%及1%的界限的t值常用t0.05(ν)、 t0.01(ν)表示 自由度趋于∞时,t分布趋向于均数为0,标准差为 1的标准正态分布。一般情况下t分布曲线较正态 分布低平,因而t0.05(ν)≥1.96, t0.01(ν)≥2.58 t值与P值呈反向关系:t越大,则P越小;反之亦 然。|t|≥ t0.05(ν),P≤0.05
抽取一定数量的观察单位作为样本进行抽样研究,
通过样本指标来说明总体特征,这种从样本获取
总体信息的过程,称~
精选ppt
2
二、均数的标准误
数理统计推论和中心极限定理central limit theorem 表明:(1)从正态总体N(μ,σ)中,随机抽
取例数为n的样本,样本均数 x 也服从正态分布;
(2)从均数为μ,标准差为σ的正态或偏态总体, 抽取例数为n的样本,样本均数 的x总体均数也 为μ,标准差用 表 x示。通常将样本统计量的 标准差称为标准误standard error, SE, 样本均 数的标准差即均数标准误standard error of mean, SEM。

抽样分布与抽样误差PPT(51张)

抽样分布与抽样误差PPT(51张)

按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样。
4·整群抽样(集团抽样)
—— 将总体全部单位分为若干“群”,然后 随机抽取一部分“群”,被抽中群体的所有 单位构成样本
例:总体群数R=16 样本群数r=4
A D
E
B F G
CM N
J H
L K
P O I
LP HD
样本比例的抽样分布
(数学期望与方差)
1. 样本比例的数学期望
E(p)
2. 样本比例的方差
– 重复抽样
p2
(1)
n

不重复抽样
2 p
(1)Nn
n N1
第二节 抽样误差
一、抽样误差的概念 二、抽样平均误差 三、抽样极限误差
指样本估计量与总体参数之间数量抽样Biblioteka 差 上的差异,仅指由于按照随机原则
•第一个
•第二个观察值
•观察值
•1
•2
•3
•4
•1
•1,1
•1,2
•1,3
•1,4
•2
•2,1
•2,2
•2,3
•2,4
•3
•3,1
•3,2
•3,3
•3,4
•4
•4,1
•4,2
•4,3
•4,4
计算出各样本的均值,如下表。并给出样本均 值的抽样分布
•16个样本的均值(x)
•第一个 •观察值
•第二个观察值 •1 •2 •3 •4

值越来越接近被估计的总体参数
P(ˆ ) 较大的样本容量
B
较小的样本容量
A

ˆ
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(二)概率
一个随机试验有许多可能的事件,我们不 仅想知道它们有哪些可能的事件,而且还想知道 某些事件出现的可能性的大小,并希望将这一可 能性用数值描述出来。为了定量地描述随机事件, 人们引入了一个描述随机事件发生可能性大小的 统计数据——随机事件的概率。某一随机事件发 生的次数占所有随机事件发生次数的比率就是该 事件的概率。许多数学家、统计学家对概率及其 计算作出了巨大的贡献,提出了概率论的公理化 体系。概率论,就是研究随机事件规律性的科学。
表4-3 成数抽样误差计算表
使用寿命 元件质量 抽检数 比重(成数)
(小时)
(个) ( % )
900以下 不合格 1
900~950 不合格 2
950~1000 不合格 6
1000~1050 合格
35
1050~1100 合格
第二节 抽样误差
一、随机事件与概率 (一)随机事件 在相同条件下,每次试验可能出现也可能不出现的状态称为
随机事件。 例如,掷一对骰子,两颗骰子落下时总共有多少种状态呢? 白色骰子能够以6种状态中任何一种状态落下:
譬如当白色骰子显示 时,黑色骰子仍有6种状态落下:
这里,骰子落下所呈现的每种状态称为随机事件。
行实割实测,计算结果: x = 6千克,Sx = 0.1千克,试计算重复
抽样误差。
已知:n = 1000 ,Sx = 0.1;求:μx =?
解:μx =
= S 2 x n
= x2 0.12 = 0.01 =0.00316(千克)
n
1000 1000
(2)样本成数的抽样误差
样本成数抽样误差μp等于总体成数除以样本单位数的平方根x
X 2 N n
n N 1
Sx2 1 n n N
例3,现仍以例1资料为例按不重复抽样方法计算抽样误差。
已知: N = 20000 , n = 1000 , Sx = 0.1千克
求:μx = ?
解:
x
0.12 1 1000 0.00308千克
1000 20000
将表4-1整理为表4-2。
表4-2 1% 样品标准差计算表
x
x- x (x- x )2 f
(x- x )2f
875 -180.5 32580.25 1 32580.25
925 -130.5 17030.25 2 34060.5
975 -80.5 6480.25 6 38881.5
1025 -30.5 930.25 35 32558.75
2.样本成数抽样误差的计算
上述样本平均数的抽样误差原理也适用于成数抽样误差计算。 因此, p。其P计算公式为:
p
P1 P N n
n N 1
P1 P 1 n
n N
例4,仍以例2资料,按不重复抽样方法计算成数抽样误差:
p
p1 p 1 n
n N
0.1 1 0.1 1 100 0.028
1075 19.5 380.25 43 16350.75
1125 69.5 4820.25 9 43472.25
1175 199.5 14280.25 3 42840.75
1225 169.5 28730.25 1 28730.25
合计 —

100 269475
Sx
xx 2 f f
269475 51.91小时
900以下
1
875
900~950
2
925
950~1000
6
975
1000~1050
35
1025
1050~1100
43
1075
1100~1150
9
1125
1150~1200
3
1175
1200以上
1
1225
合计
100

1.样本平均数 x = 105550/100 = 1055.5(小时)
x·f 875 1850 5850 35875 46225 10125 3525 1225 105550
100
1000
计算表明,不重复抽样比重复抽样误差小,因为n/N 是个小 正数,1-n/N 的值小于1。
由于总体方差σ2未知,实际操作时可用样本方差S2代替。
(三)综合练习
例如,某电子元件厂对10000个元件使用寿命抽取1%进行检 验,结果如表4-1所示。
表4-1 1%样品测试数据
使用寿命(小时) 抽检数f 组中值x
体N 个单位中抽取一个容量为n 的样本,每次抽取一个
单位记录后被抽中的单位不再放回总体中,而是从余下 的总体单位中进行抽取。因此,每次抽取后总体单位数 就会减少一个。
1.抽样平均误差
不重复抽样误差计算公式为:
X 2 N n
n N 1
当总体单位数N 很大时,N-1接近于N ,可用N 代
二、抽取样本单位的方法和抽样误差
根据每次从总体中抽取一个样本单位进行 调查登记后,是否再把这个样本单位放回原总体 中去,抽取样本单位方式有重复抽样和不重复抽 样两种方法。
(一)重复抽样
重复抽样也称回置抽样,它是从总体N 个 单位中随机抽取一个容量为n 的样本,每次抽取
并记录事件后把被抽中的单位放回总体中重新参 加下次抽取。这样,总体单位数不变,已经被抽 中的样本单位仍然有同等机会再被抽中。
1. 抽样平均误差
(1)样本平均数的抽样平均误差
统计学将样本均值与总体均值之间的平均离差的
1/n称为抽样平均误差,简称抽样误差,以μ表示。换
言之,抽样误差等于总体方差除以样本单位数之商的平 方根,即:
X 2
X
n
n
上式中σ是未知的,可用样本标准差S 代替,即:
S Sx2 x nn
例1,某地区种植20000平方米小麦,随机抽取1000平方米进
100
重复抽样: x
Sx n
51.91 5.191(小时) 100
不重复抽样:x
Sx 1 n n N
51.912 1 100 5.165(小时) 100 10000
2.质量标准规定使用寿命不足1000小时为不合格品,试分别 计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。 如表4-3所示。
μp=
= p2 n
P 1 P =
n
SP2 n
例2,从1000件产品中随机抽取100件进行质量检验,发现10
件废品,求1000件中的废品率。
p = n1/n = 10/100 = 0.1(即10%)
μp=
0.11 0.1 =0.03,(即3%)
100
(二)不重复抽样
不重复抽样也称不回置抽样,它是按随机原则从总
相关文档
最新文档