第二节 抽样误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(二)概率 一个随机试验有许多可能的事件,我们不 仅想知道它们有哪些可能的事件,而且还想知道 某些事件出现的可能性的大小,并希望将这一可 能性用数值描述出来。为了定量地描述随机事件, 人们引入了一个描述随机事件发生可能性大小的 统计数据——随机事件的概率。某一随机事件发 生的次数占所有随机事件发生次数的比率就是该 事件的概率。许多数学家、统计学家对概率及其 计算作出了巨大的贡献,提出了概率论的公理化 体系。概率论,就是研究随机事件规律性的科学。
Sx n
51.91 100
5.191(小时)
不重复抽样: x
Sx n 1 n N
51.91 100 1 5.165(小时) 100 10000
2
2.质量标准规定使用寿命不足1000小时为不合格品,试分别 计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。 如表4-3所示。
2
x
2
2
x
2
2
p
P
100
(二)不重复抽样 不重复抽样也称不回置抽样,它是按随机原则从总 体N 个单位中抽取一个容量为n 的样本,每次抽取一个 单位记录后被抽中的单位不再放回总体中,而是从余下 的总体单位中进行抽取。因此,每次抽取后总体单位数 就会减少一个。 1.抽样平均误差 N n 不重复抽样误差计算公式为: n N 1 当总体单位数N 很大时,N-1接近于N ,可用N 代 替。则上列公式可简化为:
表4-3
成数抽样误差计算表
使用寿命 元件质量 抽检数 比重(成数) (个) ( % ) (小时) 900以下 不合格 1 900~950 不合格 2 9.0 950~1000 不合格 6 1000~1050 合格 35 1050~1100 合格 43 1100~1150 合格 9 91.0 1150~1200 合格 3 1200 以上 合格 1 合 计 — 100 100.0
1 2 6 35 43 9 3 1 100
875 925 975 1025 1075 1125 1175 1225 —
875 1850 5850 35875 46225 10125 3525 1225 105550
1.样本平均数 x = 105550/100 = 1055.5(小时)
将表4-1整理为表4-2。
统计学将样本均值与总体均值之间的平均离差的 1/n称为抽样平均误差,简称抽样误差,以μ 表示。换 言之,抽样误差等于总体方差除以样本单位数之商的平 方根,即:
X
n
2
X
n
上式中σ 是未知的,可用样本标准差S 代替,即:
Sx n
2
S
x
wk.baidu.com
n
例1,某地区种植20000平方米小麦,随机抽取1000平方米进 行实割实测,计算结果: x = 6千克,Sx = 0.1千克,试计算重复 抽样误差。 已知:n = 1000 ,Sx = 0.1;求:μ x =? 解:μ x = Sn = = 0.1 = 0.01 =0.00316(千克) n 1000 1000 (2)样本成数的抽样误差 样本成数抽样误差μ p等于总体成数除以样本单位数的平方根。 即: μ p= n = P 1 P = Sn n 例2,从1000件产品中随机抽取100件进行质量检验,发现10 件废品,求1000件中的废品率。 p = n1/n = 10/100 = 0.1(即10%) μ p= 0.1 1 0.1 =0.03,(即3%)
表4-2 1% 样品标准差计算表
x 875 925 975 1025 1075 1125 1175 1225 合计
Sx
x- x -180.5 -130.5 -80.5 -30.5 19.5 69.5 199.5 169.5 —
(x- x ) 32580.25 17030.25 6480.25 930.25 380.25 4820.25 14280.25 28730.25 —
本节小节:
(一)样本容量仅为总体的一小部分,总体单位数的多少对 估计的精度没有影响起作用的是样本容量。
(二)总体标准差σ是未知的,可用样本标准差S 来代替。
(三)重复抽样时平方根法是精确的;不重复抽样时公式给 出一个较好的近似值——当样本单位数占总体单位数很小比重时。
2
2.样本成数抽样误差的计算 上述样本平均数的抽样误差原理也适用于成数抽样误差计算。 p P 因此, 。其计算公式为:
p
P P N n 1 n N 1 P P 1 n 1 n N
例4,仍以例2资料,按不重复抽样方法计算成数抽样误差:
二、抽取样本单位的方法和抽样误差 根据每次从总体中抽取一个样本单位进行 调查登记后,是否再把这个样本单位放回原总体 中去,抽取样本单位方式有重复抽样和不重复抽 样两种方法。 (一)重复抽样 重复抽样也称回置抽样,它是从总体N 个 单位中随机抽取一个容量为n 的样本,每次抽取 并记录事件后把被抽中的单位放回总体中重新参 加下次抽取。这样,总体单位数不变,已经被抽 中的样本单位仍然有同等机会再被抽中。 1. 抽样平均误差 (1)样本平均数的抽样平均误差
重复抽样: p
p1 p n 0.91 0.09 100 0.0286
不重复抽样: p
p1 p n 1 n N
0.91 0.09 100 1 0.0285 100 10000
二、影响抽样误差的因素 抽样理论研究和实践证明影响抽样误差大小的因素主要有: (一)总体各变量值X 间差异的大小 如果其他条件不变,离散程度(σ X或σ P)越大,抽样误差 μ x或μ p越大;反之,则越小。 (二)样本单位数(样本容量)的多少 其他条件不变,样本单位数n 越少,抽样误差越大;反之, 则越小。 (三)抽样方法 重复抽样误差大于不重复抽样误差。 (四)抽样调查组织形式 不同的抽样组织形式会产生不同的抽样误差。
第二节
抽样误差
一、随机事件与概率 (一)随机事件 在相同条件下,每次试验可能出现也可能不出现的状态称为 随机事件。 例如,掷一对骰子,两颗骰子落下时总共有多少种状态呢? 白色骰子能够以6种状态中任何一种状态落下:
譬如当白色骰子显示
时,黑色骰子仍有6种状态落下:
这里,骰子落下所呈现的每种状态称为随机事件。
2 2
(三)综合练习
例如,某电子元件厂对10000个元件使用寿命抽取1%进行检 验,结果如表4-1所示。
表4-1
1%样品测试数据
使用寿命(小时)
抽检数f
组中值x
x·f
900以下 900~950 950~1000 1000~1050 1050~1100 1100~1150 1150~1200 1200以上 合 计
2
2
f 1 2 6 35 43 9 3 1 100
(x- x ) f 32580.25 34060.5 38881.5 32558.75 16350.75 43472.25 42840.75 28730.25 269475
51.91小时
2
x x
f
f
269475 100
重复抽样: x
p
p p 1 n 1 n N 0.1 0.1 1 100 100 1 0.028 1000
计算表明,不重复抽样比重复抽样误差小,因为n/N 是个小 正数,1-n/N 的值小于1。 由于总体方差σ 未知,实际操作时可用样本方差S 代替。
2 X
x
X N n
2
n N 1
Sx n 1 n N
2
例3,现仍以例1资料为例按不重复抽样方法计算抽样误差。 已知: N = 20000 , n = 1000 , Sx = 0.1千克 求:μ x = ? 解:
x
1000 1 0.00308千克 1000 20000 0.1