第二节 抽样误差
抽样误差(简单随机抽样)--高等教育自学考试辅导《国民经济统计概论》第六章第二节讲义
正保远程教育旗下品牌网站 美国纽交所上市公司(NYSE:DL)
自考365 中国权威专业的自考辅导网站
官方网站: 高等教育自学考试辅导《国民经济统计概论》第六章第二节讲义
抽样误差(简单随机抽样)
一、抽样误差的概念及分类:
1.抽样误差的概念:指样本指标与全及指标之间数量上的差数。
例如:样本平均数与总体平均数之差
2.抽样误差的分类:173页
(1) 登记性误差:是指统计调查时,由于主客观原因,在登记、汇总、计算、记录中所产生的差错。
(2) 代表性误差:
1) 系统性误差:由于没有遵循随机原则,产生的抽样误差。
这类误差是可以避免的。
2) 随机误差:遵循了随机原则,也会产生抽样误差。
这类误差是不可以避免的。
二、抽样平均误差的概念及计算:
(一)抽样平均误差的概念:
1.抽样实际误差:指某一样本指标与同类全及指标之间数量上的差数。
但是,由于全及指标是一个未知数,并且样本指标可以有多个,因此,实际误差成为一个不易确定的值。
通常,使用平均误差指标计量。
2.抽样平均误差():是指所有可能出现的样本指标(样本平均数与样本成数)的标准差。
或者说,是样本指标与总体指标的平均离差。
(二)抽样平均误差的计算:
1.抽样平均数的抽样平均误差:
当总体方差已知时,。
抽样分布与参数估计
三、t分布曲线下的面积分布规律
自由度为 的t分布曲线
t 分布曲线下 的整个面积为1, t 分布曲线下从a到b 的面积为t值分布 在此范围内的百分 比,即t值落在此 范围内的概率P。
双侧:由于t分布以0为中心对称,即 P(t≤- t, )= P(t≥ t, )= /2 于是有P(- t, ≤t≤ t, )=1-
sx
u X
X
t X =n-1
s X
u分布 t分布
二、t分布图形的特点
• 1. t分布是一簇曲线。 t分布有一个参数, 即自由度 ,与标准差的自由度一致。
• 2. t分布曲线以0为中心,左右对称; 越小, t变量值的离散程度越大,曲线越扁平。
• 3. t分布曲线较标准正态曲线要扁平些(高 峰低些,两尾部翘得高些), 逐渐增大, t分布曲线逐渐的逼近于标准正态曲线,若 =,则t分布曲线和标准正态曲线完全吻 合。
参数估计在统计方法中的地位
统计方法
描述统计
推断统计
点值估计
参数估计
假设检验
区间估计
一、基本概念
➢ 参数估计:用样本统计量来估计总体参数。
点值估计:不计抽样误差,直接用样本均数来 估计μ。
区间估计:根据抽样误差的规律,按一定的概 率估计总体均数的所在范围。统计上习惯用95% 或99%可信区间表示总体均数可能所在范围。
第一节 均数的抽样误差 第二节 t分布 第三节 总体均数可信区间的估计
一、抽样研究:从总体中随机抽取部分 观察单位构成样本,用样本信息去 推断总体特征的研究方法。
统计推断的过程
总体
样
样本统计量
本
例如:样本均
值、比例
二、抽样误差:在抽样研究中,因抽样造 成的样本统计量与样本统计量、样本统计 量与总体参数的差值。
抽样推断的一般问题抽样误差
抽样平均误差是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。
例如:假设总体包含1、2、3、4、5,五个数字。
则:总体平均数为 =(1+2+3+4+5)/5=3
现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。
如:(1+3)/2=2、(1+4)/2=2.5、(2+4)/2=3、(3+5)/2=4…
二、抽样推断的内容
参数估计:参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。
假设检验:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
三、有关抽样的基本概念
(一)总体和样本
总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。
上式可变形为:Δ=tμ(极限误差是t倍的抽样平均误差)
例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果
平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?
解:已知:N=2000n=400σx=300 =4800
则:
计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。
②抽样平均数的标准差仅为总体标准差的
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?
解:抽样单位数增加2倍,即为原来的3倍
则:
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
抽样单位数增加0.5倍,即为原来的1.5倍
第二节 抽样误差
(二)概率 一个随机试验有许多可能的事件,我们不 仅想知道它们有哪些可能的事件,而且还想知道 某些事件出现的可能性的大小,并希望将这一可 能性用数值描述出来。为了定量地描述随机事件, 人们引入了一个描述随机事件发生可能性大小的 统计数据——随机事件的概率。某一随机事件发 生的次数占所有随机事件发生次数的比率就是该 事件的概率。许多数学家、统计学家对概率及其 计算作出了巨大的贡献,提出了概率论的公理化 体系。概率论,就是研究随机事件规律性的科学。
Sx n
51.91 100
5.191(小时)
不重复抽样: x
Sx n 1 n N
51.91 100 1 5.165(小时) 100 10000
2
2.质量标准规定使用寿命不足1000小时为不合格品,试分别 计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。 如表4-3所示。
统计学将样本均值与总体均值之间的平均离差的 1/n称为抽样平均误差,简称抽样误差,以μ 表示。换 言之,抽样误差等于总体方差除以样本单位数之商的平 方根,即:
X
n
2
X
n
上式中σ 是未知的,可用样本标准差S 代替,即:
Sx n
2
S
x
n
例1,某地区种植20000平方米小麦,随机抽取1000平方米进 行实割实测,计算结果: x = 6千克,Sx = 0.1千克,试计算重复 抽样误差。 已知:n = 1000 ,Sx = 0.1;求:μ x =? 解:μ x = Sn = = 0.1 = 0.01 =0.00316(千克) n 1000 1000 (2)样本成数的抽样误差 样本成数抽样误差μ p等于总体成数除以样本单位数的平方根。 即: μ p= n = P 1 P = Sn n 例2,从1000件产品中随机抽取100件进行质量检验,发现10 件废品,求1000件中的废品率。 p = n1/n = 10/100 = 0.1(即10%) μ p= 0.1 1 0.1 =0.03,(即3%)
第四章第二节 抽样误差
1 1 1 1 1
合计
统计基础知识》第四章 抽样技术
第二节
抽样误差
二、抽样平均误差
根据表4-6资料计算样本的标准差为:
统计基础知识》第四章 抽样技术
第二节
抽样误差
二、抽样平均误差
(2)质量检验标准规定寿命不足1 000小时者为不合格(见表4-7)。试分别计算不同抽 样方式下该厂元件的合格率(成数)与抽样平均误差。
91.0
100.0
统计基础知识》第四章 抽样技术
第二节
抽样误差
二、抽样平均误差
一般来说,在实际应用时,常常采用不重复随机抽样的方法从总体各单位中抽取样本单 位,进行调查; 在计算上,为了计算简便,通常可以采用重复抽样条件下抽样平均误差的计 算公式进行计算。
统计基础知识》第四章 抽样技术
Байду номын сангаас二节
抽样误差
三、抽样极限误差
(一)抽样极限误差的理论基础
概率分布的中心极限定理证明: (1)大量的客观事物总体现象是正态总体或近似于正态总体。 (2)在大样本的条件下,抽样平均数的分布是或近似地是正态分布,抽样成数的分布 是或近似地是正态分布。 (3)抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体成数。 正态分布的特征有二: 第一,以总体平均数为中心,两边完全对称分布,即抽样平均数大于或小于总体平 均数的概率完全相等,就是说抽样平均数的正误差和负误差的可能性完全一致。 第二,抽样平均数愈接近总体平均数,变量值出现的可能性就愈大; 反之,抽样平 均数愈远离总体平均数,变量值出现的可能性愈小。
(三)抽样极限误差的计算
1.样本平均数的抽样极限误差的计算
统计基础知识》第四章 抽样技术
第二节
《统计学》第七章抽样推断第二节 抽样误差
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差
或
p p P
如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差
抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:
x x X
即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x
n
式中,n为样本容量; 为总体标准 。
成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)
7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)
;
2
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
《抽样误差》课件
抽样误差的控制方法
1
增加样本容量
通过增加样本容量来减小随机误差,使样本更能代表整体总体。
2
提高调查质量
采用合适的调查方法和严格的调查流程,减小系统误差的发生。
3
优化抽样方案
选择合适的抽样方法和样本设计,以减小误差并提高整体调查质量。
案例分析
对比不同抽样方法的误差
通过对不同抽样方法的误差进行对比分析,选择最 适合的方法。
如何选择合适的抽样方法
根据调查的目的和样本特点,选择合适的抽样方法 以减小误差。
总结
1 抽样误差的重要性
2 如何有效地控制抽样误差
了解抽样误差的特点和影响,可以保证研究和调 查的有效性和可靠性。
通过增加样本容量、提高调查质量和优化抽样方 案,可以有效地控一些与抽样误差相关的经典论文,深入了解抽样误差理论和方法。
《抽样误差》PPT课件
抽样误差是研究和调查中不可避免的问题。本课程将介绍抽样误差的背景、 常见的抽样方法、误差类型以及控制方法,并通过案例分析进行进一步探讨。
概述
抽样误差的定义
抽样误差是由于从一个样本中得出结论,而这个样 本只是整体总体的一个子集,因此存在一定的误差。
抽样误差的产生原因
抽样误差的产生主要受样本选择方式、样本大小和 样本的代表性等因素的影响。
常见的抽样方法
1 简单随机抽样
2 分层抽样
从总体中随机选择样本,使每个个体都有相等的 概率被选中。
将总体分为几个层次,然后在每个层次内进行随 机抽样。
3 整群抽样
4 系统抽样
将总体分为若干个不相交的群体,然后从选择的 群体中抽取样本。
在总体中选择一个初始样本,然后按照一定的规 则选择后续的样本。
极限抽样误差
第二节极限抽样误差石家庄市第一职业中专学校石艳格050000一、教学目的与要求:1.知识目的:理解和熟练掌握极限抽样误差的概念和计算方法,让学生学会运用极限误差对总体数据做出区间估计。
2.能力目的:从学生熟悉的实例出发,研究总体出极限误差的概念,让学生在自学的过程中品尝获得成功的喜悦,从而激发他们浓厚的学习兴趣。
二、教学过程师:前面我们学习了抽样误差的概念及计算方法,明确了抽样误差是可以计算并且可以加以控制的,那如何对抽样误差进行控制呢?就是我们这节课要解决的问题。
首先,请同学们想一想,如何控制抽样误差呢?(创设问题情境,让学生自主思考)生甲:误差当然越小越好了!误差太大了,那我们用样本统计量估计的总体参数就没有意义了。
(大部分同学意见)生乙:抽样误差是随机误差,是避不可免要产生的,我们不可能让它无限度地缩小。
师:大家说的都对,我们对抽样误差加以控制,它不能太大,这是我们很容易理解的,但它也是不可能无限度地小。
因为误差小,就意味着对总体参数估计的精确度会很高,当我们没有50%以上的把握程度去达到它要求的精确度时,我们也不再去做了。
所以抽样误差不能过大,也不能过小。
我们把它可扩大或缩小的倍数称为概率度,用符号t来表示。
概率度和概率(把握程度)之间有着数量对应关系。
概率越大,则概率度的值也越大,反之,概率越小,则概率度的值也越小。
由此我们得到概率F(t)与概率度t之间的对应关系。
(幻灯片)我们常用的:t=1时,F(t)=68.27% t=2 时,F(t)=95.45% t=3时,F(t)=99.73%师:抽样误差的概念是什么?其计算公式是什么?生:抽样误差是指样本统计量与总体参数之间的平均离差程度。
用“u ”表示。
生:抽样误差计算公式共有4个,平均数的有2个,成数的有2个。
分别为:u x =2n δ u x =)1(2N n n -δ n p p u P )1(-= )1()1(Nn n p p u p --= 师:很好。
抽样误差(二)
【课题】抽样误差(二)【教材版本】娄庆松.中等职业教育国家规划教材——统计基础知识.第二版.北京:高等教育出版社,2006娄庆松.中等职业教育国家规划教材配套教学用书——统计基础知识教学参考书.第二版.北京:高等教育出版社,2006娄庆松.中等职业教育国家规划教材配套教学用书——统计基础知识习题集.第二版.北京:高等教育出版社,2006孙万军.中等职业教育国家规划教材配套多媒体教学课件书——统计基础知识.北京:高等教育出版社,2006娄庆松.中等职业教育教育部规划教材——统计原理.第二版.北京:高等教育出版社,2004娄庆松.中等职业教育教育部规划教材辅助用书——统计原理习题集.第二版.北京:高等教育出版社,2004【教学目标】知识目标:1.理解在不重复抽样条件下抽样误差的概念2.理解和熟练掌握在不重复抽样条件下抽样误差的计算方法能力目标:能够在不重复抽样条件下熟练地计算平均抽样误差【教学重点、难点】教学重点:在不重复抽样条件下平均抽样误差的概念、计算教学难点:在不重复抽样条件下平均抽样误差的概念【教学途径】利用例题和练习,让学生能够在不重复抽样条件下熟练地计算平均抽样误差。
【教学媒体及教学方法】制作PPT 。
演示法、讲授法、分组讨论法。
【课时安排】2课时(90分钟)。
【教学过程】第一环节 导入(5分钟)在上一节课,我们共同学习了在重复抽样条件下平均抽样误差的计算,重复抽样就是从总体N 个单位中随机抽取一个容量为n 的样本,每次抽取并登记结果之后把被抽中的单位放回,重新参加下次抽取,用样本平均数计算的抽样平均误差x μ=nxσ2=nxσ用样本成数的抽样平均误差x μ=()nnp p pS21=-⋅ 式中: P=nn 1提问:如果我们把每次抽取并登记结果之后单位不放回总体中,不再重新参加下次抽取,例如抽取奖品,奖品抽取后就不能用重复抽样方式进行,那么可以用何种方式? 学生讨论回答:不重复抽样方式。
统计基础第六章
(一)全及总体和样本总体
1.全及总体:简称总体或母体, 指所要调查研究对象的全体。
2.样本总体:简称样本或子样,指在 全及总体中按随机原则抽取的那部分 单位所构成的集合体。
(二)全及指标和样本指标
1.全及指标:也称母体参数,反 映总体某种属性的综合指标。
总体 N
2.样本指标:也称样本统计量 或抽样指标,反映抽样总体综合指标。
一、样本容量的影响因素
1
总体各单位之间
9 % 0 2 .6 % 8 P 9 % 0 2 .6 % 8
( 9 % 0 2 .6 % 8 1)0 0 N 0 ( P 9 % 0 0 2 0 .6 % 8 1)000
该地有两台以上彩电8 的7用3 户2N0 数P 在9287638200户到92680户之间 。
第四节 样本容量的确定
组成总体的各研究对象称之为总体单位。用N表示
样本总体
样本总体又称子样,简称样本它是由从总体 中按一定程序抽选出来的那部分总体单位所 作成的集合。
n3,0称为大 ;n样 3,0称 本为小 . 样本
全及总体是唯一确定的,而样本总体是随机的。
(二)全及指标和样本指标 1.全及指标。全及指标是根据全及总体各单位
第六章 抽样调查
本章相关内容
第一节 抽样调查的意义和作用 第二节 抽样误差 第三节 抽样推断 第四节 必要抽样数目的确定
目标要求
能力(技能)目标
知识目标
熟练运用抽样估计的一 般原理推断全及总体的
掌握随机抽样的涵义;
指标;
掌握抽样调查方法;
熟练运用抽样估计原理 进行区间估计;
掌握抽样平均误差的计算 方法;
如何衡量总体指标落在误差范围内的概率大小呢?
抽样误差
3n = 1 = 0 . 577 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 当样本单位数增加2倍时,抽样平均误差为原来的0.577倍 0.577 抽样单位数增加 0.5倍,即为原来的 1.5倍 倍 倍
则: µ x =
σ
1 .5 n
=
1 = 0 . 8165 1 .5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。 当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍 0.5倍时 0.8165
40.6 V乙 = ×100% = 7.8% 520
因V乙<V甲 故乙品种具有较大稳定性,宜于推广。 故乙品种具有较大稳定性,宜于推广。
第五章
抽样估计
教学目的与要求
抽样估计是抽样调查的继续, 抽样估计是抽样调查的继续,它提供 了一套利用抽样资料来估计总体数量特征 的方法。通过本章的学习, 的方法。通过本章的学习,要理解和掌握 抽样估计的概念、特点,抽样误差的含义、 抽样估计的概念、特点,抽样误差的含义、 计算方法,抽样估计的置信度, 计算方法,抽样估计的置信度,推断总体 参数的方法, 参数的方法,能结合实际资料进行抽样估 计。
例题一解: 例题一解 则:
已知: 已知: n=100
x=58 10 100
σ=10 = 1 ( 公斤 )
µ
x
=
σ
n
=
即:当根据样本学生的平均体重估计全部学生的平均 当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。 体重时,抽样平均误差为1公斤。 例题二解: 例题二解 x=4800 已知: 已知: N=2000 n=400 σ=300 σ 300 = = 15 ( 小时 ) 则: µ x = n 400
医学统计学04抽样误差
首先,从该地区随机抽取一定数量的居民进行高血压筛查。然后,根据抽样结果计算高血压患病率。 由于抽样是随机的,因此抽样结果会存在误差。这种误差可能受到样本量、样本代表性等因素的影响 。通过统计学方法,可以对抽样误差进行估计和校正。
实例二:某医院患者满意度调查
总结词
该实例说明了如何运用抽样调查来评估某医院的患者满意度,并探讨了抽样误差对评估 结果的影响。
的结论。
影响研究结果的可推广性
02
由于抽样误差的存在,研究结果可能无法完全代表总体情况,
因此其可推广性受到限制。
需要控制和减小抽样误差
03
为了提高研究的准确性和可靠性,需要采取措施控制和减小抽
样误差,如增加样本量、改进抽样方法等。
02
抽样误差的测量
样本均数的标准误
定义
样本均数的标准误是衡量样本均数与总体均数之间差 异的标准差,用于估计总体均数的抽样误差。
公共卫生监测是维护和促进 公众健康的重要手段,通过 抽样误差的评估,可以提高 监测数据的准确性和可靠性
。
在公共卫生监测中,抽样误 差的评估有助于确定样本量 ,以减少监测结果的误差范
围。
通过准确估计抽样误差,公 共卫生监测能够更准确地反 映总体健康状况,为制定和 调整公共卫生政策提供科学 依据。
感谢您的观看
详细描述
为了了解医院的服务质量和患者满意度,从医院的患者中随机抽取一部分进行问卷调查。 由于只对部分患者进行了调查,所以结果会存在误差。这种误差可能受到样本量、患者 代表性、问卷回收率等因素的影响。通过合理的抽样设计和统计分析,可以减小误差,
提高评估结果的准确性。
实例三:某药物疗效的临床试验
总结词
医学统计学04抽样误差
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p p 1 n 1 n N 0.1 0.1 1 100 100 1 0.028 1000
计算表明,不重复抽样比重复抽样误差小,因为n/N 是个小 正数,1-n/N 的值小于1。 由于总体方差σ 未知,实际操作时可用样本方差S 代替。
(二)概率 一个随机试验有许多可能的事件,我们不 仅想知道它们有哪些可能的事件,而且还想知道 某些事件出现的可能性的大小,并希望将这一可 能性用数值描述出来。为了定量地描述随机事件, 人们引入了一个描述随机事件发生可能性大小的 统计数据——随机事件的概率。某一随机事件发 生的次数占所有随机事件发生次数的比率就是该 事件的概率。许多数学家、统计学家对概率及其 计算作出了巨大的贡献,提出了概率论的公理化 体系。概率论,就是研究随机事件规律性的科学。
Sx n
51.91 100
5.191(小时)
不重复抽样: x
Sx n 1 n N
51.91 100 1 5.165(小时) 100 10000
2
2.质量标准规定使用寿命不足1000小时为不合格品,试分别 计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。 如表4-3所示。
2
2
f 1 2 6 35 43 9 3 1 100
(x- x ) f 32580.25 34060.5 38881.5 32558.75 16350.75 43472.25 42840.75 28730.25 269475
51.91小时
2
x x
f
f
269475 100
重复抽样: x
2 X
x
X N n
2
n N 1
Sx n 1 n N
2
例3,现仍以例1资料为例按不重复抽样方法计算抽样误差。 已知: N = 20000 , n = 1000 , Sx = 0.1千克 求:μ x = ? 解:
x
1000 1 0.00308千克 1000 20000 0.1
2
x
2
2
x
2
2
p
P
100
(二)不重复抽样 不重复抽样也称不回置抽样,它是按随机原则从总 体N 个单位中抽取一个容量为n 的样本,每次抽取一个 单位记录后被抽中的单位不再放回总体中,而是从余下 的总体单位中进行抽取。因此,每次抽取后总体单位数 就会减少一个。 1.抽样平均误差 N n 不重复抽样误差计算公式为: n N 1 当总体单位数N 很大时,N-1接近于N ,可用N 代 替。则上列公式可简化为:
统计学将样本均值与总体均值之间的平均离差的 1/n称为抽样平均误差,简称抽样误差,以μ 表示。换 言之,抽样误差等于总体方差除以样本单位数之商的平 方根,即:
X
n
2
X
n
上式中σ 是未知的,可用样本标准差S 代替,即:
Sx n
2
Sห้องสมุดไป่ตู้
x
n
例1,某地区种植20000平方米小麦,随机抽取1000平方米进 行实割实测,计算结果: x = 6千克,Sx = 0.1千克,试计算重复 抽样误差。 已知:n = 1000 ,Sx = 0.1;求:μ x =? 解:μ x = Sn = = 0.1 = 0.01 =0.00316(千克) n 1000 1000 (2)样本成数的抽样误差 样本成数抽样误差μ p等于总体成数除以样本单位数的平方根。 即: μ p= n = P 1 P = Sn n 例2,从1000件产品中随机抽取100件进行质量检验,发现10 件废品,求1000件中的废品率。 p = n1/n = 10/100 = 0.1(即10%) μ p= 0.1 1 0.1 =0.03,(即3%)
重复抽样: p
p1 p n 0.91 0.09 100 0.0286
不重复抽样: p
p1 p n 1 n N
0.91 0.09 100 1 0.0285 100 10000
二、影响抽样误差的因素 抽样理论研究和实践证明影响抽样误差大小的因素主要有: (一)总体各变量值X 间差异的大小 如果其他条件不变,离散程度(σ X或σ P)越大,抽样误差 μ x或μ p越大;反之,则越小。 (二)样本单位数(样本容量)的多少 其他条件不变,样本单位数n 越少,抽样误差越大;反之, 则越小。 (三)抽样方法 重复抽样误差大于不重复抽样误差。 (四)抽样调查组织形式 不同的抽样组织形式会产生不同的抽样误差。
2
2.样本成数抽样误差的计算 上述样本平均数的抽样误差原理也适用于成数抽样误差计算。 p P 因此, 。其计算公式为:
p
P P N n 1 n N 1 P P 1 n 1 n N
例4,仍以例2资料,按不重复抽样方法计算成数抽样误差:
表4-3
成数抽样误差计算表
使用寿命 元件质量 抽检数 比重(成数) (个) ( % ) (小时) 900以下 不合格 1 900~950 不合格 2 9.0 950~1000 不合格 6 1000~1050 合格 35 1050~1100 合格 43 1100~1150 合格 9 91.0 1150~1200 合格 3 1200 以上 合格 1 合 计 — 100 100.0
表4-2 1% 样品标准差计算表
x 875 925 975 1025 1075 1125 1175 1225 合计
Sx
x- x -180.5 -130.5 -80.5 -30.5 19.5 69.5 199.5 169.5 —
(x- x ) 32580.25 17030.25 6480.25 930.25 380.25 4820.25 14280.25 28730.25 —
第二节
抽样误差
一、随机事件与概率 (一)随机事件 在相同条件下,每次试验可能出现也可能不出现的状态称为 随机事件。 例如,掷一对骰子,两颗骰子落下时总共有多少种状态呢? 白色骰子能够以6种状态中任何一种状态落下:
譬如当白色骰子显示
时,黑色骰子仍有6种状态落下:
这里,骰子落下所呈现的每种状态称为随机事件。
1 2 6 35 43 9 3 1 100
875 925 975 1025 1075 1125 1175 1225 —
875 1850 5850 35875 46225 10125 3525 1225 105550
1.样本平均数 x = 105550/100 = 1055.5(小时)
将表4-1整理为表4-2。
本节小节:
(一)样本容量仅为总体的一小部分,总体单位数的多少对 估计的精度没有影响起作用的是样本容量。
(二)总体标准差σ是未知的,可用样本标准差S 来代替。
(三)重复抽样时平方根法是精确的;不重复抽样时公式给 出一个较好的近似值——当样本单位数占总体单位数很小比重时。
2 2
(三)综合练习
例如,某电子元件厂对10000个元件使用寿命抽取1%进行检 验,结果如表4-1所示。
表4-1
1%样品测试数据
使用寿命(小时)
抽检数f
组中值x
x·f
900以下 900~950 950~1000 1000~1050 1050~1100 1100~1150 1150~1200 1200以上 合 计
二、抽取样本单位的方法和抽样误差 根据每次从总体中抽取一个样本单位进行 调查登记后,是否再把这个样本单位放回原总体 中去,抽取样本单位方式有重复抽样和不重复抽 样两种方法。 (一)重复抽样 重复抽样也称回置抽样,它是从总体N 个 单位中随机抽取一个容量为n 的样本,每次抽取 并记录事件后把被抽中的单位放回总体中重新参 加下次抽取。这样,总体单位数不变,已经被抽 中的样本单位仍然有同等机会再被抽中。 1. 抽样平均误差 (1)样本平均数的抽样平均误差