第八章 抽样推断
八抽样推断考试习题
单项选择題1. 抽样调查的主要目的在于(A. 计算和控制误差B. 了解总体单位情况C .用样本来推断总体 D.对调查单位作深入的研究2. 抽样调查所必须遵循的基本原则是( 人 A.随意原则 B. 可比性原则C .准确性原则 D. 随机氐则3. 无偏性是指( A.抽样指标等于总体指标B. 样本平均数的平均数等于总体平均数C .样本平均数等于总体平均数D.样本成数等于总协成数4. 一致性是指当样本的单位数充分大时,抽样指标( )。
A.小于总体指标B.等于总体指标C .大于总体指标D.充分靠近总体指标5. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )A.前者小于后者B.前者大于后者C.两者相等D.两者不等6. 能够事先加以计算和控制的误差是( A.抽样误差 B.登记误差C .代表性误差 D. 系统性误差7. 对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样, 但第二个厂工人数比第一个厂工人数整整多一倍。
抽样平均误差( 人A.第一工厂大B. 第二个工厂大C .两工厂一样大 D.无法做出结论8. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( )。
A.两者相等B.两者不等C .前者小于后者 D.前者大于后者。
9. 反映抽样指标与总体指标之间抽样的可能范围的指标是(第八章 抽样推断两工厂工人工资方差相同,A.抽样平均误差B. 抽样误差系数C.概率度D. 抽样极限逞差.10. 在进行纯随机重复抽样时,为使抽样平均误差减少25%则抽样单位数应()。
A.增加25%B. 增加78%C. 增加1.78%D. 减少25%11. 在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的()倍。
A. 1.03B. 1.05 C . 0.97 D. 95%12. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是(A.抽样单位数为20B. 抽样单位数为40C.抽样单位数为90D.抽样单位数为100 13.通常所说的大样本是指样本容量(人A.小于10B. 不大于10C.小于30D. 不小于3014. 抽样成数指标P值越接近1,则抽样成数平均误差值()A. 越大B越小C越接近0.5 D越接近115. 对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%概率为0.9545,优等生比重的极限抽样误差为()。
第八章抽样推断作业
第八章抽样推断作业
1.某广告公司为了估计某地区收看某一新电视节目的居民人数所占比例,要设计一个简单随机样本的抽样方案。
该公司希望有90%的信心视所估计的比例只有2个百分点左右的误差。
为了节约调查费用,样本将尽可能小。
试问样本量应该为多大?
2.某地区对居民用于某类消费品的年支出额进行了一次抽样调查,抽取了400户居民,调查得到的平均每户支出数额为350元,标准差为47元,支出额在600元以上的只有40户。
试以95%的置信度估计:(1)平均每户支出额的区间;(2)支出额在600元以上的户数所占比例的区间。
3.某地区有1000家商店,按大、中、小分为三类,其商店数分别为N 1 =200, N 2=300, N 3 =500.今按比例分配抽取一个容量为n=100的分层随机样本,平均年营业额(单位:万元)分别为1201=y , ,752=y ,403=y 各层的样本方差分别为S 12 =44, S 22 =18, S 32 =5.试求该地区平均每家年营业额的置信度为95%的置信区间。
4.质量监督部门从某厂生产的500箱同类产品中随机抽取了10箱,并对这10箱进行全面检验。
这10箱产品的合格率分别为:85%,90%,90%,92%,92%,96%,96%,95%,95%,95%。
试求该厂这批产品不合格率的置信度为95%的置信区间。
第八节抽样推断-第节抽样推断
抽样极限误差的计算公式 基于概率估计的要求,抽样极限误差通常需要以 抽样平均误差或为标准单位来衡量。把极限误差 或分别除以或,得相对数t,它表示误差范围为抽 样平均误差的若干倍,t是测量估计可靠程度的一 个参数,称为抽样平均误差的概率度。
N 1
N n ( ) 我们把这个式子叫做修正因子。不难看出当N较大时, N 1 n 与 (1 ) 的计算结果是十分接近。因此,当N较大时在不 N 重复抽样条件计算抽样平均误差的公式可采用时
x
2
n (1 ) n N
26
[例2] 从某厂生产的10000只日光灯管中随机抽取100只进行检 查,假如该产品平均使用寿命的标准差为100小时,试计算 该厂日光灯管平均使用寿命的平均误差。 解:在重复抽样条件下 100 x 10 (小时)
6
(二)应用抽样法可对全面调查的结果加以补充或 订正
许多社会经济现象虽然可以全面调查,但同时开展抽 样调查,把两者结合起来应用也具有重要的意义。 全面调查不论是一次性普查,还是经常性统计报表制 度,由于范围广、工作量大,参加人员多,就较多地 存在发生登记性和计算性误差的可能。在全面调查后, 随即抽取一部分单位重新再调查一次,将这些单位两 次调查的资料进行对照、比较,计算其差错比率,并 以此为依据对全面调查的资料加以修正,这样就可以 进一步提高全面调查资料的准确性。 另外,由于抽样调查范围小,可以根据需要增加一些 调查项目,以便进行某项更深入的研究,以补充全面 调查的不足。
解:根据条件可知,合格率P==91.5% 1.在重复抽样条件下 p(1 p ) = 0.915 (1 0.915) = 0.88% p 1000
n
2. 在不重复抽样条件下
p
统计学(第八章抽样推断)
统计学(第⼋章抽样推断)第⼋章抽样推断【教学⽬的】抽样推断是统计研究中⼀种重要的分析⽅法。
通过本章的学习,要求掌握利⽤样本统计资料来推断总体数量特征的原理及⽅法;深刻理解抽样推断的概念及特点;了解抽样误差产⽣的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的⽅法;掌握必要样本单位数的确定⽅法。
第⼀节抽样推断概述⼀、抽样推断的概念及特点(⼀)概念按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进⾏科学估计与推断的⽅法。
包括抽样调查和统计推断抽样调查:⼀种⾮全⾯调查,按随机原则从总体中抽取部分单位进⾏调查以获得相关资料,以推断总体统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有⼀定程度的估计和推断。
(⼆)特点1.按随机原则(等可能性原则)抽取调查单位.随机抽样的⽬的是为了排除⼈的主观影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。
随机性原则是保证抽样推断正确性的⼀个重要前提条件。
随机抽样不是随便抽样。
2.根据部分推断总体的数量特征3.抽样推断的结果具有⼀定的可靠性和准确性,抽样误差可以事先计算和控制其他特点有经济性、时效性、准确性、灵活性等(三)抽样推断的应⽤ 1.不可能进⾏全⾯调查时 2.不必要进⾏全⾯调查时 3.检查⽣产过程正常与否4.对全⾯调查资料进⾏补充修正时⼆、抽样的⼏个基本概念 1.样本容量与样本个数(1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的⼤⼩称为样本容量,⼀般⽤n 表⽰,它表明⼀个样本中所包含的单位数。
⼀般地,样本单位数⼤于30个的样本称为⼤样本,不超过30个的样本称为⼩样本。
(2)样本个数:⼜称样本可能数⽬,它是指从⼀个总体中可能抽取多少个样本。
样本个数的多少与抽样⽅法有关。
2.总体参数与样本统计量(1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。
统计学第八章 抽样推断
②
和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%
第八章 抽样调查与推断
第8章抽样调查与推断【教学内容】本章主要阐述:抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式及其抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。
【教学目标】1、理解抽样误差的影响因素;2、掌握抽样调查的概念、特点和作用;3、掌握抽样平均误差的计算方法、抽样估计推断和必要抽样数目的确定原理及方法;4、初步具备在实际工作中正确运用抽样方法搜集资料并据以做出准确推断的能力。
【教学重点、难点】1、抽样调查的特点和作用;2、抽样调查的组织方式和方法;3、抽样误差的概念与计算;4、抽样推断方法;5、必要抽样数目的确定方法。
第一节抽样调查的一般问题一、抽样调查的概念、特点与作用(一)抽样调查的概念与特点概念:抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。
特点:(1)按随机原则抽取调查单位。
(2)由部分推断全体。
(3)抽样误差可以事先计算并加以控制。
(二)抽样调查的作用1、用于不可能进行全面调查的无限总体。
2、用于不可能进行全面调查而又需要了解全面情况的现象。
3、用于不必要进行全面调查的现象。
4、用于对全面调查的资料进行评价与修正。
5、用于工业生产过程的质量控制。
二、抽样调查中的几个基本概念(一)全及总体和抽样总体1.全及总体全及总体简称总体或母体,它是指所要调查研究对象的全体。
2.抽样总体抽样总体也称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。
(二)总体指标和样本指标1.总体指标总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。
2.样本指标样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。
三、抽样调查的组织方式(一)简单随机抽样概念:简单随机抽样也叫纯随机抽样,它对总体单位不作任何分类排序(队),而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。
抽样推断
第八章抽样推断【学习目标】通过本章的教学使学生了解抽样推断的概念及特点、作用;了解统计误差产生的原因;理解抽样误差的概念;熟念掌握在不同的抽样组织方式下抽样平均误差的计算方法;学会利用样本数据对总体参数进行点估计和区间估计;掌握必要抽样数目的确定方法。
为将来走上工作岗位进行抽样调查和推断打下基础。
【教学重点和难点】重点:区间估计难点:抽样平均误差的计算【案例导入】某省政府部门欲了解全省农民收入的平均水平。
该省幅员辽阔,人口众多,如果采用普查则工作量及调查费用将异常庞大。
一个可行的方法是在全省抽取部分农户进行调查,根据这部分调查所得收入数据资料去推断全省农民收入的平均水平。
某地为加强环境保护,加强水质监测,考察河水中某种污染物质是否超标。
显然对河水全部检验是不可能的,只能从河水中按照一定地点定时取样检验,根据检验结果推断河水中污染物是否超标。
某水泥厂加强产品质量控制和管理,需考察水泥标号是否达到规定标准,其方法是将水泥做成试块进行耐压试验。
由于这种试验是一种破坏性试验,显然不能把全部水泥都做成试块,只能从全部水泥中抽取部分进行试验。
从上面例子可以看出,在很多统计问题中,或者由于人力、物力、财力或时间限制,或者由于取得全部数据是不可能的,或者虽然能够取得全面数据但数据收集本身带有破坏性,我们不能收集全面数据,只能从中收集部分数据,依据这部分数据对所研究对象的数量特征或数量规律性进行推断。
这种依据部分观测取得的数据对整体的数量特征或数量规律性进行的推断称为统计推断。
第一节抽样推断中的基本概念一、抽样推断及其特点(一)抽样推断按照随机原则从总体中抽取部分单位进行观察,利用样本中的实际资料计算样本指标,并据以计算总体相应数量特征的一种统计分析方法。
包括统计调查,即对个体单位进行观察与搜集资料的方法,还包括统计分析,即对总体进行统计估计和分析的方法。
【案例8﹣1】某企业生产的5000个零件中,按照10%的比例,抽取500件进行检查,发现25件是废品,则废品率为(25/500)×100%=5%,采用抽样调查的结果,废品率是5%,来推算5000个零件的废品率,该方法即是抽样推断,抽取的500个零件就是样本。
第八章 抽样推断(2013.2修改)
为了更好地理解抽样分布的原理,首先
介绍三种不同性质的分布:
总体分布
样本分布
抽样分布
1、总体分布
总体是所研究的若干元素(个体)的集
合。
总体中每个元素的取值是不同的,这些
观测值所形成的分布就是总体分布。
定义1
总体中各元素的观测值所形成的相对频
数分布,称为总体分布。
如果总体中的所有观测值都能得到,那
总体
样 本
样本统计量
例如:样本均 值、比例、方 差
一、抽样推断的涵义及特点
1、涵义:
在抽样调查的基础上,利用样本的实际
资料计算样本指标并据以推算总体相应 数量特征的一种统计方法。
2、特点:
是由部分推算总体的一种认识方法;是
一种建立在随机抽样基础上的统计方法; 运用了概率估计的方法;抽样估计误差 可以事先计算并加以控制。
n
n 1
(2)属性样本:
设样本总体
n 个单位中有 n1 个单位具
有某种属性, n0 个单位不具有某种属 性,且
n1 n2 n
则:
n1 p n
n0 n n1 q 1 p n n
样本标准差
s
p1 p
(三)样本容量与样本可能数目 1、样本容量:样本中所含个体的数量,用“n”
量 比如
样本均值 样本比例 样本方差
X
B
S2
统计量是样本的函数,由于不同的样本
计算出来的统计量的值是不同的,因而 统计量是一个随机变量.
注:严格地讲,统计量作为一个随机变量时, 应该用大写字母来表示,如样本均值用 X
B 表示, 样本方差用 S 2 表示,样本比例用 来表示等.而相应地根据一个具体的样本 算出来的样本统计量的取值应该用小写 字母表示.
抽样推断
第八章抽样推断第一节抽样推断的意义和作用一、抽样推断的概念抽样推断是在抽样调查的基础上利用样本的实际资料计算出的样本数据,并运用概率估计方法,推算总体相应的数量指标的一种统计分析方法。
大家知道,在计划经济条件下,统计为了达到对总体数量特征的认识,往往是采用对总体的所有单位进行全面调查。
但从转变为市场经济以后,对统计调查亦进行了改革,由以全面调查为主的调查方法,逐步转变为提倡和推广抽样调查。
这种调查方法,不同于全面调查,它是通过组织抽样调查取得部分单位的实际资料,来估计和判断总体的数量特征,以达到对现象总体的认识。
抽样推断,从其内涵来说,包括抽样调查和抽样推断两部分,前者着重调查,后者着重推断。
具体地说,所谓抽样调查,是指按照随机原则从调查对象的全部单位中抽取部分单位,进行调查,取得各项准确的数据;所谓抽样推断,是指运用数理统计原理,根据抽样调查资料,对研究对象全体的数量特征,作出具有可靠程度的估计和判断,以达到对现象总体正确认识的目的。
总之,抽样推断,不仅是一种科学的非全面的调查方法,而且是一种根据非全面调查资料,推算全面情况的统计研究方法。
抽样推断具有如下几个特点:1.按照随机原则,抽选调查单位,是抽样推断的前提。
抽样调查,这种非全面调查与其他非全面调查,如典型调查、重点调查等选择单位的方法完全不同。
典型调查、重点调查均由调查者有意识地选择调查单位,因而受调查者主观因素的影响。
这样取得的调查资料,不能用来对总体的数量特征进行统计推断。
抽样调查则是按随机原则抽选调查单位,完全排除调查者主观因素的影响。
这样调查的部分单位资料,可以用来推断总体的数量特征。
那么,什么是随机原则呢?随机原则就是在抽选调查单位时,保证总体中每个单位都有相等的中选可能性。
所以随机原则又称同等可能性原则。
这样,按随机原则抽取部分单位,就有更大的可能性使抽取出来的部分单位所构成的样本总体结构与调查总体结构相似,因而使样本总体对调查总体具有充分的代表性,抽样误差也就更小了。
210编号统计第八章习题
第八章抽样推断计算题1.一批商品(10000件)运抵仓库,随机抽取100件检验其质量,发现有10件不合格。
试按重复与不重复抽样分别计算合格率抽样平均误差。
2.某厂生产彩色电视机,按不重复抽样方法从一批出厂产品中抽取1%的产品进行质量检验,取得如下资料:正常工作时间(千小时)电视机(台)6—8158—103010—125012—144014—169合计144试计算抽样平均误差。
3.假设某班期末统计学考试成绩服从正态分布,平均成绩为70分,标准差为12分,要求计算:(1)随机抽取1人,该同学成绩在82分以上的概率;(2)随机抽取9人,其平均成绩在82分以上的概率。
4.某手表厂在某段时间内生产100万个某种零件,用纯随机抽样方式不重复抽取1000个零件进行检验,测得废品为20件。
如以99.73%概率保证,试对该厂这种零件的废品率作定值估计和区间估计。
5.利用第1题的资料,以95.45%的概率保证程度对该批商品的合格率作出区间估计。
6.根据第2题的资料,对该厂生产的这批彩色电视机的正常工作时间作出区间估计。
如果规定彩色电视机的正常工作时间在12 000小时以上为一级品,试对该厂这批出厂产品的一级品率作出区间估计。
(F(t)=95%)7.对某型号电子元件10000只进行耐用性能检查。
根据以往抽样测定,求得耐用时数的标准差为600小时。
试求在重复抽样条件下:(1)概率保证程度为68.27%,元件平均耐用时数的误差范围不超过150小时,要抽取多少元件做检查?(2)根据以往抽样检验知道,元件合格率为95%,合格率的标准差为21.8%,要求在99.73%的概率保证下,允许误差不超过4%,试确定重复抽样所需抽取的元件数目是多少?如果其他条件均保持不变,采用不重复抽样应抽取多少元件做检查?8.电子元件厂日产10000只元件,经多次一般测试得知一等品率为92%,现拟采用随机抽样方式进行抽检,如果求误差范围在2%之内,可靠程度为95.45%,问需抽取多少电子元件?9.从麦当劳餐厅连续三个星期抽查49位顾客,以调查顾客的平均消费额,得样本平均消费额为25.5元。
统计学第八章(抽样推断)
ni n
N i i
i 1
k
N i i
层的标准差。
i 是各
25
(3)经济分配法
既考虑每层中总体单位的变异程度不同 ,又考虑每层的调查费用。所以在样本容 量一定的条件下,标志变异大的层样本容 量也大一些,调查费用大的层,样本容量 相对小些。则
ni n
N i i / C i
i 1
20
* 抽样的组织方式 简单随机抽样 类型抽样
机械抽样
整群抽样
多阶段抽样
21
(一)简单随机抽样 : 简单随机抽样 又称纯随机抽样,是直接从总体中按随 机的原则抽容量为 n 的样本,每一个总 体单位有相同的可能性被抽中。
特点:最遵循随机原则,但不一定能 保证样本单位在总体中分布的均匀性; 适宜于单位数不多,标志变异较小、分 布较均匀的总体。
15
抽样框
STAT
某外国公司在深圳进 应当调查的对 福田区 … 在商场的大门口 行微波炉市场调查: 象(居民户) 南山区 桃源街道办 … 微波炉普及情况 已购或未购微 在微波炉柜台前 波炉的住户 南头街道办 居民的喜好特征 桂庙村… 南 在市区街道旁边 已购该公司微 居民购买力水平 新居委会 波炉的住户 在某个住宅小区 居民一组 公司产品知名度 有购买微波炉 居民二 公司产品信誉度 意向的住户 组 …
样本标准差公式
未分组数据:
2 ( x x ) i i 1 n
n 1 分组数据
S2
S2
(x x)
i 1 i
k
n
2
S
n 1 分组数据
2 ( x x ) fi i i 1 k
(x
i 1 k
抽样推断概述
第一节 第二节 抽样推断概述 参数估计
第一节 抽样推断概述 一、抽样推断
按照随机原则从总体中抽取一部分单位进行 观察,并依据所获得数据的处理结果, 观察,并依据所获得数据的处理结果,对总 体的数量特征做出具有一定可靠程度的估计 和判断, 和判断,从而达到对总体的分布状况及其数 量特征认识的目的。 量特征认识的目的。 指样本单位的抽取不受主 观因素及其他系统性因素 的影响, 的影响,每个总体单位都 有均等的被抽中机会
全及指标 根据全及总体各个单位的标志值或
标志特征所计算的反映总体某种属 标志特征所计算的反映总体某种属 性的综合指标 ,又称总体参数。 又称总体参数。 总体参数
设总体中 N 个总体单位某项标志的标志值分别 为 X 1 , X 2 L , X N ,其中具有某种属性的有 N1个 单位,不具有某种属性的有 N 0个单位,则 单位, 个单位, ⒈ 总体平均数(又叫总体均值): 总体平均数(又叫总体均值):
⒈ 样本平均数(又叫样本均值): 样本平均数(又叫样本均值):
x =
∑
n
x n
i=1
i
或 x =
∑
m
x
i=1 m
i
fi
∑
i=1
fi
为自由度 ⒉ 样本单位标志值的标准差: 样本单位标志值的标准差:
2 1 n s = ∑ xi x 或s = n i=1
(
)
1
为 σ 的无偏估计
∑ fi
i =1
m
∑(x x)
用过去同类问题全面调查或抽样调查的经 验数据代替; 验数据代替; 用样本标准差 s代替总体标准差 σ ,用 s p 代替 σ P 。
∑ (x x ) 或 ∑ (x x ) n ∑f
第8章 抽样推断
样本可能数目
重复抽样
考虑顺序
n MN n MN
统计学
Statistics
不重复抽样
n MN
N
n
N! N n!
不考虑顺序
N n 1! n! N 1!
n MN
N! n! N n !
实际工作中,一般采用考虑顺序的重复抽样和不考虑顺序的 不重复抽样。
2012, Han Tianming, CCBUPT 16
2012, Han Tianming, CCBUPT 23
整群抽样
统计学
Statistics
整群抽样是先将总体(N)分为若干(R)群,每 群m个个体,再按随机抽样方法抽取一部分(r) 群,对抽中群的所有单位进行全面调查。
N1 样本
N2
N3
…
Ni
…
NR
总体
Mi xij
2012, Han Tianming, CCBUPT 24
等距抽样
统计学
Statistics
等距抽样是先将总体单位按某一标志顺序排 队,再按固定顺序和相等距离(间隔k)抽取样 本单位。 等距抽样可使样本单位均匀分布于总体,抽 样误差较小。其随机性主要体现在第一个单 位的确定上。
i ik i 2k i 3k i (n 1)k
0
k
2k
3k
4k
离散型随机变量
统计学
Statistics
若一个随机变量X只有两个可能取值,且 其分布为: P{X=x1}=p,P{X=x2}=1-p 则称X服从x1, x2处参数为p的两点分布。 特别地,若X服从x1=1, x2=0处参数为p 的两点分布,则称X服从参数为p的0–1分 布,记为X~(0,1)。
第八章抽样推断
上一页 下一页 返回本节首页
第八章抽样推断
(三)参数和统计量
根据总体各单位的标志值或标志属性计算的,反 映总体数量特征的综合指标称为全及指标。全及指标 是总体变量的函数,其数值是确定的、惟一的,因此 称为参数。
根据样本各单位标志值或标志属性计算的,反映 样本数量特征的综合指标称为样本指标。样本指标是 样本变量的函数,用来估计总体参数,因此也称统计 量,其值随着样本的不同而不同,因此统计量是个随 机变量。
上一页 下一页 返回本节首页
第八章抽样推断
2.不重复抽样的条件下
抽样平 :x均 n X 2 ((N N 误 1 n )); 差 N 很 当大时 x近 n X 2(1 似 N n) 为
式中,N为总体单位数;n为样本容量;σX2 为总体方差,一般情况下是未 知,可用样本方差替代 σx 2
成数的抽样平:均 p 误n差 p2((NN1n));当 N很大时近 p似 nP 2(为 1N n)
第八章 抽样推断
本章学习目的与要求 第一节 抽样推断的一般问题 第二节 抽样误差 第三节 抽样估计方法 第四节 抽样组织设计
第八章抽样推断
下一页 返回本节首页
本章学习目的与要求
目的: 学习目的在于提供一套利用抽样资料来估计总体数量特征的方法。
要求:
⒈明确抽样调查的概念、特点、作用; ⒉理解抽样误差的影响因素; ⒊掌握抽样平均误差的计算方法; ⒋掌握抽样估计方法与样本容量确定的方法; ⒌理解类型抽样、等距抽样、整群抽样的含义、特点
上一页 下一页 返回本节首页
第八章抽样推断
四、有关抽样的基本概念
(一)总体和样本 (二)样本容量和样本个数 (三)参数和统计量 (四) 重复抽样和不重复抽样
电子课件 [统计学原理与实务(第3版)][曹印革][电子教案和习题解答] 第八章 抽样推断分析
注:极限误差与概率度和抽样平均误差三者之 间存在如下关系:
1.在平均误差保持不变的情况下,增大概率度 的值,把握程度相应增加,误差范围也随之扩大, 这时估计的精确度将降低;反之,要提高估计的精 确度,就得缩小概率度值,此时把握程度也会相应 降低。
2.在概率度保持不变的情况下,抽样平均误差 小,则误差范围就就小,估计的精确度就高;反之, 抽样平均误差大,误差范围就大,估计的精确度就 低。
2.特点 (1)抽样推断是由部分推算总体的一种认识方法。 (2)抽样推断是建立在按随机原则抽取样本的基础上。 (3)抽样推断是运用概率估计的方法。 (4)抽样推断产生的误差可以事先计算、并加以控制。
二、抽样推断的作用 1.应用抽样推断法可对某些不可能或不容易进行全面 调查而又要了解其全面情况的社会经济现象进行数量 方面的统计分析。 2.应用抽样法可对全面调查的结果加以补充或订正。 3.应用抽样法可对生产过程中产品质量进行检查和控 制。 4.应用抽样推断法可对总体的某种假设进行检验,判 断假设的真伪。
4.当抽样调查是为了检验全面统计数字的质量时,全 及总体的标志变异指标或是有实际资料的,可以直接 代入公式计算必要的抽样单位数。 5.如有几个方差可以选用时,宜选择最大数值。对于 成数方差,如果没有资料时,可取其最大值0.25。 6.一个总体往往可以同时计算抽样平均数和抽样成数。 由于它们的方差和允许误差范围不同,因此,需要的 必要抽样单位数也不相同。为了防止由于样本单位数 不足而扩大抽样误差,在实际工作中往往根据比较大 的必要抽样单位数进行抽样,以满足共同的需要。
等距抽样示意图
(四)整群抽样 也称集团抽样、区域抽样,是将总体各单位按时
间或空间形式划分成许多群,然后按纯随机抽样或机 械抽样方式从中抽取部分群,对中选的所有单位进行 全面调查的抽样组织方式。
第八章 抽样推断
样本总体,是指在抽样调查中从全及总体中抽 取的那部分单位组成的总体。例如上述调查中抽取 的100名学生就构成样本总体。样本总体单位数 (或称样本容量)常用n表示,上例中n=100。
(二)全及指标与样本指标 1.全及指标(参数) 根据全及总体全部单位的数据计算的指标称全及指 标(或参数)。全及指标是客观存在的常数,在抽样 推断中常用的全用指标主要有全及平均数 X ,全及 成数P,全及方差 和全及标准差 等。 (1)全及平均数 设全及总体某一变量值为 X 1 , X 2 , , X N
AB AC AD BA BC BD CA CB CD DA DB DC
(2)不考虑顺序的不重复抽样 不考虑顺序的不重复抽样就是不重复组合。 一般地,从 N 个不同单位的总体中,随机无放回地 抽取 n 个单位组成样本,其全部可能的样本数目为 n C N N ! /[ n ! ( N n )! ] 个。如从A、B、C、D四个字母 中随机不重复抽取两个组成代码,可组成的没有 重复且字母不同的代码为C 42 4! /[ 2! ( 4 2 )! ] 6 个 , 它们是: AB AC AD BC BD CD
2
P
P (1 P )
2.样本指标(统计量) 根据样本各单位变量值或品质属性计算的 反映样本特征的统计数据称为样本指标或称统 计量。与全及指标相对应,样本指标主要有样 本平均数 x ,样本成数 p ,又称样本比率或 2 S 和样本标准差 S 等。 比重,样本方差 (1)样本平均数 设x 为样本的某一变量,其n项变量值为
图8-2 当平均数 x 0 时,密度函数的频率线以 oy 轴为 对称轴两边对称展开; 当平均数 x a 时,密度函数的频率线向右平移 a个单位; 当平均数 x a 时,密度函数的频率线向右平移 a个单位。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(四)重复抽样和不重复抽样
从总体N个单位中,随机抽取n个单位构 成样本 1、重复抽样(回置抽样) (1)考虑顺序的重复抽样数目
N
n
(2)不考虑顺序的重复抽样数目
C
n
ห้องสมุดไป่ตู้
N n 1
2、不重复抽样
(1)考虑顺序的不重复抽样数目
N! N n !
(2)不考虑顺序的不重复抽样数目
N! n!N n !
二、抽样平均误差
抽样平均误差是反映抽样误差一般水平 的指标,它的实质含义是指抽样平均数 (或成数)的标准差。即它反映了抽样 指标与总体指标的平均离差程度。抽样 平均误差的作用首先表现在它能够说明 样本指标代表性的大小。平均误差大, 说明样本指标对总体指标的代表性低.
通常用抽样平均数的标准差和抽样成数的 标准差来作为其衡量抽样误差一般水平的 尺度。 设以 x 表示抽样平均数的平均 误差, p 表示抽样成数的平均误 差,
例题:
要估计某地区10000名适龄儿童的入学率, 随机从这一地区抽取400名儿童,检查有 320名儿童入学,求抽样入学率的平均误 差。 根据已知条件:
320 P 80% 400
2
P(1 P) 80% 20% 16%
1、在重复抽样的情况下,入学率的抽样
平均误差为:
p
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
70 70 70 90 70 130 70 150 90 70 90 90 90 130 90 150 130 70 130 90 130 130 130 150 150 70 150 90 150 130 150 150 ——
M : 表示全部可能的样本数 目。则:
x P
x X
M M
2
p P
2
(一)抽样平均数的平均误差
1、在重复抽样的条件下
n 抽样平均误差的大小和总体标准差 成 正比变化,和样本容量n的平方根成反比。
x
设有4个工人,其每周工资分别为70、90、 130、150元。这一总体的平均工资和工 资标准差为:
p(1 p) 0.16 2% n 400
2、在不重复抽样的情况下,入学率的抽 样平均误差为:
p
p(1 p) n 0.16 400 1 1 1.96% n 400 10000 N
计算结果表明:用样本的入学率来估计 总体的入学率其误差的绝对值平均说来 在2%左右。
则有:P N N
1
,Q N N
0
N N1 N
1 P
如果品质标志是是非标志,把“是”的 标志表示为1,把“非”的标志表示为0, 可求成数平均数和成数方差(或标准 差)。 0 N 0 1 N 1 N 1 P XP 成数平均数: N N 成数方差: 2 2 2 2
三、抽样的基本概念
(一)全及总体和样本总体 1、 全及总体(简称总体),指所要认 识的研究对象全体 ,它是由所研究范围 内具有某种共同性质的全体单位组成的 集合体。一般用N表示总体的单位数。
2、样本总体又称子样,简称样本,是从全 及总体中随机抽取出来,代表全及总体 的那部分单位组成的集合体。样本总体 的单位数称为样本容量,通常用小写英 文字母n来表示。随着样本容量的增大, 样本对总体的代表性越来越高,并且当 样本单位数足够多时,样本平均数愈接 近总体平均数。
80 100 110 80 110 120 100 110 140 110 120 140 1320
-30 -10 0 -30 0 10 -10 0 30 0 10 30 0
x Ex
2
样本平均数的平均数 M 12 抽样平均误差
x 1320 110元 E x x X
第二节 抽样误差
一、抽样误差的意义 (一)抽样误差的概念 是指由于随机抽样的偶然因素使样本各 单位的结构不足以代表总体各单位的结 构,而引起抽样指标和全及指标之间的 绝对离差。因此,又称为随机误差,它 不包括登记误差,也不包括系统性误差。
x X
pP
(二) 影响抽样误差的因素有:
1、总体各单位标志值的差异程度; 2、样本的单位数; 3、抽样的方法; 4、抽样调查的组织形式。
成数之间的绝对离差不 超过 p
在 p p , p p 区间内,抽样成数与总 体
p
1、在重复抽样的条件下 p P为总体成数,n为样本单位数
P(1 P) n
2、在不重复抽样的条件下
p
在总体单位数很大的情况下, p 的近似 式为:
p
p(1 p) n (1 ) n N
p(1 p) N n ( ) n N 1
在得不到总体成数P的资料时,可以用实 际样本的抽样成数 p 来代替。
三、抽样极限误差
在做抽样估计时,应该根据所研究 对象的变异程度和分析任务的要求确定 可允许的误差范围,在这个范围内的数 字都是有效的,这种可允许的误差范围 称为抽样极限误差。
抽样极限误差是用绝对值形式表示 的样本指标与总体指标偏差的可允许的 最大范围。它表明被估计的总体指标有 希望落在一个以样本指标为基础的可能 范围。
70 90 70 130 70 150 90 70 90 130 90 150 130 70 130 90 130 150 150 70 150 90 150 130 ——
x
平均数离差 xE x
离差平方
900 100 0 900 0 100 100 0 900 0 100 900 4000
(三)样本容量和样本个数
1、样本容量 是指一个样本所包含的单位数。通常将 样本单位数不少于30个的样本称为大 样本,不及30个的称为小样本。社会 经济统计的抽样调查多属于大样本调查。
2、样本个数
样本个数又称样本可能数目。指从一个 总体中可能抽取的样本个数。一个总体 有多少样本,则样本统计量就有多少种 取值,从而形成该统计量的分布,此分 布是抽样推断的基础。
第八章 抽样推断
第一节 抽样推断的一般问题 一、抽样推断的意义 (一)抽样推断的一般概念 抽样推断是在抽样调查的基础上,利 用样本的实际资料计算样本指标,并据 以推算总体相应数量特征的一种统计分 析方法。
(二)抽样推断的适用范围
1、有些事物在测量或试验时有破坏性,不可能 进行全面调查 2、有些总体总理论上讲可以进行全面调查,但 实际上无法做到。 3、和全面调查比较,抽样调查可以节省人力、 费用和时间,而且比较灵活 4、在有些情况下,抽样调查的结果比全面调查 要准确 5、抽样调查方法可以用于工业生产过程中的质 量控制 6、利用抽样推断的方法,可以对于某种总体的 假设进行检验,来判断这种假设的真伪。
X X
N
70 90 130 150 110 (元) 4
2 2 2 2
70 110 90 110 130 110 150 110
4
31.62(元)
样本变量 样本平均 ( ) (x )
x
平均数离差
-40 -30 -10 0 -30 -20 0 10 -10 0 20 30 0 10 30 40 0
(2)抽样平均数的标准差(即抽样平均 误差)是总体标准差的 1 。
n
(3)可以通过调整样本单位数n来控制 抽样平均误差。
2、在不重复抽样的条件下
x
N n ( ) n N 1
2
x
n (1 ) n N
2
1 2 3 4 5 6 7 8 9 10 11 12 合计
样本变量 样本平均 ( ) ( x )
2
N P 2Q Q 2 P PQ( P Q) PQ
P
0 P N 0 1 P N 1 P
N 0 Q N1 N
例如:
某批零件的合格品率P=80%,则有:
X P 80%
P
2
80% 20% 16%
2、抽样指标(统计量)
根据样本各单位标志值或标志属性 计算的反映样本特征,用来估计全及指 标的综合指标称为统计量(抽样指标)。 统计量是样本变量的函数,用来估计总 体参数,因此与总体参数相对应,统计 量有样本平均数(或抽样成数)、样本 标准差(或样本方差 )。
2 2
4000 x 18.26(元) M 12 按不重复抽样误差公式 计算:
x
N n
1000 4 2 18.26(元) n N 1 2 4 1
(二)抽样成数的平均误差
抽样成数的平均误差表明各样本成数和 总体成数绝对离差的一般水平。 由于总体成数可以表现为总体是否标志 的(0,1)分布的平均数,即 p P , X 标准差为 P(1 P)
(三)抽样推断的特点:
1、抽样推断是由部分推算整体的一种认 识方法; 2、抽样推断是建立在随机取样的基础上。 3、抽样推断是运用概率估计的方法; 4、抽样推断的误差可以事先计算并加以 控制。
二、抽样推断的内容
1、参数估计 依据所获得的样本观察资料,对所研究现象总体 的水平、结构、规模等数量特征进行估计,这 种推断方法称为总体参数的估计。 2、假设检验 总体参数的假设检验是先对总体的状况做某种假 设,然后再根据抽样推断的原理,根据样本观 察资料对所作假设进行检验,来判断这种假设 的真伪,以决定行动的取舍,这种推断方法称 为总体参数的假设检验。
设样本变量
x为x 、 、 、 , 则有: x x
1 2 n
x xf 样本平均数x n f 2 x x x x 样本方差 n f
2