统计学第五章:抽样推断
管理统计学之抽样推断
•2020/4/29
•管理统计学讲义 游士兵
特别注意
• 如果同时有几个方差供选择,则选择其 中最大的;
• 如果同时有几个成数供选择,则选择靠 近0.5的那个成数。
•2020/4/29
•管理统计学讲义 游士兵
(3)计算举例
例1:某企业生产一批产品20000件,今随 机抽样100件作耐用时间试验,结果表明 :每件样本的平均寿命为3600小时,所 抽样本的标准差为150小时,求抽样误差 。
•2020/4/29
•管理统计学讲义 游士兵
(2)公式应用
• 抽样误差的计算公式可分为两种条件下 的两种推断的计算公式: 两种条件:重复抽样和不重复抽样 两种推断:以样本平均数推断总体 平均数;以样本成数推断总体成数 这样,就有四个计算公式。
•2020/4/29
•管理统计学讲义 游士兵
公式的验证:
的一种方法。 点估计的特点是只考虑了样本指标,
而没有考虑抽样误差。
•2020/4/29
•管理统计学讲义 游士兵
2、区间估计
(1)理论准备
所谓区间估计就是在一定概率保证下, 确定总体参数值的可能范围。
所谓概率就是指在随机事件进行大量实 验中,某种事件出现的可能性的大小。
抽样估计的概率保证程度就是指抽样误 差不超过一定范围的概率大小。
•管理统计学讲义 游士兵
2、抽样误差的来源
• 一类:登记性误差 • 二类:代表性误差
A、系统性误差 B、偶然性误差 注意:抽样误差特指偶然性误差
•2020/4/29
•管理统计学讲义 游士兵
3、影响抽样误差的因素
• 抽样单位数的多少 • 总体中被研究标志的变动程度的大小
3统计学原理作业3答案
统计学原理作业3第五章-第七章一、判断题1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(×)3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
(√)4、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。
(×)5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。
(×)6、在一定条件下,施肥量与收获率是正相关关系。
(√)7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)8、利用一个回归方程,两个变量可以互相推算(×)二、单项选择题1、在一定的抽样平均误差条件下( A )A、扩大极限误差范围,可以提高推断的可*程度B、扩大极限误差范围,会降低推断的可*程度C、缩小极限误差范围,可以提高推断的可*程度D、缩小极限误差范围,不改变推断的可*程度2、反映样本指标与总体指标之间的平均误差程度的指标是( C )A、抽样误差系数B、概率度c、抽样平均误差 D、抽样极限误差3、抽样平均误差是( D )A、全及总体的标准差B、样本的标准差c、抽样指标的标准差D、抽样误差的平均差4、当成数等于( C )时,成数的方差最大A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )A、等于78%B、大于84% c、在此76%与84%之间D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( B )A、甲厂比乙厂大 B、乙厂比甲厂大c、两个工厂一样大D、无法确定7、反映抽样指标与总体指标之间抽样误差可能范围的指标是( B )。
统计学第五章抽样习题
19、随着样本单位数的无限增大,样本指标和未知的总体
指标之差的绝对值小于任意小的正整数的可能性趋于
必然性,称为抽样估计的( )
A、无偏性
B、一致性
C、有效性
D、 充足性
20、能够事先加以计算和控制的误差是( )
A、抽样误差
B、登记误差
C、标准差
D、标准差系数
2020/3/17
13
21、在一定抽样平均误差的条件下,要提高推断的可靠
31、抽样平均误差与抽样极限误差比较,抽样本平均误差 () A、大于抽样极限误差 B、小于抽样极限误差 C、等于抽样极限误差
D、可能大于、小于、等于极限误差
2020/3/17
18
32、所谓的小样本,一般是指样本单位数( ) A、30以上 B、30以下 C、100以下 D、100以上
33、根据简单随机抽样资料,同一门课及格率甲班为70%, 乙班为80%,在班级人数相同及抽样人数相等的情况下, 及格率的抽样误差( ) A、甲班大 B、乙班大 C、相同 D、无法判断
2020/3/17
8
11、在纯随机抽样条件下,若抽样比例都为36%,则不重复抽样 的抽样平均误差比重复抽样的抽样本平均误差小( ) A、20% B、36% C、80% D、64%
2020/3/17 9
12、事先将全及总体各单位按某一标志排列,然后依固定顺序和 间隔来抽选调查单位的抽样组织形式,被称为( )
E、大小是可以控制的
11.用抽样指标估计总体指标应满足的要求是( )
A、一致性 B、准确性 C、客观性
D、无偏性 E、有效性
12.在其他条件不变的情况下,下列关于抽样平均误差、总体变 异程度及样本容量之间关系的陈述,正确的有( )
统计学中的抽样与推断
统计学中的抽样与推断在统计学中,抽样与推断是非常重要的概念。
它们涉及到我们如何从一小部分样本中推断出整个总体的特征。
在这篇文章中,我们将讨论抽样的不同方法以及如何使用样本数据进行推断。
一、抽样方法在统计学中,我们通常使用以下三种抽样方法:1. 简单随机抽样这是最基本的抽样方法。
简单随机抽样意味着从总体中随机抽出样本,每个样本被抽样的概率相等。
这种方法可以确保样本的代表性。
例如,如果我们要调查一个城市的人口,我们可以从人口登记簿中随机抽取一定数量的人口作为样本。
2. 分层抽样分层抽样是把总体划分为若干个层次,然后从每个层次中随机抽取样本。
这个方法可以减小代表性偏差。
例如,如果我们要调查一个城市的人口,我们可以按照不同的年龄段对总体进行分层,然后从每个年龄段中随机抽取一定数量的人口作为样本。
3. 系统抽样这是从总体中按照一定的规则抽样。
例如,如果我们要调查一个工厂中的员工,我们可以按照员工的工号顺序每隔一定数量抽取一个员工作为样本。
二、样本统计量的计算在进行统计推断之前,我们需要先计算样本统计量。
样本统计量是样本数据的数量指标,可以代表总体的特征。
常见的样本统计量包括:1. 样本均值样本均值是样本数据的平均值。
它可以代表总体的平均值。
例如,我们可以从一个城市的人口中随机抽取一部分人口,计算他们的平均收入,这个平均收入就是样本均值。
2. 样本标准差样本标准差是样本数据的标准差。
它可以代表总体的方差。
例如,我们可以从一个工厂中随机抽取一部分产品,计算它们的重量,这个重量的标准差就是样本标准差。
三、参数估计我们通常使用抽样中的样本统计量来估计总体参数。
例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。
常见的参数估计方法包括:1. 点估计点估计是用样本统计量来估计总体参数的方法。
例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。
2. 区间估计区间估计是用一个区间来估计总体参数的方法。
统计学 第五章
第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。
(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。
全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。
(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。
社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。
样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。
一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。
在样本容量确定之后,样本的可能数目便完全取决于抽样方法。
抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。
抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。
在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。
样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。
统计学第五章抽样习题
11.用抽样指标估计总体指标应满足的要求是( )
A、一致性 B、准确性 C、客观性
D、无偏性 E、有效性
12.在其他条件不变的情况下,下列关于抽样平均误差、总体变 异程度及样本容量之间关系的陈述,正确的有( )
A、总体变异程度一定时,样本容量越大,抽样平均误差越大
B、总体变异程度一定时,样本容量越大,抽样平均误差越小
B、抽样单位数占总体单位数的比重很大时
C、抽样单位数目很少时
D、抽样单位数目很多时
2020/3/17
7
10、在其他条件不变的情况下,抽样单位数目和抽样误差的关系 是( ) A、抽样单位数目越大,抽样误差越大 B、抽样单位数目越大,抽样误差越小 C、抽样单位数目的变化与抽样误差的数值无关 D、抽样误差变化程度是抽样单位数变动程度的1/2
19、随着样本单位数的无限增大,样本指标和未知的总体
指标之差的绝对值小于任意小的正整数的可能性趋于
必然性,称为抽样估计的( )
A、无偏性
B、一致性
C、有效性
D、 充足性
20、能够事先加以计算和控制的误差是( )
A、抽样误差
B、登记误差
C、标准差
D、标准差系数
2020/3/17
13
21、在一定抽样平均误差的条件下,要提高推断的可靠
;
;
;
。
10.对于简单随机重复抽样,若其他条件不变,则当误差范围
缩小一半,抽样单位数必须
倍,若误差范围扩大一
倍,则抽样单位数为原来的
。
11.点估计是直接用
估计不考虑
及
估计总体指标的推断方法。点 。
2020/3/17
29
14. 抽样法的基本特点是( )
统计学第5章抽样推断
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N
例
某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp
统计学第五章课后题及答案解析
第五章一、单项选择题1.抽样推断的目的在于( )A.对样本进行全面调查 B.了解样本的基本情况C.了解总体的基本情况 D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于( )A.样本单位数 B.总体方差C.抽样比例 D.样本单位数和总体方差3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差( )A.一年级较大 B.二年级较大C.误差相同 D.无法判断4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将( )A.高估误差 B.低估误差C.恰好相等 D.高估或低估5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量( )A.扩大到原来的2倍 B.扩大到原来的4倍C.缩小到原来的1/4 D.缩小到原来的1/26.当总体单位不很多且差异较小时宜采用( )A.整群抽样 B.纯随机抽样C.分层抽样 D.等距抽样7.在分层抽样中影响抽样平均误差的方差是()A.层间方差 B.层内方差C.总方差 D.允许误差二、多项选择题1.抽样推断的特点有()A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题C.用样本指标来推断总体指标 D.抽样误差可以事先计算E.抽样误差可以事先控制2.影响抽样误差的因素有( )A.样本容量的大小 B.是有限总体还是无限总体C.总体单位的标志变动度 D.抽样方法E.抽样组织方式3.抽样方法根据取样的方式不同分为( )A.重复抽样 B.等距抽样 C.整群抽样D.分层抽样 E.不重复抽样4.抽样推断的优良标准是( )A.无偏性 B.同质性 C.一致性D.随机性 E.有效性5.影响必要样本容量的主要因素有( )A.总体方差的大小 B.抽样方法C.抽样组织方式 D.允许误差范围大小E.要求的概率保证程度6.参数估计的三项基本要素有()A.估计值 B.极限误差C.估计的优良标准 D.概率保证程度E.显著性水平7.分层抽样中分层的原则是( )A.尽量缩小层内方差 B.尽量扩大层内方差C.层量扩大层间方差 D.尽量缩小层间方差E.便于样本单位的抽取三、填空题1.抽样推断和全面调查结合运用,既实现了调查资料的_______性,又保证于调查资料的_______性。
统计学课件:抽样推断
3.当总体X~N(, 2),从中抽取容量为n的样本,则
n
2
(n 1)s2
2
~
(2 n-1); 2
(xi x)2
i 1
2
~
(2 n-1)
4. 2—分布的性质 (1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ), X,Y独立,则 X +Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则 E(X)= n,D(X)=2n
3、进行产品质量检验 4、进行假设检验
(一)总体和样本 1、总体 总体也称全及总体,指所有认识的研究对象全体,它是
有所研究范围内具有某种共同性质的全体单位所组成的 集合体。 一般用英文字母大写N来表示总体的单位数。 2、样本 样本又称子样,它是从全及总体中随机抽取出来,作为 代表这一总体的那部分单位组成的集合体。 一般用英文小写字母n来表示样本的单位数。
5. 分位点 设X ~ 2(n),若对于:0<<1,
存在 2 (n) 0 满足
P{X 2 (n)} ,
则称 2 (n) 为 2 (n) 分布的上分位点。
2
(n
)
(二)t 分布
若X 服从N (0,1),Y 服从自由度为n的 2分布, 且X 和Y 独立,则 X
Y /n 服从自由度为n的 t分布。
1、全及指标 根据各单位的标志值或标志属性计算的,反映总体
数量特征的综合指标称为全及指标,又称为参数。
设总体变量 X 为: X1, X 2 ,X N 则有:
X X XF N F
2 X X 2 X X 2 F
N
F
设总体 N 个单位,有 N1 个单位具有某种性质, N0 个单位不具有某种性质,
统计学原理第5章
Nn = 42
=16 (个样本)
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
AB、AC、AD、
BA、BC、BD、
CA、CB、CD、
DA、DB、DC
第二节
抽 样 误 差
一、抽样误差的含义
1
1
1
1
0
P=0.8
p =0.4
抽样平均数平均误差的计算方法
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量成反比。(当总体标准差未知时,可 用样本标准差代替)
通过例题可说明以下几点: ①样本平均数的平均数等于总体平均数。 ②抽样平均数的标准差仅为总体标准差的
x
n 1 n N
x2f 1058400 830060 349920 270400 182250
495
445 540 420
1.1
1 0.9 0.8
544.5
445 486 336
269527.5
198025 262440 141120
合计
5
2531.5
1303113
合计
6
3911
2691030
x甲
xf f
1 n
③可通过调整样本单位数来控制抽样平均误差。
某电子产品使用寿命在3000小时以下为不合格品,从5000个产品 中抽取100件调查,结果如下: 求1:平均寿命的抽样平均误差. 2:求合格品率的抽样平均误差.
使用寿命(小时) 3000以下 3000-4000 4000-5000 5000以上 合计
安徽财经大学统计学课件-第05章 抽样推断
20
统计学
第五章
抽样推断
第二节 抽样误差
1.重复抽样的条件下
抽样平均误差: x
X
n
式中,n为样本容量; x为总体标准差一般情 况下是未知,可用样本标准差 x替代 。
成数的抽样平均误差 p :
p
n
式中,n为样本容量; p为总体成数标准差一 般情况下是未知,可用样本成数标准差 p 替代 。
第五章
抽样推断
本章主要内容
第一节 第二节 第三节 第四节
抽样推断的一般问题 抽样误差 参数估计 抽样组织设计
1
想一想 Thinking Challenge
消费者协会接到消费者投诉,指 控品牌纸包装饮料存在容量不足, 有欺骗消费者之嫌。包装上标明 的容量为250毫升。消费者协会 从市场上随机抽取50盒该品牌纸 包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生 产中正常的波动,还是厂商的有 意行为?消费者协会能否根据该 样本数据,判定饮料厂商欺骗了 消费者呢?
38
250 ml
2
统计学
第五章
抽样推断第一节 抽样推断的一般问题
第一节
抽样推断的一般问题
一、抽样推断的概念 二、抽样推断的特征 三、抽样推断的内容 四、有关抽样的基本概念
本章目录
3
统计学
第五章
抽样推断第一节 抽样推断的一般问题
一、抽样推断的概念
抽样推断是根据随机原则从总体中抽取部分总体 单位,以这一部分总体单位的实际数据推算总体 相应数量特征的一种统计分析方法。 随机原则是指在抽样调查中,使每一个单位被抽 中的概率都相等且不等于0。 随机抽样的目的是使样本与总体同分布。
统计学05第五章抽样推断
布来计算。
0
2019/11/22
第五章 抽样推断
40
2.3 区间估计
【例 5-4】 从某校学生中随机抽取 25人,调查到他们平均每天参加体育 锻炼的时间为25分钟,标准差为8分 钟。试以95%的置信水平估计该校学 生平均每天参加体育锻炼的时间。
2019/11/22
第五章 抽样推断
41
2.3 区间估计
Z~N ( 0, 1 )
Z
S
μ
ΔΔ
X X X
Z 0 Z
2019/11/22
第五章 抽样推断
31
2.3 区间估计
二 总体平均数的区间估计:
X : FZ 1
Δ
FZ , Z FZ Z
Δ
x
x x
2019/11/22
第五章 抽样推断
总体参数和样本统计量的计算公式
总体参数
样本统计量
X X1 X2 XN N
x x1 x2 xn n
P N1 N
p n1 n
X X X 2 N
S x x-x 2 n1
P P 1 P
p p 1 p
t X : x ,x
2019/11/22
第五章 抽样推断
39
2.3 区间估计
正态分布与 t 分布的比较
t 分布的应用
当 n 大,
N0, 1
S x自实由际 度 参数大估计中,当样本 t 分容布量大N 0于,13 0时,总体均值的
区t 间 0估 , σ 2计ν通 常还是用正态分
0.15
X : 4 0.45, 4 0.45 3.55, 4.45小时
《统计学原理》第5章:抽样推断
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
(完整版)第五章抽样调查习题答案
《统计学》习题五参考答案一、单项选择题:1、抽样误差是指()。
CA在调查过程中由于观察、测量等差错所引起的误差 B人为原因所造成的误差C随机抽样而产生的代表性误差 D在调查中违反随机原则出现的系统误差2、抽样平均误差就是()。
DA样本的标准差 B总体的标准差 C随机误差 D样本指标的标准差3、抽样估计的可靠性和精确度()。
BA是一致的 B是矛盾的 C成正比 D无关系4、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()。
AA增加8倍 B增加9倍 C增加1.25倍 D增加2.25倍5、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是()。
BA最小的n值 B最大的n值 C中间的n值 D第一个计算出来的n值6、抽样时需要遵循随机原则的原因是()。
CA可以防止一些工作中的失误 B能使样本与总体有相同的分布C能使样本与总体有相似或相同的分布 D可使单位调查费用降低二、多项选择题:1、抽样推断中哪些误差是可以避免的()。
A B DA工作条件造成的误差 B系统性偏差 C抽样随机误差D人为因素形成偏差 E抽样实际误差2、区间估计的要素是()。
A C DA点估计值 B样本的分布 C估计的可靠度D抽样极限误差 E总体的分布形式3、影响必要样本容量的因素主要有()。
A B C EA总体的标志变异程度 B允许误差的大小 C重复抽样和不重复抽样D样本的差异程度 E估计的可靠度三、填空题:1、抽样推断就是根据()的信息去研究总体的特征。
样本2、样本单位选取方法可分为()和()。
重复抽样不重复抽样3、实施概率抽样的前提条件是要具备()。
抽样框4、对总体参数进行区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。
准确性可靠性四、简答题:1、抽样调查与重点调查的主要不同点。
答:第一,选取调查单位的方法不同。
抽样调查是按随机原则抽取调查单位的,重点调查中的重点单位是调查标志值占总体标志总量比重很大的单位,调查单位是明显的;第二,作用不同。
5 应用统计学(教案)-抽样推断
4、抽样估计的一般步骤
设计抽样方案 抽取样本单位 收集样本资料
整理样本资料
推断总体指标
(1)抽样方案设计的基本准则
随机原则: 确保每个总体单位都有 被抽取的可能。 抽样误差最小: 控制和选择抽样数 目及抽样组织方式 费用最少: 在误差达到一定要求的 条件下,选择费用最少 的方案。
(2)抽样方案设计的主要内容 ① 编制抽样框 抽样框即总体单位的名单。 主要形式: 名单抽样框 区域抽样框 时间表抽样框 编制要求: 应包括全部总体单位 总体单位不应重复 应便于抽样的实施 应尽量利用资料,提高抽 样效果
第五章 抽样推断
基本概念
抽样误差
抽样估计 抽样组织方式
第一节 抽样估计的基本概念
一、抽样估计的意义和一般步骤 1、抽样估计的概念
抽样估计 按随机原则从总体中抽取一部 分单位进行调查,并以调查结 果对总体数量特征作出具有一 定可靠程度的估计与推断,从 而认识总体的一种统计方法。 也是一种收集资料的方法,所以也称为抽 样调查。
另外,分两个以上阶段完成抽取样本的多阶段抽 样,多在总体单位数量多分布广时采用。一般前阶段 采用分层或有关标志排队等距抽样;后阶段采用简单 随机或无关标志排队等距抽样。
④ 确定抽样数目 抽样数目: 即样本容量、样本单位数 大样本:n ≥ 30 小样本:n < 30 抽样数目的确定,与抽样误差、费 用及抽样组织方式有直接的关系。 误差小费用多时抽样数目多,误差 大费用少时抽样数目少;分层抽样除确 定整个样本容量外,还需确定子样本容 量;整群抽样需确定样本群数;多阶段 抽样需确定各阶段抽样数目。
| x - X |≤△ x (在一定概率下) 置信度、概率保证度、 可信度、把握程度,)与△x 是一对矛盾
统计学5章
有数学期望值 E ( x ) = a a 代表全及总体平均数) (
设总体变量有 N 个:X1,X2,… , XN,则
样本容量为 n:x1 , x2 , … , xn , 则:
X1 X 2 X N X= N
x1 x2 xn x = n
∵ ∴ =
2 x
x1, x2,…, xn相互独立
1 n2 E x1 X
2
E x2 X
2
E xn X
2
2
E ( xi X )( x j X ) i j
=
1 n2 1 n2
E ( x X )2 E x X 1 2 E X X
对于属性总体来说则有如下对应样本指标: 设样本总体 n 个单位中有 n1 个单位具有某种属性, n0 个单位不具有某种属性,且n1 +n0 = n 。则:
n1 p n n0 n n1 q 1 p n n
样本标准差
s
p1 p
(二)参数和统计量
(三)样本容量与样本个数
样本容量是指一个样本所包含的单位数,用 n 来 表示。一般地讲,样本单位数达到或超过30个的样本 称为大样本,而在30个以下称为小样本。 样本个数又称样本可能数目,是指从全及总体中
二、抽样推断的几个基本概念
抽样推断的几个基本概念(见图5-1)。
图5-1 抽样推断的几个基本概念
(一) 总体和样本
在抽样推断中面临两个不同的总体,即 全及总体和样本总体(见图5-2)。
图5-2 全及总体和样本总体关系示意
(一) 总体和样本
统计学第五章抽样推断
统计学第五章抽样推断二、单项选择题1、对总体的数量特征进行抽样估计的前提是抽样必须遵循(B)。
A.大量性B.随机性C.可靠性D.准确性2、一般认为大样本的样本单位数至少要大于(A)。
A.30B.50C.100D.2003、抽样平均误差是指(D)。
A.抽中样本的样本指标与总体指标的实际误差B.抽中样本的样本指标与总体指标的误差范围C.所有可能样本的抽样误差的算术平均数D.所有可能样本的样本指标的标准差4、在其它条件相同的情况下,重复抽样的抽样误差(A)不重复抽样的抽样误差。
A.大于B.小于C.总是等于D.通常小于或等于5、在其它条件不变的情况下,要使抽样误差减少1/3,样本单位数必须增加(D)。
A.1/3B.1.25倍C.3倍D.9倍6、从产品生产线上每隔10分钟抽取一件产品进行质量检验。
推断全天产品的合格率时,其抽样平均误差常常是按(C)的误差公式近似计算的。
A.简单随机抽样B.整群抽样C.等距抽样D.类型抽样7、通常使样本单位在总体中分布最不均匀的抽样组织方式是(B)。
A.简单随机抽样B.整群抽样C.分层抽样D.等距抽样9、抽样平均误差和极限误差的关系是(D)A抽样平均误差大于极限误差B抽样平均误差等于极限误差C抽样平均误差小于极限误差D抽样平均误差大于、等于、小于极限误差都可能10、抽样平均误差的实质是(D)A、总体标准差B、样本标准差C、抽样误差的标准差D、全部可能样本平均数的标准差三、多项选择题C、可以计算抽样误差D、以概率论和数理统计学为理论基础2、影响抽样平均误差大小的因素有(ABCD)。
A、总体各单位标志值的差异程度B、抽样数目C、样本各单位标志值的差异程度D、抽样组织方式E、抽样推断的把握程度3、影响必要的抽样数目的因素有(BCDE)。
A、总体各单位标志值的差异程度B、样本各单位标志值的差异程度C、抽样方法和抽样组织方式D、抽样推断的把握程度E、允许误差4、计算抽样平均误差时,由于总体方差是未知的,通常有下列代替方法(ACE)。
统计学5-8章习题答
第五章抽样推断练习一、单项选择题:1.在抽样调查中,(A )A. 全及指标是唯一确定的B. 全及指标只有一个C. 样本是唯一确定的D. 样本指标只有一个2.抽样误差产生的原因是(C )A. 在调查过程中由于观察、测量等差错所引起的误差B. 在调查中违反随机原则出现的系统误差C. 因随机抽样而产生的代表性误差D. 人为原因所造成的误差3.抽样平均误差是( C )A. 全及总体的标准差B. 样本的标准差C. 抽样指标的标准差D. 抽样误差的平均差4.样本平均数和全及总体平均数,( C )A. 前者是一个确定值,后者是随机变量B. 两者都是随机变量C. 前者是随机变量,后者是一个确定值D. 两者都是确定值5.在纯随机重复抽样的情况下,要使抽样误差减少一半,其他条件不变,则样本单位数必须(D )A. 增加2倍 B. 增加到2倍C. 增加4倍D. 增加到4倍6.抽样调查中,在其他条件不变的情况下,抽样单位数越多,则(D )A. 系统误差越大B. 系统误差越小C. 抽样误差越大D. 抽样误差越小7.在一定的抽样平均误差条件下(A )A. 扩大极限误差范围,可以提高推断的可靠程度B. 扩大极限误差范围,会降低推断的可靠程度C. 缩小极限误差范围,可以提高推断的可靠程度D. 缩小极限误差范围,不改变推断的可靠程度8.抽样极限误差是( B )A.随机误差B.抽样估计所允许的误差的上下界限C.最小抽样误差D.最大抽样误差9.抽样估计的可靠性和精确度( B )A.是一致的B.是矛盾的C.成正比D.无关系10.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟生产的所有产品进行检验,这种抽查方式是(D )A. 简单随机抽样B. 类型抽样C. 等距抽样D. 整群抽样二、多项选择题:1.抽样推断的优点()。
①时效性强②更经济③能够控制抽样估计的误差④适用范围广⑤无调查误差2.抽样调查适用于下列哪些场合:(ABC )A. 不宜进行全面调查而又要了解全面情况B. 工业产品质量检验C. 调查项目多、时效性强D. 只需了解一部分单位的情况E. 适用于任何调查3.在抽样调查中,下列说法正确的有(ABD)A. 全及总体是唯一确定的B. 样本指标是随机变量C. 样本是唯一的D. 样本指标可以有多个E. 总体指标只有一个4.抽样调查时,所估计的总体指标的区间范围(ACD )A. 是一个可能范围B. 是绝对可靠的范围C. 不是绝对可靠的范围D. 是有一定把握程度的范围E. 是毫无把握的范围5.抽样调查的组织方式有(ABCD)。
【统计学概论】抽样推断
每包重量(克) 149以下 149—150
150—151 151以上
包数 10 20 50 20
(1)以99.73%的概率保证估计这批茶叶平均每包重量的 可能范围
(2)以同样的概率保证估计这批茶叶包装的合格率的可 能范围
• 三必要抽样数目的确定
• (一)影响抽样数目的因素
•
影响抽样数目的因素有:
(一)总体和样本
总体:调查研究的事物或现象的全体,所包含 的单位数用“N”表示。
样本:从总体中所抽取的部分个体所构成的小 的总体,当中所包含的单位数用“n”
表 示,称为“样本容量”。 样本可分为: 大样本 小样本
(二)全及指标与样本指标 (参数与统计量)
1、全及指标:说明全及总体的综合数量 特征,是唯一的,又称为“参数”。
尺度,用“ ”。
2、公式:
(1)重复抽样条件下:
(2)不重复抽样条件下:
五、抽样极限(允许)误差
1、概念:是在一定的概率保证下,用样本 指标估计全及指标时允许出现的
最 大误差,用“△”表示.
2、计算公式: 根据置信度(即可靠性,F(t)=1-α),
查正态概率分布表,查得对应的概率度t。 (在总体方差未知的情况下)
例3:P94
例4 P95
例5 P96
三、抽样误差
1、概念:是在遵循随机原则的条件下,用 样本指标来代表全及指标所不可避免 的误差。就是统计误差中的随机误差
抽样误差=样本指标 -全及指标 2、影响因素:
①抽取单位数n的多少 ②被研究标志的变异程度 ③抽样方法 ④抽样组织方式
四、抽样平均误差
1、概念:是所有可能组成的样本的抽样误 差的平均数,反映样本指标与全及指标的 平均误差程度,是衡量样本代表性大小的
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章:抽样推断
二、单项选择题
1、对总体的数量特征进行抽样估计的前提是抽样必须遵循( B )。
A.大量性
B.随机性
C.可靠性
D.准确性
2、一般认为大样本的样本单位数至少要大于(A )。
A.30
B.50
C.100
D.200
3、抽样平均误差是指( D )。
A.抽中样本的样本指标与总体指标的实际误差
B.抽中样本的样本指标与总体指标的误差范围
C.所有可能样本的抽样误差的算术平均数
D.所有可能样本的样本指标的标准差
4、在其它条件相同的情况下,重复抽样的抽样误差(A)不重复抽样的抽样误差。
A.大于
B.小于
C.总是等于
D.通常小于或等于
5、在其它条件不变的情况下,要使抽样误差减少1/3 ,样本单位数必须增加(D )。
A. 1/3
B. 1.25倍
C. 3倍
D. 9倍
6、从产品生产线上每隔10分钟抽取一件产品进行质量检验。
推断全天产品的合格率时,其抽样平均误差常常是按(C )的误差公式近似计算的。
A.简单随机抽样
B.整群抽样
C.等距抽样
D.类型抽样
7、通常使样本单位在总体中分布最不均匀的抽样组织方式是(B )。
A.简单随机抽样
B.整群抽样
C.分层抽样
D.等距抽样
9、抽样平均误差和极限误差的关系是(D)
A抽样平均误差大于极限误差B抽样平均误差等于极限误差
C抽样平均误差小于极限误差
D抽样平均误差大于、等于、小于极限误差都可能
10、抽样平均误差的实质是(D)
A、总体标准差
B、样本标准差
C、抽样误差的标准差
D、全部可能样本平均数的标准差
三、多项选择题
1、抽样调查与其它非全面调查相区别的主要特点有(ACD )。
A、按随机原则抽取样本单位
B、调查资料时效性强
C、可以计算抽样误差
D、以概率论和数理统计学为理论基础
2、影响抽样平均误差大小的因素有(ABCD )。
A、总体各单位标志值的差异程度
B、抽样数目
C、样本各单位标志值的差异程度
D、抽样组织方式
E、抽样推断的把握程度
3、影响必要的抽样数目的因素有(BCDE )。
A、总体各单位标志值的差异程度
B、样本各单位标志值的差异程度
C、抽样方法和抽样组织方式
D、抽样推断的把握程度
E、允许误差
4、计算抽样平均误差时,由于总体方差是未知的,通常有下列代替方法(ACE )。
A、大样本条件下,用样本方差代替
B、小样本条件下,用样本方差代替
C、用以前同类调查的总体方差代替
D、有多个参考数值时,应取其平均数代替
E、对于比率的方差,有多个参考数值时,应取其中最接近0.5的比率来计算
5、在其它条件不变时,抽样推断的置信度1-α越大,则(ADE )。
A、允许误差范围越大
B、允许误差范围越小
C、抽样推断的精确度越高
D、抽样推断的精确度越低
E、抽样推断的可靠性越高
6、与简单随机抽样相比,在其它条件相同的情况下,类型抽样可以(ABC )。
A、缩小抽样误差
B、提高样本对总体的代表性
C、深化对总体的认识
D、提高调查资料的时效性
E、降低调查难度
7、影响抽样误差的因素有(CDE )。
A、是有限总体还是无限总体
B、是变量总体还是属性总体
C、是重复抽样还是不重复抽样
D、总体被研究标志的变异程度
E、抽样单位数的多少
8、点估计(BDE )。
A、考虑了抽样误差大小
B、没有考虑抽样误差大小
C、能说明估计结果的把握程度
D、是抽样估计的主要方法
E、不能说明估计结果的把握程度
9、评价估计量是否优良的常用标准有(ABD )。
A、无偏性
B、有效性
C、准确性
D、一致性
E、随机性
10、衡量一个抽样方案优劣的基本准则有(ABCD )。
A、抽样的随机原则
B、抽样误差最小
C、调查费用最少
D、调查时间最短
E、调查内容最多
四、填空题
1.抽样法是按照___随机____原则从全部研究对象中抽取部分单位进行观察。
2.抽样平均误差就是抽样平均数或抽样成数的__标准差_____。
3.抽样估计优良标准应具备的三个要求是___无偏性____、__有效性_____和___一致性____。
4.某乡有3000亩小麦,随机抽选60亩,测得亩产量为210公斤,用点估计的方法推断该队小麦总产量为____63___万公斤。
5.抽样调查的四种基本组织方式是__纯随机_____、_类型______、__等距_____和___整群____。
6.甲班男生25人,女生20人,乙班男生33人,女生25人,甲班学生性别差异_大于______乙班。
7.抽样调查是用__样本_____指标推断___全及____指标的一种调查方法。
8.对于属性总体所计算的比重(结构)指标,称为__总体成数_____。
9.等距抽样是事先将全及总体各单位按_某标志排队,______。
然后依__固定顺序和间隔_____来抽选调查单位的一种抽样组织方式。
10.允许误差ΔX为0.04时,抽样单位数n为100,若其它条件不变,而允许误差减至0.02和0.01时,其相应的抽样单位数为____400___和___1600____个。
11.全及总体按照其研究各单位标志的性质不同,可以分为__属性_____总体和__变量_____总体两类。
12.抽样极限误差是指____全及___指标和___抽样____指标之间抽样误差的可能范围。
13.在纯随机重复抽样条件下,如果抽样单位数比原来的增加30%,则抽样平均误差_
减少百分之12.3 ______。
14.抽样估计置信度即F(t)是表明抽样指标和总体指标的误差不超过一定范围的__概率保证程度_____。
15.在其他条件不变的情况下,抽样估计的__可靠_____性要求提高了,那么估计的__准确_____性便降低。
答案:1.随机 2.标准差 3.无偏性、一致性、有效性 4. 63 5.纯随机抽样、类型抽样、等距抽样、整群抽样 6.大于7.样本、全及8.总体成数9.某标志排队、固定顺序和间隔10. 400 1600 11.属性、变量12全及、抽样13. 减少12.3%或为原来的87.7%
14. 概率保证程度15. 可靠准确(次序可颠倒)
六、计算题
1.用不重复抽样的方法从10000个电子管中随机抽取4%进行耐用性能检查,样本计算结果平均寿命为4500小时,样本寿命时数方差为15000,要求以0.9545的概率保证程度(t=2)估计该批电子管的平均寿命范围(小时)。
解.N=10000 n=400 X=4500小时=15000小时
时
小时
∴平均寿命区间为4500±12小时
答:以95.45%的概率保证估计该批电子管的平均耐用时数在4488~4512小时之间。
3.对一批成品按纯随机不重复抽样方法抽取200件,其中废品为8件,又知抽样数目是总量的1/20,当概率为0.9545时,是否可以认定这一批产品的废品率不超过5%?
解.废品抽样成数
废品抽样平均误差
=0.0135(或1.35%)
废品抽样极限误差:
概率为95.45%时,估计废品的范围:
即:1.3%≤P≤6.7%
所以不能认为这批产品的废品率不超过5%。
4.根据以往的资料,某灯泡厂生产60瓦灯泡合格率在91~95%之间,现进行随机抽样调查,①要求极限误差不超过2%,把握程度为0.9545,需要抽选多少个灯泡?②极限误差不超过1%,需要抽选多少灯泡?
解.以历史资料,总体最大方差为:p(1-p)=0.91×0.09=0.0819 (1)(个) (2)(个)
5某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。
100名工人的日产量分组资料
△ x = t μx =1.96×0.614=1.203(件)
则该企业工人人均产量及日总产量的置信区间为:
6、若例A 中工人日产量在118件以上者为完成生产定额任务,要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。
()()()件件47.69941441126100126002==--====∑∑∑∑f f x x s f xf x ()件614.01000100110047.6122=⎪⎭⎫ ⎝⎛-=⎪⎭⎫ ⎝⎛-=N n n s x μ()()203.11261000203.11261000,203.1126203.1126+≤≤-+≤≤-X N X ,
9.010090,
96.1,10,90,100,1000101========n n p t n n n N 则己知
则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:
()()0568.09.010000568.09.01000,0568.09.00568.09.0+≤≤-+≤≤-NP P。