统计学第六章 抽样推断
统计学教案(第6章抽样推断)

二、区间估计法
在参数估计中,虽然点估计可以给出未知参数得一个估计,但不能给出估计得精度。为此人们希望利用样本给出一个范围,要求它以足够大得概率包含待估参数真值。这就就是导致区间估计问题。
所谓区间估计,就就是估计总体参数得区间范围,并要求给出区间估计成立得概率值。
设 就是未知参数, 就是来自总体得样本,构造两个统计量 , ,对于给定得 (0< <1),若 、 满足
例如
就就是一个统统计量,称为样本方差(Sample variance),
3、重复抽样与不重复抽样
(1)重复抽样:就是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一次样本单位得抽取。
(2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下一次抽样。
2、总体参数与样本统计量
(1)总体参数:总体分布得数量特征就就是总体参数,也就是抽样统计推断得对象。常见得总
体参数有:总体得平均数指标,总体成数(比重)指标,总体分布得方差、标准差等等。
(2)样本统计量:与总体参数对应得就是样本统计量。
设( )就是总体 容量为n得样本,若样本函数
( )
中不含任何未知参数,则称 为一个统计量。
2、根据部分推断总体得数量特征
3、抽样推断得结果具有一定得可靠性与准确性,抽样误差可以事先计算与控制
其她特点有经济性、时效性、准确性、灵活性等
(三)抽样推断得应用
1、不可能进行全面调查时
2、不必要进行全面调查时
3、检查生产过程正常与否
4、对全面调查资料进行补充修正时
二、抽样得几个基本概念
1、样本容量与样本个数
区间估计步骤:
1、计算样本统计量
统计学基础课件(第六章抽样推断)

Fundamentals of Statistics
统计是指这种偶然性代表性误差。 即按随机原则抽样时,在没有登记性误差和系统性误 差的条件下单纯由于不同的随机样本得出不同估计量 而产生的误差。抽样误差是抽样调查所固有的,是无 法避免与消除的,但可以运用数学方法计算其数量界 限,并通过抽样设计程序控制其范围,所以这种抽样 误差也称为可控制误差。 需要指出,抽样误差不是 固定不变的数,它的数值是随样本不同而变化的,所 以它也是随机变量。
重复抽样 AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
N n = 42 =16 (个样本)
Fundamentals of Statistics
统计学基础
第六章 抽样推断
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
Fundamentals of Statistics
Fundamentals of Statistics
统计学基础
第六章 抽样推断
本章主要内容 •抽样推断概述 •抽样误差 •抽样估计的方法 •样本容量的确定
Fundamentals of Statistics
统计学基础
第第一六章节抽样推抽断样推断概述
一、抽样推断的概念和特点 概念
抽样推断是在抽样调查的基础上,用样 本实际资料计算样本指标,并据以推算总 体相应的数量特征的一种统计分析方法。
代表性误差的发生有以下两种情况:
一种是由于违反抽样调查的随机原则,如有意地多选较好的 单位或较坏的单位进行调查。这样做,所据以计算的抽样指标 必然出现偏高或偏低现象,造成系统性的误差。系统性误差和 登记性误差都是不应当发生的,是可以也应该采取措施避免发 生或将其减小到最小限度。
统计学罗文宝主编 第六章抽样推断单选题多选题参考答案

第六章抽样推断二、单项选择题1.抽样平均误差是( A )。
A.抽样指标的标准差B.总体参数的标准差C.样本变量的函数D.总体变量的函数2.抽样调查所必须遵循的基本原则是( B )。
A.准确性原则B.随机性原则C.可靠性原则D.灵活性原则3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的( C )。
A.2倍B.3倍C.4倍D.1/4倍4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是( A )。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样5.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( C ) 。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样6.在一定的抽样平均误差条件下( A )。
A.扩大极限误差范围,可以提高推断的可靠程度B.扩大极限误差范围,会降低推断的可靠程度C.缩小极限误差范围,可以提高推断的可靠程度D.缩小极限误差范围,不改变推断的可靠程度7.映样本指标与总体指标之间的平均误差程度的指标是( C )。
A,平均数离差 B,概率度C,抽样平均误差 D,抽样极限误差8 以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为( A )。
A.无偏性B.一致性C.有效性D.准确性9.在其他条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( B )。
A.随之扩大B.随之缩小C.保持不变D.无法确定10.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样三、多项选择题1.抽样推断的特点是(ABCE) 。
A.由推算认识总体的一种认识方法B.按随机原则抽取样板单位C.运用概率估计的方法D.可以计算,但不能控制抽样误差E.可以计算并控制抽样误差2. 抽样估计中的抽样误差(ACE) 。
《国民经济统计学概论》_第六章_抽样推断

总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
统计学第6章抽样推断

t
x
S
X
,S
n
(x x)2
n 1
t
xX S
,S
n 1
(x x)2
n
t 分布
t分布是类似正态分布的一种对称分布,它通常要比 正态分布平坦和分散。一个特定的t分布依赖于称之 为自由度的参数。随着自由度的增大,t分布也逐渐 趋于正态分布
•
10、市场销售中最重要的字就是“问”。17:19:1217:19:1217:198/29/2021 5:19:12 PM
•
11、现今,每个人都在谈论着创意,坦白讲,我害怕我们会假创意之名犯下一切过失。21.8.2917:19:1217:19Aug-2129-Aug-21
•
12、在购买时,你可以用任何语言;但在销售时,你必须使用购买者的语言。17:19:1217:19:1217:19Sunday, August 29, 2021
• 抽样误差是由于随机原则导致的样本统计量 (如样本平均数、样本成数)与总体参数之间 的误差,主要包括:
xX
pP
抽样误差的影响因素
•样本容量的大小
容量大
抽样误差小
•总体的变异程度
变异大
抽样误差大
•抽样方法和抽样组织方式
不重复抽样的抽样误差比重复 抽样的抽样误差小;
抽样组织方式:简单随机抽样 的误差最大。
2x.中心极限定理
从非正态总体(平均数和标准差有限)中抽取的样本,当n足够 大时(n>30),样本平均数分布接近正态分布。n越大,分布越趋 近于正态分布。
正态总体或非正态总体、大样本
x
~
N(X
,
2 x
)
令Z x X , Z ~ N (0,1)
经济应用统计学-第六章抽样推断

非参数检验优缺点总结
• 易于理解和实现:非参数检验方法通常基于直观和易于理解的思想,计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比,非参数检 验方法的检验效能通常较低,即 当原假设为真时,非参数检验方 法更容易犯第二类错误(接受原 假设)。
对数据信息的利用不 充分
非参数检验方法通常只利用数据 的部分信息(如排序信息),而 忽略了数据的其他有用信息(如 数值大小),因此可能无法充分 利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验 等方法,用于比较同一总体内两个配对样本的差 异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法,用于比较两个独立样本所来自的 总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时,应充分考虑样本量的大小。当样本量较小时,应选择较低的置信水平以避免过大的估计误差;当 样本量较大时,可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时,可以参考相关领域的文献或行业标准,了解通常采用的置信水平及其依据。这有助 于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的 假设,而备择假设则是研究者希 望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出 的用于检验原假设的统计量,而拒 绝域则是根据显著性水平和检验统 计量的分布确定的,当检验统计量 落入拒绝域时,我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时,即备择假设只可能大于或小于原假设时,应选择单侧检验 。例如,在比较两种药物疗效的研究中,如果研究者预期新药疗效优于旧药,则应选择单侧检验。
统计学作业(抽样推断)

第六章抽样推断一、单项选择题1. 抽样调查的主要目的在于()。
A。
计算和控制误差 B. 了解总体单位情况C. 用样本来推断总体 D。
对调查单位作深入的研究2。
抽样调查所必须遵循的基本原则是( ).A. 随意原则 B。
可比性原则C. 准确性原则 D. 随机原则3。
下列属于抽样调查的事项有( )。
A. 为了测定车间的工时损失,对车间的每三班工人中的第一班工人进行调查B。
为了解某大学生食堂卫生状况,对该校的一个食堂进行了调查C。
对某城市居民1%的家庭调查,以便研究该城市居民的消费水平D。
对某公司三个分厂中的第一个分厂进行调查,以便研究该工厂的能源利用效果4。
无偏性是指().A。
抽样指标等于总体指标 B. 样本平均数的平均数等于总体平均数C。
样本平均数等于总体平均数 D. 样本成数等于总体成数5。
一致性是指当样本的单位数充分大时,抽样指标( )。
A。
小于总体指标 B. 等于总体指标C. 大于总体指标 D. 充分靠近总体指标6. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )。
A。
前者小于后者 B. 前者大于后者C。
两者相等 D。
两者不等7。
能够事先加以计算和控制的误差是( )。
A。
抽样误差 B。
登记误差C。
代表性误差 D. 系统性误差8.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍.抽样平均误差()。
A。
第一工厂大 B。
第二个工厂大C. 两工厂一样大 D. 无法做出结论9。
抽样平均误差是指抽样平均数(或抽样成数)的()。
A. 平均数 B。
平均差C. 标准差 D. 标准差系数10.在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( ).A。
两者相等 B。
两者不等C。
前者小于后者 D. 前者大于后者。
11。
反映抽样指标与总体指标之间抽样的可能范围的指标是()。
A。
抽样平均误差 B. 抽样误差系数C. 概率度 D. 抽样极限误差。
第六章 抽样推断

在不重复抽样下:
x
2
N
n
n N 1
2
53.63
10000
200
3.754小时
200 10000 1
23
第二十三页,共53页。
(2)计算灯泡的合格率和合格率的抽样平均误差。
求灯泡合格率的抽样平均误差
:
p
在重复抽样下:
p
p1 p
n
0.915 0.085 1.972% 200
⒉全及总体的分类
属性总体(是非总体)
变量总体
⒊总体单位数:N
4
第四页,共53页。
一、全及总体和抽样总体
(二)抽样总体
简称样本,是从全及总体中随机抽取出 来,作为代表这一总体的那部分单位组成的 集合体。
样本单位数:n
第五页,共53页。
返回
5
二、全及指标和抽样指标
(一)全及指标(参数): 1、概念:根据全及总体各单位标志值计
x i1
fi
m
(xi x )2 fi
2 i1
fi
m
( xi
i1
x)2 fi fi
10
第十页,共53页。
属性总体的抽样指标
抽样成数
抽样平均数
其中:
抽样标准差
p n1 n
q n0 n n1 1 p
n
n
n1:总体中具有某种属性的单位数目。
n0:总体中不具有某种属性的单位数目。
n0 n1 n
21
第二十一页,共53页。
(1)求灯泡平均使用时间、标准差和 灯泡合格率(样本)
x
xi fi fi
1057小时
2
xi x fi
统计学第6章抽样推断分析

在总体单位数为N的总体中抽取容量为n的样本, 样本个数可能有:
1、考虑顺序的不重复抽样:N(N-1)(N-2)…(N-n+1)
2、考虑顺序的重复抽样:Nn
3、不考虑顺序的不重复抽样:C
n N
N! n!(N n)!
4、不考虑顺序的重复抽样:
Cn N n1
在社会经济统计中,往往采用的是较大总体 (视为无限总体)下的无序不重复抽样。
简单随机抽样可根据总体的有限性或无限性分为 有限总体随机抽样与无限总体随机抽样。
有限总体简单随机抽样: 每个样本点(个体)能以相同的概率被抽出。
无限总体简单随机抽样: 1、每一个体来自同一总体; 2、每一个体是独立抽取的。
注意: 在有限总体的简单随机抽样中,由抽样是否具有可重
复性,又可分为重复抽样与不重复抽样。而且,根据抽样 中是否排序,所能抽到的样本个数往往不同。
如果总体单位数很“大”而样本容量很“小”,则该 修正因子趋近于1,这时,对有限总体可直接按无限总体的 公式去计算。
一个经验的衡量标准是n/N<=0.05。
例3中:
样本容量与总体单位数的比值为 n/N=30/2500=0.012,
因此,样本均值的标准差可计算如下:
x n 4000/ 30 730.30
of
(n=30)
x
II
III
x
x
x
x
x
x
x
x
2、样本均值抽样分布的数值特征
可证明在简单随机抽样中
E(x)
例3中,中层干部年薪的总体均值为51800,因此 所有可能的样本平均数的均值也为51800。
n=样本容量; N=总体单位个数 可以证明样本均值的标准差:
统计学 第6章 统计推断(1、2节)

即,我们有95%的把握认为,该外资 企业员工平均每周加班时间为52.3小时 至57.7小时之间。
第六章 统计推断
总体成数(比例)
1、假定条件
的区间估计
对于试验结果只有两种情况的总体(二项 总体),且为大样本,即满足
np 5和n(1 - p) 5
2、使用正态分布 z 统计量
第六章 统计推断
第六章 统计推断
设 是总体 的一个参数, 是参数 2的 1 和 X 两个统计量,且 ,对给定的常 1 2 数 ,及任意的 1) , 有 , (0 则称随机区间 ) 1 P( 1 2 是臵信度(臵信水平)为 的臵信区间 1 1 , 2 (区间估计)。其中 分别为臵信下限和 1 和 2 臵信上限。
(比例)为: 225 因为是大样本,故得: p 500 45% p (1 p ) p (1 p ) p z 2 , p z 2 n n
即,我们有95%的把握认为,19岁以下的青少年上网比例 在40.64%至49.36%之间。
第六章 统计推断
在简单随机抽样条件下,样本均值和样本 比例的抽样误差: 样本均值的抽样误差
重复抽样:
x
n
2
不重复抽样:
x
当总体方差 未知时,可用样本方差 代替。
第六章 统计推断
N n ( ) n N 1
2
s
2
样本比例的抽样误差
重复抽样: 不重复抽样:
p
1
n
p
2
第六章 统计推断
、1
2
方式一
统计学原理第六章 抽样推断及参数估计

1.79%
(四)其他抽样组织方式抽样平均误差的计算 方法
1.类型比例抽样平均误差的计算。 (1)平均数的抽样平均误差
重复抽样条件下:
x
不重复抽样条件下:
n
2
2
[公式6—14]
x n
n 1 N
[公式6—15]
(2)成数的抽样平均误差
重复抽样条件下:
p
估计量评判标准:
ˆ 1.一致性。设 为未知参数θ 的估计量,
x
i
x
j 1
Mi
ij
Mi
r
(i 1,2,3, , r )
[公式6—4]
x
x M
i 1 r
i
i
M
i 1
(i 1,2,3, , r )
[公式6—5]
i
整群抽样的优点:易于组织,节省调查费用 缺点:调查的总体单位过于集中且在少数样 本群中。因此,在条件相同的情况下,整 群抽样的代表性低,通常需要扩大样本群 的数目来弥补这个缺点。
X ,P,然后,再
结合总体单位数N去推算总体的有关标志总
量。总体指标的推断有点估计和区估计两
种方法。
一、点估计
点估计也称定值估计,它是以抽样得到的
样本指标作为总体指标的估计量,并以样本指
标的实际值 x 、p 直接作为总体未知参 数 、P的估计值的一种推断方法。
X
比如:某电子元件厂,某天共生产电子元件 20000件,耐用时间和合格率没进行全面 检测,而是随机抽查5%检测,经计算, 样本的平均耐用时间 x 4120 小时, 合格率p=98.56%。因此,推算这天生 产的全部电子元件平均耐用时间 x 4120 小时 ,合格率 p=98.56%。
统计学教学课件:第六章 抽样推断

已知: N 5000, 300小时,x 25小时
F (t) 95% t 1.96
重复抽样:
二、区间估计
总体指标的推断(置信区间):
x x X x x pp P pp
说明在一定可能下,总 体指标落在抽样指标的 一定范围内。
置信区间: X [x x , x x ]
P [ p p, p p ]
置信区间是统计意义上的,即一定概率下,总体指标所 落在的区间长度,等于两倍的抽样极限误差。
第四节 全及指标的推断
抽样调查的目的是为了用样本指标推断总 体指标。对总体指标的估计有两种,一种是点 估计,一种是区间估计。
一、点估计(又称“定值估计”)
——不考虑抽样误差,直接用样本指标代替全及指标。即:
X x;P p
点估计不能说明误差大小,意义不大;而采用区间估 计,可以将误差控制在一定的范围内(即说明总体指标 在某一范围内的可能性大小) 。
1. 概念:先将总体单位按某一有关标志分类(组),再按
随机原则从各类(组)中抽取样本的组织形式。
(1)样本容量n的 分配方法:
① 等比例抽取
② 不等比例抽取 (标志变异大的组多抽,反之少抽。)
组与组之间是全面调查(组间方差不影响 ) (2)特点:
组内是非全面调查(组内方差影响 )
注:类型抽样的误差常小于简单随机抽样。
原则:
节省人力、物力、财力;
保证抽样推断能达到预期的可靠程度和精确 度的要求下,确定一个适当的样本容量。
确定必要抽样单位数n的依据
1、总体被研究标志的变异程度(变异大多抽,小则少抽) 2、抽样误差的范围(精确程度)(范围大少抽,小则多抽) 3、抽样推断的可靠程度(可靠程度高多抽,反之少抽)
统计学A第6章 抽样推断

2
样本可能数目
3 0.577 9
计算复杂,可对 定义公式变形为 更为简单的形式
3.2 抽样平均误差
(2)抽样平均误差的计算 1)抽样平均数的抽样平均误差 ① 重复抽样
第6章 抽样推断 第3节 抽样平均误差
x
(总体标准差)
n (样本容量)
在总体标准差未知, 且样本单位数较大时, 可用样本标准差代替。
解: 已知: n 100, x 58, x
则:
x
10
10 1(公斤) 100 n
x
即: 当根据样本学生的平均体重估计全部学生 的平均体重时,抽样平均误差为1公斤。
② 不重复抽样
1)抽样平均数的抽样平均误差
例2: 某厂生产一种新型灯泡共2000只,随机抽出400只作 耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
的数量特征做出具有一定可靠性的估计判断,从而达
到对全部研究对象的认识的一种统计方法。 一、 2.特点 ① 抽样调查建立在随机取样的基础上; ② 抽样推断是由部分推算总体的一种方法; ③ 抽样推断是运用概率估计的方法; ④ 抽样推断的抽样误差可以事先计算并加以控制。
1.2 抽样调查的作用
第6章 抽样推断 第1节 抽样调查的意义和作用
x E x
1 0.25 0 0.25 0 0.25 0 0.25 1
2
合计
—
—
27
3
3.2 抽样平均误差
第6章 抽样推断 第3节 抽样平均误差
例1 样本平均数的平均数(总体平均数)
27 23 4 E x 3(或X 3) 9 3
第六章 抽样推断

x 样本比率 p 或 q) (
样本方差: 样本方差: s 2 样本标准差: 样本标准差: s
第六章 抽样推断
第一节 抽样推断的一般问题
(三)抽样方法和样本可能数目 1、抽样方法 (1)重复抽样
重复抽样( replacement)也叫重置抽样, 重复抽样(sampling with replacement)也叫重置抽样, 是指每次抽取一个单位记录其标志表现后又放回, 是指每次抽取一个单位记录其标志表现后又放回,重新 参加下一次的抽选。 参加下一次的抽选。
第六章 抽样推断
第二节 抽样误差
大数定律可归纳如下: 大数定律可归纳如下: 4)各单位的共同倾向(这些表现为主要的、基本的因素) )各单位的共同倾向(这些表现为主要的、基本的因素) 决定着平均数(或比率)的水平,而各单位对平均数( 决定着平均数(或比率)的水平,而各单位对平均数(或比 的离差(这些表现为次要的、偶然的因素) 率)的离差(这些表现为次要的、偶然的因素)则会由于足 够多数单位的综合汇总的结果,而相互抵消,趋于消失。 够多数单位的综合汇总的结果,而相互抵消,趋于消失。 根据大数定律的内容特点,运用抽样法时, 根据大数定律的内容特点,运用抽样法时,必须注意以下两 个问题: 个问题: 第一、抽样必须遵循随机原则。 第一、抽样必须遵循随机原则。 第二、抽样必须遵循大量原则。 第二、抽样必须遵循大量原则。
抽样误差
第六章 抽样推断
第二节 抽样误差
二、影响抽样误差的主要因素
1、样本单位数(样本容量)的多少(反比) 、样本单位数(样本容量)的多少(反比) 2、总体被研究标志变异程度的大小σ(正比) 、总体被研究标志变异程度的大小σ 正比) 3、抽样组织方式 (简单随机抽样、类型抽样、等 、 简单随机抽样、类型抽样、 距抽样、整群抽样) 距抽样、整群抽样) 4、抽样方法(不重复抽样﹤重复抽样) 、抽样方法(不重复抽样﹤重复抽样)
统计学习题集6

第六章抽样推断一、填空题1.抽样推断是按照原则,从全部研究对象中抽取部分单位进行调查.2.抽样推断的组织方式有抽样、抽样、等距抽样、整群抽样和抽样.3.抽样推断是用指标推断总体指标的一种统计方法.4.抽样平均误差与极限误差之间的关系为 .5.抽样极限误差是指指标和指标之间最大可能的误差范围.二、判断题1.抽样推断的目的是用样本指标从数量上推断全及总体指标.2.对各种不同型号的电冰箱进行使用寿命的检查,最好的方法是抽样推断.3.为了保证抽样指标的分布趋近于正态分布,抽样时,一般样本容量应大于或等于30,这时的样本称为大样本.4.某厂产品质量检查,按连续生产时间顺序每20小时抽取1小时的全部产品进行检验,这种方式是等距抽样.5.在其他条件一定时,重复抽样的抽样平均误差大于不重复抽样的抽样平均误差.6.抽样平均误差是样本指标与总体指标之间的平均离差.7.在抽样推断中,可能没有抽样平均误差.8.点估计是直接用样本指标代替总体指标.9.在其他条件一定的情况下,将重复抽样改为不重复抽样可以缩小抽样误差.10.在其他条件一定时,增大样本容量,抽样平均误差不变.三、单项选择题1.抽样调查的目的在于 .A.用样本指标推断总体指标B.对调查单位作深入的研究C.对全及总体作一般的了解D.提高调查的准确性和时效性2.对烟花爆竹进行质量检查,最好采用 .A.重点调查B.抽样调查C.典型调查D.普查3.从生产线上每隔1小时随机抽取10分钟的产品进行检验,这种方式属于 .A.等距抽样B.类型抽样C.整群抽样D.简单随机抽样4.在其他条件不变的情况下,如果重复抽样的极限误差缩小为原来的1/2,则样本容量 .A.扩大为原来的4倍B.扩大为原来的2倍C.缩小原来的1/2D. 缩小原来的1/45.纯随机抽样重复的抽样平均误差的大小取决于 .A.样本单位数B.总体方差C.总体单位数和总体方差D.样本单位数和总体方差6.从纯理论出发,最符合随机性原则的抽样方式是 .A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样7.根据对某超市100名顾客等候结账情况的调查,得知每次平均等候时间为4分钟,标准差为2分钟,在概率保证程度为95.45%的要求下,估计顾客平均等候时间的区间为 .z=2A.3.9~4.1分钟之间B.3.8~4.2分钟之间C.3.7~4.3分钟之间D.3.6~4.4分钟之间四、多项选择题1.缩小抽样误差的途径有 .A.缩小总体方差B.增加样本单位数C.减少样本单位数D.将重复抽样改为不重复抽样E.将不重复抽样改为重复抽样2.抽取样本的方法有 .A.简单随机抽样B.类型抽样C.重复抽样D.等距抽样E.不重复抽样3.抽样的组织方式有 .A.纯随机抽样B.类型抽样C.整群抽样D.等距抽样E.阶段抽样4.影响样本单位数多少的因素有 .A.总体的变异程度B.所要求的把握程度大小C.极限误差的大小D.抽样的组织方式E.抽取样本的方法5.影响平均抽样误差大小的因素有 .A.总体的变异程度B.抽取样本的方法C.抽样的组织方式D.样本单位数的多少E.是有限总体还是无限总体6.抽样推断中的抽样误差 .A.是不可不免要产生的B.是可以通过改进调查方法消除的C.只能在调查后才能计算D.既不能减小也不能消除E.其大小是可以控制的7.点估计,下列说法正确的有 .A.点估计是直接用样本指标作为总体指标的估计值B.这种估计没有表明抽样估计的误差大小C.这种估计能指出误差在一定范围内的概率保证程度的大小D.点估计是一种参数估计的方法E.点估计所得到的总体参数是一个区间范围8.抽样推断的特点有 .A.是用样本指标从数量上推断总体指标B.抽取样本时按随机性原则抽取的C.抽样误差可以计算和控制D.抽样误差是不可避免的E.是一种由部分认识总体的统计方法五、简答题1.什么是抽样误差 影响抽样误差大小的各因素与抽样误差的关系如何2.影响抽样单位数目的各因素与抽样单位数目的关系如何3.简要说明各种抽样组织方式有什么特点4.什么是抽样推断 有何特点六、计算题1.从某制药厂仓库中随机抽取100瓶c v 进行检验,其结果平均每瓶c v 为99片,样本标准差为3片,如果可靠程度为99.73%,计算该仓库平均每瓶c v 的区间范围;如果极限误差减少到原来的1∕2,可靠程度仍为99.73%,问需要调查多少瓶c v1已知:n=100 s=3 99=x z=33.010092===n s x μ 99-3×0.3≤X ≤99+3×0.3 98.1≤X ≤99.92已知:s=3 t=3 △=3×0.3∕2=0.45 222994000.2025z s n ⨯===∆ 2.某大学有学生6000人,欲调查学生的人均月生活费情况,现抽取60名学生进行调查,得到月生活费在500元以上的有42名,以95%的概率保证程度计算全体学生中月生活费在500元以上学生比重的区间范围;如果极限误差减少为5.8%,概率保证程度仍为95%,需要抽取多少名学生1已知:n=60 p=42∕60=70% z=1.96%660%30%70)1(=⨯=-=n p p p μ 70%-1.96×6%≤P ≤70%+1.96×6% 58.24%≤P ≤81.76%2已知:z=1.96 △=5.8%2222(1) 1.9670%30%2405.8%z p p n -⨯⨯===∆。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
放回 总体
继续 抽取
同一总体单位有可能被重复抽中, 而且每次抽取都是独立进行
第六章 抽样推断
确定抽样方法 不重复抽样
抽出 个体 又被称作不重置抽样、不放 STAT 回抽样 登记 特征 继续 抽取
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。
统计推断
样本总体指标:
统计量(已知量)
随机样本
第六章 抽样推断
与总体分布 特征相同
与总体分布 特征不同 总体
非随机样本
并非所有的抽样估计都按随机原 则抽取样本,也有非随机抽样
第六章 抽样推断
抽样估计的特点
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
2
n
1
f 1
i 1 i
m
x x f
m 2 i 1 i
i
⒊ 样本单位标志值的方差:
1 2 s xi x 或s n 1 i 1
2 2
n
1
f 1
i 1 i
m
x x f
m 2 i 1 i
i
计算 2.样本方差的计算公式为: 公式
s
2 n 1
第六章 抽样推断
§1.1 抽样方案的设计 ★ 一、抽样估计的意义和一般步骤 ★ 二、抽样方案设计的基本准则
三、抽样方案设计的主要内容
STAT
第六章 抽样推断
抽样方案设计的基本准则
㈠ 随机原则 ——抽取样本单位时,应确保每个总体单位都 有被抽取的可能;在对样本单位的资料进行搜 集和整理时,不能随意遗漏或更换样本单位 ㈡ 抽样误差最小 ——在其他条件相同的情况下,选抽样误差 设计抽样方案时,通常是 最小的方案 在误差达到一定要求的条 ㈢ 费用最少 件下,选择费用最少的方案 ——在其他条件相同的情况下,选费用最少 的方案
第六章 抽样推断
确定抽样组织方式
STAT 5· 多阶段抽样 —— 指分两个或两个以上的阶段来完成抽 取样本单位的过程 例:在某省100多万农户抽取1000户调查 农户生产性投资情况。
第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽10户
n 1 E{[(xi X ) ( x X )]2 } n 1 i 1
n n 1 E{ ( xi X ) 2 2 ( xi X )(x X ) n( x X ) 2 } n 1 i 1 i 1
由于 ( xi X ) xi n X n x n X n( x X )
第六章 抽样推断
§1.1 抽样方案的设计 ★ 一、抽样估计的意义和一般步骤 ★ 二、抽样方案设计的基本准则 ★ 三、抽样方案设计的主要内容
STAT
第六章 抽样推断
三、抽样方案设计的主要内容 ㈠ ㈡ ㈢ ㈣ 编制抽样框 确定抽样方法 确定抽样组织方式 确定样本容量
STAT
第六章 抽样推断
编制抽样框
样本n=100×10=1000(户)
第六章 抽样推断
确定抽样组织方式 在实际工作中,选择适当的抽样组 织方式主要应考虑: 调查对象的性质特点 对调查对象的了解程度(抽样框 的特点) 抽样误差的大小 人力、财力和物力等条件的限制
STAT
第六章 抽样推断
确定样本容量
样本容量 指样本中含有的总体单位的 数目,通常用n 来表示。
n
第六章 抽样推断
STAT
2
第六章 抽样推断
⒋ 样本成数:
n0 n1 p ,q 1 p n n
⒌ 样本单位是非标志的标准差:
n n sp p1 p pq n 1 n 1
⒍ 样本单位是非标志的方差: n n 2 sp p 1 p pq n 1 n 1
第六章 抽样推断
抽样估计
按照随机原则 从调查对象中抽取一部 分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计 与推断,从而认识总体的一种统计方法
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样估计
第六章 抽样推断
全及总体指标:
参数(未知量)
指包括全部抽样单位的名单框架, 抽样框 仅对有限总体而言
STAT
主 要 形 式
名单抽样框
区域抽样框 时间表抽样框
区域抽样框
第六章 抽样推断
中山区… 沙河口区 星海街道… 黑石礁街道 尖山一委… 尖山二委 居民一组 居民二 组 …
某外国公司在大连进 行微波炉市场调查:
STAT
在商场的大门口 在微波炉柜台前 在市区街道旁边
x
x
i 1
n
i
n
或x
x
i 1 m
m
i
fi
i 1
fi
计算 公式 1. 样本平均数的计算公式为:
x x1 f1 x2 f 2 xm f m f1 f 2 f m
第六章 抽样推断
x
i 1 m
m
i
fi
STAT
i 1
fi
设总体均值为 X 方差为 2
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.1 抽样方案的设计 ★ 一、抽样估计的意义和一般步骤
二、抽样方案设计的基本准则
STAT
第六章 抽样推断
一、抽样估计的意义和一般步骤
㈠ 抽样估计的定义 ㈡ 抽样估计的特点 ㈢ 抽样估计的运用 ㈣ 抽样估计的一般步骤 ㈤ 总体参数与样本指标
STAT
X
X
i 1
N
i
N
或X
X
i 1 m
m
i
fi
i 1
fi
第六章 抽样推断
⒉ 总体单位标志值的标准差:
2 1 N X i X 或 N i 1
1
fi
i 1
m
X
m i 1
i
X
f
2
i
⒊ 总体单位标志值的方差:
1 N
2
X
N i 1
i
X 或
第六章 抽样推断
( X 1 X ) 2 f1 ( X 2 X ) 2 f 2 ( X m X ) 2 f m f1 f 2 f m 1
( X i X )2 fi
i 1
m
f
i 1
m
STAT
i
1
1 n 2 2 E (sn1 ) E ( xi x) n 1 i 1
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定
一、抽样分布 二、抽样估计量的优良标准 三、抽样误差的概念 四、抽样平均误差 五、抽样极限误差
STAT
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 STAT 可以编制抽样框:均 匀的出产时间、可以 预见到的产品总量。
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定。
第六章 抽样推断
确定抽样方法
STAT
重复抽样 又被称作重置抽样、有放回抽样
抽出 个体
特点
登记 特征
i 1 i 1
n
n
1 E (s ) E{ ( xi X ) 2 2n( x X ) 2 n( x X ) 2 } n 1 i 1
2 n 1 n 1 E{ ( xi X ) 2 n( x X ) 2 } n 1 i 1 n 1 { E ( xi X ) 2 nE( x X ) 2 } n 1 i 1 n xi 1 n 2 由于E ( x X ) 2 D( x) D( i 1 ) 2 D( xi ) n n i 1 n 1 2 2 E ( sn 1 ) {n 2 n } n 1 n
第六章 抽样推断
抽样估计的应用 不可能进行全面调查时
不必要进行全面调查时
来不及进行全面调查时
对全面调查资料进行补充修正时
第六章 抽样推断
抽样调查研究
Sampling Study
STAT
为什么要抽样? 1. 涉及破坏受试对象
质量控制
2. 取得精确可靠的结果
3. 实际情况的约束
时间,成本等
2· 类型抽样(分层抽样) STAT ——将总体全部单位分类,形成若干个类型组, 然后从各类型中分别抽取样本单位组成样本。
N1
n1
等额抽取
样本
总体
N
N2
Nk
n2
nk
n
等比例抽取
能使样本结构更接近于总体结构,提高样本的 代表性;能同时推断总体指标和各子总体的指标
· · ·
· · ·
第六章 抽样推断
确定抽样组织方式
⒈ 重复抽样的可能样本数目:
P N N N N
n N
n
共n个
⒉ 不重复抽样的可能样本数目:
n CN N N 1N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
确定抽样组织方式
1· 简单随机抽样(纯随机抽样) ——对总体单位逐一编号,然后按随机原 则直接从总体中抽出若干单位构成样本