第八章 抽样调查与推断
统计推断与抽样调查
统计推断与抽样调查统计推断是一种基于样本数据对总体进行推断和预测的方法,而抽样调查是统计推断的主要手段之一。
在本文中,将探讨统计推断和抽样调查的相关概念、方法和应用。
一、统计推断的概念及应用统计推断是根据样本数据对总体的某些参数进行估计和推断的过程。
它通过对样本进行研究和分析,得出关于总体的一些结论,从而具有预测总体特征和评估总体参数的作用。
统计推断广泛应用于各个领域,如医学、社会学、经济学等。
例如,在医学研究中,通过对患者进行抽样调查,可以推断得出一种疾病的患病率;在市场调研中,通过对消费者进行抽样调查,可以了解产品的市场需求和消费习惯。
二、抽样调查的概念及方法抽样调查是统计学中的一种数据收集方法,它通过对样本数据进行分析,再推断总体的特征和参数。
抽样调查的步骤通常包括确定研究目标、选择抽样方法、设计问卷或实验方案、进行数据收集和分析等。
常见的抽样方法包括随机抽样、分层抽样、系统抽样等。
随机抽样是指从总体中随机选择样本,使得每个样本具有相同的概率被选中;分层抽样是将总体按照某种特征分成若干层,然后在每个层中进行随机抽样;系统抽样是按照某个规律从总体中选择样本。
三、统计推断的误差和可靠性统计推断过程中存在两种主要误差,即抽样误差和非抽样误差。
抽样误差是由于样本选择不完全代表总体而引起的误差;非抽样误差是由于样本数据的收集、分析等过程中引入的误差。
为了减少误差并提高推断结果的可靠性,统计学引入了置信水平和置信区间的概念。
置信水平是指在多次重复抽样的情况下,95%的置信水平意味着我们对总体参数的估计有95%的把握是正确的。
置信区间是对总体参数估计结果的一个区间范围,通常以一个下限和一个上限进行表示。
四、统计推断的实际应用统计推断在实际应用中具有重要的意义。
以政府调查为例,政府需要了解人口数量、就业率、教育水平等信息,但是无法对全体人口进行普查,因此采用抽样调查的方式进行数据的收集和统计推断,从而得出总体的特征和参数。
八抽样推断考试习题
单项选择題1. 抽样调查的主要目的在于(A. 计算和控制误差B. 了解总体单位情况C .用样本来推断总体 D.对调查单位作深入的研究2. 抽样调查所必须遵循的基本原则是( 人 A.随意原则 B. 可比性原则C .准确性原则 D. 随机氐则3. 无偏性是指( A.抽样指标等于总体指标B. 样本平均数的平均数等于总体平均数C .样本平均数等于总体平均数D.样本成数等于总协成数4. 一致性是指当样本的单位数充分大时,抽样指标( )。
A.小于总体指标B.等于总体指标C .大于总体指标D.充分靠近总体指标5. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )A.前者小于后者B.前者大于后者C.两者相等D.两者不等6. 能够事先加以计算和控制的误差是( A.抽样误差 B.登记误差C .代表性误差 D. 系统性误差7. 对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样, 但第二个厂工人数比第一个厂工人数整整多一倍。
抽样平均误差( 人A.第一工厂大B. 第二个工厂大C .两工厂一样大 D.无法做出结论8. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( )。
A.两者相等B.两者不等C .前者小于后者 D.前者大于后者。
9. 反映抽样指标与总体指标之间抽样的可能范围的指标是(第八章 抽样推断两工厂工人工资方差相同,A.抽样平均误差B. 抽样误差系数C.概率度D. 抽样极限逞差.10. 在进行纯随机重复抽样时,为使抽样平均误差减少25%则抽样单位数应()。
A.增加25%B. 增加78%C. 增加1.78%D. 减少25%11. 在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的()倍。
A. 1.03B. 1.05 C . 0.97 D. 95%12. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是(A.抽样单位数为20B. 抽样单位数为40C.抽样单位数为90D.抽样单位数为100 13.通常所说的大样本是指样本容量(人A.小于10B. 不大于10C.小于30D. 不小于3014. 抽样成数指标P值越接近1,则抽样成数平均误差值()A. 越大B越小C越接近0.5 D越接近115. 对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%概率为0.9545,优等生比重的极限抽样误差为()。
统计学试题库(含答案)
《统计学》试题库第一章:统计基本理论和基本概念一、填空题1、统计是统计工作、统计学和统计资料的统一体,统计资料是统计工作的成果,统计学是统计工作的经验总结和理论概括。
2、统计研究的具体方法主要有大量观察法、统计分组法、统计推断法和综合指标法。
3、统计工作可划分为设计、调查、整理和分析四个阶段。
4、随着研究目的的改变,总体和个体是可以相互转化的。
5、标志是说明个体特征的名称,指标是说明总体数量特征的概念及其数值。
6、可变的数量标志和所有的统计指标称为变量,变量的具体数值称为变量值。
7、变量按其数值变化是否连续分,可分为连续变量和离散变量,职工人数、企业数属于离散变量;变量按所受影响因素不同分,可分为确定性变量和随机变量。
8、社会经济统计具有数量性、总体性、社会性、具体性等特点。
9、一个完整的统计指标应包括指标名称和指标数值两个基本部分。
10、统计标志按是否可用数值表示分为品质标志和数量标志;按在各个单位上的具体表现是否相同分为可变标志和不变标志。
11、说明个体特征的名称叫标志,说明总体特征的名称叫指标。
12、数量指标用绝对数表示,质量指标用相对数或平均数表示。
13、在统计中,把可变的数量标志和统计指标统称为变量。
14、由于统计研究目的和任务的变更,原来的总体变成总体单位,那么原来的指标就相应地变成标志,两者变动方向相同。
二、是非题1、统计学和统计工作的研究对象是完全一致的。
(×)2、运用大量观察法,必须对研究对象的所有或足够多的单位进行观察调查。
(√)3、统计学是对统计实践活动的经验总结和理论概括。
(√)4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。
(√)5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
(×)6、某同学计算机考试成绩80分,这是统计指标值。
(×)7、统计资料就是统计调查中获得的各种数据。
(×)8、指标都是用数值表示的,而标志则不能用数值表示。
抽样调查第8章多阶段抽样18210
置信度为95%的置信区间为:160800±1.96×9216 在上面的方差估计式中,第一项是主要的,第二项 要小得多!
返回
(二)对总体比例的估计
如果要估计总体中具有所研究特征的二级单元数占全 体全体二级单元数的比例,则
P
1 N
N
Pi
i1
1 NM
N i1
Ai
式中,Ai 为第i个初级单元中具有所研究特征的二级单元
(1)多阶段抽样保持了整群抽样的样本比较集中、 便于调查、节约费用等优点。
(2)多阶段抽样不需要编制所有小单元的样本框。
三、抽选方法与推断原理
多阶段抽样时,每一个阶段的抽样可以相同,也 可以不同。它通常与分层抽样、整群抽样、系统抽样 结合使用。多阶段抽样时,抽样是分步进行的,因此, 讨论估计量的均值及其方差时,需要分阶段进行这要
S 2 2i
M
1 i
1
Mi j 1
(Yij
Y i )2,
s 2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m
抽样调查数据的统计分析与推断研究
抽样调查数据的统计分析与推断研究随着科学技术的不断发展,抽样调查成为研究的重要手段之一。
通过抽样调查,我们可以从全体群体中提取一部分样本,通过对样本数据进行统计分析和推断,得出有关全体群体的结论。
本文将从抽样调查的基本概念、抽样方法、统计分析和推断等方面进行详细探讨。
一、抽样调查的基本概念抽样调查是指从一个较大的总体中,根据一定的规则抽取若干个个体,然后对这些个体进行观察、测量或询问以获取数据的方法。
抽样调查的基本目的在于通过对代表性样本的研究,推断出总体的某种性质。
二、抽样方法1. 简单随机抽样:按随机原则从总体中抽取若干个体作为样本,每个个体被抽中的概率相等。
2. 分层抽样:将总体划分为若干层,并分别抽取每一层中的个体作为样本,以保证样本更具代表性。
3. 整群抽样:将总体划分为若干个较小的群组,然后抽取若干个群组作为样本。
4. 系统抽样:根据某一系统规则,如第一个个体随机抽样,之后每隔固定间隔个体抽样,形成样本。
5. 效应抽样:在已有的样本中,根据需要进行再次抽样,以增加精度。
三、统计分析在抽样调查中,对数据的统计分析是非常重要的。
通过对样本数据的整理、处理和分析,可以从中得出一些有意义的结论,并推断出总体的特征。
统计分析主要可以分为描述统计和推断统计两种方法。
1. 描述统计描述统计是对样本数据进行整理、展示和描述的过程,常见的方法包括频数分析、平均数、中位数、方差等。
频数分析可以帮助我们了解样本的分布情况,平均数可以衡量样本的集中趋势,方差可以反映数据的离散程度。
通过这些描述统计指标,我们可以对样本数据有一个初步的认识。
2. 推断统计推断统计是通过对样本数据的推断,来推断总体的特征。
常见的方法包括参数估计和假设检验。
参数估计是基于样本数据,对总体参数进行估计。
常见的估计方法有点估计和区间估计。
假设检验是用于检验总体参数的某种假设是否成立。
通过这些推断统计方法,我们可以对总体的特征进行推断。
第八章工作抽样 85页PPT文档
基础工业工程
1、正态分布
正态分布是概率分布中的一种极为重要的分布,用途十 分广泛,工作抽样法处理的现象接近于正态分布曲线。以 平均数为中线的两侧取标准差的1倍、2倍、3倍时,其面 积分别为总面积的68.25%、95.45%、99.73%。
68.27%
95.45%
-3σ -2σ
99.73%
-σ
X
+σ
概念:工作抽样(Work Sampling)是指对作业 者和机器设备的工作状态进行瞬时观测,调查各种 作业活动事项的发生次数及发生率,进行工时研究, 并用统计方法推断各观测项目的时间构成及变化情 况。 工作抽样的概念例证。
基础工业工程
工作抽样的概念例证
例如,欲调查某车间设备的开动情况,经过数日随机 抽样观察120次,发现有90次处于工作状态,30次处 于停止,则可推断该车间设备开动率、停止率为:
4 326
102 857
4 114
P(%)
51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78
n
绝对误差
1%
5%
400
9 996
400
9 984
399
9 964
398
9 936
397
9 900
开动 9率 010% 07% 5 停止 3率 010% 02% 5
120
120
若对该车间的4名作业者(A、B、C、D)进行秒表测 时,其工作状态如图8-1所示,可以推算出阴影部分的 面积占63.75%。若采用工作抽样法,可以选择任意时 刻对被观测对象进行观测。图8-1右侧箭头表示观测次 数是10次,同时观测了4名操作者,所以总观测次数为 10次×4=40次。将统计结果列成表格,如表8-1所示。
随机抽样调研
对全面调研统计资料的质量进行检查与修正。
2、随机抽样调查的组织方法
(1)纯随机抽样法
也称简单随机抽样法,就是在总体单位中不进行任 何有目的的选择,完全按随机原则抽选调研单位。 抽签法 乱数表法 实际运用的局限性:这种方法一般必须对总体各个 个体加以编号,而实际所需调查的总体往往是十分庞大 的;对于某些事物无法使用简单随机抽样,如连续不断 生产的大量产品进行质量检验;由于抽出的样本较为分 散,所以调查的人力、物力、费用消耗较大。
注意:A、必须有清楚的分层界限,在划分时不致发生 混淆;B、必须知道各层中的单位数目和比例;C、分 层的数目不宜太多,否则将失去分层的特征,不便在 每层中抽样。 做法: A、等比例分层抽样 按照各层中单位的数目占总体单位数目的比例分配 各层的样本数量。 每层抽取样本数计算公式为: SI=(NI/N)*S 式中:SI表示第I层应抽取的样本数;N表示总体中 含单位总数;NI 表示第I层含单位总数;S表示应抽取 样本总数。
B、不等比例分层抽样(最佳抽样法)
根据各层的标准差的大小来调整各层样本数目的抽 样方法。该方法既考虑到各层在总体中比重的大小,又 考虑了各层标准差的差异程度,有利于降低各层的差异, 以提高样本的可信度。 该方法既考虑到各层在总体中占比例的大小,又考 虑了各层标准差的差异程度,有利于降低各层的差异, 以提高样本的可信程度。 各层样本的计算公式:NI=N*NISI/Σ NISI 式中:NI表示第I层应抽取的样本数;N表示应抽取 的样本数(调查单位数);SI表示第I层的标准差(一 般为已知)。
判断抽样法
也称目的抽样法,是按照调研者的主观经验判断选 定调研单位的一种抽样方法。
统计学(第八章抽样推断)
统计学(第⼋章抽样推断)第⼋章抽样推断【教学⽬的】抽样推断是统计研究中⼀种重要的分析⽅法。
通过本章的学习,要求掌握利⽤样本统计资料来推断总体数量特征的原理及⽅法;深刻理解抽样推断的概念及特点;了解抽样误差产⽣的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的⽅法;掌握必要样本单位数的确定⽅法。
第⼀节抽样推断概述⼀、抽样推断的概念及特点(⼀)概念按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进⾏科学估计与推断的⽅法。
包括抽样调查和统计推断抽样调查:⼀种⾮全⾯调查,按随机原则从总体中抽取部分单位进⾏调查以获得相关资料,以推断总体统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有⼀定程度的估计和推断。
(⼆)特点1.按随机原则(等可能性原则)抽取调查单位.随机抽样的⽬的是为了排除⼈的主观影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。
随机性原则是保证抽样推断正确性的⼀个重要前提条件。
随机抽样不是随便抽样。
2.根据部分推断总体的数量特征3.抽样推断的结果具有⼀定的可靠性和准确性,抽样误差可以事先计算和控制其他特点有经济性、时效性、准确性、灵活性等(三)抽样推断的应⽤ 1.不可能进⾏全⾯调查时 2.不必要进⾏全⾯调查时 3.检查⽣产过程正常与否4.对全⾯调查资料进⾏补充修正时⼆、抽样的⼏个基本概念 1.样本容量与样本个数(1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的⼤⼩称为样本容量,⼀般⽤n 表⽰,它表明⼀个样本中所包含的单位数。
⼀般地,样本单位数⼤于30个的样本称为⼤样本,不超过30个的样本称为⼩样本。
(2)样本个数:⼜称样本可能数⽬,它是指从⼀个总体中可能抽取多少个样本。
样本个数的多少与抽样⽅法有关。
2.总体参数与样本统计量(1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。
原题目:抽样调查与推断
原题目:抽样调查与推断1. 引言抽样调查是社会科学研究中常用的一种方法。
通过采用抽样的方式,调查人员可以从总体中选择一部分样本,然后通过对样本数据的分析和推断,来了解总体的特征和规律。
本文将介绍抽样调查与推断的基本概念以及其在研究中的应用。
2. 抽样调查的基本概念抽样调查是指从总体中选择一部分样本,对其进行调查和测量,并通过对样本数据的分析和推断,来推断总体的特征。
抽样调查有以下几个基本概念:2.1 总体和样本总体是指研究对象的全体,而样本则是从总体中选择的部分个体。
样本的选择应具有代表性,即能够很好地反映总体的特征。
2.2 抽样方法抽样方法是指从总体中选择样本的具体方法。
常见的抽样方法包括随机抽样、分层抽样、整群抽样等。
不同的抽样方法适用于不同的研究目的和总体特点。
2.3 误差与精度抽样调查中存在着抽样误差和测量误差。
抽样误差是指由于样本选择不具有完全代表性而引入的误差,测量误差是指由于测量工具和方法的限制而引入的误差。
研究人员需要注意控制误差,提高调查的精度。
3. 抽样调查在研究中的应用抽样调查在社会科学研究中有广泛的应用。
以下是几个常见的应用领域:3.1 市场调研市场调研是商业领域中使用抽样调查的重要应用之一。
通过对消费者的样本进行调查和分析,可以了解消费者的购买行为、偏好和需求,为企业提供市场决策的依据。
3.2 社会调查社会调查是社会学、心理学等领域常用的研究方法之一。
通过对样本进行调查和分析,可以了解社会群体的态度、行为和观念等方面的特征,从而揭示社会现象的规律和原因。
3.3 民意调查民意调查是政治学领域中常用的研究方法之一。
通过对选民的样本进行调查和分析,可以了解选民对政治候选人、政策和议题的看法和态度,为政治决策提供参考。
4. 结论抽样调查与推断是社会科学研究中常用的一种方法,通过对样本数据的分析和推断,可以了解总体的特征和规律。
在实施抽样调查时,需要选择合适的抽样方法,控制误差,提高调查的精度。
统计学第八章 抽样推断
②
和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%
统计推断与抽样调查
统计推断与抽样调查在现实生活中,我们经常需要对某个群体的特征或者某个事件的发生情况进行了解和研究。
然而,由于时间、资金和人力等因素的限制,我们往往无法对整个群体进行调查和研究。
因此,我们采用抽样调查的方法,通过对一小部分样本的观察来推断整个群体的特征或者事件的发生情况。
而统计推断则是基于抽样调查的结果,进行进一步的分析和推断,从而得出对整个群体的结论。
一、抽样调查的优势抽样调查作为一种常用的研究手段,具有以下几个优势:1.节约成本:相比于对整个群体进行调查,抽样调查只需要对一小部分样本进行观察和收集数据,可以节省大量的时间、人力和资金成本。
2.提高效率:通过合理的抽样方法和调查设计,可以有效地获取样本的信息,从而快速获得对整个群体的结论。
3.减少误差:抽样调查通过使用合适的样本代表整个群体,可以减少由于调查误差带来的不准确性。
二、抽样调查的方法抽样调查的方法主要有以下几种:1.简单随机抽样:每个样本有相等的机会被选入样本中,保证了每个样本的独立性和相同的机会被选中的概率。
2.分层抽样:将总体划分成若干个层次,然后在每个层次中进行简单随机抽样,保证了各个层次的代表性。
3.系统抽样:按照一定的规则从总体中选取样本,例如每隔若干个单位选取一个样本。
4.整群抽样:将总体划分成若干个群体,然后随机选取几个群体进行调查,这些群体中的所有个体都作为样本,保证了群体间的差异性。
三、统计推断的方法基于抽样调查的结果,我们可以进行统计推断,对整个群体的特征或者事件的发生情况进行进一步分析和推断。
常用的统计推断方法有:1.点估计:通过样本数据得出对总体参数的估计值,例如计算样本均值来估计总体均值。
2.区间估计:通过样本数据估计出总体参数的范围,例如计算样本均值的置信区间。
3.假设检验:通过对样本数据进行假设检验,判断总体参数是否满足某个条件,例如判断某个产品的平均销售额是否超过某个阈值。
四、抽样调查与统计推断的应用抽样调查和统计推断广泛应用于各个领域,例如市场研究、社会调查、医学研究等。
统计学第八章(抽样推断)
ni n
N i i
i 1
k
N i i
层的标准差。
i 是各
25
(3)经济分配法
既考虑每层中总体单位的变异程度不同 ,又考虑每层的调查费用。所以在样本容 量一定的条件下,标志变异大的层样本容 量也大一些,调查费用大的层,样本容量 相对小些。则
ni n
N i i / C i
i 1
20
* 抽样的组织方式 简单随机抽样 类型抽样
机械抽样
整群抽样
多阶段抽样
21
(一)简单随机抽样 : 简单随机抽样 又称纯随机抽样,是直接从总体中按随 机的原则抽容量为 n 的样本,每一个总 体单位有相同的可能性被抽中。
特点:最遵循随机原则,但不一定能 保证样本单位在总体中分布的均匀性; 适宜于单位数不多,标志变异较小、分 布较均匀的总体。
15
抽样框
STAT
某外国公司在深圳进 应当调查的对 福田区 … 在商场的大门口 行微波炉市场调查: 象(居民户) 南山区 桃源街道办 … 微波炉普及情况 已购或未购微 在微波炉柜台前 波炉的住户 南头街道办 居民的喜好特征 桂庙村… 南 在市区街道旁边 已购该公司微 居民购买力水平 新居委会 波炉的住户 在某个住宅小区 居民一组 公司产品知名度 有购买微波炉 居民二 公司产品信誉度 意向的住户 组 …
样本标准差公式
未分组数据:
2 ( x x ) i i 1 n
n 1 分组数据
S2
S2
(x x)
i 1 i
k
n
2
S
n 1 分组数据
2 ( x x ) fi i i 1 k
(x
i 1 k
《市场调查与预测》第八章 抽样设计(28P)
▪ 分层抽样在操作上分为四种方法:比例分层、纽 曼分层、德明分层和多次分层。
2020/6/24
17
概率抽样方法
❖4.整群抽样(Cluster Sampling)
▪ 指首先将调查总体区分为若干群,然后采用SRS方法 抽出部分群作样本,最后对这些样本群进行全面调查。 即,两段整群抽样。在两段整群抽样中,如果不对所 抽样本群进行全面调查,而是进一步将这些群划分为 若干小群,然后按照随机原则抽出一部分群进行全面 调查,就形成所谓的三段整群抽样。
▪ 整群抽样有以下主要优点:
• 由于样本相对集中,整群抽样能大大降低数据收集的费用。 • 当总体单位自然聚合成群时,创建地域抽样框较容易;
• 对于研究变量而言,若群内单元差异大且群间差异小,则整 群抽样策略比SRS的统计效率更高。
2020/6/24
18
概率抽样方法
❖5.与个体大小成比例的概率抽样(PPS)
▪ 使用前须评估要素:所需费用;涵盖范围;更新频率; 来源稳定性;定义一致性;合法且正式的关系。
2020/6/24
8
抽样框架的类型
❖2.区域框
▪ 区域框是指个体由地理区域构造的一种特殊的 名录框,调查总体则由这些地理区域组成。
▪ 区域框适用于以下所述两种情况:
• 当调查本质就是地理性质的; • 或者调查机构不能获得一个适当的名录框。
▪ 时效性: 时效应该用抽样框架的更新日期与调查标准 日期的接近程度来计量。
▪ 费用大小: 1)衡量为建立抽样框花费的总费用。2) 将建立抽样框的费用与本次调查总费用进行比较。
2020/6/24
12
8.3 抽样方法
抽样调查-第8节多阶段抽样
1 1
性质1可以推广到多阶段抽样的情形,例如
对于三阶段抽样,有
E ( ) E1 E2 E3 ( ) V ( ) V1[ E2 E3 ( )] E1{V2 [ E3 ( )]} E1 E2 [V3 ( )]
N n 1 1 按二级单元的平均值: Y Y i , y y i N i 1 n i 1 N 1 2 2 ( Y Y ) , 初级单元间的方差: S1 i N 1 i 1
1 n 2 s ( y y ) i n 1 i 1
2 1
返回
N M 1 2 S ( Y Y ) i ij N ( M 1) i 1 j 1 初级单元内的方差: 2 2 n m 1 2 s ( yij y i ) n(m 1) i 1 j 1 2 2
n
第i个初级单元二级单元间的方差:
mi 1 2 2 1 2 2 s ( y y ) S 2i (Yij Y i ) , 2i ij i mi 1 j 1 M i 1 j 1 Mi
号
9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 返回
式中,
Qi 1 Pi ; qi 1 pi.
返回
【例8.2】 欲调查某个新小区居民家庭装潢聘请装潢
电子课件 [统计学原理与实务(第3版)][曹印革][电子教案和习题解答] 第八章 抽样推断分析
注:极限误差与概率度和抽样平均误差三者之 间存在如下关系:
1.在平均误差保持不变的情况下,增大概率度 的值,把握程度相应增加,误差范围也随之扩大, 这时估计的精确度将降低;反之,要提高估计的精 确度,就得缩小概率度值,此时把握程度也会相应 降低。
2.在概率度保持不变的情况下,抽样平均误差 小,则误差范围就就小,估计的精确度就高;反之, 抽样平均误差大,误差范围就大,估计的精确度就 低。
2.特点 (1)抽样推断是由部分推算总体的一种认识方法。 (2)抽样推断是建立在按随机原则抽取样本的基础上。 (3)抽样推断是运用概率估计的方法。 (4)抽样推断产生的误差可以事先计算、并加以控制。
二、抽样推断的作用 1.应用抽样推断法可对某些不可能或不容易进行全面 调查而又要了解其全面情况的社会经济现象进行数量 方面的统计分析。 2.应用抽样法可对全面调查的结果加以补充或订正。 3.应用抽样法可对生产过程中产品质量进行检查和控 制。 4.应用抽样推断法可对总体的某种假设进行检验,判 断假设的真伪。
4.当抽样调查是为了检验全面统计数字的质量时,全 及总体的标志变异指标或是有实际资料的,可以直接 代入公式计算必要的抽样单位数。 5.如有几个方差可以选用时,宜选择最大数值。对于 成数方差,如果没有资料时,可取其最大值0.25。 6.一个总体往往可以同时计算抽样平均数和抽样成数。 由于它们的方差和允许误差范围不同,因此,需要的 必要抽样单位数也不相同。为了防止由于样本单位数 不足而扩大抽样误差,在实际工作中往往根据比较大 的必要抽样单位数进行抽样,以满足共同的需要。
等距抽样示意图
(四)整群抽样 也称集团抽样、区域抽样,是将总体各单位按时
间或空间形式划分成许多群,然后按纯随机抽样或机 械抽样方式从中抽取部分群,对中选的所有单位进行 全面调查的抽样组织方式。
统计学基础及应用-抽样推断
任务八 抽样推断任务描述与分析在A市自来水公司的客户满意度调查中,我们抽样调查了A市自来水公司的700个客户,从前面的调查分析中我们了解到这700户客户对A市自来水公司的产品和服务等方面的评价。
现在你需要思考的是:这700户客户的意见能在多大程度上反映所有客户的意见?误差的可能性有多大?为了保证调查的准确性,我们是否需要再追加调查?任务分析(1)如何判断我们抽样调查的700个客户够不够?(2)根据抽调客户的意见我们如何推断出所有客户的意见?(3)被调查客户的意见与所有客户的意见误差有多少?案例8-1:为了加强与顾客的沟通,深入了解客户需求,以解决客户遇到的问题,并在此基础上持续改进公司的产品质量,进一步优化供水服务,A市自来水公司决定进行客户满意度调查,要求在2个月时间内完成调查报告。
A市共有自来水用户200万户,在短短两个月时间内必须完成客户调查并出具调查报告,你如何完成这项工作?抽样调查抽样推断是按照随机原则从总体中抽取一部分总体单位作为样本单位,组成样本总体,并以样本的数量特征对总体的数量特征做出具有一定可靠程度的估计和推断的统计分析方法。
抽样推断具有以下特点:1.抽样推断是用样本指标值来估计总体指标值 2.抽样的随机原则是抽样推断的前提3.抽样推断的误差是可以事先计算并加以控制节省调查费调查速度快调查结果准确可靠应用范围广抽样调查抽样推断常用概念总体样本从总体中按照随机原则抽选出来的一部分单位称为样本,用n 表示 我们所要调查研究的事物或现象的全体,总体单位数通常用N表示总体指标样本指标总体指标又称参数,是反映总体数量特征的综合指标,总体指标主要有:总体平均数,总体方差σ 2,总体标准差σ、总体成数P 和Q。
样本指标又称统计量,是根据样本各单位的标志值或标志特征计算的、反映样本数量特征的综合指标。
样本指标主要有:样本平均数,样本方差s2,样本标准差s,样本成数p和q。
样本容量样本样本个数又称样本可能数目,是指在一个抽样方案中从总体中所有可能被抽取的样本总数。
(完整word版)第8章 抽样调查习题
第8章 抽样调查习题一、单项选择题1、抽样调查的目的在于( )。
a.计算和控制误差b.了解总体单位情况c.用样本来推断总体d.对调查单位作深入的研究2、是非标志(即服从两点分布的变量)的标准差等于( )。
a.Pb.1-Pc.P(1-P)d.)1(P P3、能够事先加以计算和控制的误差是( )。
a.抽样误差b.代表性误差c.登记误差d.系统性误差4、抽样平均误差是指抽样平均数(或抽样成数)的( )。
a.平均数b.平均差c.标准差d.标准差系数5、在同样情况下, 重复抽样的抽样平均误差与不重复抽样的抽样平均误差相比( )。
a.两者相等 b.前者小于后者 c.两者不等 d.前者大于后者6、反映抽样指标与总体指标之间抽样误差的可能范围的指标是( )。
a.抽样平均误差b.抽样误差系数c.概率度d.抽样极限误差7、在重复抽样情况下,假定抽样单位数增加3倍(其他条件不变),则抽样平均误差为原来的( )。
a.1/2倍b.1/3倍c.1.731倍d.2倍8、在进行简单随机抽样时,为使抽样平均误差减少25%,则抽样单位数应( )。
a.增加25% b.减少13.75% c.增加43.75% d.减少25%9、抽样极限误差是指用样本指标估计总体指标时产生的抽样误差的( )。
a.最大值 b.最小值 c.可能范围 d.实际范围10、将总体单位按一定标志排队,并按固定距离抽选样本单位的方法是( )。
a.类型抽样 b.等距抽样 c.整群抽样 d.简单随机抽样11、在进行抽样估计时,常用的概率度t 的取值( )。
a.t<1b.1≤t≤3c.t=2d.t>312、等距抽样的误差与简单随机抽样相比较( )。
a.前者小b.前者大c.两者相等d.大小不定13、某地订奶居民户户均牛奶消费量为120公斤,抽样平均误差为2公斤,据此可计算户均牛奶消费量在114-126之间的概率为( )。
a.0.9545b.0.9973c.0.683d.0.90014、对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%,概率为0.9545,优等生比重的极限误差为( )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第8章抽样调查与推断【教学内容】本章主要阐述:抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式及其抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。
【教学目标】1、理解抽样误差的影响因素;2、掌握抽样调查的概念、特点和作用;3、掌握抽样平均误差的计算方法、抽样估计推断和必要抽样数目的确定原理及方法;4、初步具备在实际工作中正确运用抽样方法搜集资料并据以做出准确推断的能力。
【教学重点、难点】1、抽样调查的特点和作用;2、抽样调查的组织方式和方法;3、抽样误差的概念与计算;4、抽样推断方法;5、必要抽样数目的确定方法。
第一节抽样调查的一般问题一、抽样调查的概念、特点与作用(一)抽样调查的概念与特点概念:抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。
特点:(1)按随机原则抽取调查单位。
(2)由部分推断全体。
(3)抽样误差可以事先计算并加以控制。
(二)抽样调查的作用1、用于不可能进行全面调查的无限总体。
2、用于不可能进行全面调查而又需要了解全面情况的现象。
3、用于不必要进行全面调查的现象。
4、用于对全面调查的资料进行评价与修正。
5、用于工业生产过程的质量控制。
二、抽样调查中的几个基本概念(一)全及总体和抽样总体1.全及总体全及总体简称总体或母体,它是指所要调查研究对象的全体。
2.抽样总体抽样总体也称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。
(二)总体指标和样本指标1.总体指标总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。
2.样本指标样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。
三、抽样调查的组织方式(一)简单随机抽样概念:简单随机抽样也叫纯随机抽样,它对总体单位不作任何分类排序(队),而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。
方法:(1)重复(置)抽样即从全及总体中,每次抽取一个总体单位进行调查,经登记后再把它放回总体中参加下一次的抽取,直到抽取n个总体单位。
如果按重复抽样的方法抽选样本,可能的组(配)合样本有:(2)不重复(置)抽样即从全及总体中,每次抽取一个总体单位进行调查,经登记后不再把它放回总体中参加下一次的抽取,依此抽选直到抽取n个总体单位。
如果按不重复抽样的方法抽选样本,可能的组(配)合样本有:(1)抽签法。
具体做法是:当给总体各单位编号后,把号码写在结构均匀的签上,将签混合均匀后即可以从中抽取。
(2)随机数字法。
随机数字可以借助于计算机获得,也可应用随机数表,其中随机数表方法应用较为普遍。
表8-1 随机数字表(部分)(二)分层(类型)抽样●分层(类型)抽样又称分类抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组(类)中抽取样本单位的一种抽样方式。
●分层(类型)抽样的样本单位数在各类型之间的分配有三种方法:(二)分层(类型)抽样等数分配分层(类型)抽样法。
等比例分层(类型)抽样法。
不等比例分层(类型)抽样法。
(三)等距抽样等距抽样也称机械抽样或系统抽样,它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。
图8-1 等距抽样示意图抽样距离的计算公式为:(四)整群抽样整群抽样也称集团抽样、区域抽样或分群随机抽样,它是将总体各单位按时间或空间形式划分成许多群,然后按纯随机抽样或机械抽样方式从中抽取部分群,对被选中群的所有单位进行全面调查的抽样组织方式。
第二节抽样误差一、抽样误差的概念概念:调查误差是指调查所获得的统计数据与调查总体未知真实数据之间的差别,它包括登记性误差和代表性误差两种。
1、代表性误差代表性误差是用样本指标数值去推断总体指标数值时,由于样本各单位的结构情况不足以代表总体特征所产生的误差。
2、登记性误差是在调查过程中由于主客观原因而引起的登记性差错所造成的误差。
二、影响抽样误差的主要因素抽样误差的大小受以下几个因素的影响:(一)样本单位数(样本容量n)的多少(二)总体被研究标志变异程度(总体方差σ2)的大小(三)抽样组织方式(四)抽样方法三、抽样平均误差(一)抽样平均误差的概念在一定组织方式下进行抽样调查,根据统计研究的目的和任务,可以取一个样本,也可以取多个样本。
在抽取多个样本时,就其中每个样本来说,都有其相应的样本指标。
抽样平均误差是指以全部可能样本指标为变量,以总体指标为平均数计算得到的标准差,以符号表示,通常以代表平均数的抽样平均误差,以μp代表成数的抽样平均误差,以K代表可能组成的样本总数。
(二)计算抽样平均误差的理论公式根据抽样平均误差的概念可得其一般计算公式:[例8-1]为叙述简便,假设有10、20、30和40这4个数字组成一个总体,从中随机抽取两个数字作为样本,求抽样平均误差。
总体平均数为:采取重复抽样法,可能组(配)合的样本数及相应指标的计算见表8-2。
全部可能样本平均数的平均数()等于总体平均数( ),即:表8-2 重复抽样的样本数及相应指标计算表表8-3 不重复抽样的样本数及相应指标计算表(三)抽样平均误差的计算方法1.平均数的抽样平均误差。
2.成数的抽样平均误差。
[例8-2]某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为85%。
现按简单随机抽样方式从800只仪表中抽取10%进行检验,求合格品比率的抽样平均误差。
由上述可知:在重复抽样条件下:在不重复抽样条件下:[例8-3]某大学有4 500名学生,采用不重复简单随机抽样方式从中抽取10%的学生,调查其每月生活费用支出情况。
抽样结果显示,学生平均每人每月生活费支出800元,标准差200元,生活费用支出在1 000元以上的学生占全部学生的20%。
试求抽样平均误差。
由上述可知:(四)其他抽样组织方式抽样平均误差的计算方法1.分层(类型)比例抽样平均误差的计算。
(1)平均数的抽样平均误差。
(2)成数的抽样平均误差。
[例8-4]某县对某种农作物的产量进行一次分层(类型)比例抽样调查。
调查资料整理的结果见表8-4,试求抽样平均误差。
表8-4 分层(类型)抽样平均误差计算表2.等距抽样平均误差的计算。
直接计算等距抽样的平均误差,在实践中是一个不容易解决的问题。
一般认为如果总体单位是按无关标志排序(队)的,它的抽样误差就十分接近简单随机抽样的误差,为了简便起见,可以采用简单随机抽样平均误差公式来近似地计算。
同理,如果总体单位是按有关标志排序(队),其抽样平均误差可采用分层(类型)抽样平均误差的公式计算其近似值。
3.整群抽样平均误差的计算。
(1)平均数的抽样平均误差。
(2)成数的抽样平均误差。
[例8-5]某商店购进300箱(50只/箱)苹果,入库前随机抽取1%检查其质量。
检验结果的整理资料见表8-5,试求抽样平均误差。
表8-5 整群抽样平均误差计算表首先,分别计算样本平均数和样本成数。
其次,分别求出样本平均数的群间方差和成数的群间方差。
最后,根据[公式8-20]和[公式8-21]求出μx和μp。
第三节总体指标的推断一、点估计1、概念点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值( x ,p)直接作为总体未知参数( x ,P)的估计值的一种推断方法。
2、三个标准在实际中,根据不同样本数据或用不同的方法来估计同一个总体参数,可能会得到不同的估计量。
但哪一个估计量更好一些,其评判通常采用下面三个标准:1.一致性。
设θ为未知参数θ的估计量,当n→∞时,要求θ按概率收敛于θ,即:2.无偏性。
若要求估计量θ的数学期望等于未知参数的真值θ,即:3.有效性。
无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。
二、区间估计1、概念区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。
2、内容第一:这一可能范围的大小;第二:总体指标落在这个可能范围内的概率。
[例8-1]样本平均数的概率分布见表8-6。
表8-6样本平均数的概率分布把这全部可能的样本平均数编制成变量数列(见表8-6),然后再将它们绘成图形,即可得到一个钟形的平滑曲线(如图8-2所示)。
图8-2 正态分布曲线图抽样估计的置信度就是表明样本指标和总体指标的误差不超过一定范围的概率有多大。
图8-3 样本指标置信度图[例8-7]利用[例8-3]的资料,在95.45%的置信度下估计全体学生月平均生活费用的可能范围,以及月生活费用在1 000元以上学生所占比重的可能范围。
[例8-8]从某县农民家庭中随机抽取100户调查其年收入情况。
农民家庭按年人均纯收入额分组的资料见表8-7。
要求以95%的置信度对全县农民家庭的年人均纯收入和年人均纯收入在10 000元以上户数所占比重作出区间估计。
表8-8 某县百户农民家庭按年人均纯收入分组抽样指标计算表第四节必要抽样数目的确定一、影响必要抽样数目的主要因素有下列几个: (一)总体被研究标志的变异程度(二)对推断精确度的要求(三)对推断可靠性的要求(四)抽样调查的组织方式和方法(五)人力、物力和财力的允许条件二、确定抽样数目的方法(一)在重复抽样条件下推断总体平均数所需要的抽样数目:推断总体成数所需要的抽样数目:(二)在不重复抽样条件下推断总体平均数所需要的抽样数目:推断总体成数所需要的抽样数目:。