第7章 抽样调查

合集下载

第七章 整群抽样

第七章 整群抽样
j 1
y 1 yi i M M
y
j 1
M
总体总值及按群平均的总体均值:
Y Yi Yij
i 1 i 1 j 1 A A M
Y 1 A Y Yi A A i 1
样本总值及按群平均的样本均值:
y yi yij
i 1 i 1 j 1 a a M
• 总体均值 Y 的无偏估计: y y 1 aM aM
V ( y) 1 f 2 Sb aM
1 a y y y ij i a M i 1 j 1 i 1
a
M
• 方差:
2 • 方差的无偏估计: v ( y ) 1 f sb
aM
第二节
群大小相等的整群抽样
LOGO
第一节
抽样方式
LOGO
• 实施理由: ① 缺少调查单位的必要信息无法对其直接编制抽样框实施 概率抽样,而由调查单位组成的群是现成的或者群很容 易划分从而编制群抽样框非常容易时,常采用整群抽样。 ② 使调查实施便利、节省费用而采用整群抽样。 ③ 对某些由特殊结构的群组成的总体实施整群抽样能使精 度有较大提高。
第七章 整群抽样
本章要点
LOGO
对于整群抽样,本章给出了群大小相等和群大小不等 的整群抽样方法及与之匹配的估计量、估计量的方差及方差 的估计量。 • 具体要求: • 掌握群大小相等情形对群进行简单随机抽样简单估计量的 无偏性、方差及方差的无偏估计,掌握群的划分原则;了 解群内方差、群间方差概念及其对整群抽样精度的影响。 • 掌握群大小不等情形与简单随机抽样相匹配的简单估计量、 比率估计量及与抽样相匹配的汉森-赫维茨估计量及性质。 • 掌握估计总体比例的整群抽样方法及简单估计量、比率估 计量。

第七章 抽样调查技术

第七章 抽样调查技术

13
一、简单随机抽样

(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;

第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体


概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。

2015/12/22
23
三、分层抽样

(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24

假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因


原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。

抽样调查-第7章 系统抽样

抽样调查-第7章 系统抽样
返回
三、总体单元的排序
系统抽样时N个总体单元的排序情况 大致有以下三种:
(1)按无关标志排队 (2)按有关标志排队
(3)介于上述两者之间
返回
四、系统抽样的优缺点
系统抽样的优点: 1.简便易行,容易确定样本单元
2.样本单元在总体中分布比较均匀
系统抽样的缺点: 1.如果单元的排列存在周期性的变化,而抽样 者对此缺乏了解或缺乏处理经验,抽取的样本 的代表性就可能很差。
3,8,13。 7 8 9 10 11 12 6 5 4 3 2
1
13
循环等距抽样
返回
3. 不等概系统抽样法
不等概系统抽样中每个单元的入样概率不相等.最常用 也是最简单的不等概系统抽样是PS 抽样.即入样概率 i 与单元大小 M 成比例的系统抽样.令
i
Mi 表示总体所有单元大小的总和,则 i n M0

Y( n1) k r

yr
Y

yk
nk
返回
令 Yrj
Y( j 1) k r (r 1,2,, k ; j 1,2,, n) 得下表:
1 2
Y12
1 2
Y11 Y21

Y22

r

Yr1

Yr 2
k
层平均

Yk1

Yk 2

j Y Y
M0 Mi
i 1
N
实施不等概系统抽样最简单的方法是代码法: 下面以例7.1来说明 【例7.1】设总体由10个行政村组成,N=10,每个行政村 的人数 M i 见下表.利用PS 系统抽样抽取n=3个行政村.
返回
用PS系统抽样抽选行政村

《统计学原理》课件第七章抽样调查

《统计学原理》课件第七章抽样调查
4 -6
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序

究 原
总体分布 样本分布 抽样分布

一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析

第7章 抽样方法

第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。

经济统计学第7章抽样调查

经济统计学第7章抽样调查
经济统计学第7章抽样调查
目录
• 抽样调查概述 • 抽样调查的基本方法 • 样本量的确定 • 抽样误差与推断方法 • 抽样调查的组织与实施
01 抽样调查概述
定义与特点
定义
抽样调查是一种统计学方法,通过对 总体中的一部分进行调查,来推断总 体的特征和规律。
特点
经济高效、快速、准确度高、可操作 性强、误差可控。
THANKS FOR WATCHING
感谢您的观看
准备辅助工具
根据调查需要,准备辅 助工具,如调查表格、 录音设备等。
调查过程的控制
培训调查人员
对调查人员进行培训,确保他们了解调查目 的、问卷内容、抽样方法等。
现场实施
按照抽样计划进行现场调查,确保每个样本 都得到有效的调查。
数据采集
对收集到的数据进行整理、分类和编码,确 保数据的准确性和完整性。
适用于总体内各单位之间存在明显的差异性。
系统抽样
定义
先将总体中的所有单位按一定的顺序排 列,然后按照固定的间隔或系统地抽取
样本单位的方法。
操作方法
首先确定一个合理的起始点,然后按 照固定的间隔依次抽取样本单位。
特点
每隔一个固定数量的单位抽取一个样 本单位,每个样本单位被抽中的概率 都相等。
适用范围
抽样调查的分类
按样本选取方式
随机抽样、分层抽样、系统抽样、整群抽样等。
按样本规模
大样本、中样本、小样本。
按调查目的
探索性调查、描述性调查、因果性调查。
抽样调查的应用场景
01
市场调研
了解市场需求、消费者行为、品牌 知名度等。
质量控制
产品检验、过程控制、质量评估等。
03

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。

调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。

例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。

由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。

同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。

为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。

调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。

例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。

同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。

(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。

例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。

(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。

调查项⽬确定的正确与否直接关系到调查的质量。

因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。

应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。

例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。

调查项⽬有⼀般项⽬和重点项⽬之分。

⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。

第7章 抽样调查及答案

第7章  抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。

它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。

是一种灵活快捷的调查方式。

2.抽样调查有全及总体与样本总体之区分。

样本容量小于30时一般称为小样本。

对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。

样本可能数目与样本容量有关也与抽样的方法有关。

抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。

正态分布的密度函数有两个重要的参数(σ;x )。

它有对称性、非负性等特点。

中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。

推出了样本分布的标准差为:1--=N n N n x σμ。

4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。

无偏性、一致性和有效性是抽样估计的优良标准。

抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。

抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。

在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。

在通常情况下总体的方差是未知的,一般要用样本的方差来代替。

把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。

μt =∆,用抽样的平均误差来度量抽样的极限误差。

把抽样估计的把握程度称为抽样估计的置信度。

抽样的极限误差越大,抽样估计的置信度也越大。

抽样估计又可区分为点估计和区间估计。

第七章市场调查方式(抽样技术)

第七章市场调查方式(抽样技术)

具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)

抽样技术-第7章

抽样技术-第7章

h 层方差。

'
当二重抽样比 ' 和 都可以忽略不计时,式(7.4)可简化为:




− −
'
v( )≈ ∑ +' ∑ w'h( - )2

=
=
(7.5)
【例7.1】
某银行要调查其客户的资产情况。已知该银ห้องสมุดไป่ตู้的客户数为
8000,针对客户规模差异较大的特点,拟采用分层抽样。但由
c2h(h=1,2,…,L)。忽略其他费用,则费用函数可以表示为:
L
CT=c1n'+ ∑ c2hnh
h=1
(7.6)
由于 nh 是随机变量,所以选择 n'和 fhD 的期望费用 CT* 为:
CT* =
L
E(CT)=c1n'+n' ∑ c2hfhDWh
(7.7)
h=1
根据式(7.3),总体均值估计量的方差为:

E( )=


是 的无偏估计,即
(7.2)
定理 7.3

V( )的样本估计量为:



− −




v( )= ∑ - ' w' + ' - ∑ w'h( - )2 (7.4)


=
=


v( )是 V( )的近似无偏估计。式中, 是第二重样本第
二重抽样比估计方差的样本估计:

v(yRD )
1 2
1 1
=n sy + n - n'

第7章抽样调查

第7章抽样调查

二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E

如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u




1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。

07章抽样调查基础知识

07章抽样调查基础知识


1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100

不重复抽样平均误差为: x

400(1 100 ) 1.99(小时) 100 10000

抽样调查习题集答案

抽样调查习题集答案

抽样调查习题集答案篇一:2015年《统计学》第七章抽样调查习题及满分答案2015年《统计学》第七章抽样调查习题及满分答案一、单选题1. 反映样本指标与总体指标之间抽样误差可能范围的指标是(B)。

A、样本平均误差B、抽样极限误差C、可靠程度D、概率度2.在其它条件不变的情况下,抽样单位数目和抽样误差的关系是( B )。

A.抽样单位数目越大,抽样误差越大B.抽样单位数目越大,抽样误差越小C.抽样单位数目的变化与抽样误差的数值无关D.抽样误差变化程度是抽样单位数变动程度的1/23.事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织形式,被称为(D)。

A、分层抽样B、简单随机抽样C、整群抽样D、等距抽样4.在同样条件下,不重置抽样的抽样平均误差与重置抽样的抽样平均误差相比(A)。

A、前者小于后者B、前者大于后者C、两者相等D、无法判断5.如果总体成数方差未知,计算必要抽样数目时,可用总体方差的最大值,最大值为( B )。

A、0.24B、0.25C、0.50D、1 6.抽样估计的置信度是(C )A.概率度B.区间范围的大小C.概率保证程度或置信概率D.与概率度无关的量7.随机抽样的基本要求是严格遵守(B)A、准确性原则B、随机性原则C、代表性原则D、可靠性原则8.抽样调查的主要目的是(D)A.广泛运用数学方法 B.计算和控制抽样误差 C.修正普查资料D.用样本指标推算总体指标9. 抽样调查中(A )A、既有登记性误差,也有代表性误差B、只有登记性误差,没有代表性误差C、没有登记性误差,只有代表性误差D、既没有登记性误差,也没有代表性误差10.要使抽样误差减少一半(在其它条件不变的情况下),则抽样单位数必须( D )。

A、增加2倍B、增加到2倍C、增加4倍D、增加到4倍11.抽样平均误差反映了样本指标与总体指标之间的(C )A、实际误差B、实际误差的绝对值C、平均误差程度D、可能误差范围12.在实际工作中,不重复抽样的抽样平均误差的计算,采用重复抽样的公式的场合是( A )A、抽样单位数占总体单位数的比重很小时B、抽样单位数占总体单位数的比重很大时C、抽样单位数目很少时D、抽样单位数目很多时13.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将( C )。

第7章抽样设计和现场调查市场营销调研

第7章抽样设计和现场调查市场营销调研
第7章抽样设计和现场调 查市场营销调研
2021年7月30日星期五
7.1 市场调研中的抽样调查
1 .市场调研中的抽样调查概述
(1)市场调研中流行抽样调查的原因
市场调查受到费用、时间和信息精确度等因 素的限制。
(2)市场调查对抽样的要求(原则)
样本要有代表性,即要能代表适当定义的总 体
样本要能足够精确地提供稳定的结果 样本要尽可能精确地得到问题所需要的各类
(3)确定抽样单位
抽样单位是包括在抽样总体中个体的基本单位,
(4)选择抽样方法(随机还是非随机,分层还是不分层) (5)决定样本的大小——后面讲 (6)决定抽样实施计划——抽样如何具体执行 (7)选择样本、实施调查及搜集信息
【观念应用 4-1】
从1000个对象中抽选出100个样本进行访问调查,请他 们对经济发展速度的前景进行预测,其中认为明年经济增 长速度将达到8%以上的有60人,即占被抽样总数的 60%,按百分比推算法,调查总体1000个对象中将有 600人认为明年的经济增长速度将达到8%以上,说明大 多数人对经济发展前景相当看好。也可按平均数推算法进 行推断,即将调查的样本结果加以平均求出样本平均数代 入平均数推算总体的公式(总体=总体个数*样本平均 数)。假定对500个商店客流量调查,从50个样本调查 结果,平均客流量为350人次,那么500个商店的总客 流量为:500×350人次=175 000人次。【分析提示】 按百分比推算法和平均数推算法,以样本指标推算总体指 标。
77 04 74 47 67 98 10 50 71 75 52 42 07 44 38 49 17 45 09 62 78 83 51 03 74 83 11 25 93 47
【补充阅读资料】
要从94家上市公司中抽取12家作为调查样本,可 先将94空公司由1至94编号N=94,然后在乱数 表上任意上一点一行(或一列)中一个数字作为 起点数,从这个数字按上下或左右顺序读起,每 出现两个数字,即为被抽中的单位码号。假定本 例是从第四行左边第五个数字向右顺序读起,则 所抽取单位是:68 27 31 05 03 72 93 15 55 59 56 35 ,此过程中的96因大于 94,舍去不用是因为在顺序抽取的过程中,遇到 比编号大的数字,应该舍去。

第七章 抽样调查

第七章 抽样调查

第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。

简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。

2、抽样调查的特点⑴随机原则。

所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。

也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。

⑵从数量上推算全体。

抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。

⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。

3、几个概念⑴总体也称为母体、一般总体等。

是指具有某种统计特征的一类事物的全部个案。

也即,研究对象的全体称为总体。

例如,某批产品、某类病人、某个生产过程等。

总体的单位数通常用符号N来表示。

⑵个体也称为个案、元素。

组成总体的每个元素称为个体。

有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。

⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。

也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。

总体是大群体,样本是小群体。

在社会研究中,资料的收集工作往往是在样本中完成的。

样本的单位数(即样本容量)常用符号n来表示。

⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。

(5)抽样单位就是一次直接的抽样所使用的基本单位。

吉珠统计学期末考试重点第7章 抽样及抽样分布

吉珠统计学期末考试重点第7章  抽样及抽样分布

x
时, f (x) 的曲线以 x 轴为渐近线。
第七章 抽样调查
4. 标准正态分布
标准正态分布的概率密度函数为:
1 ( z) e , <z< 2
若随机变量 Z 服从标准正态分布, 则记为 Z~ (0, 1)
z2 2
1. 任何一个一般的正态分布,可通过下面的 线性变换转化为标准正态分布
总体均值的区间估计
(一) 大样本时总体均值的区间估计
第七章 抽样调查
例:某企业生产A产品的工人有1000人, 某日采用不重复抽样从中随机抽取100人调查 他们的当日产量,样本人均产量为35件,产量 的样本标准差为4.5件。请以95.45%的臵信度
估计该日人均产量的臵信区间。
解:①计算抽样平均误差
x 0
x a
第七章 抽样调查
标准差 决定密度函数曲线 f (x) 的陡缓程度.
0.5
1
2
第七章 抽样调查
3. 正态分布密度函数的特点
(1) 对称性。 (2) 非负性。
(3) f (x) 在 X x 时达到极大值 f(x ) 1 2
(4) f (x) 的曲线在 X x 处有拐点。 (5 )当
Z X

x2 2
~ N (0,1)
2. 标准正态分布的概率密度函数
1 ( x) e 2 , x
3. 标准正态分布的分布函数 t2 x x 1 -2 ( x) (t )dt e dt 2
第七章 抽样调查
标准正态分布, 具有如下性质或结论:
③计算抽样极限误差
由 1 ) 0.95 ,查t分布表得, (
t n 1 t 2.5% (9)=2.2622
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

解: 250000;n 6400; x 20h; 8h;F (t ) 95.45% t 2; N
n / N 6400 / 25000 2.56% 5% 重复抽样 8 0.1(h) (3)' 0.16h (1) x n 6400 x
2013-3-7
2
第一节 抽样调查的概述
随机抽取
总体
说明 总体指标数值
样本 计算
X

2
推算
样本指标数值 2 x S
特点
1)随机原则 2)根据部分推断总体 3)抽样误差可以事先计算并加以控制
2013-3-7
3
抽样推断的流程:
一、抽选样本 二、计算样本指标/抽样指标 1、平均数 / 成数 x
2013-3-7
9
第三节 抽样误差
影响抽样误差的因素:

1) 2) 3) 4)
抽 样 单 位 数 总体的变异程度




抽样组织形式
2013-3-7
10
第三节 抽样误差
正态分布概率简表 概率度t
0.50 1.00 1.64 1.96 2.00 3.00 4.00 38.29 68.27 90.00 95.00 95.45 99.73 99.99
t:概率度
2013-3-7
8
第四节 抽样调查的组织形式 P181

1、简单随机抽样:直接从总体中抽取调查单位的抽 样调查方式。一般先进行编码,然后随机抽取。 2、机械抽样:先将总体单位按某一标志排序,然后 按照固定的顺序和相同的间隔来抽选样本单位的组织 方式。 3、类型抽样:将总体单位先按一定标志分组,然后 在各组中随机抽取样本的组织方式,以保证样本对总 体具有更高的代表性 4、整群抽样:将总体划分为若干个群(区域),然后以 群为单位从中随机抽取部分群,最后对中选 群中的所 有单位进行全面调查的组织方式。
4 10 16 12 8 50
2 484 1936 55 t 220 x-22 1.65 3.30(件) x 65 144 1440 650 -12 (5 1200 -2 75 ) x x X x x 4 64 85 64 768 8 1020 77 760 18 3 2592 95 3.30 X 77324.30 — — 6800 3850 73.70 X— 80.30(件)
2013-3-7
可靠程度
概率保证程度F(t) (%)
11
[例] 某冰箱厂对250000台冰箱进行质量抽查,随机抽查6400台, 测得冰箱停电保温时间平均为20h,标准差为8h,其中有400台 不合格,试按照95.45%的可靠性计算:(1)全部250000台冰箱每 台平均停电保温时间;(2)全部250000台冰箱的合格率范围;(3) 若要求均值的允许误差不超过0.16h,至少应抽查多少台?
2、某工厂有2000个工人,用简单随机重复抽样的方 P 计算流程:p p p 解:N 2000 n 50; 法抽出50个工人作为样本,调查其产量水平,如下 ; n1 50 4 月产量/件 人数 (1) p 92 % 50 n 4 60以下 用p代替P p(1 p) 92%(1 92%) 60-70 10 (2) p 3.84 % 70-80 16 50 n
f
50
2013-3-7
15
2、某工厂有2000个工人,用简单随机重复抽样的方 P 计算流程:p p p 解:N 2000 n 50; 法抽出50个工人作为样本,调查其产量水平,如下 ; n1 50 4 月产量/件 人数 (1) p 92 % 50 n 4 60以下 用p代替P p(1 p) 92%(1 92%) 60-70 10 (2) p 3.84 % 70-80 16 50 n
2
xf x x x x x x
n
2
2

f
1)以95.45%的概率保证程度估计该厂工人的月平均产量
计算流程: S x x x X x
xf 3850 解:N 2000; (1) x 77 (件) f 50 n 50; ( x x) 2 f 6800 2 (2)S x 13614 50 f
第五节 必要抽样单位数n的确定

简单随机抽样单位数的计算公式
2013-3-7
18
[例:1] 对生产大型号的电池进行抽样调查,重复抽样得 1)电流强度的标准差为0.4安培,若要求抽样平均电流强 度的极限误差不超过0.07安培,则至少要抽取多少节电池 2)合格品率为95%,若要求抽样合格率的极限误差不超 过5%,则至少要抽取多少节电池。 3)若要同时满足① ②极限误差的要求,则应取多少节电 池(以95.45%的可靠性计算)
2013-3-7
7
第三节 抽样误差
三、抽样极限误差

样本指标与总体指标之间的误差的可能范围 x X x x x X x x 无法直接得到 p P p p p P p p
抽样极限误差与抽样平均误差的关系:
t
x t x
p t p
2
xf x x x x x x
n
2
2

f
1)以95.45%的概率保证程度估计该厂工人的月平均产量
计算流程: S x x x X x 及总产量。 总产量=平均产量×总人数
Xf 3850 73.70 N X N 80.30 N () 1X (件) f X50 77 2000 解: 2000; 73.70 2000 N 2 N 80.30 n 50; (2)147400 xX fN 160600(件) 2 ( x ) 6800 136 Sx
20 0.2 X 20 0.2
p p P p p
19.8 X 20.2(h)
93.75% 0.60% P 93.75% 0.60%
93.15% P 94.35% 12 2013-3-7
[例] 某冰箱厂对250000台冰箱进行质量抽查,随机抽查6400台, 测得冰箱停电保温时间平均为20h,标准差为8h,其中有400台 不合格,试按照95.45%的可靠性计算:(1)全部250000台冰箱每 台平均停电保温时间;(2)全部250000台冰箱的合格率范围;(3) 若要求均值的允许误差不超过0.16h,至少应抽查多少台?
解:1) 0.4安培; 0.07安培; x 2 2 t x 22 0.42 nx 130.61 取131节 2 2
2) p 95%; p 5%;
t 2 p(1 p) 22 95%(1 95%) np 76 (节) 2 2 0.05 p
80-90 90以上 合计 12 8 50
p t p 2 3.84% 7.68%
(4) p p P p p
2)若60件以下 为未达标,试以 92% 7.68% P 92% 7.68% 84.32% P 99.68% 95.45%的概率 2、达标人数 达标率 全部人数 保证程度估计 84.32%N PN 99.68%N 该厂工人的达 84.32% 2000 PN 99.68% 2000 标率及达标人数 1686.4 PN 1993.6(人) 2013-3-7 17
80-90 90以上 合计 12 8 50
p t p 2 3.84% 7.68%
(4) p p P p p
2)若60件以下 为未达标,试以 92% 7.68% P 92% 7.68% 84.32% P 99.68% 95.45%的概率 保证程度估计 该厂工人的达 标率。 2013-3-7 16
x x X x x
20 0.2 X 20 0.2
பைடு நூலகம்
x t x 2 0.1 0.2(h)
nx
t x
2
2

' 2 x
2 2 82 10000 (台) 2 0.16
19.8 X 20.2(h)
2013-3-7
13
2 2 1、某工厂有2000个工人,用简单随机重复抽样的方 2 136 用 1.65(件) S x 代替 x (3) x 法抽出50个工人作为样本,调查其产量水平,如下 50
可避免
计 系统性误差(偏差):由没有遵循随机原则造成 误 差 代表性 重点调查、典型调查
误差
抽样误差(随机误差):抽样调查
2013-3-7
5
第三节 抽样误差
二、抽样平均误差

是指抽样平均数(或成数)的标准差。反映了 抽样指标与全及指标之间的平均误差程度。
x
2
n


n
P
P(1 P) n
月产量/件
60以下 60-70 70-80 80-90 90以上 合计
f 人数 组中值 x
4 10 16 12 8 50
2 484 1936 55 t 220 x-22 1.65 3.30(件) x 65 144 1440 650 -12 (5 1200 -2 75 ) x x X x x 4 64 85 64 768 8 1020 77 760 18 3 2592 95 3.30 X 77324.30 — — 6800 3850 73.70 X— 80.30(件)
第7章 抽样调查
宁波大红鹰学院
2013-3-7
1




1、抽样调查的特点: 2、统计误差的分类、产生原因(区分方法) (哪些误差能避免): 3、影响抽样误差的因素: 4、重复和不重复抽样(抽样方法)的选择: 5、总体标准差或方差未知时的处理: 6、类型、整群、简单随机抽样的辨别: 7、全及总体(指标)与抽样总体(指标)的地 位关系: 8、计算总体平均数和总体成数(区间)
相关文档
最新文档