《抽样调查》PPT课件
合集下载
《抽样调查》课件
当调查范围比较小, (1)结果准确 调查不具有破坏性, (2)全面了解 数据要求准确全面 数据 时
(1)调查范围大, 工作量大
(2)受客观条件 限制
抽样 调查
当调查范围比较 大,受条件限制, 调查具有破坏性
(1)调查范围小 (1)结果不是很 (2)节省时间、 准确 物力、人力 (2)不能全面了
解数据
例2.今年我市有4万名考生参加中考,为了 了解这些考生的数学成绩,从中抽取2 000 名考生的数学成绩进行统计分析,在这个问 题中,下列说法:①这4万名考生的数学中 考成绩的全体是总体;②每个考生是个体; ③2 000名考生是总体的一个样本;④样本 容量是2 000,其中说法正确的有__①___④____
你还能举出一些利用抽样调查方法 进行调查的例子吗?
抢答:以下调查,哪些适宜全面调查,
哪些适宜抽样调查? (1)调查某批次汽车的抗撞击能力 抽样调查
(2)了解某班学生的身高情况
全面调查
(3)调查春节联欢晚会的收视率
抽样调查
(4)选出某校短跑最快的学生参加全市比赛 全面调查
适用范围
优点
缺点
全面 调查
(3)你认为在抽取样本时应注意什么? 1.样本容量要适当(不多也不少)
2.样本要具有代表性 (4)简单随机抽样的特点是什么?
每一个个体都有相等的机会被抽到
我校初中部有3000名学生,要想了解全校学生对 新闻、体育、动画、娱乐、戏曲五类节目的喜爱,怎 样进行调查?请完成设计方案。
谢谢!
10.2 抽样调查
彭怀慧 指导老师 张 陈
问题:了解长沙市7.8万名留守儿童受 教育情况,你打算怎样调查?
思考:要知道 一锅汤的味道,该 怎么办呢?
第八章抽样调查ppt课件全
XP
• 总体比率的方差为: • σ2=P(1-P) • 样本比率也是两个变量(0,1)的平均数
• 其标准差为:
s p(1p)
x
n 1
p
n
• 抽样比率的平均数及标准误差相应为: pP
(8-11)
•
P(1P)
p
n
(8-12)
• 与抽样平均数分布一样,抽样比率分布的平均数未知,所以同样用 一个样本的比率p来推断总体比率P,在推理上其基本原理和用样 本平均数推断总体平均数是相同的,这里不再赘述。
AN=N(N-1)(N-2)…(N-n+1)=N!/(N-n)!
(8-1)
(2)考虑顺序的重复抽样数目,即通常所说的可重复排列数:
BnN=Nn
(8-2)
(3)不考虑顺序的不重复抽样数目,即通常所说的不重复组合数:
CnN=N(N-1)(N-2)…(N-n+1)/n!=N!/n!(N-n)!
(8-3)
(4)不考虑顺序的重复抽样数目,即通常所说的可重复组合数:
(2) 在实际工作中可以取得全面资料,但不能进行全面调查时, 要运用统计抽样。例如工业上有些产品的质量检查,需要 对产品进行破坏性试验,如灯泡的寿命检查等,只有通过科 学的统计抽样进行检查,才能确定产品的质量
• (3) 对时间序列总体,根据一定顺序的抽查,可以对 生产过程进行控制和检验。例如对工业产品质量 控制就要运用统计抽样来进行。
三、统计抽样的重要作用
(1) 对于那些从理论上讲可以取得全面资料,但实际工作中,没 有必要进行全面调查的事物,运用统计抽样这种非全面调 查的方法同样可以取得资料,从而用更少的人力、时间、 费用达到对总体的认识。例如要了解居民家庭收入情况, 如果对所有的居民家庭收支进行逐户登记,工作量太大,客 观上有困难,事实上也办不到,所以只要抽取若干个具有代 表性居民家庭进行调查,就可以获得满足调查任务要求的 统计资料。
抽样调查第2章简单随机抽样ppt课件
记录样本
将读取到的随机数对应的个体作为样本,并记录其编号。
计算机模拟法
编号
选择随机数生成器
设置参数
生成随机数
筛选样本
将总体的个体编号,并将 编号数据输入计算机。
在计算机中选择一个合适 的随机数生成器。
根据需要设置随机数生成 器的参数,如生成随机数 的范围、数量等。
使用随机数生成器生成 一定数量的随机数。
详细记录每个被抽中样本的信息和特征,如 姓名、性别、年龄、职业等。
处理异常情况
保密原则
如遇到无法联系或拒绝接受调查的样本,需 按照预先设定的方案进行处理,如替换或重 新抽取等。
在整个抽样过程中,需严格遵守保密原则, 确保被调查者的隐私不被泄露。
05
数据分析与结果解读
数据整理与初步分析
1 2
数据来源与采集方式
根据生成的随机数,从总 体中筛选出对应的个体作 为样本,并记录其编号。 如果需要,还可以对样本 进行进一步的处理和分析。
03
样本容量确定与误差控制
样本容量确定原则及方法
原则
在满足调查精度和可靠性的前提下, 尽可能减少样本容量,以节约成本和 提高效率。
方法
根据总体大小、总体方差、调查精度要 求等因素,采用适当的统计公式或经验 法则来确定样本容量。
01
介绍点估计和区间估计的概念、方法和应用场景,并比较其优
缺点。
假设检验的基本原理
02
阐述假设检验的基本原理和步骤,包括原假设和备择假设的设
定、检验统计量的选择、显著性水平的确定等。
常用统计检验方法
03
介绍常用的统计检验方法,如t检验、F检验、卡方检验等,并
说明其应用场景和注意事项。
将读取到的随机数对应的个体作为样本,并记录其编号。
计算机模拟法
编号
选择随机数生成器
设置参数
生成随机数
筛选样本
将总体的个体编号,并将 编号数据输入计算机。
在计算机中选择一个合适 的随机数生成器。
根据需要设置随机数生成 器的参数,如生成随机数 的范围、数量等。
使用随机数生成器生成 一定数量的随机数。
详细记录每个被抽中样本的信息和特征,如 姓名、性别、年龄、职业等。
处理异常情况
保密原则
如遇到无法联系或拒绝接受调查的样本,需 按照预先设定的方案进行处理,如替换或重 新抽取等。
在整个抽样过程中,需严格遵守保密原则, 确保被调查者的隐私不被泄露。
05
数据分析与结果解读
数据整理与初步分析
1 2
数据来源与采集方式
根据生成的随机数,从总 体中筛选出对应的个体作 为样本,并记录其编号。 如果需要,还可以对样本 进行进一步的处理和分析。
03
样本容量确定与误差控制
样本容量确定原则及方法
原则
在满足调查精度和可靠性的前提下, 尽可能减少样本容量,以节约成本和 提高效率。
方法
根据总体大小、总体方差、调查精度要 求等因素,采用适当的统计公式或经验 法则来确定样本容量。
01
介绍点估计和区间估计的概念、方法和应用场景,并比较其优
缺点。
假设检验的基本原理
02
阐述假设检验的基本原理和步骤,包括原假设和备择假设的设
定、检验统计量的选择、显著性水平的确定等。
常用统计检验方法
03
介绍常用的统计检验方法,如t检验、F检验、卡方检验等,并
说明其应用场景和注意事项。
抽样调查ppt
L
例:对某地区进行家庭年收入调查,以居民户为抽样单元, 将居民户划分为城镇居民和农村居民两层,每层按简单随机 抽样抽取10户,调查获得如下数据(单位:万元)。试估计 该地区居民家庭总收入并求估计的标准差。
层 居民 户总 数 样本户家庭年收入 1 2 3 4 5 6 7 8 9 10
1
2
2、使估计量总方差达到最小 ……
3.1样本分配对精度与费用的影响
例 某个总体分为三层,其层权 Wh 及标准差 S h 见表。设总样本量为300, 考虑六种不同的样本分配,并计算出各种分配下,总体均值估计量的方 差和总费用
与
h
1 2 3
Wh
0.2 0.3 0.5
Sh
ch
9 4 16
2 Sh nh
常数分 配
ph qh
例 广告公司要调查某市电视观众看某一广告的人数比例,由于市区、近郊、 远郊的观众对广告的兴趣有差别,而且调查的费用也不同,因此分为三层。 调查数据如表所示:
层 市区 近郊 远郊 总体比例 0.5 0.2 0.3 样本量 200 80 120 观看广告 人数 160 40 30 比例 0.8 0.5 0.25
h 1 L
PhQh nh
证明:
2 L N 1 h N h nh P 2 h Qh V pst Wh V ph 2 N h 1 Nh 1 nh h 1 L 2 1 N h N h nh PhQh 2 Nh nh h 1 N L
Wh2 1 f h
h 1
C
n
h 1
L
h
ch
2900
3137
3300
2123
《抽样调查》绪论 ppt课件
ppt课件
17
精度与费用
抽
精度由误差来表现。 样
抽样样本误量差越与大样,本在量其有它关条,误 差
件相同情况下,抽样误
差就越小,抽样调查的 精度就越高。
样本容量
调查的费用是一个与样本量有关的函数,最简
单的是线性费用函数。C c0 c1n
最优抽样设计:指以最小的费用达到要求的精 度或者在给定费用的情况下达到最大的精度
例:调查北京市民对出租车行业的满意度调查
ppt课件
3
全面调查与非全面调查
根据“调查是否针对总体的所有单元”划分:
全面调查: 非全面调查
普查
应用前提
非全面调查相对于全面调查的优点:
(1)时间短速度快; (2)费用少成本低; (3)调查结果比较准确; (4)应用范围广泛。
ppt课件
4
抽样调查的基本概念
ppt课件
11
总体参数和(样本)统计量
总体参数:总体是调查的客体,而总体参数 是总体某个特征或属性的数量表现。
常见的总体参数有4种:(1)总体总值; (2)总体均值;(3)总体比例;(4)总 体比率。
总体总值、总体均值、总体比例三者是统一 的,它们都可以用总体均值来表示。
why
ppt课件
究者个人的经验和判断,它无法估计和控制抽 样误差,无法用样本的量化数据来推断总体。
ppt课件
6
概率(随机)抽样(probability sampling ) 非概率(非随机)抽样(non- probability sampling )
概率抽样调查 非概率抽样调查
优点: 能够保证样本的代表性,避免人为因素 的干扰; 用概率抽样取得的样本去估计总体特征 时,可以对由抽样产生的抽样误差进行 估计。
统计学课件第六章抽样调查PPT课件
特点
每个样本被选中的机会都 相等,样本的代表性相对 较好。
分层抽样
定义
先将总体按一定标准分成 若干层次或群,然后从各 层或群中按随机原则抽取 样本。
方法
分类抽样、比例抽样、类 型抽样。
特点
能够提高样本的代表性, 降低误差,减少资源浪费。
系统抽样
定义
先将总体中的所有个体按某种顺序排列,然后按 照固定的间隔或系统选取样本。
改进抽样方法
采用更科学的抽样方法和技术,如分层抽样、系统抽样等,以提 高样本的代表性。
提高样本代表性
在抽样过程中尽量减少非随机误差,如无回答、不完整数据等, 以提高样本对总体的代表性。
05 抽样调查的组织与实施
抽样调查的设计
确定调查目的
明确调查的目标和意图,为后 续的抽样设计提供指导。
确定调查对象
合理安排问题的顺序、布局和格式,以提高 问卷的易用性和回答率。
确定调查方式
选择合适的调查方式,如自填式、面访式等, 并确定数据收集的途径。
测试与修正
对问卷进行测试和修正,确保问卷的准确性 和可靠性。
调查的实施与质量控制
培训调查员
对调查员进行培训,确保他们了解调 查目的、问卷内容、调查方法等。
现场实施
将总体分成若干个群集或组,然后从每个 群集或组中抽取一定数量的样本,也称为 簇抽样或组抽样。
抽样调查的应用场景
01
02
03
04
市场调查
通过对目标市场的部分消费者 进行调查,了解市场需求、消 费者行为和产品反馈等信息。
社会调查
通过对一定范围内的社会成员 进行调查,了解社会现象、人 口状况和社会问题等信息。
统计学课件第六章抽样调查ppt课 件
抽样调查课件
上旳必然选择,和普查相比,它具有精确度高、 成本低、速度快、应用面广等优点。
一般合用于下列范围: 1.实际工作不可能进行全方面调查观察,而又需要了
解其全方面资料旳事物;
2.虽可进行全方面调查观察,但比较困难或并不必要;
3.对普查或全方面调查统计资料旳质量进行检验和修
正;
4.抽样措施合用于对大量现象旳观察,即构成事物总
在统计调查中,调查资料与实际情况不一致, 两者旳偏离称为统计误差。
登记误差
统计误差
代表性误差
系统性误差
随机误差
实际误差
抽样平均误差
抽样误差即指随机误差,这种误差是抽 样调查固有旳误差,是无法防止旳。
抽样误差就是指样本指标和总体指标之间数 量上的差别,即 x X 、p P 。
抽样误差旳影响原因:
40
40 10
25
40 20
30
40 30
35
40 40
40
40 50
45
50 10
30
50 20
35
50 30
40
50 40
45
50 50
50
合计
-
5
25
10
100
-5
25
0
0
5
25
10
100
15
225
0
0
5
25
10
100
15
225
20
400
-
2 500
(xX )2
抽样平均误差( )
x
n
2500 10(元) 25
六、反复抽样和不反复抽样
以上每一种组织方式又有不同旳抽取样本措 施(机械抽样和整群抽样没有反复抽样):
一般合用于下列范围: 1.实际工作不可能进行全方面调查观察,而又需要了
解其全方面资料旳事物;
2.虽可进行全方面调查观察,但比较困难或并不必要;
3.对普查或全方面调查统计资料旳质量进行检验和修
正;
4.抽样措施合用于对大量现象旳观察,即构成事物总
在统计调查中,调查资料与实际情况不一致, 两者旳偏离称为统计误差。
登记误差
统计误差
代表性误差
系统性误差
随机误差
实际误差
抽样平均误差
抽样误差即指随机误差,这种误差是抽 样调查固有旳误差,是无法防止旳。
抽样误差就是指样本指标和总体指标之间数 量上的差别,即 x X 、p P 。
抽样误差旳影响原因:
40
40 10
25
40 20
30
40 30
35
40 40
40
40 50
45
50 10
30
50 20
35
50 30
40
50 40
45
50 50
50
合计
-
5
25
10
100
-5
25
0
0
5
25
10
100
15
225
0
0
5
25
10
100
15
225
20
400
-
2 500
(xX )2
抽样平均误差( )
x
n
2500 10(元) 25
六、反复抽样和不反复抽样
以上每一种组织方式又有不同旳抽取样本措 施(机械抽样和整群抽样没有反复抽样):
《抽样调查》PPT课件
在上述三种调查方案中,你认为采用哪一种调查方案比较合理, 谈谈你的理由.
理由:A方案所选取的方案太特殊.B方案所选取的样本与考察 对象无关,C方案抽取的样本比A方案,比B方案更具有代表性和 科学性.
开拓思维
电视台需要在本市调查某节目的收视率,每个看电 视的人都要被问到吗?对一所中学学生的调查能否 作为该节目的收视率?你认为对不同地区,不同年龄, 不同文化背景的人所作的调查结果会一样吗?
可以利用表格来表示:
测试序 号
1
2
3
4
5
6
7
时间(分) 7.5 7.5 7.5 7 6.8 6.5 6.3
可以利用图形来表示:
时间(分)
8
时间(分)
7.5
87
7.5
6.5
7
6.65
5.65
5.5
1 2 345 67
测试序号
(3) 据调查,某校九年级有300名学 生,其中30%的学生步行上学,50%的 学生乘公交车上学,15%的学生骑车上 学,其余的学生用其他交通工具上学。
A.为了了解某校2000名学生的视力情况,从中抽查1 名七年级男生的视力
B.为了了解某市中小学女生的体能情况,从该市少 年体校优秀女运动员中抽取10名进行体能测试
C.某市3万名九年级学生参加中考,为了了解他们的 数学考试情况,命题组人员从中抽取100名考生,对他 们身高进行统计分析
D.某班有50名学生,为了了解这50名学生的体重情 况,对这50名学生每人进行体重测量
李老师因为工作量大,花费时间多, 计算的结果准确。
江叶的爸爸计算工作量较小,花费时 间比较少,计算的结果不够准确。
4.对于初一(5)班的这次数学测试,江叶 的爸爸因为临时有事,请三位同学按如下 三种方法计算,你认为哪种方法计算的结 果将会和李老师的计算结果比较接近?为 什么?
理由:A方案所选取的方案太特殊.B方案所选取的样本与考察 对象无关,C方案抽取的样本比A方案,比B方案更具有代表性和 科学性.
开拓思维
电视台需要在本市调查某节目的收视率,每个看电 视的人都要被问到吗?对一所中学学生的调查能否 作为该节目的收视率?你认为对不同地区,不同年龄, 不同文化背景的人所作的调查结果会一样吗?
可以利用表格来表示:
测试序 号
1
2
3
4
5
6
7
时间(分) 7.5 7.5 7.5 7 6.8 6.5 6.3
可以利用图形来表示:
时间(分)
8
时间(分)
7.5
87
7.5
6.5
7
6.65
5.65
5.5
1 2 345 67
测试序号
(3) 据调查,某校九年级有300名学 生,其中30%的学生步行上学,50%的 学生乘公交车上学,15%的学生骑车上 学,其余的学生用其他交通工具上学。
A.为了了解某校2000名学生的视力情况,从中抽查1 名七年级男生的视力
B.为了了解某市中小学女生的体能情况,从该市少 年体校优秀女运动员中抽取10名进行体能测试
C.某市3万名九年级学生参加中考,为了了解他们的 数学考试情况,命题组人员从中抽取100名考生,对他 们身高进行统计分析
D.某班有50名学生,为了了解这50名学生的体重情 况,对这50名学生每人进行体重测量
李老师因为工作量大,花费时间多, 计算的结果准确。
江叶的爸爸计算工作量较小,花费时 间比较少,计算的结果不够准确。
4.对于初一(5)班的这次数学测试,江叶 的爸爸因为临时有事,请三位同学按如下 三种方法计算,你认为哪种方法计算的结 果将会和李老师的计算结果比较接近?为 什么?
第9讲 大学统计学课件-抽样调查
总体方差(δ2)和总体标准差(δ)——测定全及总体标 志变异程度的指标
抽样指标 —— 根据抽样总体各个单位标志值计 算的综合 指标,与全及指标相对应
抽样平均数 (x)——抽样总体中某一变量 值(观测值)的算术平均数
抽样成数(p)——具有某种标志的单位数 在抽样总体 中所占的比重 样本方差 (s2) 和样本标准差 (s)—— 说明 抽样总体标志变异程度的指标
2.5 3.0 4.0 4.5 5.0
0.98760 0.99730 0.99940 0.99993 0.99999
例 6.3 某大学有 500 人进行高等数学统考,随机抽查 20% , 所得有关成绩数据如表。 试以95.45%的概率保证:
(1)估计全部学生的平均成绩;
(2)确定成绩在80分以上学生所占的比重和估计人数。
区间推断的可靠程度(置信度)
令 x t则 t x x
x
p
p
则
t 则 p t p
式中:t — 概率自由度(极限误差为平均误 差的倍数)
x t x X x t x
依据中心极限定律,当 n≥30,抽样平均指标近似服从 正态分布,全及指标所落范围就可以用曲线所围成的面积大 小来计算。
x
s n
x
p
s2 n (1 ) n N
p(1 p) n (1 ) n N
抽样成数 p 平均误差
p(1 p) n
应用条件
n 5% N
n 5% N
影响抽样误差的因素
全及总体标志变动程度 ——与抽样误差的大小成正比关系
样本单位数
——与抽样误差的大小成反比关系 抽样组织形式 ——抽样组织形式不同,抽样误差的大小不同
《抽样调查》第五章 整群抽样-课件ppt
平方和 19 112
1 216 203 1 235 315
自由度 6 524 530
均方(方差)
sb2=3 185 sw2=2 321 s2=2 331
三、整群抽样效率分析及群的划分原则
在总体方差固定的条件下,整群抽样的精 度取决于群内相关系数,群内相关系数愈小, 即群内差异或群内方差愈大,则估计量的精度 愈高。
群间抽样,群内全查 层间全查,层内抽查
分组原则 缩小群间差异,
扩大层间差异,
扩大群内差异
缩小层内差异
分组目的 扩大抽样单元
缩小总体
分组结果 总方差=群间方差+群 总方差=层间方差+层
内方差
内方差
第二节 群大小相等的整群抽样
—对群进行简单随机抽样时的估计量与方差
❖ 一、符号说明 ➢ 总体群数 N(A) ,样本群数 n(a) ➢ 第i群中包含的总体单位数 M ➢ 总体第i群第j个单位指标值 Yij(i=1,2...N;j=1,2..M) ➢ 样本第i群第j个单位指标值 yij(i=1,2...n;j=1,2..M)
)(Yik Y Y )2
)
(
j
k)
ˆc
sb2
sb2 (M
s2 1)s2
c
M (N 1)Sb2 (NM 1)S 2 (M 1)(NM 1)S 2
c
1
S 2 S2
sb 2
M n 1
n i 1
( yi
y)2
s2
1 n
n i 1
si2
分析
c 的取值范围在[ 1 ,1]。
1 M
明群当内单元c 越0 相时似,;表明c群值完越全小是,随则机群的内;单c元值的越差大异,越表大。 当 c 0时,表示这个差异比随机分组时群内的差异
抽样调查-系统抽样培训课程(ppt 71页)
行政村编号 人数(Mi)
累计人数
抽中代码
1
103
103
100
2
432
535
3
96
631
4
246
877
723
5
84
961
6
73
1034
7
205
1239
8
168
1407
1346
9
146
1553
10
317
1870
M 0 iN 1M i 18 ,n 73 ,k 0M n062返3回
也是最简单的不等概系统抽样是PS抽样.即入样概率
与单元大小
i
M
成比例的系统抽样.令
i
N
M0 Mi
i1
表示总体所有单元大小的总和,则
i
n
Mi M0
实施不等概系统抽样最简单的方法是代码法:
下面以例7.1来说明
【例7.1】设总体由10个行政村组成,N=10,每个行政村
的人数 M i 见下表.利用PS系统抽样抽取n=3个行政村.
返回
五、系统抽样、整群抽样和分层抽样的关系
系统抽样既可以看成一种特殊的整群抽样, 又可以看成一种特殊的分层抽样。下面以一般 的等距抽样为例说明:
假设抽样间距为k,总体单元数为N=nk。将总体 的N个单元排列成k行n列,如下表所示。表中的每 一行单元都是系统抽样的一个样本。
返回
系统抽样的总体单元
12
系统抽样中最简单也是最常用的规则是等间隔 抽取,这种系统抽样又称等距抽样。
返回
二、系统抽样的一般方法 1.直线等距抽样 假设总体单元数为N,样本容量为n,N是n的整数倍.
累计人数
抽中代码
1
103
103
100
2
432
535
3
96
631
4
246
877
723
5
84
961
6
73
1034
7
205
1239
8
168
1407
1346
9
146
1553
10
317
1870
M 0 iN 1M i 18 ,n 73 ,k 0M n062返3回
也是最简单的不等概系统抽样是PS抽样.即入样概率
与单元大小
i
M
成比例的系统抽样.令
i
N
M0 Mi
i1
表示总体所有单元大小的总和,则
i
n
Mi M0
实施不等概系统抽样最简单的方法是代码法:
下面以例7.1来说明
【例7.1】设总体由10个行政村组成,N=10,每个行政村
的人数 M i 见下表.利用PS系统抽样抽取n=3个行政村.
返回
五、系统抽样、整群抽样和分层抽样的关系
系统抽样既可以看成一种特殊的整群抽样, 又可以看成一种特殊的分层抽样。下面以一般 的等距抽样为例说明:
假设抽样间距为k,总体单元数为N=nk。将总体 的N个单元排列成k行n列,如下表所示。表中的每 一行单元都是系统抽样的一个样本。
返回
系统抽样的总体单元
12
系统抽样中最简单也是最常用的规则是等间隔 抽取,这种系统抽样又称等距抽样。
返回
二、系统抽样的一般方法 1.直线等距抽样 假设总体单元数为N,样本容量为n,N是n的整数倍.
抽样调查-完整版PPT课件
分对象的方式来收集数据,根据部分来估计整体 的情况,叫做抽样调查.
2.总体: 3.个体: 4.样本:
所要考察对象的全体叫做总体.
总体中每一个考察对象叫做个体
从总体中所抽取的一部分个体叫做 总体的 一个样本.
5.样本容量:
样本的个数.
抽样调查的图表形式
抽样调查
总体
估计
样本
抽样
抽样调查是实际中应用非常广泛的 一种调查方式,它是从总体中抽取 样本进行调查,根据样本来估计总
体的一种调查。
你能再举出抽 样调查的实例
吗?
抽样调查
简单随机抽样: 总体中的每一个个体都有相等的机会被
抽到,这种方法就叫简单随机抽样
2.总体: 3.个体: 4.样本:
所要考察对象的全体叫做总体.
总体中每一个考察对象叫做个体
从总体中所抽取的一部分个体叫做 总体的 一个样本.
5.样本容量:
样本的个数.
抽样调查的图表形式
抽样调查
总体
估计
样本
抽样
抽样调查是实际中应用非常广泛的 一种调查方式,它是从总体中抽取 样本进行调查,根据样本来估计总
体的一种调查。
你能再举出抽 样调查的实例
吗?
抽样调查
简单随机抽样: 总体中的每一个个体都有相等的机会被
抽到,这种方法就叫简单随机抽样
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/12/21
浙江财精选经pp大t 学
5
第一节 概 述
2020/12/21
浙江财经大学
6
1、抽样调查概念
广义:抽取部分单位观察,并根据观察结果推断全体。
狭义:按照随机原则抽取部分单位观察,并运用数理 统计方法,由部分对总体做出数量上的推断分析。
随机抽样:保证总体中各单位具有同等机会被抽中, 客观地抽取样本,并推断总体。
2、抽样总体:从全及总体随机抽取得部分单位的集合体。
一个全及总体中,可以抽取多个抽样总体,即抽样总体 不是唯一的、确定的。一般认为,样本容量n大于或等于30 个单位数时称为大样本,小于30个单位数时称为小样本。
2020/12/21
浙江财精选经pp大t 学
10
(二)全及指标和抽样指标 1、全及指标:根据全及总体中的各单位标志值或标志特征
2020/12/21
浙江财精选经pp大t 学
3
了解
1、抽样调查的意义 2、抽样调查的适用范围 3、不同抽样方式的可能样本数目 4、抽样调查的理论依据 5、抽样平均误差的意义 6、各种抽样组织方式介绍 7、不重复抽样的必要抽样单位数计算
2020/12/21
浙江财精选经pp大t 学
4
第一节 概 述 第二节 基本概念及理论依据 第三节 抽样平均误差 第四节 全及指标推断 第五节 抽样方案设计
浙江财精选经pp大t 学
16
二、抽样调查的理论依据
1、大数定律:
该定律表明,当样本单位数n足够大时,抽样平均数
趋近于总体平均数 X ,抽样成数p趋近于总体成数P。这x
为抽样推断提供了重要依据。
2、中心极限定律:
该定律证明,不论总体服从何种分布,只要它的数学 期望和方差存在,从中抽取容量为n的样本,当n足够大,
浙江财精选经pp大t 学
12
2、抽样指标:根据抽样总体中的各单位标志值或标志特征
计算的综合指标。又称统计量,是一个随机
变量总体: 属性总体:
变量。
x x
n
S (x x)2
n 1 p n1 1 q
n s p p(1 p) pq
S称为样本标准差
q n0 n
pq 1
n1 具有某种属性的单位数, n0 不具有某种属性的单位数。
2020/12/21
浙江财精选经pp大t 学
13
(三)抽样方法和样本可能数目
1、抽样方法:从全及总体随机抽取得部分单位的取样方法。
样本数目与样本容量有关,也与抽样方法有关,样本容量 既定,则样本数目取决于抽样的方法。
根据取样的方式不同
重复抽样 不重复抽样
根据对样本的要求不同
考虑顺序抽样 不考虑顺序抽样
(一般不可避免)
返回目录
2020/12/21
浙江财精选经pp大t 学
8
第二节 基本概念及理论依据
2020/12/21
浙江财经大学
9
一、基 本 概 念 (一)全及总体和抽样总体 1、全及总体:所要认识对象的全体。它是唯一的、确定的。
变量总体: 总体中总体单位的标志为数量标志 属性总体: 总体中总体单位的标志为品质标志
2020/12/21
浙江财精选经pp大t 学
7
2、特点
1)只抽取部分单位; 2)用部分推断总体; 3)抽样遵循随机原则; 4)会产生抽样误差,但误差可以计算和控制。
3、统计误差
统计数字与各种实际数量之间的差别。
登记误差: 调查误差或工作误差,指在登记、汇总计 算过程中产生的误差。(可以避免的)
代表性误差:用部分去推断总体产生的误差。
第六章 抽样调查
2020/12/21
浙江财经大学
1
掌握 本 章 要 求
1、基本概念 2、抽样指标计算 3、抽样平均误差的影响因素及计算 4、全及指标推断:抽样极限误差计算、
置信区间计算 5、简单随机抽样重复抽样的必要抽样单
位数计算
2020/12/21
浙江财精选经pp大t 学
2
理解
1、抽样调查分类 2、抽样调查特点 3、全及总体分类及全及指标 4、抽样方式分类 5、抽样误差概念及分类 6、抽样平均误差影响因素 7、可信程度、概率度 8、抽样方案设计基本原则 9、主要的抽样组织方式种类
计算的、反映总体某种属性的综合指标。又
称统计参数。它是唯一确定的。
变量总体: X X
N
(X X )2
N
称为总体标准差
属性总体: P N1 1 Q N
Q N0 N
P P(1 P) PQ
PQ 1
N1具有某种属性的单位数, N0 不具有某种属性的单位数。
2020/12/21
浙江财精选经pp大t 学
以上结合为四种抽样方法:考虑顺序的重复抽样、考虑顺
序的不重复抽样、不考虑顺序的重复抽样和不考虑顺序的不重
复抽样。
2020/12/21
浙江财精选经pp大t 学
14
2、样本可能数目
1)考虑顺序的重复抽样
BNn k N n
2)考虑顺序的不重复抽样
ANn k N (N 1)
(N n 1) N ! (N n)!
则这个样本的平均数 x趋于正态分布。这为抽样误差的概
率估计提供了依据。
返回目录
2020/12/21
浙江财精选经pp大t 学
17
第三节 抽样平均误差
2020/12/21
浙江财经大学
18
一、抽样误差的概念和理解
1、抽样误差:来源于登记性误差和代表性误差。
登记性误差:调查误差或工作误差,指在调查、编辑、编 码、汇总过程中由于观察、测量、登记、计 算上的差错或被调查者提供虚假资料而引起 的误差。
11
属性总体成数方差公式推导:
X
F
及格
1
N1
不及格
0
N0
则属性总体的平均数
X
XF 1 N1 0 N0 N1 P
F
N1 N0
N
P
(X X )2 f
(1 P)2 N1 (0 P)2 N0
f
N1 N0
(1 P)2 P P2 (1 P) P(1 P) PQ
2020/12/21
3)不考虑顺序的不重复抽样
CNn
k
N (N 1)
(N n 1) n!
N! n!(N n)!
4)不考虑顺序的重复抽样
DNn
k
Cn N n1
(N n 1)! n!(N 1)!
2020/12/21
浙江财精选经pp大t 学
15
例如:一个盒子里有三个球,标号分别为1、2、3,现从中随 机抽取两个。即N=3,n=2:
1)考虑顺序的重复抽样
BNn k 32 9
2)考虑顺序的不重复抽样
ANn
k
3! 6 (3 2)!
3)不考虑顺序的重复抽样
DNn
k
C2 321
6
123 1 11 12 13 2 21 22 23 3 31 32 33
4)不考虑顺序的不重复抽样
CNn
k
3! 3 2!(3 2)!
2020/12/21