第5章抽样推断——2抽样误差教学教案
社会调查研究方法教案第5章 抽样

第5章抽样(8学时)第一节抽样的意义与作用一、抽样的概念1.总体总体(population)通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。
或者说一个样本就是总体的一个子集。
3.抽样明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位(sampling unit)就是一次直接的抽样所使用的基本单位。
抽样单位与构成总体的元素有时是相同的,有时又是不同的。
5.抽样框抽样框(sampling frame)又称做抽样X围,它指的是一次直接抽样时总体中所有抽样单位的。
6.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
在统计中最常见的总体值是某一变量的平均值,7.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。
样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。
二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。
本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。
但实际上广大研究人员在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。
以现代统计学和概率论为基础的现代抽样理论,以及不断发展、不断完善的各种抽样方法.正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。
第5章--抽样分布与参数估计教案资料

(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
抽样推断的一般问题抽样误差

抽样平均误差是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。
例如:假设总体包含1、2、3、4、5,五个数字。
则:总体平均数为 =(1+2+3+4+5)/5=3
现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。
如:(1+3)/2=2、(1+4)/2=2.5、(2+4)/2=3、(3+5)/2=4…
二、抽样推断的内容
参数估计:参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。
假设检验:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
三、有关抽样的基本概念
(一)总体和样本
总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。
上式可变形为:Δ=tμ(极限误差是t倍的抽样平均误差)
例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果
平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?
解:已知:N=2000n=400σx=300 =4800
则:
计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。
②抽样平均数的标准差仅为总体标准差的
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?
解:抽样单位数增加2倍,即为原来的3倍
则:
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
抽样单位数增加0.5倍,即为原来的1.5倍
社会调查研究方法教案第章 抽样

第5章抽样(8学时)第一节抽样的意义与作用一、抽样的概念1.总体总体(population)通常与构成它的元素共同定义:总体是构成它的所有元素的集合,元素则是构成总体的最基本单位。
2.样本样本(sample)就是从总体中按一定方式抽取出的—部分元素的集合。
或者说一个样本就是总体的一个子集。
3.抽样明白了总体和样本的概念,再来理解抽样的概念就十分容易了。
所谓抽样(sampling),指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择成抽取样本的过程。
4.抽样单位抽样单位(samplingunit)就是一次直接的抽样所使用的基本单位。
抽样单位与构成总体的元素有时是相同的,有时又是不同的。
5.抽样框抽样框(samplingframe)又称做抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单。
6.参数值参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。
在统计中最常见的总体值是某一变量的平均值,7.统计值统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。
样本值是从样本的所有元素中计算出来的,它是相应的总体值的估计量。
二、抽样的作用在社会研究中,抽样主要解决的是对象的选取问题,即如何从总体中选出一部分对象作为总体的代表的问题。
本章一开始我们就说过,一项社会研究若能对总体中的全部个体都进行了解,那当然是很好的。
但实际上广大研究人员在时间、经费、人力等方面遇到难题,甚至陷入困境,从而不得不在庞大的总体与有限的时间、人力、经费这二者之间寻求平衡。
以现代统计学和概率论为基础的现代抽样理论,以及不断发展、不断完善的各种抽样方法.正好适应了社会研究的发展和应用的需要,成为社会研究知识体系中必不可少的一部分内容。
第5章__抽样推断

抽样误差的影响因素
(1)总体各单位标志变异程度。 (2)样本容量的大小。 (3)抽样方法。 (4)抽样的组织形式。
四、抽样极限误差
含义:
抽样极限误差指在进行抽样估计时,根据研究对象的变 异程度和分析任务的要求所确定的样本指标与总体指标 之间可允许的最大误差范围。
计算方法:
它等于样本指标可允许变动的上限或下限与总体指标 之差的绝对值。
则:
x
n
10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解 已知: N 2000, n 400, x 4800, 300
则:
x
n
300 15(小时) 400
x
2 1 n
3002 1
400
13.42(小时)
n N
-20
400
-15
225
-5
25
0
0
-15
225
-10
100
0
0
5
25
-5
25
0
0
10
100
15
225
0
0
5
25
15
225
20
400
0
2000
样本平均数的平均数( x )
x
样本可能数目
960 16
60元
所以 (x) X
样抽样平均误差x
x (x)2
样本可能数目
2000 11.18元 16
四个工人工资分别为40、50、70、80元
抽样平均误差 x
n
15.81 11.18元 2
统计学第5章抽样推断

任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N
例
某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp
《抽样误差》优质课教学设计

《抽样误差》优质课教学设计抽样误差优质课教学设计
一、教学目标
知识目标
- 了解抽样误差的概念
- 掌握如何计算抽样误差
- 掌握如何减少抽样误差的方法
- 了解抽样误差的作用和意义
能力目标
- 培养学生对数据分析的能力
- 提高学生的数据处理和分析能力
- 培养学生的实际操作能力
- 培养学生在解决实际问题时的思维能力
二、教学重点和难点
教学重点
- 抽样误差的概念和计算方法- 如何减少抽样误差的方法
教学难点
- 抽样误差的概念和作用
- 如何采样、样本量及数据分析三、教学方法
教学手段
- 案例分析法
- 讲授结合实例演示
- 讨论交流模式
教学过程
1. 案例分析法
- 展现一个调查中的案例
- 提出问题并引导学生讨论
- 通过讨论引导学生了解抽样误差的概念和作用2. 讲授结合实例演示
- 讲解抽样误差的含义和计算方法
- 通过实例演示帮助学生更好的理解和掌握方法3. 讨论交流模式
- 引导学生针对不同情境讨论如何选择样本量- 引导学生思考如何在实际调查中减少抽样误差
四、教学评估
考核方式
- 案例分析
- 实际操作
考核内容
- 能够正确解释抽样误差的概念和作用
- 能够正确计算抽样误差
- 能够使用正确的方法减少抽样误差
- 能够在实际应用中运用所学知识解决相关问题。
教育科学研究方法005第五章 抽样方法

的研究信息丰富。这种研究对象的选择作为背景知识应该反映在
最后的研究报告中。
思考题
1.结合自己的研究实践,你认为影响抽样误差的最主要因素是什么?
为什么?
2.你使用过以下哪种抽样方法?效果如何?
(1)简单随机抽样
(2)分层随机抽样
(3)最大差异抽样
(4)典型个案抽样
3.试比较不同抽样方法的优点与不足。
4.简单随机抽样和分层随机抽样有什么不同?举例说明。
5.随机抽样中分层随机抽样方法是如何进行的?举例说明。
6.当使用非随机抽样时,典型个案抽样和极端个案抽样有什么不同?
请各举一例详细说明。
7.如何评估抽样误差?
谢谢您的观看
Thank you
的统计量,标准误的表示方法不同。最常用的是均数的标准误,计算
公式为: = (s为样本标准差)
标准误可以说明不同样本之间的变异情况,也即不同样本的参差
情况。标准误用来衡量抽样误差。标准误越小,表明样本统计量与总
体参数的值越接近,用样本统计量推断总体参数的可靠度越高。抽样
误差应与登记性误差和系统偏误相区别。
(1)常用的随机抽样方法
教育研究中常用的随机抽样方法有简单随机抽样、等距抽
样、分层随机抽样、整群抽样四种。
(2)常用的非随机抽样方法
非随机抽样也称为有目的抽样。教育研究中常用的非随机
抽样有全面抽样、最大差异抽样、极端个案抽样、典型个案抽
样等类型。
三、抽样方法的选择
选择适当的抽样方法,首先,受制于研究的目的以及对总体
总体现象分类比较明显时,采用分层随机抽样比其他方法的抽样误
《统计学原理》第5章:抽样推断

n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
《抽样推断二》课件

实例分析
1 实例解析1:某公司员工工资水平的
推断
通过抽样推断,可以估计某公司员工的平均 工资水平,从而为薪资调整提供依据。
2 实例解析2:某学校学生数学成绩的
推断
通过抽样推断,可以推断全校学生的数学成 绩水平,从而进行教学改进和学生评价。
结论
1 抽样推断在实际应用中的重要性
抽样推断在决策与预测中起着重要的作用,为实际问题提供数据支持。
标准误差
1 标准误差的概念
标准误差是样本统计量与总体参数之间的差 异的测量,用于衡量样本均值的可靠性。
2 标准误差的意义
标准误差越小,样本均值与总体参数之间的 差异越小,推断结果越可靠。
3 标准误差的计算方法
标准误差可以通过样本标准差和样本容量来 计算。
4 标准误差和样本量的关系
增加样本量可以减小标准误差,提高推断准 确性。
2 学习抽样推断的启示和反思
通过学习抽样推断,我们可以更好地理解数据分析的原理与方法,提高数据科学思维。
参考文献
参考教材:《统计学导论》第三版 相关论文:李晓峰等.《抽样推断方法及其应用研究》. 统计与决策, 2020, 42(3): 1-10.
《抽样推断二》PPT课件
本PPT课件系统讲解抽样推断的原理与应用。从抽样分布到标准误差、置信 区间、假设检验等方面进行详细介绍,结合实例分析帮助学习者理解和应用。
什么是抽样推断
抽样推断是从样本数据推断总体特征的一种方法。通过统计学原理,我们可 以利用样本数据推断总体参数的值,从而进行决策和预测。
抽样分布
假设检验
1 假设检验的基本概念
假设检验是通过对样本数据进行统计推断, 判断总体参数是否满足某种假设。
抽样误差

3n = 1 = 0 . 577 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 当样本单位数增加2倍时,抽样平均误差为原来的0.577倍 0.577 抽样单位数增加 0.5倍,即为原来的 1.5倍 倍 倍
则: µ x =
σ
1 .5 n
=
1 = 0 . 8165 1 .5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。 当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍 0.5倍时 0.8165
40.6 V乙 = ×100% = 7.8% 520
因V乙<V甲 故乙品种具有较大稳定性,宜于推广。 故乙品种具有较大稳定性,宜于推广。
第五章
抽样估计
教学目的与要求
抽样估计是抽样调查的继续, 抽样估计是抽样调查的继续,它提供 了一套利用抽样资料来估计总体数量特征 的方法。通过本章的学习, 的方法。通过本章的学习,要理解和掌握 抽样估计的概念、特点,抽样误差的含义、 抽样估计的概念、特点,抽样误差的含义、 计算方法,抽样估计的置信度, 计算方法,抽样估计的置信度,推断总体 参数的方法, 参数的方法,能结合实际资料进行抽样估 计。
例题一解: 例题一解 则:
已知: 已知: n=100
x=58 10 100
σ=10 = 1 ( 公斤 )
µ
x
=
σ
n
=
即:当根据样本学生的平均体重估计全部学生的平均 当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。 体重时,抽样平均误差为1公斤。 例题二解: 例题二解 x=4800 已知: 已知: N=2000 n=400 σ=300 σ 300 = = 15 ( 小时 ) 则: µ x = n 400
第五章抽样推断ppt课件

在99.73%概率保证程度下,估计该厂全部灯泡平均耐用时间 在919~933.8小时之间。
⑵ p=0.4%
p1p0.00 0.4 990 6 .2% 8
p
n
500
概率保证程度为0.6827时,t=1
1 0.28 %
p
p
p 0 . 4 % 0 . 2 % 0 . 8 1 % p 2 0 . , 4 % 0 . 2 % 0 . 8 6 %
第五章 参数估计
本章学习目的与要求 第一节 抽样分布 第二节 抽样误差 第三节 抽样估计方法 第四节 抽样组织设计
下一页 前往本节首页
本章学习目的与要求
目的: 学习目的在于提供一套利用抽样资料来估计总体数量特征的方法。
要求: ⒈明确抽样调查的概念、特点、作用; ⒉了解抽样误差的影响要素; ⒊掌握抽样平均误差的计算方法; ⒋掌握抽样估计方法与样本容量确定的方法; ⒌了解类型抽样、等距抽样、整群抽样的含义、特点 与适用场所。
2.不反复抽样的条件下
抽样平 :x均 n X 2 ((N N 误 1 n )); 差 N 很 当大时 x 近 n X 2(1 似 N n) 为
式中,N为总体单位数;n为样本容量;σX2 为总体方差,普通情况下是未 知,可用样本方差替代 σx 2
成数的抽样平:均 p 误np2(差 (NN1n));当 N很大时近 p似 nP 2(1为 N n)
〔1〕估计值 〔2〕抽样误差范围 〔3〕概率保证程度
上一页 下一页 前往本节首页
〔二〕总体平均数(成数)的区间估计
表
xx X xx ,
达
或Xxx ,xx
式 其中,Δx tμx 为极限误差
pp P pp,
或P pp, pp
【统计学概论】抽样推断

每包重量(克) 149以下 149—150
150—151 151以上
包数 10 20 50 20
(1)以99.73%的概率保证估计这批茶叶平均每包重量的 可能范围
(2)以同样的概率保证估计这批茶叶包装的合格率的可 能范围
• 三必要抽样数目的确定
• (一)影响抽样数目的因素
•
影响抽样数目的因素有:
(一)总体和样本
总体:调查研究的事物或现象的全体,所包含 的单位数用“N”表示。
样本:从总体中所抽取的部分个体所构成的小 的总体,当中所包含的单位数用“n”
表 示,称为“样本容量”。 样本可分为: 大样本 小样本
(二)全及指标与样本指标 (参数与统计量)
1、全及指标:说明全及总体的综合数量 特征,是唯一的,又称为“参数”。
尺度,用“ ”。
2、公式:
(1)重复抽样条件下:
(2)不重复抽样条件下:
五、抽样极限(允许)误差
1、概念:是在一定的概率保证下,用样本 指标估计全及指标时允许出现的
最 大误差,用“△”表示.
2、计算公式: 根据置信度(即可靠性,F(t)=1-α),
查正态概率分布表,查得对应的概率度t。 (在总体方差未知的情况下)
例3:P94
例4 P95
例5 P96
三、抽样误差
1、概念:是在遵循随机原则的条件下,用 样本指标来代表全及指标所不可避免 的误差。就是统计误差中的随机误差
抽样误差=样本指标 -全及指标 2、影响因素:
①抽取单位数n的多少 ②被研究标志的变异程度 ③抽样方法 ④抽样组织方式
四、抽样平均误差
1、概念:是所有可能组成的样本的抽样误 差的平均数,反映样本指标与全及指标的 平均误差程度,是衡量样本代表性大小的
《抽样误差》教学设计

《抽样误差》教学设计抽样误差教学设计引言本文档旨在设计一个关于抽样误差的教学课程,帮助学生理解和应用抽样误差的概念。
通过本课程的研究,学生将能够了解抽样误差的定义、计算方法和影响因素,并能够应用这些知识进行数据分析。
教学目标1. 了解抽样误差的定义和意义;2. 掌握抽样误差的计算方法;3. 理解抽样误差的影响因素;4. 学会应用抽样误差进行数据分析。
教学内容第一节:抽样误差的定义和意义(时长:30分钟)1. 介绍什么是抽样误差;2. 解释抽样误差的意义和作用;3. 通过实例展示抽样误差对数据分析结果的影响。
第二节:抽样误差的计算方法(时长:60分钟)1. 分类介绍常见的抽样误差计算方法,如标准误、置信区间等;2. 使用实际样本数据进行抽样误差计算的演示;3. 练:要求学生根据给定数据计算抽样误差。
第三节:抽样误差的影响因素(时长:45分钟)1. 讲解抽样误差的影响因素,包括样本大小、抽样方法等;2. 讨论不同因素对抽样误差的影响程度;3. 分组讨论:要求学生讨论在不同抽样条件下抽样误差的变化情况。
第四节:应用抽样误差进行数据分析(时长:45分钟)1. 介绍如何应用抽样误差进行数据分析;2. 案例分析:要求学生根据给定数据及其抽样误差进行相应的数据分析;3. 提供反馈和讨论学生的分析结果。
教学方法1. 授课讲解:通过简明扼要的语言介绍抽样误差的知识点;2. 实例演示:通过具体实例展示抽样误差的计算和应用方法;3. 练和作业:让学生进行抽样误差的计算和数据分析练,加深理解;4. 讨论和互动:引导学生进行小组讨论,分享观点和经验。
教学评估1. 课堂问题:在课堂上提出相关问题,考察学生对抽样误差的理解;2. 作业评估:布置作业要求学生计算抽样误差并进行数据分析,评估学生的掌握程度;3. 小组讨论:评估学生在小组讨论中的表现和思维能力。
结语通过本课程的学习,学生将能够理解抽样误差的概念、计算方法和影响因素,并能够应用抽样误差进行数据分析。
5 应用统计学(教案)-抽样推断

| x - X |≤△ x (在一定概率下) 置信度、概率保证度、 可信度、把握程度, 用(1 - α)表示。
(1 - α)与△x 是一对矛盾
实践中可根据合理置信度求相应极限误差;也可根 据极限误差范围求相应置信度
抽样极限误差: 抽样极限误差:可允许的误差范围
x
x
x
x x X x x
【例1】对某县水稻产量进行重复抽样 调查,实测400亩得平均亩产620公斤,标 准差90公斤,试计算当概率保证度为 95.45%时平均亩产的抽样极限误差。
解:重复抽样条件下抽样平均误差 400 n = 9 公斤 ∴ △x = Zα/2μx
μ
x
=
S
√
=
√
90
= 4.5 公斤
表明有95.45%的把握程度断定样本平均 亩产与全县实际平均亩产之差不超过9公斤
月工资水 平(元) 524 534 540 550 560 580 600 660
工人数
4
6
9
10
8
6
4
3
xf x = f
524*4+534*6+540*9+550*10+560*8+580*6+600*4+660*3 50
=560元
( x x ) 2 f 2 =1052.8元 f
(二)小样本条件下
根据t分布确定抽样极限误差。
若给定(1 - α),可由自由 度为(n - 1)的t分布表查得临界
值tα/2,使得(x - X)/μx在区间 (-tα/2,tα/2)的概率为(1 - α )。 即: 在给定概率(1 - α )下,抽样极限误 差△x = tα/2μx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
2020/8/14
17
抽样平均误差性质讨论
总体分布
X = 2.5
2 1.25 2 1.12
2020/8/14
.3 P ( x ) 抽样分布
.2
.1
0
1.0 1.5 2.0 2.5 3.0 3.5 4.0
x
x
x 2.5
M
2 0.625 x
2 0.79 x 18
抽样平均误差性质讨论
M
x
i1
x i
1.01.54.02.5
M
16
M
(x x)2 i
(1.02.5)2 (4.02.5)2
i1
x
M
16
0.6250.79 2 1.25
n
2
x
2020/8/14
19
抽样平均误差性质讨论
(1)样本平均数的平均数等于总体平均数
第五章 抽样推断
第二节 抽样误差 (本章的重点和难点)
2020/8/14
1
内容体系
一、抽样误差的意义
(一)抽样误差
抽样误差的理 论问题
(二)抽样误差产生的原因
(三)影响抽样误差大小的因素
二、抽样平均误差
(一)样本平均数的抽样平均误差
抽样误差的计
(二)样本成数的抽样平均误差
算和控制问题
现从总体中抽取n=2的简单随机样本
在考虑顺序重复抽样条件下,共有多少个样本?
42=16个样本
把所有可能的样本列到下面的表格中:
2020/8/14
9
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
4.抽样调查的组织形式
目标: 主观确定2、3、4来适应1,使
误差控制在我们期望的范围之内
2020/8/14
8
抽样平均误差引论 ——个别样本的抽样误差
【例】设一个总体,含有4个元素(个体),即总体单位
数 N=4 。 4 个 单 位 的 变 量 值 分 别 为 X1=1 、 X2=2 、 X3=3 、X4=4。 总体的均值=2.5
第二个观察值
观察值
1
2
3
4
所有样本的 平均抽样误 差怎样来表
示呢?
1
1.5
1.0
0.5
0
2
1.0
0.5
0
0.5
3
0.5
0
0.5
1.0
4
0
0.5
1.0
1.5
个别样本的 抽样误差
二、抽样平均误差μ
➢ 是所有可能样本的样本指标与总体指标的平均离差。
➢ μx——样本平均数的抽样平均误差 ➢ μp——样本成数的抽样平均误差
ExxX
1
(2)抽样平均误差仅为总体标准差的
n
(3)可以通过调整样本单位数n来控制抽样平均
误差的大小
σ是总体参数 客观存在不可
x
(xX)2 M
p
( pP)2 M
➢ 上式被称为抽样平均误差的理论公式,为什么? 1.总体指标未知 2.实践中只会抽取一个样本,不会抽出所有可能的样本
2020/8/14
12
抽样平均误差又称为抽样标准误
x
(xX)2 M
p
( pP)2 M
可以变
换为:
x
[xE(x)]2 M
p
[pE(p)]2 M
所有可能的n = 2 的样本(共16个)
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4
2
2,1
2,2
2,3
2,4
3
3,1
3,2
3,3
3,4
4
4,1
4,2
4,3
4,4
2020/8/14
16
抽样平均误差性质讨论
计算出各样本的均值
16个样本的均值(x)
第一个 观察值
第二个观察值
1
2
3
4
1 1.0 1.5 2.0 2.5
单 位 数 N=4 。 4 个 单 位 的 变 量 值 分 别 为 X1=1 、 X2=2、X3=3 、X4=4 。总体的均值、方差
N
Xi
X i1 2.5 N
N
(Xi X)2
2 i1
1.25
N
抽样平均误差性质讨论
从总体中抽取n=2的简单随机样本,在考虑顺序重复抽样
条件下,共有42=16个可能的样本
三、抽样极限误差
并给出参数估
抽样极限误差的含义和定义公式
计的基本思想
四、概率度t和置信度F(t)
2020/8/14
2
一、抽样误差的意义
➢ 抽样误差的大小表明抽样效果的好坏,抽样误差越小, 样本的代表性越高;反之,越低
➢ (一)抽样误差的含义
➢ 指按照随机原则,从总体中抽出样本,由于样本的结 构与总体的结构有差距,从而引起的样本指标和全及 指标之间的离差.
3.抽样方法
——重复/不重复
不重复抽样的误差<重复抽样的误差
4.抽样调查的组织形式
等距抽样、分层抽样<简单随机抽样<整群抽样
2020/8/14
7
影响抽样误差大小的因素(续)
主观 确定
1.总体各单位标志值的差异程度σ或σ2
2.样本容量的大小n
客观存在无
3.抽样方法——重复/不重复
法改变
3,4
4
4,1
4,2
4,3
4,4
计算出各样
本的均值
16个样本的均值(x)
第一个 观察值
第二个观察值
1
2
3
4
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
计算出各样本的抽样误差
16个样本的抽样误差x X
第一个
➢ 离差的正负没有区别,所以经常用绝对离差表示抽样
误差 x X
pP
➢计算抽样误差时,一般假定不存在登记性误差和系统误 差
2020/8/14
3
调查中的误差来源
调查中 的误差
登记性误差 (工作性误差)
代表性误差
是差错, 可以尽可 能地避免
系统性的 代表性误差
偶然性的 代表性误差
违反随机原则 抽样,可避免
抽样误差。 不是差错, 不可避免, 随机抽样特 有的,可以 计算并控制
2020/8/14
5
(三)影响抽样误差大小的因素
1.总体各单位标志值的差异程度
——σ或σ2
正向关系
2.样本容量的大小
——n
反向关系
lim x X n N
lim p P n N
2020/8/14
6
影响抽样误差大小的因素(续)
前提条件: E(x) X E(p) P
中心极限 定理已经 证明了
2020/8/14
13
抽样平均误差的实际计算公式
(一)样本平均数的抽样平均误差μx
1、重复抽样条件下
x
2
nn
➢可以看出,μx与σ成正比,与n的平方根成反比
2020/8/14
14
抽样平均误差性质讨论
(1)样本平均数的平均数是不是总体平均数? (2)抽样平均误差是不是样本平均数的标准差? (3)抽样平均误差与总体标准差的计算关系是什么? 【例】设一个总体,含有4个元素(个体) ,即总体