第7章-抽样推断
(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
统计学原理第七章 抽样调查

合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
《统计学原理》课件第七章抽样调查

第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序
研
究 原
总体分布 样本分布 抽样分布
理
一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析
教育研究方法 【第7章】 教育统计与测量 教学PPT课件

第1节
抽样与测量
2. 外部效度 外部效度指实验结果能普遍推论到样本的总体和其他同类现象中去的程度,即结论的普遍代表 性和适用性。 为了提高外部效度,让研究结果具有更大的应用价值、适用性和可推广性,就要考虑研究情境 的普遍性。比如,让研究场景更接近现实生活,尽可能在多样化群体中随机抽取有代表性的样本, 增大样本覆盖面和样本量,等等。 外部效度与内部效度是相互影响的。
JIAOYUYANJIU FANGFA
目录
CONTENTS
PART 01
抽样与测量
PART 02
描述统计
PART 03
推断统计
第7章 教育统计与测量
第1节 抽样与测量 第2节 描述统计 第3节 推断统计
第1节
通过本章的学习,你将能够
● 掌握抽样的策略和技巧; ● 理解信度、效度、描述性统计、推断性统计等术语; ● 理解并掌握测量及相关统计的分析技巧; ● 学会对量的研究数据进行描述性统计和推断性统计分析; ● 理解统计分析中常见的问题以及解决途径。
第1节
抽样与测量
案例7-1 抽样的表述方法
采用三阶段随机整群抽样的方法对中国中部省会城市的所有初中一、二年级(7年级和8年 级)的儿童进行抽样。第一阶段以该市17个区的经济、教育发展水平以及人口数量为指标,采 用聚类分析得到四个类别,从每个类别中随机抽取一个区。第二阶段是对入样区的所有学校抽 样。根据学校所在的位置、学校性质、学校类型及经费等级四个方面进行分类并随机抽样。第 三阶段是对入样学校的班级进行抽样。入样班级的儿童、儿童的家长、班级对应的教师、学校 对应的校长都填写了相应的问卷。
效度是指研究中所获得的研究结果的正确度以及可推广程度。 研究结论的正确程度反映的是研究的内在效度,是指研究结果与研究目标的吻合度和达成度。 研究的外在效度就是指研究结果的可推广程度。
第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第7章 《抽样推断》练习题

《第7章抽样推断》练习题一、单项选择题1、对某市居民生活状况作了一次抽样调查, 据样本资料计算, 平均每居民实际月生活费用76元, 抽样平均误差3元, 调查队推断市居民实际月生活费用在70—82之间, 这一推断的可靠程度为:A、68.27%B、95%C、95.45%D、99.73%2、在一定的抽样平均误差条件下,A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度3、按设计标准,某自动食品包装机所包装食品的平均每袋重量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验4、一所较大规模的大学教务部决定调整课程时间安排,以便提供足够的时间使大家可以为上课做好准备。
到目前为止,教务部认为课间安排20分钟的时间足够了。
表述零假设H0和备择假设H1A、H0:µ=20 H1:µ≠20B、H0:µ≥20 H1:µ<20C、H0:µ≤20 H1:µ>205、当我们根据样本资料对零假设作出接受或拒绝的决定时,可能出现的情况有:①当零假设为真时接受它;②当零假设为假时接受它;③当零假设为真时拒绝它;④当零假设为假时拒绝它.A、①B、②C、①②③D、①②③④6、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少?A、53.3B、1.65C、720D、13207、在其他条件不变的情况下,要使抽样误差减少1/3,则样本量必须增加多少倍?A、1/3B、1.25C、3D、9二、多项选择题1、推断统计学研究的主要问题是A、如何科学地确定总体B、如何科学地从总体中抽取样本C、怎样控制样本对总体地代表性误差D、怎样控制总体对样本地代表性误差E、由所抽取地样本去推断总体特征2、在抽样推断中,样本单位数的多少取决于A、总体标准差的大小B、允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样方法和组织形式3、抽样推断的概率度、可靠性和精确度的关系为()A、概率度增大,估计的可靠性也增大B、概率度增大,估计的精确度下降C、概率度减小,估计的精确度下降D、概率度减小,估计的可靠性增大E、估计的可靠性增大,估计的精确度也增大3、影响抽样平均误差大小的因素有A、样本各单位标志值的差异程度B、总体各单位标志值的差异程度C、样本单位数D总体单位数E、抽样方法4、在其他条件不变时,抽样估计的置信度(1-α)越大,则:A、允许误差范围越大B、允许误差范围越小C、抽样估计的精确度越高D、抽样估计的精确度越低E、抽样估计的可靠性越高5、在假设检验中,当我们作出拒绝原假设而接受备择假设的结论时,表示A、有充足的理由否定原假设B、原假设必定是错误的C、犯错误的概率不大于αD、犯错误的概率不大于βE、在原假设为真的假设下发生了小概率事件三、判断改错题1、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。
第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制
ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n
第7章 抽样推断

D 所调查的200名学生
正确答案是( C )
同步训练
8. 某大学的一位研究人员希望估计该大学本科生 平均每月的生活费支出,为此,他调查了200名学 生,发现他们每月平均生活费支出是500元。该研 究人员感兴趣的参数是( ) A 该大学的所有学生 B该大学所有大学生的月平均生活费支出 C该大学所有的在校本科生
经常采用的样本指标主要有样本均值、样本比例和样 本方差。
(二)总体指标和样本指标
样本均值:
未分组 分 组
x x2 xn x 1 n
x
i 1
n
i
样本比例:
x f x f
i i
n
i
样本方差:
n1 p n
S
S
2
未分组
2
(x
i
i
x)2
n 1
x)2 fi
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
二、抽样推断的特点 • 按随机原则抽取样本
每个单位都有 相同的被抽中 的机会,哪个单 位被抽中,由随 机因素确定,完 全排除抽样者 的个人主观意 志
• 运用概率论的理论和方法,用样本指标来推断 总体指标。 • 推断的误差可以事先计算和控制。
N! M n!( N n)!
M
( N n 1)! n!( N 1)!
(五)抽样组织方式
简单随机抽样
类型抽样
整群抽样 等距抽样 多阶段抽样
抽样的组织方式
简单随机抽样
简单随机抽样也叫纯随机抽样。它是按照随机原则直接从总体 N个单位中抽取n个单位作为样本,然后通过对样本单位的调
经济统计学第7章抽样调查

参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15
第七章市场调查方式(抽样技术)

具体做法: A、抽签法(有重复和不重复抽样两种选择)
先给调查总体的每个单位编号,然后将号码写在卡片上搅拌均匀, 任意从中抽选,抽到一个号码,就对上一个单位,直到抽足预先 规定的项目为止。适用于总体单位较少的情况。
B、乱数表(随机数表)法 优点:完全排除了抽样中主观因素的干扰、简单易行 缺点:在调查总体单位差异小(同质总体)情况下,调查结果 具有代表性,否则会产生较大误差 适用范围:总体单位明确、总体单位数较少、总体各单位间差 异程度较小
14
1
合 计
1 30
50
20
100
第四步:具体抽样 优点:较简单易行、准确度较高;节省费用, 能较快地获得市场信息 缺点:若调查者对调查总体不了解,会产生较 大误差 适用范围:调查者对调查总体了解
(二)随机抽样
严格按随机原则从调查总体中 抽取样本单位的调查方式。
1、简单随机抽样(纯随机抽样)
含义:在总体单位中,不进行任何有目的 的选择,完全按随机原则抽取样本单位 的方式。
具体做法:
第一步:对样本总体进行分类; 第二步:确定每类样本的分配数额; 第三步:编制样本交叉配额分配表; 第四步:具体抽样 仍以上例为例,采用相互控制配额抽样 第一步、第二步(略) 第三步:编制样本交叉配额分配表
高收入 民族 汉 族 回 族 其他民族
中收入
低收入
合计
21 8
35
14 6 0
70 28 2
2、分层随机抽样(类型随机抽样、分类 随机抽样)
( 1 )含义:将总体单位按某一标准(有关标 志)分组,然后在各个类型组中,按随机原 则抽取样本单位的方式。 (2)具体做法: 第一步:选择有关标志对总体进行划分; 第二步:确定各组的样本分配数额 方法:等比例和不等比例 等比例:ni = n× (Ni / N) 不等比例: ni = n×(Ni· Si /∑Ni· S i)
徐国祥《统计学》(第2版)配套题库【章节题库】第7章~第9章 【圣才出品】

十万种考研考证电子书、题库视频学习平台
第 7 章 抽样和抽样分布
一、单项选择题 1.进行抽样推断时,必须遵循的基本原则是( )。 A.准确性原则 B.标准化原则 C.随机性原则 D.可靠性原则 【答案】C 【解析】抽样推断是指按照随机的原则从调查总体中抽取一部分样本单位进行观察,并 以样本指标对总体指标做出具有一定可靠性的估计和推断,从而达到对调查总体的认识的一 种统计方法。
2 / 65
圣才电子书 十万种考研考证电子书、题库视频学习平台
5.一般说来,使样本单位在总体中分布最不均匀的抽样组织方式是( )。 A.简单随机抽样 B.分层抽样 C.等距抽样 D.整群抽样 【答案】D
6.下列关于样本平均数和总体平均数的说法,正确的是( )。 A.前者是一个确定值,后者是随机变量 B.前者是随机变量,后者是一个确定值 C.两者都是随机变量 D.两者都是确定值 【答案】B
A.类型抽样 B.等距抽样 C.整群抽样 D.多阶段抽样 【答案】A 【解析】类型抽样即分类抽样或分层抽样,它是指先将总体按主要标志进行分组,再按
4 / 65
圣才电子书 十万种考研考证电子书、题库视频学习平台
随机原则从各组中抽取样本单位的一种抽样组织形式。
10.通常所说的大样本是指样本容量( )。 A.大于等于 30 B.小于 30 C.大于 10 D.在 10~20 之间 【答案】A
2.抽样调查中,无法避免和消除的是( )。 A.登记误差 B.系统性误差 C.测量工具误差 D.随机误差 【答案】D 【解析】随机误差是指遵守了随机原则,但可能抽到不同的样本而产生的误差。随机误 差在抽样调查中是不可避免的,是偶然的代表性误差。这种误差的大小可以计算并加以控制。
抽样方法

5. 修正的概率抽样
修正的概率抽样是概率抽样与非概 率抽样的结合。主要用于多阶段抽 样,前几个阶段用概率抽样,最后 用非概率抽样,一般是配额抽样。
实用文档
21
二、概率抽样
在需要根据样本的结果对总体进行推断时 应使用概率抽样。
最简单的概率抽样设计是等概率抽样,包 括简单随机抽样和系统抽样。
不等概率抽样比较复杂且大多需要辅助抽 样框信息。不等概率抽样有:概率与大小 成比例的抽样,整群抽样,分层抽样,多 阶段抽样和多相抽样。不等概率抽样通常 用来提高抽样设计方案的效率,或降低抽 样费用。
简单随机抽样的缺点是:
抽样框中即使有现成的辅助信息也不 加利用,使得估计的统计效率较其他 利用辅助信息的样本设计低;
由于样本在总体中的地理分布范围比 较广,如果采用面访,费用较高;有 可能抽到一个“差的”样本;
如果不用计算机,而用随机数表抽一 个大样本将十分单调劳神。
实用文档
31
系统抽样(SYS)
能计算出各个单元的入样概率。从而
无法得到总体目标量的可靠估计值及
其抽样误差估计值。
实用文档
4
非概率抽样能用在下面几个方面的研 究中:
用来形成一种想法; 作为设计开发概率抽样调查的初始步骤; 在后续步骤中帮助理解概率抽样调查结
果。 有时,非概率抽样是唯一可行的选择。
例如,在医学实验中,采用志愿者抽样 可能是取得数据的唯一途径。
其抽样单元是从总体中等距抽出的。 它需要一个抽样间距和一个随机起点。
抽样间距是k=N/n,随机起点r是介 于1到k之间的一个随机数。 被抽中的单元是:r,r十k,r+2k, r+3k,…,r+(n-1)k。
实用文档
建筑统计各章节习题及答案7

第七章抽样推断习题及答案一、名词解释1、抽样推断:2、抽样平均误差:3、极限误差:4、重复抽样:5、区间估计:5、类型抽样:二、填空题1、抽样推断是利用________推断________的一种统计分析方法。
2、在简单随机抽样条件下,重复抽样的抽样平均误差是不重复抽样的________倍。
3、在缺少总体方差的资料时,可以用________来推断总体方差,计算抽样平均误差。
4、扩大极限误差的范围,可以________推断的可靠程度;缩小极限误差的范围,则会________推断的可靠程度。
三、单项选择题1、抽样必须遵循的基本原则是()A、灵活性原则B、可靠性原则C、准确性原则D、随机原则2、抽样平均误差是()A、登记性误差B、代表性误差c、系统性误差 D、随机误差3、抽样平均误差和极限误差的关系是()A、抽样平均误差大于极限误差B、抽样平均误差等于极限误差C、抽样平均误差小于极限误差D、抽样平均误差可能大于、等于或小于极限误差4、在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本单位()A、扩大为原来的2倍B、扩大为原来的4倍C、缩小为原来的1/2倍D、缩小为原来的1/4倍5、一般来说, 在抽样组织形式中,抽样误差较大的是()A、简单抽样B、类型抽样C、等距抽样D、整群抽样6、根据抽样的资料, 一年级优秀生比重为20%, 二年级为10%,在人数相等时,优秀生比重的抽样误差()A、一年级较大B、二年级较大C、相同D、无法判断7、根据重复抽样的资料, 甲项目工人工资方差为25,乙项目为100,乙单位人数比甲单位多3倍, 则抽样误差()A、甲单位较大B、无法判断C、乙单位较大D、相同8、一个全及总体()A、只能抽取一个样本B、可以抽取多个样本C、只能计算一个指标D、只能抽取一个单位9、最符合随机原则地抽样组织形式是()A、整群抽样B、类型抽样C、阶段抽样D、简单随机抽样四、多项选择题1、抽样估计的抽样平均误差()A、是不可以避免的B、是可以改进调查方法消除的C、是可以事先计算的D、只有调查结束之后才能计算E、大小是可以控制的2、影响样本单位数目的因素有()A、推断的可靠程度B、抽样方法C、抽样组织方式D、允许误差的大小E、总体各单位标志变异程度3、提高推断的可靠程度, 可以采取的办法是()A、扩大估计值的误差范围B、缩小估计值的误差范围C、增大概率度D、降低概率度E、增加样本单位数4、影响抽样平均误差的因素有()A、总体标志变异程度B、抽样方法C、样本单位D、抽样组织形式E、样本指标值的大小5、和重复抽样相比,不重复抽样的特点是()A、总体单位数在抽选过程中逐渐减少B、总体中每个单位都有被多次抽中的可能C、总体中每个单位没有被多次抽中的可能D、样本可能数目要多些E、样本可能数目要少些6、总体标准差未知时, 常用的替代办法有()A、用过去调查的同类问题的经验数据B、用样本的标准差C、凭调查者经验确定D、用总体方差E、大致确定7、在抽样组织方式中,为提高样本对总体的代表性的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样8、在抽样组织方式中,为简化抽样工作的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样五、简答题1、影响抽样平均误差的因素有哪些?2、影响必要样本单位数目的因素有哪些?3、抽样平均误差、抽样极限误差和概率度三者之间是何关系?六、计算分析题1、某学校英语三级等级考试,学生成绩呈正态分布,根据经验标准差为10分,今随机抽样100名同学,得平均分为65分,当概率保证程度为95.45%时,推断该校同学的平均成绩的范围。
第7章抽样调查

二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E
如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u
1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。
第7章 抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。
它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。
是一种灵活快捷的调查方式。
2.抽样调查有全及总体与样本总体之区分。
样本容量小于30时一般称为小样本。
对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。
样本可能数目与样本容量有关也与抽样的方法有关。
抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。
3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。
正态分布的密度函数有两个重要的参数(σ;x )。
它有对称性、非负性等特点。
中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。
推出了样本分布的标准差为:1--=N n N n x σμ。
4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。
无偏性、一致性和有效性是抽样估计的优良标准。
抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。
抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。
在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。
在通常情况下总体的方差是未知的,一般要用样本的方差来代替。
把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。
μt =∆,用抽样的平均误差来度量抽样的极限误差。
把抽样估计的把握程度称为抽样估计的置信度。
抽样的极限误差越大,抽样估计的置信度也越大。
抽样估计又可区分为点估计和区间估计。
河南财经政法大学统计学练习题 抽样推断习题

第七章抽样推断习题一、单项选择题1、抽样推断的主要目的是()①对调查单位作深入研究②计算和控制抽样误差③用样本指标来推算总体指标④广泛运用数学方法2、抽样调查与典型调查的主要区别是()①所研究的总体不同②调查对象不同③调查对象的代表性不同④调查单位的选取方式不同3、按随机原则抽样即()①随意抽样②有意抽样③无意抽样④选取样本时要求总体中每个单位都有相等的机会或可能性被抽中4、抽样应遵循的原则是()①随机原则②同质性原则③系统原则④及时性原则5、下列指标中为随机变量的是()①抽样误差②抽样平均误差③允许误差④样本容量6、下列指标中为非随机变量的是()①样本均值②样本方差③样本成数④样本容量7、样本是指()①任何一个总体②任何一个被抽中的调查单位③抽样单元④由被抽中的调查单位所形成的总体8、从单位总量为20的总体中,以简单随机重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个9、从单位总量为20的总体中,以简单随机不重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个10、抽样误差是指()①在调查过程中由于观察、测量等差错所引起的误差②在调查中违反随机原则出现的系统误差③随机抽样而产生的代表性误差④人为原因所造成的误差11、抽样极限误差是()①随机误差②抽样估计所允许的误差的上下界限③最小抽样误差④最大抽样误差12、抽样平均误差就是()①样本的标准差②总体的标准差③随机误差④样本指标的标准差13、在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者14、在其它条件相同的情况下,重复抽样的估计精确度和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者15、抽样估计的可靠性和精确度()①是一致的②是矛盾的③成正比④无关系16、抽样推断的精确度和极限误差的关系是()①前者高说明后者小②前者高说明后者大③前者变化而后者不变④两者没有关系17、点估计的优良标准是()①无偏性、数量性、一致性②无偏性、有效性、数量性③有效性、一致性、无偏性④及时性、有效性、无偏性18、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()①增加8倍 ②增加9倍 ③增加45倍 ④增加2.25倍 19、在简单随机重复抽样下,欲使抽样平均误差缩小31,则样本容量应( ) ①增加8倍 ②增加9倍③增加2.25倍 ④的确应考虑抽样方法和抽样组织形式等20、当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )①51% ②49%③70% ④30%21、在500个抽样产品中,有95%的一级品,则在简单随机重复抽样下一级品率的抽样平均误差为( )①0.9747% ②0.9545%③0.9973% ④0.6827%22、若样本均值为120,抽样平均误差为2,则总体均值在114—126之间的概率为( ) ①0.6827 ②0.90③0.9545 ④0.997323、若有多个成数资料可供参考时,确定样本容量或计算抽样平均误差应该使用( ) ①数值最大的那个成数 ②数值最小的那个成数③0.5 ④数值最接近或等于0.5的那个成数24、影响分类抽样平均误差大小的主要变异因素是( )①类内方差 ②类间方差③总体方差 ④样本方差25、影响整群抽样平均误差大小的主要变异因素是( )①群内方差 ②群间方差③总体方差 ④样本方差26、当有多个参数需要估计时,可以计算出多个样品容量n ,为满足共同的要求,必要的样本容量一般应是( )①最小的n 值 ②最大的n 值③中间的n 值 ④第一个计算出来的n 值27、抽样时需要遵循随机原则的原因是()①可以防止一些工作中的失误②能使样本与总体有相同的分布③能使样本与总体有相似或相同的分布④可使单位调查费用降低二、多项选择题1、抽样推断的优点()①时效性强②更经济③能够控制抽样估计的误差④适用范围广⑤无调查误差2、抽样推断适用于()①具有破坏性的场合②用于时效性要求强的场合③对于大规模总体和无限总体的场合进行调查④用于对全面调查的结果进行核查和修正⑤不必要进行全面调查,但又需要知道总体的全面情况时3、同其它统计调查比,抽样推断的特点是()①比重点调查更节省人、财、物力②以部分推断总体③采用高率估计的方法④可以控制抽样误差⑤按随机原则抽选样本4、目标总体与被抽样总体相比()①前者是所要认识的对象②后者是抽样所依据的总体③两者所包含的单位数有时相等,有时不等④两者所包含的单位数相等⑤两者是不同的概念,所包含的单位数不等5、重复抽样和不重复抽样差别有()①可能的样本数目不同②抽样误差的大小不同③抽样误差的计算公式不同④前者属于随机抽样,后者属于非随机抽样⑤两者适用的情况不同6、抽样推断()①是科学的资料收集方法②是科学的推断方法③是非全面调查④典型调查的一种7、抽样推断中哪些误差是可以避免的()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④因抽样破坏随机原则而造成的方向性偏差8、抽样误差中不包括()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④由于工作失误所造成的误差9、样本平均数的()①分布在大样本下服从或近似服从正态分布②平均数是总体平均数③方差是总体方差④平均数是随机变量⑤分布与总体的分布形式相同10、抽样平均误差是()①所有可能抽样误差的一般水平②总体标准差③估计量的标准差④无偏估计量的标准差⑤样本的标准差11、影响抽样平均误差的主要因素有()①总体的变异程度②样本容量③重复抽样和不重复抽样④样本各单位的差异⑤估计的可靠性和准确度的要求12、计算抽样平均误差时,若缺少总体方差和总体成数,可用的资料有()①过去抽样调查得到的相应资料②小规模调查得到的资料③样本资料④过去全面调查得到的资料⑤重点调查得到的资料13、极限误差是()①衡量估计准确度的尺度②大于抽样平均误差的确定数值③是满足一定可靠性要求的最大抽样误差的绝对值④最大抽样误差⑤小于抽样平均误差的确定数值14、区间估计的要素是()①点估计值②样本的分布③估计的可靠度④抽样极限误差⑤总体的分布形式15、抽样估计的优良标准主要有()①无偏性②一致性③可靠性④有效性⑤及时性16、影响必要样本容量的因素主要有()①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样④样本的差异程度⑤估计的可靠度17、假设检验()①用了反证法的思想,和数学中的反证法是有区别的②用了反证法的思想,和数学中的反证法是没有区别的③可能会犯第一类型错误,即“受伪”错误④可能会犯第二类型错误,即“弃真”错误⑤在样本容量固定时,犯“弃真”和“受伪”错误的概率是相互制约的,无法使它们同时尽可能地小18、类型抽样的优点是()①只适合对各类分别进行估计②只适合对总体进行估计③既可以对各类分别进行估计,也可以对总体进行估计④估计的效果较好,在实践中广泛应用⑤可使总体的方差减少19、系统抽样()①按无关标志排队的系统抽样,可看作不放回的简单随机抽样②按有关标志排队的系统抽样,其效果要高于不放回的简单随机抽样③按有关标志排队的系统抽样,其效果要低于不放回的简单随机抽样④要避免抽样间距和现象本身的周期性节奏相重合⑤在常见的抽样方法中,它的误差一定是最小的20、整群抽样中的群与分类抽样中的类相比()①两者相同②两者不同③两者的划分原则正好相反④要求群内差异大⑤要求类内差异大三、填空题1、抽样推断就是根据( )的信息去研究总体的特征。
07章抽样调查基础知识

1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100
不重复抽样平均误差为: x
400(1 100 ) 1.99(小时) 100 10000
第七章 抽样调查

第七章抽样调查一、抽样原理1、定义抽样调查是按照随机原则从被研究对象的总体中(全部研究对象)抽取一部分单位进行调查观察,并运用数理统计的原理,以调查所得的指标(实际观察数值)来推断被研究总体的相应指标达到对总体的认识。
简言之,抽样调查就是从总体中抽取一定数量的样本来推断总体的情况。
2、抽样调查的特点⑴随机原则。
所谓随机原则,就是说在我们所研究的总体中,每一个个案都有被选中、抽取的机会。
也即我们在总体中抽样时,哪一个个案能被抽取,哪一个个案不能被抽取,不是人为主观决定的,而完全是偶然碰机会的。
⑵从数量上推算全体。
抽样调查是抽取部分个案进行调查,但它的主要目的不是为了了解这部分单位本身,而是为了据此从数量上推算全体。
⑶抽样调查使我们有可能用更少的人力、物力、时间、费用达到对总体的认识,而且可以起到丢普查资料进行修正补充,提高大范围调查的准确程度的作用,因而在理论上和方法上都具有重要的意义。
3、几个概念⑴总体也称为母体、一般总体等。
是指具有某种统计特征的一类事物的全部个案。
也即,研究对象的全体称为总体。
例如,某批产品、某类病人、某个生产过程等。
总体的单位数通常用符号N来表示。
⑵个体也称为个案、元素。
组成总体的每个元素称为个体。
有时也称具有某种统计特征的每一个对象为个案构成一个总体的个案,可以是人或物,也可以指个性、心理反应等。
⑶样本也称为抽样总体、样本总体等从总体中抽取一部分代表进行研究分析时,这一部分被抽取的个案称为总体中的一个样本。
也就是说,从总体中抽取的若干个案所组成的群体,称之为样本。
总体是大群体,样本是小群体。
在社会研究中,资料的收集工作往往是在样本中完成的。
样本的单位数(即样本容量)常用符号n来表示。
⑷抽样从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽样样本的过程。
(5)抽样单位就是一次直接的抽样所使用的基本单位。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
为 P 的 ⒌ 样本单位是非标志的标准差: 无偏估计
n n sp p1 p pq n 1 n 1
⒍ 样本单位是非标志的方差: n n 2 sp p 1 p pq n 1 n 1
为 的 无偏估计
2 P
当样本容量很大时,1/n,与1/(n-1)相差不 大,样本方差的分式,可以直接除以n, 与总本的方差计算分式保持一致。
p
P 1 P n 时,有 当N≥500
N n N n n 1 N 1 N N
不重复抽样时:
p
P1 P N n n N 1
P1 P n 1 n N
抽样平均误差的计算公式
关于总体方差的估计方法
0
100 225 0 25 225 400 2000
• 样本平均数的平均数:
960 E( ) 60 可能的 样本数目 16
• 抽样平均误差
ux
2 [ E ( ) ]
K
2000 11 .18 16
ux
n
15.81 2
11.18
抽样平均误差的计算公式
X
m i 1
i
X
f
2
i
⒋ 总体成数:
N0 N1 P ,Q 1 P N N
⒌ 总体是非标志的标准差:
P P1 P PQ
当P Q 0.5时, P有最大值
⒍ 总体是非标志的方差:
P P1 P PQ
2
指根据样本单位的标志值计算的用 样本指标 以估计和推断相应总体指标的综合 指标,又被称为估计量或统计量
AA BA CA DA
AB BB CB DB
AC BC CC DC
AD BD CD DD
第八章 抽样推断
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第三节 抽样平均误差
一、抽样误差的概念 二、抽样平均误差 三、抽样极限误差
指样本估计量与总体参数之间数量 抽样误差 上的差异,仅指由于按照随机原则 抽取样本而产生的代表性误差,不 包括登记性误差和系统偏差
序号 1 2 3 4 5 样本变量 ( 1) 40 40 40 40 50 ( 2) 40 50 70 80 40 40 45 55 60 45 样本平均数 平均数离差 -20 -15 -5 0 -15
E
离差平方
[ E ]2
400 225 25 0 225
6
7 8 9
50
用过去同类问题全面调查或抽样调查的经 验数据代替; 用样本标准差 s代替总体标准差 ,用 s p 代替 P 。
x x 或 x x f n 1 f 1
2 2
n p1 p n 1
影响抽样误差的因素
总体各单位的差异程度(即标准差 越大,抽样误差越大; 的大小): n越大,抽样误 样本单位数的多少: 差越小; 抽样方法:不重复抽样的抽样误差 比重复抽样的抽样误差小; 抽样组织方式:简单随机抽样的误 差最大。
2
n
1
为 的无偏估计
f
i 1
m
i
1
x
m i 1
i
x fi
2
⒊ 样本单位标志值的方差:
2 1 2 s x i x 或s n 1 i 1 2 n
1
为 的无偏估计
2
f
i 1
m
i
1
x
m i 1
i
x fi
2
⒋ 样本成数:
n0 n1 p ,q 1 p n n
支持该候选人的选民 占全部选民的比例: 160/400=40%
★ 第一节 抽样推断的基础理论
第二节 抽样误差 第三节 抽样估计 第四节 样本容量的确定
第七章 抽样推断
第一节
抽样估计的意义
★ 一、抽样估计的定义
二、抽样估计的特点 三、抽样估计的运用 四、抽样估计的一般步骤
抽样估计
按照随机原则 从调查对象中抽取一部 分单位进行调查,并以调查结果对总体 数量特征作出具有一定可靠程度的估计 与推断,从而认识总体的一种统计方法
考虑顺序的重复抽样 考虑顺序的不重复抽样
AA BA CA DA
AB AC AD BB BC BD CB CC CD DB DC DD
AA BA CA DA
AB BB CB DB
AC BC CC DC
AD BD CD DD
不考虑顺序的重复抽样
不考虑顺序的不重复抽样
AA BA CA DA
AB AC AD BB BC BD CB CC CD DB DC DD
s2 1 N X i XFra bibliotek或 n i 1
1
fi
i 1
m
X
m i 1
i
X fi
2
N 2 1 2 s X i X 或 2 n i 1
1
fi
i 1
m
X
m i 1
i
X fi
2
sp
n p1 p pq n
sp
计 算 样 本 统 计 量
推 断 总 体 参 数
第二节 抽样调查的基本概念及 理论依据
• ★ 一、全及总体和抽样总体 • 二、全及指标和抽样指标 • 三、抽样方法和样本的可能数目 • 四、 抽样调查的理论依据
全及总体
•研究对象的全体,即第一章中 学过的总体。
全及总体中所包括的单位数一般用N表示。 1、 有限总体 2、无限总体
特点
同一总体中每个单位被抽中的机会并 不均等,在连续抽取时,每次抽取都 不是独立进行
是最为常用的抽样方法,用于无限总 体和许多有限总体样本单位的抽样。
考虑顺序的抽样 对样本的 要求不同
AB≠BA
不考虑顺序的抽样 AB=BA 考虑顺序的重复抽样 Bn N = N n
两种分 类交叉
考虑顺序的不重复抽样
2、同时,有1500人参加了公司培训,则 参加公司培训计划的比例为: P =1500/2500=0.60 上述总体均值、总体标准差、比例均称为总 体的参数
参数是总体的数值特征
如:例3中的中层干部平均年薪,年薪标准差及受培训 人数所占比例均为该公司中层干部这一总体的参数。
●抽样估计就是要通过样本而非总体来估计总体参数。
50 50 70
50
70 80 40
50
60 65 55
-10
0 5 -5
100
0 25 25
10
11 12 13 14 15 16 合计
70
70 70 80 80 80 80 -----
50
70 80 40 50 70 80
60
70 75 60 65 75 80 960
0
10 15 0 5 15 20 ---
2
n p1 p pq n
例3:某大公司人事部经理整理其2500个中层干部 的档案。其中一项内容是考察这些中层干部的 平均年薪及参加过公司培训计划的比例。 总体:2500名中层干部 如果:上述情况可由每个人的个人档案中得知, 可容易地测出这2500名中层干部的平均年薪及 标准差。 假如:1:已经得到了如下的结果: 总体均值: =51800 总体标准差: =4000
抽样估计的现实应用
例1 一汽车轮胎制造商生产一种被认为寿命更 长的新型轮胎。
120个 样本
测试
平均里程: 36,500公里
推断
新轮胎 平均寿命: 36,500公里
例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众 占全部登记投票人总数的比例。由于时间及财力的限制: 400个 样本 支持人数: 160 推断
设样本中 n 个样本单位某项标志的标志值 分别为 x1 , x2 , xn ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n0 个,则
⒈ 样本平均数(又叫样本均值):
x
x
i 1
n
i
n
或x
x
i 1 m i 1
m
i
fi
i
f
为自由度 ⒉ 样本单位标志值的标准差:
1 s x i x 或s n 1 i 1
x1 X
p1 P
x2 X
p2 P
说 明
对于任何一个样本,其抽样 误差都不可能测量出来 抽样误差的大小可以依据概 率分布理论加以说明
更大样本 容量的抽 样分布
某个样本 容量的抽 样分布
X
x n
根据所有可能样本的样平均数或 样本成数计算的标准差,即每一 抽样平均 次抽样的样本指标和总体指标之 间的平均差异程度。即样本估计 误差 量的标准差
总体平均数
X 40 50 70 80 X 60 N 4
2 ( X X )
标 准 差
N (40 60) 2 (50 60) 2 (70 60) 2 (80 60) 2 4
1000 4 15.81
现用重复抽样的方法从4人中抽取2人构成样本,求样本的平均数,用以代表 4人总体的平均水平,所有可能的样本及样本的平均工资列表如下:
325009260 / 29 3347 .72
p 19 / 30 0.63
抽样方法 重复抽样
抽出 个体 又被称作重置抽样、有放回抽样 登记 特征 放回 总体 继续 抽取