第五章 抽样估计学习指导
第5章--抽样分布与参数估计教案资料
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
9
9,1
9,2
9,3
9,4
9,5
9,6
9,7
9,8
9,9
9,10
(5)
(5.5)
(6)
(6.5)
(7)
(7.5)
(8)
(8.5)
(9)
(9.5)
10
10,1
10,2
10,3
10,4
10,5
10,6
10,7
10,8
10,9
10,10
数是 ,标准差是 ,从这个总体中抽出一 个容量是 n 的样本,则样本平均数 X 也服从 正态分布,其平均数 E( X ) 仍为 ,其标准
差为 。 X 5-19
从正态分布的再生定理可以看出,只要总体 变量服从正态分布,则从中抽取的样本,不管n 是多少,样本平均数都服从正态分布。但是在 客观实际中,总体并非都是正态分布。对于从 非正态分布的总体中抽取的样本平均数的分布 问题,需要由中心极限定理来解决。
第5章--抽样分布与参数估计
第一节 抽样的基本概念与数学原理
一、有关抽样的基本概念 二、大数定理与中心极限定理
5-2
一、有关抽样的基本概念
(一)样本容量与样本个数 1.样本容量。样本是从总体中抽出的部分
单位的集合,这个集合的大小称为样本容量, 一般用n表示,它表明一个样本中所包含的单 位数。
lim
n
1 n
p
n
i 1
X
i
1
(5.5)
5-17
大数定理表明:尽管个别现象受偶然因 素影响,有各自不同的表现。但是,对总体 的大量观察后进行平均,就能使偶然因素的 影响相互抵消,消除由个别偶然因素引起的 极端性影响,从而使总体平均数稳定下来, 反映出事物变化的一般规律。
统计学原理(抽样估计)
统计学原理第五章 抽样估计一、抽样推断概念:在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计方法<部分推断总体>。
二、抽样推断的几个范畴1. —X 平均数2. σ标准差3. N 总体4. n 样本5. P 成数6. Z 概率度 三、抽样方法重复抽样(回置抽样) 不重复抽样(不回置抽样) 四、区间估计A.重复抽样 例: 解:已知N = 1000 n = 100 —X = 79 σ =10 F(Z) = 2(0.9545)1. 平均误差(µ)2. 极限误差(允许误差) = Z 2 × 1 = 23. 区间估计—X- ≤ —X≤ —X+79-2~ 79+2 77~81答:以概率度为95.45%的,在77~81之间。
B.不重复抽样 1.平均误差(µ)1= 10²/100 =µ = x Δx σ²/ nµ = x Δx Δx µ = x (1- n/ N)(σ²/n ) Δxµ x2.极限误差 = Z3. 区间估计 —X - ≤ — X ≤ —X+C.成数区间估计(重复抽样)例:解:已知N = 1000 n = 75 (注:样本合格数)/ n = 75/100 = 0.75 1. 平均误差so (σ = 1- P)2. 极限误差Z = 2 ×0.043 = 0.0863. 区间估计 P- ≤ P ≤ P+0.75-0.086 ~ 0.75+0.086 0.664 ~ 0.836 答:以95.45%的概率,在66.4~83.6之间。
重点题型(解题思路): P149 17t解:已知 = 190(注:样本合格数) F(Z ) = 90%=1.64 2.31% /n =190/200 = 0.95 = 95%(P 即为合格率)Δx Δ x µ p =P(1- P) n=0.75(1-0.75) =1000.043µ =x σ²/ n Δp = µ pΔp Δp Δp =<2> 1.64×0.015 = 0.025P- ≤ P ≤ P+ 0.95-0.025 ~ 0.95+0.025 0.925 ~ 0.975<3> Z = / = 0.025/0.015 =1.66 答:<1>合格率为95%,抽样平均误差为0.015;<2>以90%的概率保证程度,合格率在 92.5% ~ 97.5%之间;如果极限误差为2.31%,其概率保证度为1.66。
第五章 抽样估计学习指导
第五章 抽样估计学习指导一、判断题×√1.抽样估计是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的.( )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本.( )3.在抽样估计中,作为推断的总体和作为观察对象的样本都是确定的.唯一的.( )4.优良估计的无偏性是指:所有可能的样本平均数的平均数等于总体平均数.( )5.抽样成数的特点是,样本成数越大,则成数方差越大.( )6.在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大.( ) n x σμ=7.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度.( )8.抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的.( )9.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度.( )10.在简单随机抽样中,如果重复抽样的抽样极限误差增加40%,其他条件不变,则样本单位数只需要原来的一半左右.( ) 11.抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差.( )12.样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比.( )二.单项选择题1.抽样调查的主要目的是( ).A.用样本指标来推算总体指标B.对调查单位做深入研究C.计算和控制抽样误差D.广泛运用数学方法2.抽样调查所必须遵循的基本原则是( ).A.准确性原则B.随机性原则C.可靠性原则D.灵活性原则3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的( ).A.2倍B.3倍C.4倍 D1/4倍4.按随机原则直接从总体N 个单位中抽取n 个单位作为样本,这种抽样组织形式是( ).A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样5.抽样误差是指( ).A.在调查过程中由于观察.测量等差错所引起的误差B.在调查中违反随机原则出现的系统误差C.随机抽样而产生的代表性误差D.人为原因所造成的误差6.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( ).A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样7.在一定的抽样平均误差条件下( ). p p xx Z Z μμ=∆=∆A.扩大极限误差范围,可以提高推断的可靠程度B. 扩大极限误差范围,会降低推断的可靠程度C. 缩小极限误差范围,可以提高推断的可靠程度D. 缩小极限误差范围,不改变推断的可靠程度8.反映样本指标与总体指标之间的平均误差程度的指标是( ).A.抽样误差系数B.概率度C.抽样平均误差D.抽样极限误差9. 抽样平均误差是( ).A.全极总体的标准差B.样本的标准差C.抽样指标的标准差D.抽样误差的平均差10.当成数等于( )时,成数的方差最大. A.1 B.0 C.0.5 D.-111.对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%.当概率为95.45%时,该行业职工收入在800元以下所占比重是( ). p p ∆-p p P ∆+≤≤A.等于78%B.大于84% p p Z μ=∆C.在76%--84%之间D.小于76%12.假定一个拥有一亿人口的大国和百万人口的小国居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄抽样平均误差( ). 212121,n n N N ≥≥=σσ n x σμ=A.不能确定B.两者相等C.前者比后者大D. 前者比后者小13.在其他条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( ).A 随之扩大 B.随之缩小 C.保持不变 D.无法确定14.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( ).A. 简单随机抽样B.类型抽样C.等距抽样D.整群抽样15.对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( ). )1(2Nn n x -=σμ A.甲厂比乙厂大 B. 乙厂比甲厂大C.两个工厂一样大D.无法确定16.按地理区域划片进行的区域抽样,其抽样方法属于( ).A. 简单随机抽样 D.类型抽样B.等距抽样C.整群抽样三.多项选择题1.抽样估计的特点是( ).A.由部分认识总体的一种认识方法B.建立在随机取样的基础上C.对总体参数进行估计采用的是确定的数学分析方法D.可以计算出抽样误差,但是不能对其进行控制E.既能够计算出抽样误差,又能够对其进行控制2.抽样估计中的抽样误差( ).A.是一种系统性误差B. 是一种代表性误差C.属于一种登记误差D.属于一种偶然性误差E.是违反了随机原则而产生的误差3.影响抽样误差大小的因素有( ). n x σμ= )1(2Nn n x -=σμA.抽样调查的组织形式B.抽取样本单位的方法C.总体被研究标志的变异程度D.抽取样本单位数的多少E.总体被研究标志的属性4.在抽样估计中( ).A.抽样指标的数值不是唯一的B.总体指标是一个随机变量C.可能抽取许多个样本D.统计量是样本变量的函数E.全及指标又称为统计量5.从全及总体抽取样本单位的方法有( ).A.简单随机抽样B.重复抽样C.不重复抽样D.概率抽样E.非概率抽样6.在抽样估计中,样本单位数的多少取决于( ). 222x Z n ∆=σA.总体标准差的大小B.允许误差的大小C.抽样估计的把握程度D.总体参数的大小E.抽样方法7. 总体参数区间估计必须具备的三个要素是( ). x x ∆-≤X ≤x x ∆+, p p ∆-p p P ∆+≤≤A.样本单位数B.样本指标C.全及指标D.抽样误差范围E.抽样估计的置信度8.采用类型抽样的组织形式( ).A.需要对总体各单位进行分组B.适用于总体各单位标志值差异较大的总体C.随机抽选其中的某一类型,并对其所有单位进行调查D.抽样误差较小E.最符合随机原则9.简单随机抽样( ).A. 适用于总体各单位呈均匀分布的总体B. 适用于总体各单位标志值差异较大的总体C.在抽样之前要求对总体各单位加以编号D. 最符合随机原则E.是各种抽样组织形式中最基本最简单的一种形式10.在抽样平均误差一定的条件下( ).A. 扩大极限误差范围,可以提高推断的可靠程度B. 缩小极限误差范围,可以提高推断的可靠程度C. 扩大极限误差范围,只能降低推断的可靠程度D. 缩小极限误差范围,只能降低推断的可靠程度E.扩大或缩小极限误差范围与推断的可靠程度无关五.计算题(主要是思路和方法提示)1.(1)进行简单随机重复抽样,假定抽样单位增加3倍,则抽样平均误差μ将发生如何变化?(2)如果要求抽样误差范围Δ减少20%,其样本单位数n 应如何调整?2.某企业生产一批日光灯管,随机重复抽取400只作使用寿命试验.测试结果,平均寿命为5000小时,样本标准差为300小时,400只中发现10不合格.求平均数的抽样平均误差和成数的抽样平均误差. p x μμ和3.某机械厂生产一批零件10000个,检验员甲用简单随机重复抽样方法抽取300个,发现有9个不合格.检验员乙用简单随机不重复抽样方法抽取200个, 发现有5个不合格.试求两种不同抽样方法下合格品率的抽样平均误差.4.某企业生产某产品10000袋,为检验其包装重量是否达到标准,检验员甲按简单随机重复抽样方法抽取200袋进行检查, 检验员乙用简单随机不重复抽样方法抽取200袋进行检验.样本标准差均为2克.试求两种不同抽样方法下包装平均重量的抽样平均误差。
抽样与抽样估计
第五章抽样与抽样估计教学目的与要求:参照教学大纲。
教学重点:抽样误差、区间估计的方法、样本容量的确定、抽样组织形式等教学难点:抽样平均误差的概念及计算、区间估计的几种方法、各种不同抽样组织形式的特点第一节抽样调查中的基本概念一、抽样推断的一般概念抽样推断是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。
抽样推断的特点:它是由部分推算整体的一种认识方法;它是建立在随机取样的基础上。
它是运用概率估计的方法;抽样推断的误差可以事先计算并加以控制。
抽样推断的主要内容为:参数估计和假设检验二、抽样的基本概念1、全及总体和样本总体全及总体是我们所要研究的对象,又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。
总体单位的总数称为总体容量,一般用N表示。
样本总体则是我们所要观察的对象,样本总体又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。
样本总体的单位数称为样本容量,通常用小写英文字母n来表示。
对于一次抽样调查,全及总体是唯一确定的。
而样本是不确定的,具有随机性,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。
根据总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指示称为总体指标,也称总体参数。
常用的总体指标有总体平均数(或总体成数)、总体标准差(或总体方差)。
由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标称为统计量(抽样指标)。
统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差)。
2、样本容量和样本个数样本容量是指一个样本所包含的单位数。
通常将样本单位数不少于30个的样本称为大样本,不及30个的称为小样本。
社会经济统计的抽样调查多属于大样本调查。
统计学课件05第5章抽样与参数估计
反映样本数据的集中趋势和平均水平。
样本方差
定义
样本方差是每个样本数据与样本均值差的平方和的平均值,即 $s^2 = frac{1}{n} sum_{i=1}^{n} (x_i - overline{x})^2$。
计算方法
先计算每个样本数据与样本均值的差,然后将差平方,最后求和平 均。
作用
反映样本数据的离散程度和波动情况。
样本量的确定
根据调查目的和精度要求确定样 本量:精度要求越高,需要的样
本量越大。
根据总体规模和抽样方法确定样 本量:总体规模越大,需要的样 本量越大;分层或整群抽样较简 单随机抽样需要的样本量更大。
根据调查资源确定样本量:资源 有限时,需要在满足调查目的和 精度要求的前提下,合理确定样
本量。
02 参数估计
大数定律的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布函数F(x),则对于任意正实数ε,有 lim(n->∞)P(|X1+X2+...+Xn/n-E(X))/ε)=0,其中E(X)是随机变量X的期望值。
大数定律的实例
在抛硬币实验中,随着实验次数的增加,正面朝上的频率将趋近于0.5。
中心极限定理
中心极限定理定义
中心极限定理是指在大量独立同分布的随机变量中,不论 这些随机变量的分布是什么,它们的平均值的分布总是趋 近于正态分布。
中心极限定理的数学表达
设随机变量X1,X2,...,Xn是相互独立的,且具有相同的分布 函数F(x),则对于任意实数x,有lim(n->∞)P(∑Xi≤x)=∫(∞->x)F(t)dt。
样本分布的性质
无偏性
如果样本统计量的数学期 望等于总体参数,则该统 计量是无偏的。
抽样估计——精选推荐
第五章抽样估计抽样调查在统计调查和分析中应用非常广泛,是一种非常重要的调查方法。
本章的目的在于提供一套簏利用抽样资料来估计总体数量特征的方法。
通过对本章的学习要求理解:1、什么是抽样推断,对比一般推算,它具有哪些特点,在哪些场合运用抽样推断的方法;2、抽样误差是怎样形成的,如何计算抽样误差,如何确定一定误差范围的置信度;3、抽样估计的优良标准是什么,怎样估计总体的平均指标和成数指标;4、抽样调查的组织形式及其误差。
第一节抽样推断的一般问题抽样推断的意义抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计方法。
抽样推断具有以下特点:抽样推断是由部分推算整体的一种认识方法。
抽样推断是建立在随机取样的基础上。
抽样推断是运用概率估计的方法。
抽样推断的误差可以事先计算并加以控制。
抽样推断的内容推断的前提是我们对总体的数量特征不了解或了解很少,但是利用抽样推断的方法去解决这类问题,可以有两种途径,因此,抽样推断的内容就有两个方面,即参数估计和假设检验。
这两方面的内容虽然都是利用样本观察值所提供的信息,对总体做出估计或判断,但它们所解决问题的着重点是不同的。
一、参数估计。
由于我们不知道总体数量特征,可以这样考虑即依据所获得的样本观察资料,对所研究对象总体的水平、结构、规模等数量特征进行估计,这种推断方法称为总体参数估计。
二、假设检验。
由于我们对总体的变化情况不了解,不妨先对总体的状况作某种假设,然后在根据抽样推断的原理,根据样本观察对所作假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍,这种推断方法称为总体参数的假设检验。
有关抽样的基本概念一、总体和样本。
总体也称全及总体,指所要认识研究对象的全体。
它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。
总体的单位数通常是很大的,甚至是无限的,一般用N表示总体的单位数。
样本又称子样,它是从全及总体中随机抽取出来的们作为代表这一总体的哪部分单位组成的集合体,样本的单位数是有限的,相对值或标志属性决定的。
统计学第五章 抽样推断与参数估计
总体
样本
参数
统计量 平均数 标准差、方差
X
、2
P
S、 S2
成数
p
( x x )2 f s2 f 1
( x x )2 s2 n 1
第一节
抽样调查的意义和作用
一、抽样方法 抽样方法有两种:概率抽样和非概率抽样。 (一)概率抽样 它根据随机原则,以一定的入样概率,从现象总体中随机 抽取若干样本单位,然后计算样本单位的数量特征(称为统 计量),并以此来推断估计总体参数。参数估计可分为点估 计和区间估计。 1.随机抽样的特点 ①数据的随机性;②抽样方法的随机性;③当用样本统计量 来估计总体参数时,不但要考虑样本单位的数量特征,也 要考虑各样本单位的入样概率;④随机抽样要求样本单位 的入样概率通过一定的随机化程序来实现。
N ( ,
2
n
)
• 这是一个非常重要的结论,有广泛的应用。 (请参见中心极限定理。)
(二)、重置抽样分布--样本成数的分布
• 总体成数p是指具有某种特征的单位在总体中的比重。成 数是一个特殊平均数,设总体单位总数目是N,总体中有 该特征的单位数是N1。设x是0、1变量(总体单位有该特 征,则x取1,否则取0),则有: N1
第二节 抽样分布 一、大数定理与中心极限定理
• (一)、大数定理
1 n lim p X i 1 当样本容量n 充分大时,可以用 n 样本平均估计总体平均。 n i 1
m lim p p 1 n n
当试验次数n充分大时,可以用 频率代替概率。
第五章抽样分布与参数估计
第五章抽样分布与参数估计
•七、抽样调查中的几个基本概念
•(一)全及总体与样本总 体
•1.全及总体是指根据调查目的所确定的研究对象全体.简称 为总体.常用 N 表示总体单位数。
•2.样本总体是指根据随机原则从总体中抽取一部分单位所 组成的整体.常用 n 表示样本单位数(样本容量)。
•1.点估计
•点估计也叫定值估计,就是以所抽样本资料为依据, 直接根据所选择的估计量对总体指标作出一个确定值 的估计,同时表明估计的精度和概率保证程度。
•或
•2.区间估计
•区间估计就是以点估计为依据,用一个具有一定可靠 程度的区间范围来估计总体指标。
第五章抽样分布与参数估计
•对总体平均数的区间估计为:
•或 •对总体成数的区间估计为:
•或
第五章抽样分布与参数估计
•第三节 必要样本容量的确定
• 抽样调查理论中,样本容量 n 的确定具有 实实在在的意义。 n 过大,违背抽样调查的 宗旨, n 过小,则抽样误差偏大,无法作出 精确的估计。
第五章抽样分布与参数估计
•一、影响因素
•1.总体标志变动度
•各调查单位标志值之间的差异越 大•抽样分布越分散 •抽样误差越大 •若想满足一定的精度要求 , 则必要样本量就越多
•具体排队时又分
•按无关标志排队 •按有关标志排队
第五章抽样分布与参数估计
•5.多阶段随机抽样
• 多阶段随机抽样是将一次抽样后得到的样本当作总 体再次进行随机抽样,得到第二次抽样样本,然后再如 此进行下去的抽样方式。 •例如:我国农产量调查就采用五阶段抽样方式。省抽县、 县抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行 实割实测的调查方法。
统计学原理 第五章 抽样估计
4、影响抽样误差大小的因素:
总体各单位标志值的差异程度。(差异程度越大,抽 样误差越大) 样本的单位数(样本单位数越多,抽样误差越小) 抽样方法(重复抽样的误差比不重复抽样的误差要大 些) 抽样调查的组织形式(简单随机抽样、类型抽样、等 距抽样、整群抽样)
二、抽样平均误差 1、抽样平均误差是反映抽样误差的一般水平的指标。 2、用抽样平均数的标准差或抽样成数的标准差来作为衡 量其抽样误差一般水平的尺度。
4、总体参数点估计的特点:
优点:简便、易行、原理直观 缺点:这中估计没有表明抽样估计的误差,更 没有指出误差在一定范围内的概率保证程度有 多大。
二、抽样估计的臵信度: 1、抽样估计臵信度就是表明抽样指标和总体指标的误差, 不超过一定范围的概率保证程度。 2、概率是指在随机事件进行大量实验中,某种时间出现 的可能性大小,它可以用某种事件出现的频率表示。 3、抽样估计的概率保证程度就是指抽样误差不超过一定 范围的概率大小,用字母F(Z)表示。 当Z=1时,F(Z)=68.27% 当Z=2时, F(Z)=95.45% 当Z=3时, F(Z)=99.73%
x Z x 概率保证程度越大,F Z 越大,Z越大, x 越大,准确性降低。
4、总体参数区间估计的方法:
根据已经给定的抽样误差范围,求概率保证程 度。 步骤:抽取样本——计算抽样指标(作为总体指 标估计值)——计算标准差、抽样平均误差— —估计总体指标的上、下限——求出t ,查表 得Ft
四、总体参数的区间估计
1、总体参数区间估计是根据给定的概率保证程度的需求, 利用实际抽样资料,指出总体被估计值的上限和下限, 即指出总体参数可能存在的区间范围,而不是直接给 出总体参数的估计值。 2、
称区间x1, x2 — 总体指标X的置信区间 1 — 估计置信度、 — 显著性水平 x1 — 置信下限、x2 — 置信上限
第五章抽样估计
第五章抽样估计第五章抽样调查与参数估计在实际的统计分析过程中,由于各种因素的限制,我们很少能够将研究对象中所有单位的数据收集起来进行计算分析。
在很多情况下,我们是进行抽样调查,根据样本的信息对研究对象的数量特征进行推断。
参数估计是一种关于如何利用样本的信息对总体特征做出具有一定可靠程度推断的统计分析方法,它是推断统计中非常重要的方法之一。
本章将介绍抽样调查的基本问题,然后在介绍抽样分布的基础上讨论参数估计的基本原理,最后介绍对一个总体参数进行估计的方法。
第一节抽样调查与抽样的组织形式抽样调查是一种非全面调查,它是按照随机原则从总体中抽取部分调查单位作为样本进行调查,以搜集样本数据的调查形式。
抽样调查获取的样本资料是进行参数估计、方差分析、假设检验等推断统计的基本依据。
一、抽样调查的特点与作用(一)抽样调查的特点抽样调查与其他非全面调查方式相比具有以下特点:1.抽样调查是按随机原则抽取总体单位作为样本的。
随机抽样意味着总体中某个单位被抽中与否,不会受到调查者和被调查者主观愿望的影响,从而保证了样本对总体的代表性。
2.抽样调查得到的样本资料可以用来推断总体数量特征。
依据概率论与数理统计的相关原理,在一定的置信水平下,可以估计出总体的数量特征和状态,这种估计有着坚实的理论基础。
3.用抽样调查的数据估计总体的状况必然产生抽样误差,抽样误差虽不可避免,但它是可以估计和控制的。
(二)抽样调查的作用与优点抽样调查是实际中应用最广泛的一种调查方式,它的作用和优点表现在以下几个方面:1.对于一些不可能或者不必要进行全面调查的现象,可以采用抽样调查的方式。
比如对灯泡的使用寿命、轮胎的里程试验、食品的合格率等破坏性检查就不可能进行全面调查;而对于有些社会经济现象,总体单位数多且分布很广,调查资源有限,就没有必要采用全面调查,这时都可以考虑采用抽样调查,然后据之推断出总体的特征。
2.抽样调查可以对全面调查的资料进行补充和修正。
第5章抽样与抽样估计演示
PPT文档演模板
第5章抽样与抽样估计演示
三、样本比例的抽样分布
∵样本中具有某种特征的单位数x~B(n,P)
∴样本比例的精确分布——二项分布
PPT文档演模板
样本比例的近似分布——正态分布
•(大样本下)
•均值、比率 抽样分布一览 表
第5章抽样与抽样估计演示
第三节 抽样估计的基本方法
这节是本章的中心。参数估计最基本的方 法是简单估计(又有点估计和区间估计 两种)。不讨论比估计和回归估计。抽 样数目也是事先必须估计的量。
(一)正态总体,总体方差已知时 样本均值的抽样分布——正态分布
样本均值的标准值的抽样分布——标准正态分布
大样本下,样本均值的抽样分布—— —渐进正态分布
均值的抽样平均误差=样本均值的标准差
(二)正态总体,总体方差未知时 样本均值的标准值的抽样分布——t分布
PPT文档演模板
第5章抽样与抽样估计演示
均值的抽样分布
第5章_抽样与抽样估计 演示
PPT文档演模板
2020/11/26
第5章抽样与抽样估计演示
本章要解决的主要问题
• 抽样——抽取样本
• 什么是样本 • 怎么抽——抽样方式、方法 • 从哪里抽——抽样框 • 抽 多 少 —— 样本大小
• 抽样估计——用所抽取样本去估计总体
• 要估计什么——总体参数(总体特征) • 用什么来估计——样本估计量 • 用什么估计方法 • 估计结果的形式 • 估计结果的可靠性和准确性
再见,see you again
PPT文档演模板
2020/11/26
第5章抽样与抽样估计演示
第一节 抽样调查中的基本概念
本节的目的、说明
本节的主要内容——
05第五章 抽样调查
(三)分层抽样 1.分层抽样的含义 分层抽样,又称为分类抽样,它是先将总体中 的所有单位按其一定的属性或特征分成相互不重叠 的若干层,然后在每一层中分别抽取样本,最后把 各层中抽出的样本合在一起构成总体的样本的方法。 2.分层抽样程序 3.等比例分层抽样 4.不等比例分层抽样
【例5-3】某地共有居民4万户,按经济收入高低进行分类,其中高收 入居民为8000户,中等收入居民为24000户,低收入居民有8000户。 要从中抽出800户进行购买力调查,采用等比例分层抽样,如何抽取? 分析:因为购买力是与家庭的收入水平密切相关的,所以以收入水平作 为分层变量是合适的。按此变量将总体分为高收入户、中等收入户和低 收入户三层。具体的抽样程序如下: 第一步,计算各层在总体中的比例。 高收入户:8000/40000=20%;中等收入户: 24000/40000=60%;低收入户:8000/40000=20%。 第二步,各层在总体中所占的比例与各层在样本中所占的比例是一样的。 因此,计算样本在各层中的具体分布数目。 高收入户:800*20%=160(户); 中等收入户:800*60%=480(户); 低收入户:800*20%=160(户)。 第三步,在各层中采用等距抽样方法抽取样本单位。
小结
重点:抽样调查的分类和抽样误差的测定。
难点:样本容量的估计及抽样误差的测定。
作业
1.简要回答单纯随机抽样的具体分类及其各 自特点。 2.简述类型随机抽样的优点及其适用范围。
【例5-2】现有180名学生,要利用等距抽样法从中抽取 15名学生作研究样本,其方法如下:先将学生按与学生学 习成绩无关的标志编号,假设按学生座位顺序把学生编为1 -180号,然后按下述步骤抽取:
(1)确定抽样间隔距离k=180/15=12 (2)随机抽取了编号34为起点,即决定从第34号单位作 为第一个样本。先前抽取样本为34-12=22号单位;向后 抽取样本为34+12=46;如此类推,抽出的15个样本为: (10),(22),(34),(46),(58),(70), (82),(94)(106),(118),(130), (142),(154),(166),(178)
统计学原理课后习题答案第五章抽样及参数估计
统计学原理课后习题答案第五章抽样及参数估计统计学原理课后习题答案第五章抽样及参数估计1.①由题意可知本题属于:纯随机重复抽样下的总体比例区间估计。
已知:n=1000,82882.8%1000p ==,(Z)195.45%F α=-= ,查表得/2=2Z α 由于不知总体标准差,用样本的标准差代替:p 82.8%282.8% 2.4%Z α±=±?=±即:80.4%P 85.2%≤≤所以该城市拥有彩电家庭比例的置信区间为80.4%—85.2%。
②由题意可知本题属于:重复抽样时比例的必要抽样数目。
已知: 82.8%p =,5%p ?= ,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替:2222(1P)382.8%(1-82.8%)5130.05p z P n -??==≈?2.由题意可知本题属于:纯随机重复抽样下的总体平均数的抽样极限误差已知:n=100,=3x ,=0.8σ ,(Z)195%F α=-= ,查表得/2=1.96Z α/2= 1.960.16Z α?=?= 分钟 3.(1)已知:n=150,12382%150p ==,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替:p 82%382%9.41%Z α±=±?=±即:72.59%P 91.41%≤≤(2)已知:n=150,=2x ,=0.75σ ,(Z)199.73%F α=-= ,查表得/2=3Z α/20.752320.2x Z αμ=±=±?=± 分钟即:1.8 2.2μ≤≤4. 已知:200σ=,30z ?= ,(Z)195%F α=-= ,查表得/2=1.96Z α 则:2222221.9620017130z z n σ?==≈? 户(1)如上图(2)40名职工的平均考核成绩为30704076.75xfx f===∑ 样本的方差为22()4777.5s122.54x x ff-===∑∑ (Z)195%F α=-= ,查表得到/2 1.96Z α=/276.75 1.911.07676.75 3.43s x Z α±=±?=± 即在95%的概率保证度下,该企业工人的平均考核成绩在73.32到80.18直接。
05抽样估计资料
第五章抽样估计第一节抽样估计的理论基础抽样估计的基本内容就是研究如何根据总体的部分数据信息(构造样本指标也称统计量)去估计未知总体指标(也称参数)的理论和方法。
学习步骤:抽样估计的理论基础——大数定律和中心极限定理→掌握抽样分布的有关概念及基本原理→抽样估计的理论和方法。
一、大数定律大量的独立重复测量值的算术平均值具有稳定性。
对于这种稳定性的研究构成了大数定律的基本内容。
两个重要的大数定律:贝努里大数定理、辛钦大数定律设事件A在一次试验中发生的概率为p,在n次独立重复试验中,事件A发生了m次,那么对任意给定的正数ε,有其等价形式是贝努里大数定理说明:事件发生的频率m/n,依概率收敛于事件发生的概率p,这个定理用严格的数学形式表达了频率的稳定性,也就是说,当n很大时,事件发生的频率与概率有较大偏差的可能性很小。
因此,当n很大时,可用事件发生的频率m/n近似地代替事件发生的概率p,即p≈m/n,这种方法称为抽样估计,它是数理统计的主要研究课题。
(二)辛钦大数定律设随机变量X1,X2,…,X n相互独立,服从同一分布,且(E(X k)=μ,k=1,2,…),则对任意正数ε,恒有:辛钦大数定律为我们用测量数据的算术平均数代替其真值的方法提供了理论依据。
假定要测量某一物理量μ,在不变条件下测量n次,得到的结果X1,X2,…,X n是不完全相同的,它们可以看作n个独立随机变量X1,X2,…,X n(它们服从同一分布且数学期望均为μ)。
按照辛钦大数定律,当n很大时,我们取n次测量结果的算术平均数作为真值μ的近似值,这时出现较大偏差的可能性很小。
一般说来,测定的次数越多,近似程度越好。
二、中心极限定理当处理大样本问题时,将它作为一个非常重要的工具。
下面介绍两个常用的中心极限定理。
定理1:林德贝格—勒维中心极限定理,也称为独立同分布中心极限定理。
定理2:德莫佛—拉普拉斯中心极限定理。
它表明:二项分布的极限分布是正态分布,因此,当n充分大时,若随机变量X n~B(n,p),则近似地有X n~N(np,np(1-p),于是我们可以利用正态分布近似地计算二项分布的概率。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章 抽样估计学习指导一、判断题×√1.抽样估计是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的.( )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本.( )3.在抽样估计中,作为推断的总体和作为观察对象的样本都是确定的.唯一的.( )4.优良估计的无偏性是指:所有可能的样本平均数的平均数等于总体平均数.( )5.抽样成数的特点是,样本成数越大,则成数方差越大.( )6.在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大.( ) n x σμ=7.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度.( )8.抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的.( )9.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度.( )10.在简单随机抽样中,如果重复抽样的抽样极限误差增加40%,其他条件不变,则样本单位数只需要原来的一半左右.( ) 11.抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差.( )12.样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比.( )二.单项选择题1.抽样调查的主要目的是( ).A.用样本指标来推算总体指标B.对调查单位做深入研究C.计算和控制抽样误差D.广泛运用数学方法2.抽样调查所必须遵循的基本原则是( ).A.准确性原则B.随机性原则C.可靠性原则D.灵活性原则3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的( ).A.2倍B.3倍C.4倍 D1/4倍4.按随机原则直接从总体N 个单位中抽取n 个单位作为样本,这种抽样组织形式是( ).A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样5.抽样误差是指( ).A.在调查过程中由于观察.测量等差错所引起的误差B.在调查中违反随机原则出现的系统误差C.随机抽样而产生的代表性误差D.人为原因所造成的误差6.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( ).A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样7.在一定的抽样平均误差条件下( ). p p xx Z Z μμ=∆=∆A.扩大极限误差范围,可以提高推断的可靠程度B. 扩大极限误差范围,会降低推断的可靠程度C. 缩小极限误差范围,可以提高推断的可靠程度D. 缩小极限误差范围,不改变推断的可靠程度8.反映样本指标与总体指标之间的平均误差程度的指标是( ).A.抽样误差系数B.概率度C.抽样平均误差D.抽样极限误差9. 抽样平均误差是( ).A.全极总体的标准差B.样本的标准差C.抽样指标的标准差D.抽样误差的平均差10.当成数等于( )时,成数的方差最大. A.1 B.0 C.0.5 D.-111.对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%.当概率为95.45%时,该行业职工收入在800元以下所占比重是( ). p p ∆-p p P ∆+≤≤A.等于78%B.大于84% p p Z μ=∆C.在76%--84%之间D.小于76%12.假定一个拥有一亿人口的大国和百万人口的小国居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1%人口计算平均年龄,则平均年龄抽样平均误差( ). 212121,n n N N ≥≥=σσ n x σμ=A.不能确定B.两者相等C.前者比后者大D. 前者比后者小13.在其他条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( ).A 随之扩大 B.随之缩小 C.保持不变 D.无法确定14.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( ).A. 简单随机抽样B.类型抽样C.等距抽样D.整群抽样15.对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( ). )1(2Nn n x -=σμ A.甲厂比乙厂大 B. 乙厂比甲厂大C.两个工厂一样大D.无法确定16.按地理区域划片进行的区域抽样,其抽样方法属于( ).A. 简单随机抽样 D.类型抽样B.等距抽样C.整群抽样三.多项选择题1.抽样估计的特点是( ).A.由部分认识总体的一种认识方法B.建立在随机取样的基础上C.对总体参数进行估计采用的是确定的数学分析方法D.可以计算出抽样误差,但是不能对其进行控制E.既能够计算出抽样误差,又能够对其进行控制2.抽样估计中的抽样误差( ).A.是一种系统性误差B. 是一种代表性误差C.属于一种登记误差D.属于一种偶然性误差E.是违反了随机原则而产生的误差3.影响抽样误差大小的因素有( ). n x σμ= )1(2Nn n x -=σμA.抽样调查的组织形式B.抽取样本单位的方法C.总体被研究标志的变异程度D.抽取样本单位数的多少E.总体被研究标志的属性4.在抽样估计中( ).A.抽样指标的数值不是唯一的B.总体指标是一个随机变量C.可能抽取许多个样本D.统计量是样本变量的函数E.全及指标又称为统计量5.从全及总体抽取样本单位的方法有( ).A.简单随机抽样B.重复抽样C.不重复抽样D.概率抽样E.非概率抽样6.在抽样估计中,样本单位数的多少取决于( ). 222x Z n ∆=σA.总体标准差的大小B.允许误差的大小C.抽样估计的把握程度D.总体参数的大小E.抽样方法7. 总体参数区间估计必须具备的三个要素是( ). x x ∆-≤X ≤x x ∆+, p p ∆-p p P ∆+≤≤A.样本单位数B.样本指标C.全及指标D.抽样误差范围E.抽样估计的置信度8.采用类型抽样的组织形式( ).A.需要对总体各单位进行分组B.适用于总体各单位标志值差异较大的总体C.随机抽选其中的某一类型,并对其所有单位进行调查D.抽样误差较小E.最符合随机原则9.简单随机抽样( ).A. 适用于总体各单位呈均匀分布的总体B. 适用于总体各单位标志值差异较大的总体C.在抽样之前要求对总体各单位加以编号D. 最符合随机原则E.是各种抽样组织形式中最基本最简单的一种形式10.在抽样平均误差一定的条件下( ).A. 扩大极限误差范围,可以提高推断的可靠程度B. 缩小极限误差范围,可以提高推断的可靠程度C. 扩大极限误差范围,只能降低推断的可靠程度D. 缩小极限误差范围,只能降低推断的可靠程度E.扩大或缩小极限误差范围与推断的可靠程度无关五.计算题(主要是思路和方法提示)1.(1)进行简单随机重复抽样,假定抽样单位增加3倍,则抽样平均误差μ将发生如何变化?(2)如果要求抽样误差范围Δ减少20%,其样本单位数n 应如何调整?2.某企业生产一批日光灯管,随机重复抽取400只作使用寿命试验.测试结果,平均寿命为5000小时,样本标准差为300小时,400只中发现10不合格.求平均数的抽样平均误差和成数的抽样平均误差. p x μμ和3.某机械厂生产一批零件10000个,检验员甲用简单随机重复抽样方法抽取300个,发现有9个不合格.检验员乙用简单随机不重复抽样方法抽取200个, 发现有5个不合格.试求两种不同抽样方法下合格品率的抽样平均误差.4.某企业生产某产品10000袋,为检验其包装重量是否达到标准,检验员甲按简单随机重复抽样方法抽取200袋进行检查, 检验员乙用简单随机不重复抽样方法抽取200袋进行检验.样本标准差均为2克.试求两种不同抽样方法下包装平均重量的抽样平均误差。
5.某工厂有1500个工人,用简单随机重复抽样方法抽取50个工人作为样本,调查其工资水平,资料如下:要求:(1)计算样本平均数x和抽样平均误差μ。
x(2)以95.45%的可靠性估计该工厂工人的月平均工资X和工资总额的区间NX.6.采用简单随机重复抽样方法,在2000件产品中抽查200件,其中合格品190件.要求(1)计算合格品率p及其抽样平均误差μ.p(2)以95.45%的可靠性对合格品率和合格品数量进行区间估计.(3)如果极限误差为2.31%,则其概率保证程度是多少?7.某电子产品使用寿命在3000小时以下为不合格,现在用简单随机重复抽样方法,从5000个产品中抽取100个对其使用寿命进行调查.其结果如下:根据以上资料计算:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差(2) 按重复抽样和不重复抽样计算该产品合格率的抽样平均误差(3)根据重复抽样计算抽样平均误差,以68.27%的概率保证程度对该产品的平均使用寿命和合格率进行区间估计.8.外贸公司出口一种食品,规定每包规格不低于150克,现在用重复抽样方法抽取其中100包进行检验,其结果如下:要求:(1)以99.73%的概率估计这批食品平均每包重量的范围,以便确定平均重量是否达到规格要求; x x ∆-x x X ∆+≤≤(2)以同样的概率保证估计这批食品合格率范围. p p ∆-p p P ∆+≤≤9.某学校有2000名学生参加英语等级考试,为了了解学生的考试情况,用不重复抽样方法抽取部分学生进行调查,所得资料如下:试以95.45%的可靠性估计该学校学生英语等级考试成绩在70分以上的学生所占比重范围p p ∆-p p P ∆+≤≤.10.为了解某城市分体式空调的零售价格,随机抽取若干个商场中的40台空调,平均价格为3800元,样本标准差400元.要求:(1) 计算抽样平均误差(2) 以99.73%的概率估计该城市分体式空调的价格区间. x x ∆-x x X ∆+≤≤11.对一批成品按重复抽样方法抽取100件,其中废品4件,当概率为95.45%时,可否认为这批产品的废品率不超过6%?12.在4000件成品中按不重复抽样方法抽取200件进行检查,结果有废品8件,当概率为95.45%时,试估计这批产品的废品量NP的范围.13.在某乡2万亩水稻中按重复抽样方法抽取400亩,得知平均亩产量为609斤,样本标准差为80斤.要求以95.45%的概率保证估计该乡水稻的平均亩产量和总产量的区间范围. 14. 某乡有5000农户, 按重复抽样方法抽取100户调查,得平均每户年纯收入12000元,标准差2000元.要求:(1) 以95%(t=1.96)的概率保证估计全乡平均每户X年纯收入的区间.(2)以同样概率保证估计全乡农户年纯收入总额XN的区间范围.15.假定某统计总体有5000个总体单位,其被研究标志的方差为400,若要求抽样极限误差不超过3, 概率保证为95.45%,试问采用不重复抽样方法应该抽取多少样本单位?16.某企业生产一种新型产品共5000件, 随机抽取100件作质量测试.测试结果,平均寿命为4500小时,标准差300小时.试在90%概率保证下,估计该新型产品的平均寿命区间. x x ∆-x x X ∆+≤≤。