第七章 抽样推断与检验

合集下载

第七章 抽样推断

第七章  抽样推断

一 抽样推断概述
(二)样本容量和样本可能数目
1.样本容量
样本容量是指一个样本中所包含的单位数的多少。总体单位数通常用N表示,样本容 量一般用n表示。在社会经济统计中,总体单位数N一般很大,有时可以是无限多的,样
本容量n相对于总体单位数N一般是很小的。n 30 的样本叫小样本,n 30 的样本叫大样
不重复抽样又称不回置抽样,其具体做法是:从总体N个单位中抽取一个容量为n的 样本,每次从总体中随机抽取一个单位,观察登记后不再放回总体,在此基础上抽取第 二个单位,依次类推。
不重复抽样有这样的特点:每次抽样以后,总体都会少一个单位。因此,不重复抽 样的每次抽取都会影响到下一次,n次抽取不是相互独立的。所以,不重复抽样的每次抽 一个,连续抽n次,相当于一次从总体中抽出n个单位组成样本。由于每次抽取时总体单 位数不同,每个单位中选或不中选的机会在各次是不同的。
一 抽样推断概述
(3)抽样推断的误差可以事先计算并进行控制 以抽样调查的样本指标数值来推断总体指标数值,虽然存在一定误差,但这种误差
在抽样调查之前是可以计算的,并能根据统计研究的任务、目的、精确性等,采取相应 的措施加以控制,使抽样推断的结论达到一定的可靠程度。这也是抽样调查不同于其他 调查方式的重要区别之一。
一 抽样推断概述
2.抽样框
要从一个总体中抽选样本,很重要的一个问题就是需要一个包括全部总体单 位的框架,以此代表总体,从中抽取样本单位。从中抽取样本的这个框架就称为 抽样框。它的作用就是将无形的总体变成有形的事物以便于实际抽取。
一 抽样推断概述
要很好地理解抽样框,需要区分一对概念:目的总体和被抽样总体。 在统计研究中,根据研究目的所确定的理想总体,就是目的总体。但是,有 时目的总体非常复杂,尤其在社会经济调查中,我们想得到一个包括目的总体全 部单位的框架往往很难,只能用一个接近目的总体,并且容易取得和便于操作的 框架来代替,这就是被抽样总体,即抽样框包含的总体范围。

第七章 抽样推断

第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制

ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n

《统计学》第七章抽样推断第二节 抽样误差

《统计学》第七章抽样推断第二节 抽样误差
6-3
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差

p p P


如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差

抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:

x x X

即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x

n
式中,n为样本容量; 为总体标准 。


成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)

7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)

2

第七章 统计 抽样推断

第七章 统计 抽样推断

同上,如果将样本中n条鱼的平均重量计算出 来,记为 x ,它就可以作为湖中全部鱼的平 均重量 的估计量,则湖中鱼产量的点估计
量为
ˆ nN1 x Nˆ n1
例2 某工厂生产了一批产品,共10000件,须经 检验后方可出厂,按规定次品率不得超过3%。 现从中抽取100件产品,结果发现有5件次品,
lim P(
n

) 1
估计值的优良标准
问题:
不是那一个统计量来估计某个总体 m 参数?
o
x 第一,我们为什么以这一个而 me
第二,如果有两个以上的统计 估计值的优良标准: 量可以用来估计某个总体参数,其 无偏性、有效性、一致性 估计结果是否一致?是否一个统计 量要优于另一个?
(二) 主要的样本指标
指根据抽样总体各个单位的标志值 样本指标 或标志特征计算的综合指标,又被 称为统计量,它是随机变量。
设样本中 n 个样本单位某项标志的标志值 分别为 x1 , x2 , xn ,其中具有和不具有某 种属性的样本单位数目分别为 n1和 n0 个,则
⒈ 样本平均数(又叫样本均值):
可以这样去推理:鱼在湖中的游动具有一定
的随机性质,如果网是均匀撒出的,则打捞出的
鱼应当对湖中整个的鱼具有较好的代表性。整个 但可以通过有记号的鱼所占的比重n1/n去估计,

N 1 n1 N n
湖中有记号的鱼所占的比重(记为P)N1/N虽然未知,
于是,整个湖中鱼的总数目N的点估计就是
ˆ nN1 N n1
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样推断
总体指标:参数
(未知量)
统计推断

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。

调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。

例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。

由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。

同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。

为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。

调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。

例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。

同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。

(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。

例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。

(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。

调查项⽬确定的正确与否直接关系到调查的质量。

因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。

应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。

例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。

调查项⽬有⼀般项⽬和重点项⽬之分。

⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。

抽样推断

抽样推断

t=1.96 F(t)=95%
t=2 F(t)=95.45%
t=3 F(T)=99.73%
28
x
2 x
3 x
4 x
5 x 432x xx 5 x
2020/7/24
第三节 抽样估计
一、点估计
点估计以样本指标的实际值直接作为相应总体指标的估计
值,即直接以样本平均数、成数推断总体的平均数和成数。
设Xˆ 表 示 总 体 平 均 数X的 估 计 量 ,Pˆ 表 示 总 体 成 数P的 估 计 量
第四节 必要样本
单位数的确定 一、确定必要样本单位数的意义
直接关系到抽样误差大小 影响到抽样推断的效果 影响到抽样调查的成本
34
样本单位数越多, 抽样误差越小
抽样单位数越多, 抽样效果越好
抽样单位数越多, 调查成本越大
2020/7/24
第四节 必要样本 单位数的确定
二、必要样本单位数的确定
重复抽样
1
1
7
0
0
8
1
1
9
2
4
63
0
12
x x 63 7元 M9
x X 2 12 1.15元
x
M
9
x X X X X 2
5
-2
4
7
0
0
9
2
4
21

8
X X 21 7元
N
3
X X 2 8 1.63元
N
3
1.63 1.15元
x
n
2
第二节 抽样误差
样本平均数:x
x
n
xf f
样本方差: 2 ( x x)2 ( x x)2 f

《统计学》第七章(抽样调查)

《统计学》第七章(抽样调查)

20
(1)以99.73%的概率保证程度估计这批茶叶平均每包重量的 范围,以便确定平均重量是否达到规格要求。
第七章 抽样调查
第一节 抽样调查概述 第二节 抽样估计 第三节 抽样的组织形式
1
第一节 抽样调查概述 一、抽样调查的含义
(一)抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一
部分单位进行观察,并根据样本的实际数据,对总体的 数量特征做出具有一定可靠程度的估计和判断,从而达 到对全部研究对象的认识的一种统计方法。其中心问题 是如何根据已知的部分资料来推断未知的总体情况。
(3)抽样总体标准差和抽样总体方差。
说明抽样总体之间标志值变异程度的指标,叫做抽样
总体标准差。抽样总体标准差的平方称为抽样总体方
差(简称样本方差)。其计算公式为:
s
2
xx n
2
s2 x x n
20
一个总体可以抽取许多个样本,而样本不同, 抽样指标的数值也各不相同。可见,抽样指标的数 值不是惟一确定的。因为抽样指标是样本变量的函数, 是随机可变的变量。也就是说,由 样本观测值所决定的 统计量是随机变量。
x=2*60=120
8480~8720
(2) up=3.1%
p=6.2%
68.8%~81.2%
50
例4,某外贸公司出口一种茶叶,规定每包规格不低于150克。 现在用不重复抽样的方法抽取其中1%进行检验,其结果如下:
每包重量 (克)
包数
148~149
10
149~150
20
150~151
50
151~152
21
(三)重复抽样和不重复抽样 1.重复抽样(重置抽样) 采用这种方法抽取样本单位的特点是:同一单位 有多次重复被抽中的机会,并且总体单位数目始 终不变,每个单位抽中或抽不中的机会在各次都 是相同的。

第七章 抽样推断与检验

第七章 抽样推断与检验

样本平均数与样本成数的抽样极限误差
用 x 、 p 分别表示样本平均数与样本成数的 抽样极限误差 x x x x
Pp p Pp
上式说明:由于总体参数是未知数,而统计量是可测算的,因 此,抽样误差范围的实际意义是被估计总体指标落在由抽样指 标所确定的范围,即落在以下范围内
其平均数和方差分别为
它是一个是 非标志
N 0 N N1 N1 P ,Q 1 P N N N
N1 P P N
PQ P1 P
2 P
第一节
c)是根据样本各单位标志值 或标志属性计算的综合指标。与常用的总体参数 相对应,有样本平均数、样本方差和样本成数等。 以小写字母表示。
第三节
假设检验
一、假设检验的基本原理 二、总体的均值的假设检验 三、总体成数的假设检验
第三节
假设检验 一、假设检验的基本原理
假设检验(Hypothesis testing)是利用样本的 实际资料检验事先对总体某些数量特征所作的假 设是否可信的一种统计分析方法。 假设检验是从总体参数所做的一个假设开始 的。假设一般包括两部分:原假设H0和备择假设 H1。
第七章抽样推断与检验
学习内容
学习重点
第一节 抽样中的几个基本概念 第二节 参数估计 第三节 假设检验 第四节 抽样设计 1、参数估计 2、假设检验
假设检验的基本原理和方法
学习难点
第一节
抽样中的几个基本概念
一、抽样推断 二、参数和统计量 三、重复抽样和不重复抽样 四、抽样误差
第一节
抽样中的几个基本概念 抽样推断
P
P 1 P n
p1 p n 1 n N
重复抽样的条件下

第7章抽样调查

第7章抽样调查

二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E

如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u




1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。

第七章 抽样推断

第七章  抽样推断

不重复抽样样本平均数的抽样分布
❖ 1.样本平均数的平均 数(数学期望)等于总 体平均数。
xX
❖ 2.样本平均数的方差 等于总体方差的1/n乘 以修正因子。
2
2
Nn
x n N1
❖ 二、抽样推断的理论依据
❖ 1.大数定律(大数法则)
❖ 大数法则证明:如果随机变量总体存在着有限 的平均数和方差,则对于充分大的样本单位数n, 可以用几乎趋近于1的概率,来期望样本平均数 与总体平均数的绝对离差为任意小,即对于任意
❖ 样本可分为大样本和小样本。若n<30,则称为 小样本。否则称为大样本。一般,社会经济现象 都是大样本。自然实验多是小样本。
❖ 研究对象一经确定,则总体也就唯一确定了。 但作为观察对象的样本就不是这样的。从一个总 体中可以抽取很多个样本,每次可能抽到哪个样 本不是确定的,也不是唯一的。
❖ 三、随机原则和随机性
❖ 四、整群抽样
❖ 整群抽样是将总体分为若干群,并尽量使这些 群之间没有明显的类别差异,然后,以群为单位, 在这些群中随机地抽取一个或几个群作为样本, 样本包括被抽中群中的全部单位。
❖ 假定将总体分为m群,从中抽取k群,则每个个 体中选的概率为k/m。
❖ 整群抽样适用于总体容量很大的情况,一般多 用于居民家计调查,农产量调查和大量产品的质 量检验等等。
解:平均身高的抽样平均误差:
s 5 0.35c4m
x n 200
近视率的抽样平均误差 :
p=n1/n=156/200=78%
pp (1 n p )0 .7 2 8 (1 0 0 .70 )8 0 .02 2 9 .9% 3 3
❖ 若上例是从1000人中采用不重复抽样方式 抽取的200人,则其抽样平均误差为:

统计学 抽样推断课件

统计学 抽样推断课件

3、抽样误差极限
在做抽样估计时,应该根据所研究对象的 变异程度和分析任务的要求确定可允许的 误差范围,在这个范围内的数字都算是有 效的。我们把这种可允许的误差范围称为 抽样极限误差。它等于样本指标可允许变 动的上限或下限与总体指标之差的绝对值。
4、抽样误差的概率度
基于概论估计的要求,抽样极限误差通常 需要以抽样平均误差 或 为标准单位来 或 衡量。把极限误差 分别 除 以 或 x x 得相对数t,表示误差范围为抽样平均误差 的 t 倍。 T 是测量估计可靠程度的一个参数, 称为抽样误差的概率度。
教学重点与难点
一、有关抽样的基本概念——总体和样本、 参数和统计量、样本容量和样本个数重复 抽样和不重复抽样。 二、抽样误差的意义及其影响因素、抽样 极限误差、抽样平均误差、抽样估计等内 容。
教学内容
一、抽样推断的基础 二、抽样推断与误差 三、抽样估计与推算
(一)抽样推断的基础
我们从如下3个方面进行研究: 1、 抽样推断的意义 2、抽样推断的内容 3、有关抽样的基本概念
2、抽样估计的精度
误差率=
x X x x x
估计精度=1-误差率=1-
x x
x X x
=1-
3、抽样估计的置信度
抽样估计置信度就是表明抽样指标和总体指标的 误差不超过一定范围的概率保证程度。 所谓概率就是指在随机事件进行大量实验中,某 种事件出现的可能性大小,它通常可以用某种事 件出现的频率来表示。抽样估计的概率保证程度 就是指在抽样误差不超过一定范围的概率大小。
课堂练习
22.某部门对职工进行家庭经济情况调查,取得各项抽样资料如下:
抽查户数 每户月平均收入(元) 标准差(元)
职员工人
200 600

第7章 抽样调查及答案

第7章  抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。

它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。

是一种灵活快捷的调查方式。

2.抽样调查有全及总体与样本总体之区分。

样本容量小于30时一般称为小样本。

对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。

样本可能数目与样本容量有关也与抽样的方法有关。

抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。

正态分布的密度函数有两个重要的参数(σ;x )。

它有对称性、非负性等特点。

中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。

推出了样本分布的标准差为:1--=N n N n x σμ。

4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。

无偏性、一致性和有效性是抽样估计的优良标准。

抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。

抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。

在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。

在通常情况下总体的方差是未知的,一般要用样本的方差来代替。

把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。

μt =∆,用抽样的平均误差来度量抽样的极限误差。

把抽样估计的把握程度称为抽样估计的置信度。

抽样的极限误差越大,抽样估计的置信度也越大。

抽样估计又可区分为点估计和区间估计。

统计学 抽样推断课件

统计学 抽样推断课件
x
p
p
p
三、抽样估计与推算
总体参数的点估计 抽样估计的精度 抽样估计的置信度 总体参数的区间估计
1、总体参数的点估计
参数点估计的基本特点是,根据总体指标 的结构形式设计样本指标(称统计量)作 为总体参数的估计量,并以样本指标的实 际值直接作为相应总体参数的估计值。 优良估计总标准有三个方面:无偏性 、一 致性 、有效性
课堂练习
15.进行简单随机重复抽样,假定抽样单位增加3倍,则 抽样平均误差将发生如何变化?如果要求抽样误差减少 20%,其样本单位数应如何调整? 16.某工厂有1500个工人,用简单随机重复抽样的方法 抽出50个工人作为样本,调查其工资水平,如下表:
月工资水平(元) 524 534 540 550 560 580 600 660
课堂练习
8.假定10亿人口大国和100万人口小国的居民年龄变异程 度相同。现在各自用重复抽样的方法抽取本国的1%人口计 算平均年龄,问两国平均年龄抽样平均误差是否相同,或 哪国比较大? 9.参数估计的优良标准是什么?抽样平均数和抽样成数估 计是否符合优良估计标准,试加以说明。 10.什么是概率度?什么是置信度?这两者有什么关系? 11.类型抽样中的分组和整群抽样中的分群有什么不同意 义和不同要求? 12.试比较等距抽样中按无关标志和按有关标志排队的优 缺点,比较有标志排队中半距起点固定间隔取样和随机起 点对称等距取样的优缺点。
教学重点与难点
一、有关抽样的基本概念——总体和样本、 参数和统计量、样本容量和样本个数重复 抽样和不重复抽样。 二、抽样误差的意义及其影响因素、抽样 极限误差、抽样平均误差、抽样估计等内 容。
教学内容
一、抽样推断的基础 二、抽样推断与误差 三、抽样估计与推算

第七章 抽样推断与检验

第七章 抽样推断与检验
于是,如果允许误差为 p,可得最小的抽样数目:
n Z 22 P ( 1 P ) 2 p
(三)总体方差的区间估计
▪ 总体均值已知时,总体方差的区间估计
2
( xi )2 2
2(n)
P (1 2 (n) 2 ) 1
P(
2 (n)
1 )
P(
2 (n)
2 )
2
1
2 1
(n), 2
一定误差的要求下选择费用最小。或者一定 费用开支条件下,选择误差最小。
二、抽样的组织设计
(一)简单随机抽样(Simple random sampling):直接从总体N个单位中抽取n
个单位作为样本,也称单纯随机抽样。
(二)类型抽样(Stratification sampling): 又称分层抽样,对总体单位按主要标志分 组,再从各组中按随机的原则按比例抽选 一定单位构成样本。不存在组间误差。
▪ 抽样推断(sampling inference)是在抽样调查的 基础上,利用样本的实际资料计算样本指标,并据 以推算总体相应数量特征的一种统计分析方法。
▪ 特点: 1. 抽样推断是建立在随机取样的基础上,坚持抽取的
随机原则,增强被抽中单位对总体的代表性。
2. 抽样推断是由部分推算整体的一种认识方法。 3. 抽样推断以概率论中的大数法则和中心极限定理为
2
(n)
2
2
P
(
2 1
(n)
2 (n)
2
(n))
1
2
2
P
(x 2 i( n))22
2
(1 2 x i2 (n ))2 1
▪ 总体均值未知时,总体方差的区间估计
2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x = x , x ≤ x ≤ + x
样本平均数 x 是以总体平均数 为中心,在 ( x, + x) 之间变动. ) 样本成数 p 是以总体成数 P 为中心,在( P p, P + p范围 内变动.
p = p P , P p ≤ p ≤ P + p
(三)抽样误差范围及其可靠程度
概率度t 1 1.5 1.96 2 3
置信概率F(t) 0.6827 0.8664 0.9500 0.9545 0.9773
(四)影响抽样误差的因素
1抽样单位数n的多少 样本容量越大,抽样误差则越小. 2总体标志的变异程度 变异程度越大,抽样误差就越大,反之,总体标 志变异程度越小,则抽样误差越小.当总体各单 位标志值都相等,那么抽样指标就等于总体指标, 抽样误差也就不存在了. 3抽样的组织方式和抽样方法 在相同条件下,重复抽样的误差大于不重复抽样 的误差.
2抽样成数的平均误差 成数的抽样平均误差表明各样本成数和总体成数绝对 离差的一般水平. x p = p, σ p = p (1 p ) 重复抽样的条件下,成数的抽样平均误差为:
δp =
p (1 p) n
不重复抽样的条件下,成数的抽样平均误差为:
p(1 p) N n p(1 p) n δp = *( )≈ (1 ) n N 1 n N 在得不到总体成数P的资料时,也可以用实际样本的 抽样成数p来代替
n = (Z α 2 ) P (1 P)
2
2 p
(三)总体方差的区间估计
总体均值已知时,总体方差的区间估计 Nhomakorabeaχ
2
∑ (x =
2 2
i
)
2
2
σ
χ (n)
2
P ( λ1 < χ ( n ) < λ 2 ) = 1 α P ( χ ( n ) ≤ λ1 ) = P ( χ ( n ) ≥ λ 2 ) =
2
总体均值未知时,总体方差的区间估计
χ =
2

2 1
( xi x ) 2
σ
α
2
2
=
( n 1) S n2 1
σ
2
χ 2 ( n 1)
P ( λ1 < χ 2 ( n 1) < λ 2 ) = 1 α
λ1 = χ
( n 1), λ 2 = χ α ( n 1)
2 2
2 ( n 1) S n 1 P 2 ≤σ χ α ( n 1) 2
抽样设计的基本原则
其次,考虑样本容量(Sample size)和结构问 题.样本容量取决于对抽样推断准确性,可 靠性的要求.抽样设计应该善于评价而且有 效利用由于调整样本结构而产生的效果. 再次,抽样的组织形式问题. 最后,调查费用.可变费用和不变费用.在 一定误差的要求下选择费用最小.或者一定 费用开支条件下,选择误差最小.
二,参数的区间估计
Parameter inter-regional estimation 基本特点是 根据给定的概率保证程度的要求,利用实际抽样 资料,指出总体参数的上限和下限,即给出总体 参数可能存在的区间范围.即,对于总体的被估 计指标 X,找出样本的两个估计量 X 1 和 X 2 ,使被估 计指标 X 落在区间 ( X 1 , X 2 )内的概率为 1 α ,0 < α < 1 为已知,即P( X 1 ≤ X ≤ X 2 ) = 1 α 称区间 ( X 1 , X 2 ) 为总 体指标 X 的置信区间,置信概率为 1 α , α X 为显著性水平, 1 是置信下限,X2 是置信上限.
第二节 参数估计
参数估计(parameter estimation),是指利用实 际调查计算的样本统计量来估计相应的总体指标 的数值,由于总体指标是表明总体数量特征的参 数,所以叫做参数估计.估计方法有点估计,区 间估计两种. 一,参数的点估计 (一)点估计方法 根据总体指标的结构形式设计样本指标(称统计 量)作为总体参数的估计量,并以样本指标的实 际值直接作为相应总体参数的估计值.
第七章 抽样推断与检验
6学时
第一节 抽样中的几个基本概念
一,抽样推断及其应用 抽样推断(sampling inference)是在抽样调查的 基础上,利用样本的实际资料计算样本指标,并据 以推算总体相应数量特征的一种统计分析方法. 特点: 1. 抽样推断是建立在随机取样的基础上,坚持抽取的 随机原则,增强被抽中单位对总体的代表性. 2. 抽样推断是由部分推算整体的一种认识方法. 3. 抽样推断以概率论中的大数法则和中心极限定理为 理论依据. 4. 抽样误差可以事先计算和控制.
2抽样误差范围估计的可靠程度 抽样误差范围是用一定倍数的抽样平均误差 来表示的,这个倍数一般用t表示,它是以抽 样平均误差为尺度来衡量的相对误差范围, 我们称之为概率度.用公式表示: x = tδ x , p = tδ p 在一定抽样平均误差条件下,概率度 t 越大, 则抽样误差范围越大,区间 ( x x , x + x ) 或 ( p p , p + p ) 越宽,总体参数落在区间内的 概率越大,抽样估计的可靠程度就越高.概 率度t与置信概率成正比.
二,抽样的组织设计
(三)等距抽样(systematic sampling)也称 机械抽样或系统抽样,先按某一标志对总体 各单位进行排队,然后依一定顺序和间隔抽 样的一种组织方式.第一个样本单位随机确 定后,其余各单位的位置也确定了. (四)整群抽样(Cluster sampling)也称集 团抽样,是将总体各单位划分成许多群,然 后从其中随机抽取部分群,对中选群的所有 单位进行全面调查的抽样组织方式.不存在 组内误差.
(三)抽样误差范围及其可靠程度
1抽样极限误差 抽样误差范围就是变动的抽样指标与确定的总体参数之 间的离差的可能范围. 它是根据概率论,以一定的可靠程度保证抽样误差不超 过某一给定的范围,统计上把这个给定的抽样误差范围 叫做抽样极限误差(the limit error of sampling),也称 为抽样允许误差.
四,抽样误差
(一)抽样误差的概念 抽样误差(error of sampling):由于抽样的 随机性所导致的样本指标与被它估计的总 体相应指标的差数. 抽样误差越小,说明样本指标对总体指标 的代表性越高.反之,抽样误差越大,则 说明样本指标对总体指标的代表性低.
四,抽样误差
(二)抽样平均误差 由于总体参数是未知数,因此抽样实际误差是不可能 计算得到的.为了反映抽样误差的一般水平,需要采 用抽样平均误差指标. 用所有可能样本的统计量与相应的总体参数的标准差 来反映所有可能样本的统计量于总体参数的平均差距. 抽样平均误差(average error of sampling)通常用 δ 符号δ来表示.用 δ x 表示平均数的抽样平均误差; p 表示成数的抽样平均误差.M表示可能出现的样本种 数.
2
x
N ( ,σ / n )
2
采用统计量Z,将非标准正态分布转化为标准正 态分布, x
Z=
σ
n
N ( 0,1)
(一)总体均值的区间估计
对于给定的置信概率 1 α ,查正态分布表, Zα 得出相应的临界值 ,/2
P Z α < Z < Z α = 1 α 2 2 x < Zα = 1 α P Z α < 2 σ n 2 σ σ P x Zα < < x + Zα = 1α n n 2 2
(二)总体成数的区间估计
在大样本 大样本下,样本成数的分布趋近于如下正态分布: 大样本
p ~ N ( P, P (1 P) / n)
pP P (1 P ) n ~ N ( 0 , 1)
设在1- α 的置信度下,对应的临界值为Z α/2 ,则易知
p P ≤ Z α 2 P (1 P ) n
于是,如果允许误差为 p,可得最小的抽样数目:
δx =
(x )2 ∑ M
δp =
( p P) 2 ∑ M
(二)抽样平均误差
1平均数抽样平均误差 重复抽样 不重复抽样
δx = σ 2 ( N n)
n ( N 1)
δx =
σ2
n
=
σ
n
σ2
n (1 ) n N
δx =
相同条件下,不重复抽样误差数值一定小于重复 抽样的抽样误差.
(二)抽样平均误差
一,参数的点估计
(二)点估计量优劣的标准 1无偏性(unbiasedess),要求所有可能样本指 标的平均数与被估计的总体参数之间没有偏差. 2一致性(consistent),用统计量估计总体参数 要求当样本的单位数充分大时,抽样指标也充分 地靠近总体指标. 3有效性(availability),以统计量估计总体参数 时,优良估计量的方差应该比其他估计量的方差 小.
二,参数和统计量
(二)参数和统计量 参数(parameter)是抽样推断所要推断的 总体指标.例如,σ2,总体成数p 总体成数p:表示总体中具有某种性质的单 位数在总体全部单位中所占的比重. 统计量 (statistic):根据样本各单位标志 值或标志属性计算的综合指标. 例如:样本平均数,样本方差,样本成数.
(一)总体均值的区间估计
σ 2 未知时总体均值的区间估计 2 总体方差
当总体服从正态分布,但是总体方差未知时,要 2 代替 σ 2 来建立置信区间. 用样本修正方差 S n 1 新统计量服从自由度为n-1的t分布.
x T= S n 1 n
t ( n 1)
S n 1 S n 1 , x + tα (n 1) x tα (n 1) n n 2 2
(一)总体均值的区间估计
考虑三个问题: 总体的分布形式,即总体是否服从正态分 布. 总体方差 σ 2 是否已知. 当总体为非正态分布或分布形式未知时, 要考虑样本容量n的大小来确定采用何种估 计方式.
相关文档
最新文档