统计学第七章抽样推断

合集下载

抽样推断syong专业知识讲座

抽样推断syong专业知识讲座

计算出各样本旳均值,如下表。
样本平均数
概率
11.52
2.533.54
1/162/163/164/163/162/161/16
样本平均数旳均值或
抽样平均误差是全部样本指标与总体指标离差旳平均水平,所以有下列计算
0.7906件旳含义是,对于16个样本,不论抽到哪个样本平均来说误差为0.7906件。
二、抽样推断旳特点 1、抽样推断是非全方面调查。能够节省人力物力和财力,取得事半功倍旳效果。 2、抽样推断是按随机原则抽选调查单位。 3、抽样推断是用样本旳指标数值去推算总体旳指标数值。 4、抽样推断利用旳是概率原理。 5、抽样推断中产生旳误差能够事先计算并加以控制。
2.抽样平均误差旳计算
27
(2)样本成数旳抽样平均误差
抽样平均误差
【例】从10000名学生中抽查200名测得平均身高为1.65m,已知学生身高旳总体原则差σ=0.28。其中女生占全部学生旳比重30%。求学生平均身高和女生比重旳抽样平均误差。
抽样平均误差(举例)
解:已知N=10000,n=200, x =1.65m,σ = 0.28,p = 30%
(例题分析)
【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产旳一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量旳分布服从正态分布,且总体原则差为10克。试估计该批产品平均重量旳置信区间,置信水平为95%
§7.4 参数估计旳一般问题
估计量与估计值评价估计量旳原则点估计与区间估计
估计量:用于估计总体参数旳随机变量如样本均值,样本百分比、样本方差等例如: 样本均值就是总体均值 旳一种估计量参数用 表达,估计量用 表达估计值:估计参数时计算出来旳统计量旳详细值假如样本均值 x =80,则80就是旳估计值

教育统计学_第七、八章 抽样分布及总体平均数的推断

教育统计学_第七、八章 抽样分布及总体平均数的推断

20 1
20 1
P(57.14 68.86) 0.99
答:该地区这一年高考数学平均分95%和99%的 置 信 区 间 分 别 为 58.72 至 67.28 分 之 间 和 57.14 至 68.86分之间。
3.大样本的情况:
当样本容量比较大,自由度在逐渐增大,这时的t分布 已经非常接近正态分布。这时可把t分布转成标准正态 分布来作处理。然后再作区间估计。
n
n
P( X 1.96 X 1.96 ) 0.95
n
n
要在一定可靠度上求出总体参数的置信区间的 上下限,需要以下条件:
1.要知道与所要估计的参数相对应的样本统计量的 值,以及样本统计量的理论分布;
2.要求出该种统计量的标准误;
3.要确定在多大的可靠度上对总体参数作估计,再 通过查某种理论概率分布表,找出与某种可靠度相 对应的该分布横轴上记分的临界值,才能计算出总 体参数的置信区间上下限。
三、 σ未知条件下总体平均数的区间估计
1.σ未知条件下总体平均数区间估计的基本原理 (1)当总体σ未知,总体呈正态分布,大样本或小
样本时
(2)或当总体σ未知,总体虽不呈正态分布,大样 本容量较大(n>30)时,样本平均数可以转换成t 值。
总体平均数95%置信区间为:
P(t X t ) 0.95
E(X )
第一节 抽样分布
2、容量为n的平均数在抽样分布上的标准差,等 于总体标准差除以n的方根。
X
n
第一节 抽样分布
3、从正态总体中,随机抽取的容量为n的一切可能 样本平均数的分布也呈正态分布。
4、虽然总体不呈正态分布,如果样本容量较大, 反映总体μ和σ的样本平均数的抽样分布,也接近于 正态分布。

统计学原理第七章 抽样调查

统计学原理第七章 抽样调查
29


x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;

《统计学原理》课件第七章抽样调查

《统计学原理》课件第七章抽样调查
4 -6
第二节 抽样调查的基本概念
全及总体(总体) 样本总体(样本)
几组基 本概念
重复抽样 不重复抽样
大数定律 中心极限定理
4 -7
研究对象
抽 取 方 法
重复考虑顺序 不重复不考虑 顺序

究 原
总体分布 样本分布 抽样分布

一、全及总体和样本总体
全及总体:也称总体。指所要认识对象的全体。 用N表示有限总体的单位数,称总体容量。
m
lim p n
n
p
ε
1
贝努大数定律对于抽样调查的意义:
从理论上解释了用频率代替概率的理论依据, 即随着抽样单位数n的增加,事件A发生的频率接近 于事件A发生的概率。
4 - 18
大数定律特点
大数定律论证了抽样平均数趋近于总体平均 数的趋势,这为抽样推断提供了重要依据。 但是:
抽样平均数和总体平均数的离差究竟有多大? 离差的分布状况怎样? 离差不超过一定范围的概率究竟有多少?
(二)抽样成数的抽样平均误差
重复抽样: 不重复抽样:
p
p1 p
n
p
p1 p 1 n
n N
说明:实际应用中,平均数和成数的标准差一般是 未知的,通常采用如下方式解决 (1)用过去调查的资料 (2)样本方差的资料代替总体方差 (3)用小规模调查资料 (4)用估计材料
4 - 30
【进上例行者】测为试合某(1,格灯)平资品泡均料,厂使如计对用下算10时。这00按批0间个质灯:x产量泡品规的进定时x行ff,间寿灯抽命2泡样12检10使平40测0用均0,寿误随1命差0机5在和7(抽小1合0取时格002)率小%样的时本平以
按照随机原则 从调查对象中抽取一部分单位进行 观察,并运用数理统计的原理,以被抽取的那部分 单位的数量特征为代表,对总体做出数量上的推断 分析

统计学中的抽样与推断

统计学中的抽样与推断

统计学中的抽样与推断在统计学中,抽样与推断是非常重要的概念。

它们涉及到我们如何从一小部分样本中推断出整个总体的特征。

在这篇文章中,我们将讨论抽样的不同方法以及如何使用样本数据进行推断。

一、抽样方法在统计学中,我们通常使用以下三种抽样方法:1. 简单随机抽样这是最基本的抽样方法。

简单随机抽样意味着从总体中随机抽出样本,每个样本被抽样的概率相等。

这种方法可以确保样本的代表性。

例如,如果我们要调查一个城市的人口,我们可以从人口登记簿中随机抽取一定数量的人口作为样本。

2. 分层抽样分层抽样是把总体划分为若干个层次,然后从每个层次中随机抽取样本。

这个方法可以减小代表性偏差。

例如,如果我们要调查一个城市的人口,我们可以按照不同的年龄段对总体进行分层,然后从每个年龄段中随机抽取一定数量的人口作为样本。

3. 系统抽样这是从总体中按照一定的规则抽样。

例如,如果我们要调查一个工厂中的员工,我们可以按照员工的工号顺序每隔一定数量抽取一个员工作为样本。

二、样本统计量的计算在进行统计推断之前,我们需要先计算样本统计量。

样本统计量是样本数据的数量指标,可以代表总体的特征。

常见的样本统计量包括:1. 样本均值样本均值是样本数据的平均值。

它可以代表总体的平均值。

例如,我们可以从一个城市的人口中随机抽取一部分人口,计算他们的平均收入,这个平均收入就是样本均值。

2. 样本标准差样本标准差是样本数据的标准差。

它可以代表总体的方差。

例如,我们可以从一个工厂中随机抽取一部分产品,计算它们的重量,这个重量的标准差就是样本标准差。

三、参数估计我们通常使用抽样中的样本统计量来估计总体参数。

例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。

常见的参数估计方法包括:1. 点估计点估计是用样本统计量来估计总体参数的方法。

例如,我们可以使用样本均值来估计总体均值,使用样本标准差来估计总体标准差。

2. 区间估计区间估计是用一个区间来估计总体参数的方法。

第七章 抽样推断

第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制

ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n

《统计学》第七章抽样推断第二节 抽样误差

《统计学》第七章抽样推断第二节 抽样误差
6-3
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差

p p P


如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差

抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:

x x X

即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x

n
式中,n为样本容量; 为总体标准 。


成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)

7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)

2

第7章 抽样推断

第7章 抽样推断


D 所调查的200名学生
正确答案是( C )
同步训练
8. 某大学的一位研究人员希望估计该大学本科生 平均每月的生活费支出,为此,他调查了200名学 生,发现他们每月平均生活费支出是500元。该研 究人员感兴趣的参数是( ) A 该大学的所有学生 B该大学所有大学生的月平均生活费支出 C该大学所有的在校本科生
经常采用的样本指标主要有样本均值、样本比例和样 本方差。
(二)总体指标和样本指标

样本均值:

未分组 分 组
x x2 xn x 1 n
x
i 1
n
i


样本比例:
x f x f
i i
n
i

样本方差:

n1 p n
S
S
2
未分组
2
(x
i
i
x)2
n 1
x)2 fi
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
二、抽样推断的特点 • 按随机原则抽取样本
每个单位都有 相同的被抽中 的机会,哪个单 位被抽中,由随 机因素确定,完 全排除抽样者 的个人主观意 志
• 运用概率论的理论和方法,用样本指标来推断 总体指标。 • 推断的误差可以事先计算和控制。
N! M n!( N n)!
M
( N n 1)! n!( N 1)!
(五)抽样组织方式
简单随机抽样
类型抽样
整群抽样 等距抽样 多阶段抽样
抽样的组织方式
简单随机抽样
简单随机抽样也叫纯随机抽样。它是按照随机原则直接从总体 N个单位中抽取n个单位作为样本,然后通过对样本单位的调

经济统计学第7章抽样调查

经济统计学第7章抽样调查
CHAPTER ONE
参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15

第7章 抽样调查及答案

第7章  抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。

它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。

是一种灵活快捷的调查方式。

2.抽样调查有全及总体与样本总体之区分。

样本容量小于30时一般称为小样本。

对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。

样本可能数目与样本容量有关也与抽样的方法有关。

抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。

正态分布的密度函数有两个重要的参数(σ;x )。

它有对称性、非负性等特点。

中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。

推出了样本分布的标准差为:1--=N n N n x σμ。

4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。

无偏性、一致性和有效性是抽样估计的优良标准。

抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。

抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。

在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。

在通常情况下总体的方差是未知的,一般要用样本的方差来代替。

把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。

μt =∆,用抽样的平均误差来度量抽样的极限误差。

把抽样估计的把握程度称为抽样估计的置信度。

抽样的极限误差越大,抽样估计的置信度也越大。

抽样估计又可区分为点估计和区间估计。

统计学课件:抽样推断

统计学课件:抽样推断

3.当总体X~N(, 2),从中抽取容量为n的样本,则
n
2
(n 1)s2
2
~
(2 n-1); 2
(xi x)2
i 1
2
~
(2 n-1)
4. 2—分布的性质 (1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ), X,Y独立,则 X +Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则 E(X)= n,D(X)=2n
3、进行产品质量检验 4、进行假设检验
(一)总体和样本 1、总体 总体也称全及总体,指所有认识的研究对象全体,它是
有所研究范围内具有某种共同性质的全体单位所组成的 集合体。 一般用英文字母大写N来表示总体的单位数。 2、样本 样本又称子样,它是从全及总体中随机抽取出来,作为 代表这一总体的那部分单位组成的集合体。 一般用英文小写字母n来表示样本的单位数。
5. 分位点 设X ~ 2(n),若对于:0<<1,
存在 2 (n) 0 满足
P{X 2 (n)} ,
则称 2 (n) 为 2 (n) 分布的上分位点。
2
(n
)
(二)t 分布
若X 服从N (0,1),Y 服从自由度为n的 2分布, 且X 和Y 独立,则 X
Y /n 服从自由度为n的 t分布。
1、全及指标 根据各单位的标志值或标志属性计算的,反映总体
数量特征的综合指标称为全及指标,又称为参数。
设总体变量 X 为: X1, X 2 ,X N 则有:
X X XF N F
2 X X 2 X X 2 F
N
F
设总体 N 个单位,有 N1 个单位具有某种性质, N0 个单位不具有某种性质,

第七章 统计 抽样推断

第七章 统计 抽样推断

与全面调查相比,抽样调查既节省了人力、 物力、财力和时间,又达到了认识总体数量特 征的目的。我国在1994年确立了以周期性普查 为基础,以经常性抽样调查为主体,同时辅之 以重点调查、科学核算等综合运用的统计调查 方法体系。
三、优点:
1、更科学
2、更经济 3、时效性强 4、应用广
四、抽样推断的应用
n AN N!/( N n)!
N
n
不考虑顺序的不重复抽样
不考虑顺序的重复抽样
C
n N
C
n N n1
第三节:点估计和抽样平均误差
人们每时每刻都在做估计。根据婴儿的哭 声估计其冷热和什么时候吃奶、根据望闻问切 来估计病人的病情、根据外表估计一个人的身 高体重、根据前几天的数据估计今天的股市行 情,根据营业数据等估计一个公司的业绩等等。 估计就是根据你拥有的信息来对现实世界进行 某种判断。统计中的估计也不例外,它是完全 根据数据做出的。
x 或p P
1、抽样误差是个概念,只能理解无法计算;
2、抽样误差是个变量,随着样本不同而不同。
问:抽样误差是个变量,那么抽样误差有多少个 变量值?
二、抽样平均误差
• 平均误差
(一)抽样平均误差的定义公式 1、平均数的抽样平均误差
x
(x )
2
所有可能的样本数目
2、成数的抽样平均误差
指样本单位的抽取不受主 观因素及其他系统性因素 的影响,每个总体单位都 有均等的被抽中机会
抽样推断
总体指标:参数
(未知量)
统计推断
样本总体指标:统
计量(已知量)
例1 对湖中鱼产量的估计。 欲了解某湖中鱼的总产量,如果湖中有N条鱼, 平均每条鱼的重量为

河南财经政法大学统计学练习题 抽样推断习题

河南财经政法大学统计学练习题 抽样推断习题

第七章抽样推断习题一、单项选择题1、抽样推断的主要目的是()①对调查单位作深入研究②计算和控制抽样误差③用样本指标来推算总体指标④广泛运用数学方法2、抽样调查与典型调查的主要区别是()①所研究的总体不同②调查对象不同③调查对象的代表性不同④调查单位的选取方式不同3、按随机原则抽样即()①随意抽样②有意抽样③无意抽样④选取样本时要求总体中每个单位都有相等的机会或可能性被抽中4、抽样应遵循的原则是()①随机原则②同质性原则③系统原则④及时性原则5、下列指标中为随机变量的是()①抽样误差②抽样平均误差③允许误差④样本容量6、下列指标中为非随机变量的是()①样本均值②样本方差③样本成数④样本容量7、样本是指()①任何一个总体②任何一个被抽中的调查单位③抽样单元④由被抽中的调查单位所形成的总体8、从单位总量为20的总体中,以简单随机重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个9、从单位总量为20的总体中,以简单随机不重复抽样抽取5个单位,则可能的样本数目是()①250个②25个③3200000个④15504个10、抽样误差是指()①在调查过程中由于观察、测量等差错所引起的误差②在调查中违反随机原则出现的系统误差③随机抽样而产生的代表性误差④人为原因所造成的误差11、抽样极限误差是()①随机误差②抽样估计所允许的误差的上下界限③最小抽样误差④最大抽样误差12、抽样平均误差就是()①样本的标准差②总体的标准差③随机误差④样本指标的标准差13、在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者14、在其它条件相同的情况下,重复抽样的估计精确度和不重复抽样的相比()①前者一定大于后者②前者一定小于后者③两者相等④前者可能大于、也可能小于后者15、抽样估计的可靠性和精确度()①是一致的②是矛盾的③成正比④无关系16、抽样推断的精确度和极限误差的关系是()①前者高说明后者小②前者高说明后者大③前者变化而后者不变④两者没有关系17、点估计的优良标准是()①无偏性、数量性、一致性②无偏性、有效性、数量性③有效性、一致性、无偏性④及时性、有效性、无偏性18、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应()①增加8倍 ②增加9倍 ③增加45倍 ④增加2.25倍 19、在简单随机重复抽样下,欲使抽样平均误差缩小31,则样本容量应( ) ①增加8倍 ②增加9倍③增加2.25倍 ④的确应考虑抽样方法和抽样组织形式等20、当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )①51% ②49%③70% ④30%21、在500个抽样产品中,有95%的一级品,则在简单随机重复抽样下一级品率的抽样平均误差为( )①0.9747% ②0.9545%③0.9973% ④0.6827%22、若样本均值为120,抽样平均误差为2,则总体均值在114—126之间的概率为( ) ①0.6827 ②0.90③0.9545 ④0.997323、若有多个成数资料可供参考时,确定样本容量或计算抽样平均误差应该使用( ) ①数值最大的那个成数 ②数值最小的那个成数③0.5 ④数值最接近或等于0.5的那个成数24、影响分类抽样平均误差大小的主要变异因素是( )①类内方差 ②类间方差③总体方差 ④样本方差25、影响整群抽样平均误差大小的主要变异因素是( )①群内方差 ②群间方差③总体方差 ④样本方差26、当有多个参数需要估计时,可以计算出多个样品容量n ,为满足共同的要求,必要的样本容量一般应是( )①最小的n 值 ②最大的n 值③中间的n 值 ④第一个计算出来的n 值27、抽样时需要遵循随机原则的原因是()①可以防止一些工作中的失误②能使样本与总体有相同的分布③能使样本与总体有相似或相同的分布④可使单位调查费用降低二、多项选择题1、抽样推断的优点()①时效性强②更经济③能够控制抽样估计的误差④适用范围广⑤无调查误差2、抽样推断适用于()①具有破坏性的场合②用于时效性要求强的场合③对于大规模总体和无限总体的场合进行调查④用于对全面调查的结果进行核查和修正⑤不必要进行全面调查,但又需要知道总体的全面情况时3、同其它统计调查比,抽样推断的特点是()①比重点调查更节省人、财、物力②以部分推断总体③采用高率估计的方法④可以控制抽样误差⑤按随机原则抽选样本4、目标总体与被抽样总体相比()①前者是所要认识的对象②后者是抽样所依据的总体③两者所包含的单位数有时相等,有时不等④两者所包含的单位数相等⑤两者是不同的概念,所包含的单位数不等5、重复抽样和不重复抽样差别有()①可能的样本数目不同②抽样误差的大小不同③抽样误差的计算公式不同④前者属于随机抽样,后者属于非随机抽样⑤两者适用的情况不同6、抽样推断()①是科学的资料收集方法②是科学的推断方法③是非全面调查④典型调查的一种7、抽样推断中哪些误差是可以避免的()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④因抽样破坏随机原则而造成的方向性偏差8、抽样误差中不包括()①调查性误差②因抽样破坏随机原则而造成的系统性偏差③抽样误差④由于工作失误所造成的误差9、样本平均数的()①分布在大样本下服从或近似服从正态分布②平均数是总体平均数③方差是总体方差④平均数是随机变量⑤分布与总体的分布形式相同10、抽样平均误差是()①所有可能抽样误差的一般水平②总体标准差③估计量的标准差④无偏估计量的标准差⑤样本的标准差11、影响抽样平均误差的主要因素有()①总体的变异程度②样本容量③重复抽样和不重复抽样④样本各单位的差异⑤估计的可靠性和准确度的要求12、计算抽样平均误差时,若缺少总体方差和总体成数,可用的资料有()①过去抽样调查得到的相应资料②小规模调查得到的资料③样本资料④过去全面调查得到的资料⑤重点调查得到的资料13、极限误差是()①衡量估计准确度的尺度②大于抽样平均误差的确定数值③是满足一定可靠性要求的最大抽样误差的绝对值④最大抽样误差⑤小于抽样平均误差的确定数值14、区间估计的要素是()①点估计值②样本的分布③估计的可靠度④抽样极限误差⑤总体的分布形式15、抽样估计的优良标准主要有()①无偏性②一致性③可靠性④有效性⑤及时性16、影响必要样本容量的因素主要有()①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样④样本的差异程度⑤估计的可靠度17、假设检验()①用了反证法的思想,和数学中的反证法是有区别的②用了反证法的思想,和数学中的反证法是没有区别的③可能会犯第一类型错误,即“受伪”错误④可能会犯第二类型错误,即“弃真”错误⑤在样本容量固定时,犯“弃真”和“受伪”错误的概率是相互制约的,无法使它们同时尽可能地小18、类型抽样的优点是()①只适合对各类分别进行估计②只适合对总体进行估计③既可以对各类分别进行估计,也可以对总体进行估计④估计的效果较好,在实践中广泛应用⑤可使总体的方差减少19、系统抽样()①按无关标志排队的系统抽样,可看作不放回的简单随机抽样②按有关标志排队的系统抽样,其效果要高于不放回的简单随机抽样③按有关标志排队的系统抽样,其效果要低于不放回的简单随机抽样④要避免抽样间距和现象本身的周期性节奏相重合⑤在常见的抽样方法中,它的误差一定是最小的20、整群抽样中的群与分类抽样中的类相比()①两者相同②两者不同③两者的划分原则正好相反④要求群内差异大⑤要求类内差异大三、填空题1、抽样推断就是根据( )的信息去研究总体的特征。

《应用统计学》第七章:抽样推断

《应用统计学》第七章:抽样推断

样本指标
n

样本均值:

x

x1

x2
...
xN

xi
i1
n
n
样本成数: p n1
n
样本方差:S2 1
_
(x - x)2
n 1
样本标准差: S S2
四、抽样的理论依据
大数定律
• 切贝谢夫定理:当样本容量n足够大时,独立同分布的 一系列随机变量的算术平均数接近(依概率p收敛于)数 学期望值,即随机变量平均数具有稳定性,该定律提 供了用样本平均数估计总体平均数的理论依据。
N
总体均值:

X

X1

X2
...
XN

Xi
i1
N
N
总体成数: X)2 N _
总体方差: 2 (X - X)2 N
样本指标
由样本内各个单位标志值或标志特征计算的综合 指标称为样本指标
与总体指标相对应,样本指标也有样本平均数, 样本成数,样本标准差及样本方差,样本均值及 样本成数一般用小写字母来表示。
P(1- P) (1- n ) nN
【举例】抽样成数的抽样平均误差的计算
返回
第三节 抽样方案设计
简单随机抽样 类型抽样(分层随机抽样) 机械抽样 整群抽样 多阶段抽样
一、简单随机抽样
简单随机抽样又称为纯随机抽样,它是对总体不 作任何处理,不进行分类也不搞排队,而是从总 体的全部单位中随机抽选样本单位。
组单位数的多少与各组标志变动程度的差异两个
因素。
ni
抽样调查的特点
按随机原则抽取调查单位 根据部分实际资料对全部总体的数量特征

抽样推断的基本概念

抽样推断的基本概念

抽样误差是抽样调查自身所固有的、不可 避免的误差,虽然不能消除这种误差,但 有办法进行计算,并能对其加以控制。
抽样平均误差是指所有可能组成的样本的
15
二、抽样推断的几个基本概念
对于同一总体,按同一数目进行抽样,可 以得到许多样本,每一个样本都可以计算 出抽样平均数、抽样成数和抽样误差。
这些数都带有偶然性,有大有小。为了能 用样本指标去推算总体指标,就需要计算 抽样误差的平均数,这个平均数就是抽样 平均误差。
第二,有些总体从理论上讲可以进行全面调查,但实际 办不到或没有必要,可以用抽样推断的方法解决。
第三,用于那些具有破坏性与消耗性的产品质量检查。 第四,对全面调查资料进行评价与修正。 第五,用于工业生产管理。抽样推断可以用于生产过程
中的质量控制,检查生产工艺过程是否正常。 第六,抽样推断能节省人力、物力、财力和时间,比较
统计学
抽样推断的基本概念
一、抽样推断的意义
教学资源
2
一、抽样推断的意义
抽样推断是一种非全面调查,是按照随机 原则,从总体中抽取一部分单位进行调查, 并以其结果对总体某一数量特征做出估计 和推断的一种统计方法,抽样推断的基本 要求是严格按照随机原则抽取样本单位。
3
一、抽样推断的意义
抽样推断作为一种专门的统计方法在实践中得到了广泛 的应用。
且p n1
q 。 则n0 : n n1 1 p
n
nn
其中,p为样本总体中具有某种属性的单
位数占全部单s 位数p的1比p重 ,q为样本总体
中不具有某种属性的单位数占全部单位数 13
二、抽样推断的几个基本概念
3.样本容量与样本个数 样本容量是指一个样本所包含的单位数,
用n来表示。对比全及总体单位数N来说, n则是个很小的数,它可以是N的几十分 之一、几百分之一、几千分之一、几万分 之一。

统计学原理任务七统计分析——抽样推断

统计学原理任务七统计分析——抽样推断
统计学原理
任务七

统计分析——抽样推断
掌握抽样推断基础知识 计算抽样误差 抽样估计 确定必要样本容量 认识抽样组织形式任务四 分任务五 分任务六
分任务一
掌握抽样推断基础知识
7.1
一、抽样推断的含义与作用
(一)抽样推断的含义 抽样推断是按照随机原则,从总体中抽出一 部分单位作为样本,对样本进行详细地调查 登记,并计算出样本指标数值,然后根据样 本指标数值对总体的数量特征(总体指标数 值)作出具有一定可靠程度的估计和判断的 一种统计分析方法。
7.1

三、抽样推断中的基本概念
(二)全及指标和抽样指标 1.全及指标 全及指标是指根据全及总体各个单位的标志值或标志特征计算的, 反映总体某一方面特征或属性的综合指标。由于全及总体是唯一 确定的,因而全及指标数值也是唯一确定的。
7.1

三、抽样推断中的基本概念
(二)全及指标和抽样指标 2.抽样指标 抽样指标是指由抽样总体各个单位标志值或标志特征计算的,反 映抽样总体某一方面特征或属性的综合指标。由于从一个全及总 体中可以抽出许多个样本,样本不同,抽样指标的数值也就可能 不同,所以抽样指标的数值不是唯一确定的。
7.2

三、抽样平均误差
7.1
三、抽样推断中的基本概念



(三)样本容量和样本个数 1.样本容量 样本容量是指一个样本所包含的单位数,通常用小 写英文字母n表示。 2.样本个数 从总体N个单位中随机抽选n个单位构成样本,通常 有多种抽选方法,每一种抽选方法实际上是n个总体 单位的一种排列组合,一种排列组合便构成一个可 能的样本,n个总体单位的排列组合总数,称为样本 个数或者样本的可能数目,常用小写英文字母k表示。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(pP)2
(pp)2
样本的可能 数 样目 本的可能数目
由此可见,抽样平均误差就是样本平均数或样本成数的标准差。 在实际中,重复抽样的抽样平均误差为:
x
n2或p
PQ n
2020/9/24
• 不重复抽样的情况下,样本平均数或样本成数的标准差为:
x p
2 (N n) 2 (1 n )
n N 1
第二节 抽样推断中的几个基本概念
一、总体
(一)总体的概念 (二)分类 1、按照全及总体所包含总体单位个数的多少,可以分为有限总
体和无限总体 2、按照全及总体中各单位标志的性质不同,可以分为属性总体
和变量总体 3、按照样本单位的来源不同,可将总体分为目标总体和被抽样
总体
2020/9/24
(三)反映总体特征的主要指标 对于变量总体,反映总体集中分布趋势的算术平均数
• (二)样本成数的抽样分布定理
• 三、抽样误差与抽样平均误差
• (一)抽样误差
• 由抽样随机性所产生的样本指标与总体指标之间的离差叫做抽
样误差。如
x或pP
2020/9/24
(二)抽样平均误差
• 抽样平均误差可以表示为:
x 样本(x的 可 )2 能数 样目 本(x的 x)可 2 能数目
p
P 2 PQ PQ
二、样本 (一)样本的概念
样本容量n≥30为大样本,n≺30为小样本 (二)反映样本特征的主要指标 对于样本变量总体:
n
k
xi
xi fi
x i1
n
或x
i 1 k
fi
i 1
n
k
(xi x)2
(xi x)2 fi
s2 i1 n1
或s2 i1 k
fi 1
i1
2020/9/24
x x
pP p
1、在总体为正态分布,且总体方差已知
抽样平均数的允许误差为 抽样成数的允许误差
x z1x 2
p z1p 2
2020/9/24
• 2、在任意一个总体中抽样,总体方差已知,如果样本容量 n≥30时:
平均数的极限误差 成数的极限误差
x z1x 2
p z1p 2
3、在正态分布总体中抽样,样本容量n≺30,且总体方差未知的 情况下:
N
Xi
i1
N
K
X iFi
i1 K
Fi
i1
反映总体离中分布趋势的方差或标准差
N
(Xi )2
2 i1
N
K
( X i ) 2 Fi
2 i1 K
Fi
i 1
N
(Xi )2
i1
N
K
( X i )2 Fi
i1 K
Fi
i 1
2020/9/24
对于属性总体,其平均数和方差或标准差为:
二、特点: 1、样本单位是按随机原则抽取的 2、抽样推断是一种从数量上由部分推断总体的研究方法 3、抽样推断是采用概率估计的方法 4、抽样推断的误差可以事先计算并加以控制 三、抽样推断的应用 (一)调查具有破坏性的场合 • (二)对无限总体或总体规模非常大的场合进行调查
2020/9/24
(三)不必要进行全面调查但又需要知道总体的全面情况时 (四)对全面调查的结果进行核查和修正 (五)对资料时效性要求很强的场合
2、在简单随机不重复抽样时
pE(p)P
p 2 P (1 n P ) N N 1 n 或 pP (1 n P ) N N 1 n
2020/9/24
二、抽样分布定理

(一)样本平均数的抽样分布定理
• 1、正态分布的再生定理 • (一)正态分布的再生定理.doc • 2、中心极限定 • (一)正态分布的再生定理.doc • 3、小样本条件下的t分布定理
n
N
PQ(N n) PQ(1 n )
n N 1
n
N
可见,影响抽样误差大小的因素有: 1、总体各单位的差异程度 2、样本容量的大小 3、抽样方法 4、抽样的组织形式
2020/9/24
• (三)抽样极限误差 • 抽样极限误差就是指样本指标与全及总体指标之间误差的最大
可能范围,通常用“△”表示:
平均数的极限误差 成数的极限误差
四、样本的可能数目
在讲顺序的重复抽样的条件下,样本的可能数目为 N n
在不讲顺序的不重复抽样下,样本的可能数目为:
C
n N
五、抽样调查的理论基础
(一)大数定律 大数定理是关于大量的随机先行的均值具有稳定性的定理。 1、贝奴里大数定理 2、契比雪夫大数定理
(二)中心极限定理 证明某一分布的极限分布为正态分布的定理为中心极限定理。 正态分布?
第七章 抽样推断
第一节 抽样推断的基本问题 第二节 抽样推断中的几个基本概念 第三节 抽样分布和抽样误差 第四节 抽样估计 第五节 抽样推断误差的控制
2020/9/24
第一节 抽样推断的基本问题
一、抽样推断的概念: 抽样包括抽样调查和抽样推断两部分。 抽样推断包括两个有联系但又具有一定差别的方面, 即估计和检验
平均数的极限误差 成数的极限误差
x t1ˆx 2
p t1ˆp 2
2020/9/24
第四节 抽样估计
总体参数的估计方法有两种:即点估计和区间估计。
一、点估计方法
点估计,就是将样本指标直接作为未知的总体指标的估计值 。
一个优良的估计量要求满足: (一)无偏性 (二)一致性 (三)有效性 点估计给出的只是总体指标的一个估计数值,既没有给出准确
n
(xi x)2
s i1
或பைடு நூலகம்
n1
对于属性样本总体
k
(xi x)2 fi
i1
k
fi 1
i1
xp
s2 n pq n 1
s n pq n 1
需指出:n-1称为变量的自由度,也就是变量自由取值的个数 。
三、抽样方式
抽样方式不 重重 复复 抽抽 样不 讲 样不 讲 讲 顺讲 顺 顺 序顺 序 序序
2020/9/24
度,也没有给出可靠程度。因此,在实际工作中不单独使用。
第七章
抽样推断
2020/9/24
• 教学目的:通过本章的学习使学生掌握 抽样推断的基本原理和方法,理解抽样 分布的理论和样本容量的确定方法。
• 教学重点:重点介绍抽样误差的概念、 抽样平均误差的计算、参数估计的基本 方法和必要样本容量的确定方法。
• 教学学时:本章将用9个学时介绍。
2020/9/24
2020/9/24
第三节:抽样分布和抽样误差
一、抽样分布
(一)样本平均数的抽样分布
1、在简单随机重复抽样时; 样本平均数的抽样分布.doc 2、在简单随机不重复抽样时: 样本平均数的抽样分布.doc (二)样本成数的抽样分布 1、 在重复抽样时,
pE(p)P
p 2P(1n P)或 p
P(1P) n
相关文档
最新文档