第8章 抽样推断与参数估计

合集下载

抽样推断

抽样推断
2 2
(三)成数的区间估计 • ☆总体成数P的置信度为100(1-)%的置信 区间为: 重复抽样:
( x z / 2 m p , x z / 2 m p )
不重复抽样: N n N n ( x z / 2 m p , x z / 2 m p ) N 1 N 1
三、样本容量的确定 (一)确定样本容量的意义 • ☆ 找出在规定误差范围内的最小样本容量, 这样确定的样本容量可以在保证满足误差要求 下使得调查费用最小。
2 NZ / 2 P (1 P ) n 2 N2p Z / 2 P (1 P )
第五节
一、假设检验基本概念
假设检验
(一)假设检验基本原理 假设检验的一般步骤: 第一步:确定原假设和备择假设; 第二步:明确检验统计量; 第三步:根据显著性水平,确定拒绝域; 第四步:计算检验统计量的数值; 第五步:给出判断结论。
第八章
抽样推断
第一节
抽样推断概述
一、抽样推断的概念及特点 • ☆抽样推断的概念: 按随机原则从总体中抽取一部分单位(称为样 本),根据样本的信息对总体的数量特征进行科学 估计与推断的方法称为抽样推断。 • ☆抽样推断的主要特点: 第一、按随机原则抽取调查单位 第二、根据部分推断总体 第三、抽样误差可以估计和控制,推断结果 具有一定的可靠性和准确性。
mx
r R 1
其中 为平均数的群间样本方差,即 x2
1 r ( xi x ) 2 r i 1
2 x
(2)成数的抽样平均误差为:
mp
2 p Rr
r

R 1
2 其中 p 为成数的群间样本方差,即
r 1 2 2 p ( pi p ) r i 1

八抽样推断考试习题

八抽样推断考试习题

单项选择題1. 抽样调查的主要目的在于(A. 计算和控制误差B. 了解总体单位情况C .用样本来推断总体 D.对调查单位作深入的研究2. 抽样调查所必须遵循的基本原则是( 人 A.随意原则 B. 可比性原则C .准确性原则 D. 随机氐则3. 无偏性是指( A.抽样指标等于总体指标B. 样本平均数的平均数等于总体平均数C .样本平均数等于总体平均数D.样本成数等于总协成数4. 一致性是指当样本的单位数充分大时,抽样指标( )。

A.小于总体指标B.等于总体指标C .大于总体指标D.充分靠近总体指标5. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )A.前者小于后者B.前者大于后者C.两者相等D.两者不等6. 能够事先加以计算和控制的误差是( A.抽样误差 B.登记误差C .代表性误差 D. 系统性误差7. 对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样, 但第二个厂工人数比第一个厂工人数整整多一倍。

抽样平均误差( 人A.第一工厂大B. 第二个工厂大C .两工厂一样大 D.无法做出结论8. 在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( )。

A.两者相等B.两者不等C .前者小于后者 D.前者大于后者。

9. 反映抽样指标与总体指标之间抽样的可能范围的指标是(第八章 抽样推断两工厂工人工资方差相同,A.抽样平均误差B. 抽样误差系数C.概率度D. 抽样极限逞差.10. 在进行纯随机重复抽样时,为使抽样平均误差减少25%则抽样单位数应()。

A.增加25%B. 增加78%C. 增加1.78%D. 减少25%11. 在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的()倍。

A. 1.03B. 1.05 C . 0.97 D. 95%12. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是(A.抽样单位数为20B. 抽样单位数为40C.抽样单位数为90D.抽样单位数为100 13.通常所说的大样本是指样本容量(人A.小于10B. 不大于10C.小于30D. 不小于3014. 抽样成数指标P值越接近1,则抽样成数平均误差值()A. 越大B越小C越接近0.5 D越接近115. 对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%概率为0.9545,优等生比重的极限抽样误差为()。

教育统计学_第七、八章 抽样分布及总体平均数的推断

教育统计学_第七、八章 抽样分布及总体平均数的推断

20 1
20 1
P(57.14 68.86) 0.99
答:该地区这一年高考数学平均分95%和99%的 置 信 区 间 分 别 为 58.72 至 67.28 分 之 间 和 57.14 至 68.86分之间。
3.大样本的情况:
当样本容量比较大,自由度在逐渐增大,这时的t分布 已经非常接近正态分布。这时可把t分布转成标准正态 分布来作处理。然后再作区间估计。
n
n
P( X 1.96 X 1.96 ) 0.95
n
n
要在一定可靠度上求出总体参数的置信区间的 上下限,需要以下条件:
1.要知道与所要估计的参数相对应的样本统计量的 值,以及样本统计量的理论分布;
2.要求出该种统计量的标准误;
3.要确定在多大的可靠度上对总体参数作估计,再 通过查某种理论概率分布表,找出与某种可靠度相 对应的该分布横轴上记分的临界值,才能计算出总 体参数的置信区间上下限。
三、 σ未知条件下总体平均数的区间估计
1.σ未知条件下总体平均数区间估计的基本原理 (1)当总体σ未知,总体呈正态分布,大样本或小
样本时
(2)或当总体σ未知,总体虽不呈正态分布,大样 本容量较大(n>30)时,样本平均数可以转换成t 值。
总体平均数95%置信区间为:
P(t X t ) 0.95
E(X )
第一节 抽样分布
2、容量为n的平均数在抽样分布上的标准差,等 于总体标准差除以n的方根。
X
n
第一节 抽样分布
3、从正态总体中,随机抽取的容量为n的一切可能 样本平均数的分布也呈正态分布。
4、虽然总体不呈正态分布,如果样本容量较大, 反映总体μ和σ的样本平均数的抽样分布,也接近于 正态分布。

抽样分布、参数估计和假设检验

抽样分布、参数估计和假设检验

抽样分布一、抽样分布的理论及定理 (一) 抽样分布抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n 的若干个样本,对每一样本可计算其k 统计量,而k 个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。

(二) 中心极限定理中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。

1.如果总体呈正态分布,则从总体中抽取容量为n 的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。

2.从总体中抽取容量为n 的一切可能样本时,所有样本均数的均数(X μ)等于总体均数(μ)即μμ=X3.从总体中抽取容量为n 的一切可能样本时,所有样本均数的标准差(X σ)等于总体标准差除以样本容量的算数平方根,即n X σσ=中心极限定理在统计学中是相当重要的。

因为许多问题都使用正态曲线的方法。

这个定理适于无限总体的抽样,同样也适于有限总体的抽样。

中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数X μ与样本标准差X σ)的计算方法。

(三)抽样分布中的几个重要概念1.随机样本。

统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample )。

所谓随机样本是指按照概率的规律抽取的样本,2.抽样误差。

从总体中抽取容量为n 的k 个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差。

3.标准误。

样本统计量分布的标准差或某统计量在抽样分布上的标准差,符号SE 或Xσ表示。

根据中心极限定理其标准差为n X σσ=正如标准差越小,数据分布越集中,平均数的代表性越好。

管理统计学习题参考答案第八章

管理统计学习题参考答案第八章

第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。

因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。

根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。

当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。

后一种情况是小概率事件。

在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。

(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。

原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。

原假设和备择假设是相互对立的,检验结果二者必取其一。

接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。

② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。

在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。

③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。

假设检验就是应用了小概率事件实际不发生的原理。

这里的小概率就是指α。

但是要小到什么程度才算小概率? 对此并没有统一的标准。

通常取α=0.1,0.05,0.01。

给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。

统计学第八章 抽样推断

统计学第八章 抽样推断


和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%

第八章 抽样调查与推断

第八章 抽样调查与推断

第8章抽样调查与推断【教学内容】本章主要阐述:抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式及其抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。

【教学目标】1、理解抽样误差的影响因素;2、掌握抽样调查的概念、特点和作用;3、掌握抽样平均误差的计算方法、抽样估计推断和必要抽样数目的确定原理及方法;4、初步具备在实际工作中正确运用抽样方法搜集资料并据以做出准确推断的能力。

【教学重点、难点】1、抽样调查的特点和作用;2、抽样调查的组织方式和方法;3、抽样误差的概念与计算;4、抽样推断方法;5、必要抽样数目的确定方法。

第一节抽样调查的一般问题一、抽样调查的概念、特点与作用(一)抽样调查的概念与特点概念:抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。

特点:(1)按随机原则抽取调查单位。

(2)由部分推断全体。

(3)抽样误差可以事先计算并加以控制。

(二)抽样调查的作用1、用于不可能进行全面调查的无限总体。

2、用于不可能进行全面调查而又需要了解全面情况的现象。

3、用于不必要进行全面调查的现象。

4、用于对全面调查的资料进行评价与修正。

5、用于工业生产过程的质量控制。

二、抽样调查中的几个基本概念(一)全及总体和抽样总体1.全及总体全及总体简称总体或母体,它是指所要调查研究对象的全体。

2.抽样总体抽样总体也称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。

(二)总体指标和样本指标1.总体指标总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。

2.样本指标样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。

三、抽样调查的组织方式(一)简单随机抽样概念:简单随机抽样也叫纯随机抽样,它对总体单位不作任何分类排序(队),而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。

《概率统计简明教程》第二版(第8章-统计量与抽样分布)统计与统计学、统计量、抽样分布

《概率统计简明教程》第二版(第8章-统计量与抽样分布)统计与统计学、统计量、抽样分布

《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆短期的机遇变异
重复投掷一枚均匀硬币六次,观察每次出现的面: (1)正反正反反正 (2)反反反正正正 (3)正反反反反反
直觉认为结果(1)是随机的,结果(2)和结果 (3)很不随机。 从概率的观点认为结果(1)、(2)、(3)的发 生有相同的概率,因而没有哪一个结果比其他结果更多 一点或少一点随机性。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
◆变异性(Variablity)
统计数据和统计资料具有变异性, 即个体之间有 差异,而对同一个体的多次观察,其结果也会不一样, 并且几乎每一次观察都随着时间的不同而改变,因而变 异性是一个重要的统计观念。 抽样结果的差异是变异性的主要表现 不能仅仅根据一次抽样的结果就断下结论!
《概率统计简明教程》第二版
第八章 统计量与抽样分布
二、总体和样本
1.总体
我们关心的是总体中的个体的某项指标(如人的身高、 灯泡的寿命, 汽车的耗油量…) .
由于每个个体的出现是随机的,所以相应的数量指标 的出现也带有随机性 . 从而可以把这种数量指标看作一 个随机变量X ,因此随机变量X的分布就是该数量指标在 总体中的分布.
《概率统计简明教程》第二版
第八章 统计量与抽样分布
三、什么是统计学
◆长期的规律性
在某地的彩票活动中,七年中有人累计中两次大 奖的机会是: 一半对一半
人们的潜意识常常与理性思考的结果有很大差别, 如不善于统计思考,即使面对十分平常的现象,也会闹 出笑话。
《概率统计简明教程》第二版
第八章 统计量与抽样分布
第八章 统计量与抽样分布
二、总体和样本

第八章抽样推断

第八章抽样推断

(一)总体平均数X的区间估量
1.重复抽样。在重复抽样条件下,估量量x听 从或近似听从 N(X, σ2) ,所以统计量 x-X U= ─── σ/√n
听从或近似听从N(0,1), 依据附录正态散 布表得: P(|u|<t)=1-α
式中,t称为牢靠性目的,或概率度,它与1- α有关,可经过查表求得。
2.不重复抽样
五、抽样方案的反省 (一)准确性反省 所谓准确性反省,看能否超
越了方案所允许的误差的范围。假定误差限小于 或等于允许的误差,即:△x≤允许误差,那么说 明方案的设计契合准确性的要求,可以实施。假 定,△x>允许误差,那么说明方案不契合准确性 的要求,就要对方案停止反省和修正,直至契合 准确性的要求为止。
(二)样本成数的平均误差。
总体成数P 可以表现为总体是非标志的平均数。 即E(X)=P
它的规范差σ=√P(1-P)
依据样本平均误差和总体规范差的关系,可以失掉样本 成数的平均误差的计算公式。
1.在重复抽样下:
μp=
n
p(1 p)
=
n
2.在不重复抽样下:
2 (Nn)
μp= n N 1
三、抽样极限误差
1.ห้องสมุดไป่ตู้体各单位标志值的变异水平。在其他条件 不变的状况下,总体各单位标志值的变异水 平愈大,抽样误差也愈大,反之那么愈小。
2.样本单位数的多少。在其他条件不变的状况 下,样本单位数愈多,抽样误差就愈小,反 之那么愈大。
3.抽样方法。抽样方法不同,抽样误差也不同。 普通说来,重复抽样的误差比不重复抽样的 误差要大。
在不重复抽样u条件下,x X
统计量
2
n
(
N N
n 1
)

参数估计方法

参数估计方法

第八章参数估计方法研究工作的目的在于了解总体特征的有关信息,因而用样本统计数估计相应总体参数,并由之进行统计推断。

总体特征的各种参数,在前几章主要涉及平均数、标准差等,并只从直观上介绍其定义和公式,未就其历,即参数估计(parameter estimation)的方法作讨论。

本章将简要介绍几种常用参数估计方法,即矩法、最小二乘法、极大似然法。

第五章述及参数的点估计(point estimation)和区间估计(interval estimation),本章讨论点估计方法。

区间估计是在点估计的基础上结合统计数的抽样分布而进一步作出的推论,有关内容将散见在其它各章。

第一节农业科学中的主要参数及其估计量的评选标准一、农业科学中的主要参数农业科学研究中需要估计的参数是多种多样的,主要包括总体数量特征值参数,例如,用平均数来估计品种的产量,用平均数差数来估计施肥等处理的效应;用百分数(或比例)来估计遗传分离比例、群体基因或基因型频率、2个连锁主基因间的重组率;通过变异来源的剖分,用方差来估计环境方差、遗传方差和表型方差,在此基础上以估计性状的遗传力等遗传参数;用标准误来估计有关统计数的抽样误差,如重组率的标准误、遗传抽样误差、遗传多样性误差、频率误差等。

在揭示变数间的相互关系方面,用相关系数来描述2个变数间的线性关系;用回归系数、偏回归系数等来描述原因变数变化所引起的结果变数的平均变化的数量,用通径系数来描述成分性状对目标性状的贡献程度等。

有关数量关系和数量变化方面的内容将在第9至11章介绍。

二、参数估计量的评选标准讨论参数估计方法前需要了解数学期望(expectation)的概念和评价估计方法优劣的标准。

(一) 数学期望在抽样分布中,已经讲述了从总体中抽出所有可能样本的样本平均数的平均数等于总体平均数,这里,样本平均数的平均数就是一种数学期望。

例如,一个大豆品种的含油量为20%,测定一次可能是大于20%,再测定可能小于20%,大量反复测定后平均结果为20%,这时20%便可看作为该大豆品种含油量的数学期望,而每单独测定一次所获的值只是1个随机变量。

统计学8 参数估计

统计学8 参数估计
宽,估计的值愈不精确; ( 2 )置信度愈小,置信区间愈窄 , 精确度越 高
第二节 均值区间估计
有一定的概率P(95%或99%)保证,
x
请思考:P 与


x
三者怎样联系起来
???
答案:统计量

x 的分布是将三者联系起来的桥。
一、抽样分布与抽样误差
从总体中随机抽取一份样本,计算均数。 这个均数不同于总体均数!为什么? 再从该总体中随机抽取一份样本,再计 算均数。 前后两个均数不等,为什么?
S SE= = n n

标准误的特点
抽样的样本量越大,标准误就越小; 原来总体变异度小,标准误就越小。 标准误反映了样本均值间的离散程度,也反映了样本 均值与总体均值之间的差异。当标准误大时,用样本 均值对总体均值的估计的可靠程度就小;反之亦然。
标准误用途
衡量样本均值的可靠性:标准误越小,表明样本 均值越可靠; 参数估计:估计总体均值的置信区间(区域); 假设检验:用于总体均值的假设检验(比较)。
总体参数的点估计公式
1.样本均值 2.样本方差
1 x x n 1 2 2 s ( x x ) n 1
X,S 2 作为总体的参
即用样本的 数的点估计值。
点估计的优点在于它能够明确地估计总体 参数,但由于样本是随机的,抽出一个具 体的样本得到的估计值很可能不同于总体 真值。 它与真值的误差﹑估计的可靠性怎样,我 们无法知道,而区间估计则可弥补这种不 足之处。
二、均值的区间估计(教材p139)
当置信度为1-=0.95时,置信区间为:
[ x 1.96

n

n
, x 1.96

徐国祥《统计学》(第2版)配套题库【课后习题】(参数估计)

徐国祥《统计学》(第2版)配套题库【课后习题】(参数估计)

第8章参数估计1.什么是统计推断?统计推断的两类问题是什么?答:统计推断就是根据样本的信息,对总体的特征作出推断,它包括参数估计和假设检验,其中参数估计可分为点估计和区间估计两大类。

2.什么是点估计?什么是区间估计?两者各有什么优缺点?答:点估计是根据样本数据计算的一个估计值,其优点在于它通过样本资料就能够明确地估计总体参数。

不足之处是,一般点估计值不会等于总体参数的真值,并且无法给出它与真值的误差以及估计可靠性程度。

区间估计是通过样本来估计总体参数可能位于的区间。

优点是指出了未知参数所在区间的上下限,同时指出该区间包含真值的可靠度(置信度),弥补了点估计的不足。

3.评判一个估计量好坏的标准有哪些?答:评判一个估计量的好坏有以下三个标准:(1)无偏性如果样本统计量的期望值等于该统计量所估计的总体参数,则这个估计量叫做无偏估计量。

这是一个好的估计量的一个重要条件。

(2)一致性当样本容量n增大时,如果估计量越来越接近总体参数的真值时,就称这个估计量为一致估计量。

估计量的一致性是从极限意义上讲的,它适用于大样本的情况。

(3)有效性有效性是指估计量的离散程度。

如果两个估计量都是无偏的,其中方差较小的(对给定的样本容量而言)就可认为相对来说是更有效的。

4.确定样本容量大小的因素有哪些? 答:决定样本容量大小的因素有以下三点: (1)受总体方差σ2数值大小的影响总体方差大,抽样误差大,则应多抽一些样本容量,反之,则可少抽一些。

当然,总体方差为0时,那么只需抽出其中一个就能代表总体。

但实际工作中,我们往往不知道总体方差,因而必须做试验性调查,或以过去的历史资料做参考。

(2)可靠性程度的高低要求可靠性越高,所必需的样本容量就越大。

也就是说,为获得所需精度而指定的概率越大,所需要的样本容量就越大。

(3)允许误差的大小这主要由研究的目的而定。

若要求推断比较精确,允许误差应该低一些,随之抽取的样本容量也要求多一些;反之,若允许误差可以大一些,样本容量也可以少一些。

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估计最全版

(抽样检验)抽样与参数估计最全版(抽样检验)抽样与参数估计抽样和参数估计推断统计:利⽤样本统计量对总体某些性质或数量特征进⾏推断。

从数据得到对现实世界的结论的过程就叫做统计推断(statisticalinference)。

这个调查例⼦是估计总体参数(某种意见的⽐例)的壹个过程。

估计(estimation)是统计推断的重要内容之壹。

统计推断的另壹个主要内容是本章第⼆节要介绍的假设检验(hypothesistesting)。

因此本节内容就是由样本数据对总体参数进⾏估计,即:学习⽬标:了解抽样和抽样分布的基本概念理解抽样分布和总体分布的关系了解点估计的概念和估计量的优良标准掌握总体均值、总体⽐例和总体⽅差的区间估计第⼀节抽样和抽样分布回顾相关概念:总体、个体和样本抽样推断:从所研究的总体全部元素(单位)中抽取壹部分元素(单位)进⾏调查,且根据样本数据所提供的信息来推断总体的数量特征。

总体(Population):调查研究的事物或现象的全体参数个体(Itemunit):组成总体的每个元素样本(Sample):从总体中所抽取的部分个体统计量样本容量(Samplesize):样本中所含个体的数量壹般将样本单位数不少于三⼗个的样本称为⼤样本,样本单位数不到三⼗个的样本称为⼩样本。

壹、抽样⽅法及抽样分布1、抽样⽅法(1)、概率抽样:根据已知的概率选取样本①、简单随机抽样:完全随机地抽选样本,使得每壹个样本都有相同的机会(概率)被抽中。

注意:在有限总体的简单随机抽样中,由抽样是否具有可重复性,⼜可分为重复抽样和不重复抽样。

⽽且,根据抽样中是否排序,所能抽到的样本个数往往不同。

②、分层抽样:总体分成不同的“层”(类),然后在每壹层内进⾏抽样③、整群抽样:将壹组被调查者(群)作为壹个抽样单位④、等距抽样:在样本框中每隔壹定距离抽选壹个被调查者(2)⾮概率抽样:不是完全按随机原则选取样本①、⾮随机抽样:由调查⼈员⾃由选取被调查者②、判断抽样:通过某些条件过滤来选择被调查者(3)、配额抽样:选择壹群特定数⽬、满⾜特定条件的被调查者2、抽样分布壹般地,样本统计量的所有可能取值及其取值概率所形成的概率分布,统计上称为抽样分布(samplingdistribution)。

统计学第八章(抽样推断)

统计学第八章(抽样推断)

ni n
N i i
i 1

k
N i i
层的标准差。
i 是各
25
(3)经济分配法
既考虑每层中总体单位的变异程度不同 ,又考虑每层的调查费用。所以在样本容 量一定的条件下,标志变异大的层样本容 量也大一些,调查费用大的层,样本容量 相对小些。则
ni n
N i i / C i
i 1
20
* 抽样的组织方式 简单随机抽样 类型抽样
机械抽样
整群抽样
多阶段抽样
21
(一)简单随机抽样 : 简单随机抽样 又称纯随机抽样,是直接从总体中按随 机的原则抽容量为 n 的样本,每一个总 体单位有相同的可能性被抽中。
特点:最遵循随机原则,但不一定能 保证样本单位在总体中分布的均匀性; 适宜于单位数不多,标志变异较小、分 布较均匀的总体。
15
抽样框
STAT
某外国公司在深圳进 应当调查的对 福田区 … 在商场的大门口 行微波炉市场调查: 象(居民户) 南山区 桃源街道办 … 微波炉普及情况 已购或未购微 在微波炉柜台前 波炉的住户 南头街道办 居民的喜好特征 桂庙村… 南 在市区街道旁边 已购该公司微 居民购买力水平 新居委会 波炉的住户 在某个住宅小区 居民一组 公司产品知名度 有购买微波炉 居民二 公司产品信誉度 意向的住户 组 …
样本标准差公式
未分组数据:
2 ( x x ) i i 1 n
n 1 分组数据
S2
S2
(x x)
i 1 i
k
n
2
S
n 1 分组数据
2 ( x x ) fi i i 1 k
(x
i 1 k

统计学复习(抽样分布、参数估计、假设检验)

统计学复习(抽样分布、参数估计、假设检验)

两个样本均值之差的抽样分布 (1)如: ) 抽样
X1 − N(µ1,σ12 ), X2 − N(µ2 ,σ2 ),
2
则 x1 − x2 ) ~ N(µ1 − µ2 , (
σ12 σ22
n1 + n2
)
抽样
σ12 N1 − n1 σ22 N2 − n2 (x1 − x2 ) ~ N[(µ1 − µ2 , ( )+ ( )] n1 N1 −1 n2 N2 −1
对于无限总体, 对于无限总体, 一个估计 如果对任意 量如能完 ε>ˆ 0 满足条件 全地包含 LimP(|θn −θ |≥ ε ) = 0 未知参数 n→∞ 信息, 信息,即 则称 θˆ 是 θ 为充分量 的一致估计。 的一致估计。
点估计
常用的求点估计量的方法
用样本的数字特征 1.数字特征法: 1.数字特征法:当样本容量增大时 ,用样本的数字特征 数字特征法 去估计总体的数字特征。 去估计总体的数字特征。 例如,我们可以用样本平均数(或成数 和样本方差来估 例如,我们可以用样本平均数 或成数)和样本方差来估 或成数 计总体的均值(或比率 和方差。 或比率)和方差 计总体的均值 或比率 和方差。
样本均值的抽样分布(简称均值的分布) 样本均值的抽样分布(简称均值的分布) 抽样
均值µ=∑Xi/N 均值
均值 X = Σxi
n
样本均值是样本的函数, 故样本均值是一个统计量, 样本均值是样本的函数, 故样本均值是一个统计量, 统计量 统计量是一个随机变量 随机变量, 统计量是一个随机变量, 样本均值的概率分布称为 样本均值的抽样分布。 样本均值的抽样分布。
2
n
总体均值 (µ) )
X ± tα
2
( n −1 )

电子课件 [统计学原理与实务(第3版)][曹印革][电子教案和习题解答] 第八章 抽样推断分析

电子课件 [统计学原理与实务(第3版)][曹印革][电子教案和习题解答] 第八章 抽样推断分析

注:极限误差与概率度和抽样平均误差三者之 间存在如下关系:
1.在平均误差保持不变的情况下,增大概率度 的值,把握程度相应增加,误差范围也随之扩大, 这时估计的精确度将降低;反之,要提高估计的精 确度,就得缩小概率度值,此时把握程度也会相应 降低。
2.在概率度保持不变的情况下,抽样平均误差 小,则误差范围就就小,估计的精确度就高;反之, 抽样平均误差大,误差范围就大,估计的精确度就 低。
2.特点 (1)抽样推断是由部分推算总体的一种认识方法。 (2)抽样推断是建立在按随机原则抽取样本的基础上。 (3)抽样推断是运用概率估计的方法。 (4)抽样推断产生的误差可以事先计算、并加以控制。
二、抽样推断的作用 1.应用抽样推断法可对某些不可能或不容易进行全面 调查而又要了解其全面情况的社会经济现象进行数量 方面的统计分析。 2.应用抽样法可对全面调查的结果加以补充或订正。 3.应用抽样法可对生产过程中产品质量进行检查和控 制。 4.应用抽样推断法可对总体的某种假设进行检验,判 断假设的真伪。
4.当抽样调查是为了检验全面统计数字的质量时,全 及总体的标志变异指标或是有实际资料的,可以直接 代入公式计算必要的抽样单位数。 5.如有几个方差可以选用时,宜选择最大数值。对于 成数方差,如果没有资料时,可取其最大值0.25。 6.一个总体往往可以同时计算抽样平均数和抽样成数。 由于它们的方差和允许误差范围不同,因此,需要的 必要抽样单位数也不相同。为了防止由于样本单位数 不足而扩大抽样误差,在实际工作中往往根据比较大 的必要抽样单位数进行抽样,以满足共同的需要。
等距抽样示意图
(四)整群抽样 也称集团抽样、区域抽样,是将总体各单位按时
间或空间形式划分成许多群,然后按纯随机抽样或机 械抽样方式从中抽取部分群,对中选的所有单位进行 全面调查的抽样组织方式。

(完整word版)第8章 抽样调查习题

(完整word版)第8章   抽样调查习题

第8章 抽样调查习题一、单项选择题1、抽样调查的目的在于( )。

a.计算和控制误差b.了解总体单位情况c.用样本来推断总体d.对调查单位作深入的研究2、是非标志(即服从两点分布的变量)的标准差等于( )。

a.Pb.1-Pc.P(1-P)d.)1(P P3、能够事先加以计算和控制的误差是( )。

a.抽样误差b.代表性误差c.登记误差d.系统性误差4、抽样平均误差是指抽样平均数(或抽样成数)的( )。

a.平均数b.平均差c.标准差d.标准差系数5、在同样情况下, 重复抽样的抽样平均误差与不重复抽样的抽样平均误差相比( )。

a.两者相等 b.前者小于后者 c.两者不等 d.前者大于后者6、反映抽样指标与总体指标之间抽样误差的可能范围的指标是( )。

a.抽样平均误差b.抽样误差系数c.概率度d.抽样极限误差7、在重复抽样情况下,假定抽样单位数增加3倍(其他条件不变),则抽样平均误差为原来的( )。

a.1/2倍b.1/3倍c.1.731倍d.2倍8、在进行简单随机抽样时,为使抽样平均误差减少25%,则抽样单位数应( )。

a.增加25% b.减少13.75% c.增加43.75% d.减少25%9、抽样极限误差是指用样本指标估计总体指标时产生的抽样误差的( )。

a.最大值 b.最小值 c.可能范围 d.实际范围10、将总体单位按一定标志排队,并按固定距离抽选样本单位的方法是( )。

a.类型抽样 b.等距抽样 c.整群抽样 d.简单随机抽样11、在进行抽样估计时,常用的概率度t 的取值( )。

a.t<1b.1≤t≤3c.t=2d.t>312、等距抽样的误差与简单随机抽样相比较( )。

a.前者小b.前者大c.两者相等d.大小不定13、某地订奶居民户户均牛奶消费量为120公斤,抽样平均误差为2公斤,据此可计算户均牛奶消费量在114-126之间的概率为( )。

a.0.9545b.0.9973c.0.683d.0.90014、对400名大学生抽取19%进行不重复抽样调查,优等生比重为20%,概率为0.9545,优等生比重的极限误差为( )。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5500包原材料的平均重量在63.14~66.86之间。
总体平均数估计
根据置信度的要求,估计极限误差可能的范围,并指出估计区间,具体步骤如下:
①抽取样本,并根据样本的标志值求出样本平均数 和标准差S,在大样本
的情况下用S代替
②根据给定的置信度F(z),查正态分布概率表得到z
③根据
计算估计区间的上下限。
2、类型抽样
(1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各 类型组中采用简单随机抽样方式或其它方式抽取样本单位。
(2)样本单位数在各类型组中的分配方式 ①等额分配:在各类型组中分配同等单位数。 ②等比例分配:按各类型组在总体中所占比例分配样本单位数。即:
③最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。
例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值 10000元,标准差2000元。总体近似服从正态分布,在置信水平为 96.76%(z=2.14)的条件下建立广告平均费用的置信区间。
电视台一分钟广告的平均费用在8894~11106之间。
(二)根据极限抽样误差 具体步骤如下:
例:经抽样调查计算样本亩产粮食600公斤,并求得抽样平均误差是3公斤,现给 定抽样误差极限为6公斤,求总体平均亩产落在估计区间的概率?
已知:
u=3公斤 Δ=6公斤
则估计区间(600-6,600+6)=(594,606)
查正态概率表得,落在估计区间的概率为:

F(z)=F(2)=95.45%
3.1 抽样单位数目的计算
(一)简单随机抽样单位数目的确定 1、计算公式 (1)平均数
(2)成数
2.例题
(1)某类产品根据以往资料的估计,总体方差5.456千克,现对一批进行简单随 机抽样以推断该批产品的平均重量,要求可靠程度达到99.73%,误差范围不超 过0.9千克,需要抽多少样本单位?
按题意
(2)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为99.73%,误差范围不超过5%,推断该批产品的一等品率,
②有关标志排队
(4)抽取第一个样本单位的方法
①随机抽取
②居中抽取
4、整群抽样
(1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数 登记调查。
(2)抽样平均误差的计算公式
某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋) 检查平均每袋重量和一级品率,样本资料如下:
,求概率保证度F(z) 。
①抽取样本,并根据样本的标志值求出样本平均数 作为总体平均数的估计
值,并计算标准差S以推算平均误差
②根据给定的极限抽样误差,估计总体平均数上下限。
③根据
概率度z, 查正态分布概率表,求得置信度F(z)。
在一项新广告的跟踪调查中,在被调查的400人中有240人会记起广告的标语。试求会记起广告
(一)抽样分布 据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分
布;当n足够大时,样本成数的分布近似为正态分布。
(二)关系
第三节 抽样单位数目的确定 3.1、抽样单位数目的计算
(一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样 3.2、影响抽样单位数目的因素
返回
一、抽样平均误差
(一)抽样平均误差的概念
二、抽样平均误差计算
1、简单随机抽样平均误差的计算公式 ①平均数的抽样平均误差
②成数的抽样平均误差
练习
1、某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200 只,分别计算抽样平均误差。
2、该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平 均误差。
步骤如下:
①抽取样本,计算样本的成数 p和标准差S,并由此推算出抽样的平均误差u
②根据给定的置信度F(z),查正态分布概率表得到z
③根据
计算总体成数的上下限。
成数的区间估计
消费额下限= 消费额上限= 点估计:麦当劳餐馆顾客平均消费额为32元 区间估计:以90%的概率保证,麦当劳餐馆顾客消费额在29.8-34.2之间
某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250 包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平 为95%的条件下建立这种原材料的置信区间。
(3)抽样平均误差的计算公式
①平均数的抽样平均误差 重复
不重复且等比例
②成数的抽样平均误差 重复
不重复且等比例
例题
①有12块小麦地,每块1亩。6块处于丘陵地带,亩产量(斤)分别为:300 330
330 340 370 370 。 6块处于平原地带,亩产量(斤)分别为:420 420
450 460 490 520。抽查4块,测定12块地的平均亩产量,计算其抽样误
差。 ②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其
抽样误差。
用类型抽样,每类抽2块
计算各组方差
平均组内方差
抽样误差
3、等距抽样
(1)概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取
样本单位。
(2)排对的方法 ①无关标志排队 (3)抽取样本单位的方法 ①按相等的距离取样 ②对称等距取样
3、据电视观众抽样调查资料显示:电视观众平均收视时间为95分钟,标准差为70, 如果采用重复抽样的方法随机抽取10000人或40000人,分别计算抽样平均误差。
4、据CNNIC “中国互联网络发展状况统计报告”显示:截止到 2009年1月中国宽带 网民占网民总体的90.6%,如果采用重复随机抽取方法在网民中抽取100人和400 人,分别计算抽样平均误差。
计算抽样平均误差
(三)影响抽样平均误差的因素
1、总体标准差的大小 2、样本单位数的多少 3、抽样方法的不同 4、抽样组织方式的差别
2.2 抽样极限误差
样本指标围绕总体指标左右两侧波动形成的一定范围。 抽样极限误差:样本指标与总体指标最大可能的误差范围
2.3、抽样极限误差与抽样平均误差的关系
例:麦当劳餐馆在7星期内抽查49名顾客的消费额如下,在概率90%的保证下,顾客平均消费额的 估计区间.
15 24 38 26 30 42 18 30 25 34 44 20 35 46 28 47…..
解:①计算样本的平均数和标准差:
②根据给定的置信度F(z)=90%,查概率表z=1.64 ③计算:
1、平均数的区间估计 2、成数的区间估计 3、2个总体平均数之差的估计
二、抽样估计的方法
(一)点估计
(二)区间估计
特点:不是指出被估计参数的确定数值,而是指出被估计参数的的可能范围,同时对参数落在某
一范围内给定相应概率的保证程度。z-概率度 1、平均数的区间估计 (1)样本取自总体方差已知的正态分布(大、小样本)
据题意
(三)等距抽样
计算公式 (1)按有关标志排队 同类型重复抽样
(2)按无关标志排队 同简单随机不重复抽样
3.2、影响抽样单位数目的因素
总体各单位的变异程度 抽样推断的准确程度△ 抽样推断的可靠程度Z 抽样的组织形式 抽样的方法
第四节 抽样估计
4.1 估计量的优标准:无偏性、有效性、一致性 4.2 抽样估计的方法 (一)点估计:直接用样本指标代替总体指标 不能准确的告诉我们估计的把握程度 (二)区间估计 :不仅仅告诉我们一个范围,告诉我们估计的把握程度
需要抽多少样本单位? 按题意
(二)类型抽样
1、计算公式
2、例题
某工厂早、中、晚生产罐头10000瓶,根据以往资料的估计平均重量的类型平均 方差为0.549克,合格率的类型平均方差为0.02787,要求可靠程度为何95%, 平均重量的允许误差为0.11克,合格率的允许误差为0.025,用类型抽样推断 10000瓶罐头的平均重量和合格率,需要抽多少样本单位?
语占总体比率的95%置信度的估计区间。
根据样本资料计算:

P=n1/n2=240/400=60%
根据给定的置信度要求F(Z)= 95%,查表Z=1.96 根据
以概率95%的保证程度,会计会记起广告语的人数占总体比率的55.2-64.8之间
总体成数的估计
(一)根据置信度的要求,估计极限误差可能的范围,并指出估计区间范围,具体
第8章 抽样推断与参数估计
第一节 抽样误差 第二节 抽样单位数目的确定 第三节 参数估计
第一节 抽样误差
2.1、抽样平均误差 (一)概念 (二)计算
1、简单随机抽样
2、类型抽样
3、等距抽样 4、整群抽样
5、阶段抽样
(三)影响抽样平均误差的因素
2.2、抽样极限误差
2.3、抽样极限误差与抽样平均误差的关系
相关文档
最新文档