统计基础第七章抽样推断

合集下载

统计学原理第七章 抽样调查

统计学原理第七章 抽样调查
29


x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;

第七章 抽样调查

第七章  抽样调查

数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x

2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x

n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍

则:
1 x 0.8165 1.5n 1.5

即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:

第七章 抽样推断

第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制

ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n

《统计学》第七章抽样推断第二节 抽样误差

《统计学》第七章抽样推断第二节 抽样误差
6-3
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差

p p P


如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差

抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:

x x X

即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x

n
式中,n为样本容量; 为总体标准 。


成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)

7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)

2

统计学原理形成性考核册及答案作业(三)

统计学原理形成性考核册及答案作业(三)

《统计学原理》作业(三)(第五~第七章)一、判断题:1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。

(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。

(×)3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证(√)4、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。

(×)5、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。

(√)6、在一定条件,施肥量与收获率是正相关关系。

(√)7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ )。

8、利用一个回归方程,两个变量可以互相推算(×)。

二、单项选择题1、在一定的抽样平均误差条件下( A )。

A、扩大极限误差范围,可以提高推断的可靠程度B、扩大极限误差范围,会降低推断的可靠程度C、缩小极限误差范围,可以提高推断的可靠程度D、缩小极限误差范围,不改变推断的可靠程度2、反映样本指标与总体指标之间的平均误差程度的指标是( C )。

A、抽样误差系数B、概率度C、抽样平均误差D、抽样极限误差3、抽样平均误差是( C )。

A、全及总体的标准差B、样本的标准差C、抽样指标的标准差D、抽样误差的平均差4、当成数等于( C )时,成数的方差最大。

A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是( C )。

A、等于78%B、大于84%c、在此76%与84%之间 D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差(A )。

第7章抽样

第7章抽样
29
随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第一次课抽样原理与方法

(抽样检验)第七章第⼀次课抽样原理与⽅法第⼀节抽样⽅案的制定在科学研究中,除了进⾏控制试验外,有时也要进⾏调查研究。

调查研究是对已有的事实通过各种⽅式进⾏了解,然后⽤统计的⽅法对所得数据进⾏分析,从⽽找出其中的规律性。

例如,了解畜禽品种及⽔产资源状况;探索和分析对某种疾病有效的防治规律、措施以及新的检验⼿段和⽅法等。

由于现场调查⽴⾜于⽣产实际,所以它是研究和解决实际问题的⼀种重要研究⽅法。

同时,控制试验的研究课题,往往是在调查研究的基础上确定的;试验研究的成果,⼜必须在其推⼴应⽤后经调查得以验证。

为了使调查研究⼯作有⽬的、有计划、有步骤地顺利开展,必须事先拟定⼀个详细的调查计划。

调查计划应包括以下⼏个内容:(⼀) 调查研究的⽬的任何⼀项调查研究都要有明确的⽬的,即通过调查了解什么问题,解决什么问题。

例如,家畜健康状况的调查的⽬的是评定家畜健康⽔平;畜禽品种资源调查的⽬的是了解畜禽品种的数量、分布与品种特征特性等情况。

同时,调查研究的⽬的还应该突出重点,⼀次调查应针对主要问题收集必要的数据,深⼊分析,为主要问题的解决提出相应的措施和办法。

(⼆) 调查的对象与范围根据调查的⽬的,确定调查的对象、地区和范围,划清调查总体的同质范围、时间范围和地区范围。

例如,四川省家禽品种资源调查,调查地区为四川省,调查总体和对象为全省各市、县的家禽,调查时间从2000年1⽉到2000年12⽉。

(三) 调查的项⽬调查项⽬的确定要紧紧围绕调查⽬的。

调查项⽬确定的正确与否直接关系到调查的质量。

因此,项⽬应尽量齐全,重要的项⽬不能漏掉;项⽬内容要具体、明确,不能模棱两可。

应按不同的指标顺序以表格形式列⽰出来,以达到顺利完成搜集资料的⽬的。

例如,家禽品种资源调查项⽬有:种类(鸡、鸭、鹅等)、品种(柴鸡、来航、⽩洛克等),数量、体重、产蛋性能等项⽬。

调查项⽬有⼀般项⽬和重点项⽬之分。

⼀般项⽬主要是指调查对象的⼀般情况,⽤于区分和查找,如畜主姓名、住址及编号等。

统计基础试题——参数估计和假设检验

统计基础试题——参数估计和假设检验

第七章参数估计和假设检验一、填空题1.在抽样推断中,常用的总体指标有、和。

2.在抽样推断中,按随机原则从总体中抽取的部分单位叫,这部分单位的数量叫。

3.整群抽样是对总体中群内的进行的抽样组织形式。

4.若总体单位的标志值不呈正态分布,只要,全部可能样本指标也会接近于正态分布。

5.抽样估计的方法有和两种。

6.扩大误差范围,可以推断的可靠程度,缩小误差范围则会推断的可靠程度。

7.对总体的指标提出的假设可以分为和。

8.如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为。

二、单项选择题1.所谓大样本是指样本单位数在()及以上。

A.50个B.30个C.80个D.100个2.总体平均数和样本平均数的关系是()。

A.总体平均数是确定值,样本平均数是随机变量B.总体平均数是随机变量,样本平均数是确定值C.总体平均数和样本平均数都是随机变量D.总体平均数和样本平均数都是随机变量3.先对总体按某一标志分组,然后再在各组中按随机原则抽取一部分单位构成样本,这种抽样组织方式称为()。

A.简单随机抽样B.机械抽样C.类型抽样D.整群抽样4.用样本指标对总体指标作点估计时,应满足4点要求,其中无偏性是指()。

A.样本平均数等于总体平均数B.样本成数等于总体成数C.样本指标的平均数等于总体的平均数 D.样本指标等于总体指标5.在其它条件不变的情况下,提高抽样估计的可靠程度,其精确度将()。

A.保持不变B.随之扩大C.随之缩小D.无法确定6.在抽样估计中,样本容量()。

A.越小越好B.越大越好C.有统一的抽样比例D.取决于抽样估计的可靠性要求。

7.假设检验中的临界区域是指()。

A.接受域B.拒绝域C.检验域D.置信区间三、多项选择题1.在抽样推断中,抽取样本单位的具体方法有()。

A.重复抽样B.不重复抽样C.分类抽样D.等距抽样E.多阶段抽样2.在抽样推断中,抽取样本的组织形式有()。

抽样推断 习题及答案

抽样推断 习题及答案

第六章抽样推断习题答案一、名词解释用规范性的语言解释统计学中的名词。

1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。

2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。

3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。

4. 样本容量:是指样本中的总体单位数量。

5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。

这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。

6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。

7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。

8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

二、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。

1. 抽样推断中,如果获取的样本数据准确,那么,由此推断的总体参数也一定准确。

(×)不一定2. 极限误差越大,则抽样估计的可靠性就越小。

(×)越大3. 抽样平均误差的大小与样本容量的大小成正比关系。

(×)反比4. 在一般的抽样推断中,抽样平均误差小于极限误差。

(×)不一定5. 重复抽样条件下的抽样平均误差,一定比不重复抽样条件下的抽样平均误差大。

(×)在其他条件相同的情况下6. 在不重复抽样的情况下,若调查的单位数为全及总体的10%,则所计算的抽样平均误差比重复抽样计算的抽样误差少10%。

抽样方法

  抽样方法

5. 修正的概率抽样
修正的概率抽样是概率抽样与非概 率抽样的结合。主要用于多阶段抽 样,前几个阶段用概率抽样,最后 用非概率抽样,一般是配额抽样。
实用文档
21
二、概率抽样
在需要根据样本的结果对总体进行推断时 应使用概率抽样。
最简单的概率抽样设计是等概率抽样,包 括简单随机抽样和系统抽样。
不等概率抽样比较复杂且大多需要辅助抽 样框信息。不等概率抽样有:概率与大小 成比例的抽样,整群抽样,分层抽样,多 阶段抽样和多相抽样。不等概率抽样通常 用来提高抽样设计方案的效率,或降低抽 样费用。
简单随机抽样的缺点是:
抽样框中即使有现成的辅助信息也不 加利用,使得估计的统计效率较其他 利用辅助信息的样本设计低;
由于样本在总体中的地理分布范围比 较广,如果采用面访,费用较高;有 可能抽到一个“差的”样本;
如果不用计算机,而用随机数表抽一 个大样本将十分单调劳神。
实用文档
31
系统抽样(SYS)
能计算出各个单元的入样概率。从而
无法得到总体目标量的可靠估计值及
其抽样误差估计值。
实用文档
4
非概率抽样能用在下面几个方面的研 究中:
用来形成一种想法; 作为设计开发概率抽样调查的初始步骤; 在后续步骤中帮助理解概率抽样调查结
果。 有时,非概率抽样是唯一可行的选择。
例如,在医学实验中,采用志愿者抽样 可能是取得数据的唯一途径。
其抽样单元是从总体中等距抽出的。 它需要一个抽样间距和一个随机起点。
抽样间距是k=N/n,随机起点r是介 于1到k之间的一个随机数。 被抽中的单元是:r,r十k,r+2k, r+3k,…,r+(n-1)k。
实用文档

建筑统计各章节习题及答案7

建筑统计各章节习题及答案7

第七章抽样推断习题及答案一、名词解释1、抽样推断:2、抽样平均误差:3、极限误差:4、重复抽样:5、区间估计:5、类型抽样:二、填空题1、抽样推断是利用________推断________的一种统计分析方法。

2、在简单随机抽样条件下,重复抽样的抽样平均误差是不重复抽样的________倍。

3、在缺少总体方差的资料时,可以用________来推断总体方差,计算抽样平均误差。

4、扩大极限误差的范围,可以________推断的可靠程度;缩小极限误差的范围,则会________推断的可靠程度。

三、单项选择题1、抽样必须遵循的基本原则是()A、灵活性原则B、可靠性原则C、准确性原则D、随机原则2、抽样平均误差是()A、登记性误差B、代表性误差c、系统性误差 D、随机误差3、抽样平均误差和极限误差的关系是()A、抽样平均误差大于极限误差B、抽样平均误差等于极限误差C、抽样平均误差小于极限误差D、抽样平均误差可能大于、等于或小于极限误差4、在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本单位()A、扩大为原来的2倍B、扩大为原来的4倍C、缩小为原来的1/2倍D、缩小为原来的1/4倍5、一般来说, 在抽样组织形式中,抽样误差较大的是()A、简单抽样B、类型抽样C、等距抽样D、整群抽样6、根据抽样的资料, 一年级优秀生比重为20%, 二年级为10%,在人数相等时,优秀生比重的抽样误差()A、一年级较大B、二年级较大C、相同D、无法判断7、根据重复抽样的资料, 甲项目工人工资方差为25,乙项目为100,乙单位人数比甲单位多3倍, 则抽样误差()A、甲单位较大B、无法判断C、乙单位较大D、相同8、一个全及总体()A、只能抽取一个样本B、可以抽取多个样本C、只能计算一个指标D、只能抽取一个单位9、最符合随机原则地抽样组织形式是()A、整群抽样B、类型抽样C、阶段抽样D、简单随机抽样四、多项选择题1、抽样估计的抽样平均误差()A、是不可以避免的B、是可以改进调查方法消除的C、是可以事先计算的D、只有调查结束之后才能计算E、大小是可以控制的2、影响样本单位数目的因素有()A、推断的可靠程度B、抽样方法C、抽样组织方式D、允许误差的大小E、总体各单位标志变异程度3、提高推断的可靠程度, 可以采取的办法是()A、扩大估计值的误差范围B、缩小估计值的误差范围C、增大概率度D、降低概率度E、增加样本单位数4、影响抽样平均误差的因素有()A、总体标志变异程度B、抽样方法C、样本单位D、抽样组织形式E、样本指标值的大小5、和重复抽样相比,不重复抽样的特点是()A、总体单位数在抽选过程中逐渐减少B、总体中每个单位都有被多次抽中的可能C、总体中每个单位没有被多次抽中的可能D、样本可能数目要多些E、样本可能数目要少些6、总体标准差未知时, 常用的替代办法有()A、用过去调查的同类问题的经验数据B、用样本的标准差C、凭调查者经验确定D、用总体方差E、大致确定7、在抽样组织方式中,为提高样本对总体的代表性的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样8、在抽样组织方式中,为简化抽样工作的组织方式有()A、简单随机抽样B、分组抽样C、机械抽样D、整群抽样E、阶段抽样五、简答题1、影响抽样平均误差的因素有哪些?2、影响必要样本单位数目的因素有哪些?3、抽样平均误差、抽样极限误差和概率度三者之间是何关系?六、计算分析题1、某学校英语三级等级考试,学生成绩呈正态分布,根据经验标准差为10分,今随机抽样100名同学,得平均分为65分,当概率保证程度为95.45%时,推断该校同学的平均成绩的范围。

第7章抽样调查

第7章抽样调查

二、抽样误差的基本要求
无偏性 一致性 有效性
评价估计量优良性的三个标准:
1、无偏性: 样本统计量的期望值等于被估计 的总体参数。
设 表示总体的待估参数,ˆ 是估计 的样本
统计量,无偏估计指的是ˆ 满足:
E

如:由于 E x X ,所以样本平均数是总体平
x
9.13
n3
2.在不重复抽样下
抽样平均误差
x
2 1 n n N
σ为总体标准差,n为样本单位数,N为总体单位数。
例:从40、50、70、80中抽取3个组成样本,在不重 复抽样下,求抽样平均误差。
求总体标准差,直接用计算器统计功能键可以求出:
X X 2 15.81
N
求抽样平均误差
x
2 N n n N 1
15.812 4 3 5.27 3 41
练习:
1、随机重复抽选某校学生100人,调查他们的体 重得到平均体重为58公斤,标准差为10公斤。问 抽样推断的平均误差是多少?
练习:
1、随机重复抽选某校学生100人,调查他们的体重得到平 均体重为58公斤,标准差为10公斤。问抽样推断的平均误 差是多少?
设它们的平均数为 X,方差为,2 即 Exi ,X u
2 xi 2(i=1,2,…)。则对任意的正数ε,有:
limBiblioteka n p1 n
n i 1
xi
u




1
中心极限定理
正态分布的再生定理:
只要在样本容量n充分大的条件下,不论全 及总体的变量分布是否属于正态分布,其抽样 平均数也趋近正态分布。

第7章 抽样调查及答案

第7章  抽样调查及答案

第七章 抽样调查一、本章重点1.抽样调查也叫做抽样推断或参数估计,必须坚持随机抽样的原则。

它是一种非全面调查,其意义在于对总体的推断上,存在可控制性误差。

是一种灵活快捷的调查方式。

2.抽样调查有全及总体与样本总体之区分。

样本容量小于30时一般称为小样本。

对于抽样调查来讲全及总体的指标叫做母体参数,是唯一确定的未知的量,样本指标是根据样本总体各单位标志值计算的综合性指标,是样本的一个函数,是一个随机变量,抽样调查就是要用样本指标去估计相应的总体指标。

样本可能数目与样本容量有关也与抽样的方法有关。

抽样方法可以分为考虑顺序的抽样与不考虑顺序的抽样;重复抽样与不重复抽样。

3.大数定律、正态分布理论、中心极限定理是抽样调查的数理基础。

正态分布的密度函数有两个重要的参数(σ;x )。

它有对称性、非负性等特点。

中心极限定理证明了所有样本指标的平均数等于总体指标如X x E =)(。

推出了样本分布的标准差为:1--=N n N n x σμ。

4.抽样推断在逻辑上使用的是归纳推理的方法、在方法上使用的是概率估计的方法、存在着一定误差。

无偏性、一致性和有效性是抽样估计的优良标准。

抽样调查既有登记性误差,也有代表性误差,抽样误差是一个随机变量,而抽样的平均误差是一个确定的值。

抽样误差受总体标志值的差异程度、样本容量、抽样方法、抽样组织形式的影响。

在重复抽样下抽样的平均误差与总体标志值的差异程度成正比,与样本容量的平方根成反比即n x σμ=,不重复抽样的抽样平均误差仅与重复抽样的平均误差相差一个修正因子即N nn x -=1σμ。

在通常情况下总体的方差是未知的,一般要用样本的方差来代替。

把抽样调查中允许的误差范围称作抽样的极限误差x ∆或p ∆。

μt =∆,用抽样的平均误差来度量抽样的极限误差。

把抽样估计的把握程度称为抽样估计的置信度。

抽样的极限误差越大,抽样估计的置信度也越大。

抽样估计又可区分为点估计和区间估计。

07章抽样调查基础知识

07章抽样调查基础知识


1.14%
n
150
若按不重复抽样方式:
p(1p) n 0.98(10.98) 150
p
(1 )
(1 )1.137%4
nN
150
15000
三、抽样误差的允许范围
(一)抽样极限误差 抽样极限误差也叫允许误差,是指样本指标与
总体指标之间抽样误差的可能范围。
x x X p pP 将上式等价转换为下列不等式:
抽样误差
一、抽样误差的概念 (一)代表性误差
代表性误差是指在抽样调查中,用部分样 本推断总体时,由于样本各单位的结构情况不 足以代表总体状况而产生的误差。
代表性误差有两种:系统误差和随机误差。
1、系统误差是指破坏了抽样的随机原则而产生 的误差。例如有意识的选取好的单位或较差单 位进行调查造成的误差。
4、抽样组织方式(分层抽样误差较小,整群抽 样误差较大)。
二、抽样平均误差的计算 (一)样本平均数的抽样的平均误差
的计算 重复抽样条件下:
不重复抽样条件下:
(二)样本成数的抽样平均误差的计算 重复抽样条件下: 不重复抽样条件下:
(三)总体方差未知时的解决办法 1.用样本方差、成数代替 2.用过去的资料代替 3.用估计值代替 4.用小规模试验性调查资料代替 见书例2.
例:
某灯泡厂从一天所生产的产品10,000个 中抽取100个检查其寿命,得平均寿命为 2000小时,根据以往资料:σ =20小时, 分别按重复抽样和不重复抽样求抽样平 均误差
重复抽样平均误差为:
202 202(小时 )
x 100 100

不重复抽样平均误差为: x

400(1 100 ) 1.99(小时) 100 10000

统计学基础及应用-抽样推断

统计学基础及应用-抽样推断

任务八 抽样推断任务描述与分析在A市自来水公司的客户满意度调查中,我们抽样调查了A市自来水公司的700个客户,从前面的调查分析中我们了解到这700户客户对A市自来水公司的产品和服务等方面的评价。

现在你需要思考的是:这700户客户的意见能在多大程度上反映所有客户的意见?误差的可能性有多大?为了保证调查的准确性,我们是否需要再追加调查?任务分析(1)如何判断我们抽样调查的700个客户够不够?(2)根据抽调客户的意见我们如何推断出所有客户的意见?(3)被调查客户的意见与所有客户的意见误差有多少?案例8-1:为了加强与顾客的沟通,深入了解客户需求,以解决客户遇到的问题,并在此基础上持续改进公司的产品质量,进一步优化供水服务,A市自来水公司决定进行客户满意度调查,要求在2个月时间内完成调查报告。

A市共有自来水用户200万户,在短短两个月时间内必须完成客户调查并出具调查报告,你如何完成这项工作?抽样调查抽样推断是按照随机原则从总体中抽取一部分总体单位作为样本单位,组成样本总体,并以样本的数量特征对总体的数量特征做出具有一定可靠程度的估计和推断的统计分析方法。

抽样推断具有以下特点:1.抽样推断是用样本指标值来估计总体指标值 2.抽样的随机原则是抽样推断的前提3.抽样推断的误差是可以事先计算并加以控制节省调查费调查速度快调查结果准确可靠应用范围广抽样调查抽样推断常用概念总体样本从总体中按照随机原则抽选出来的一部分单位称为样本,用n 表示 我们所要调查研究的事物或现象的全体,总体单位数通常用N表示总体指标样本指标总体指标又称参数,是反映总体数量特征的综合指标,总体指标主要有:总体平均数,总体方差σ 2,总体标准差σ、总体成数P 和Q。

样本指标又称统计量,是根据样本各单位的标志值或标志特征计算的、反映样本数量特征的综合指标。

样本指标主要有:样本平均数,样本方差s2,样本标准差s,样本成数p和q。

样本容量样本样本个数又称样本可能数目,是指在一个抽样方案中从总体中所有可能被抽取的样本总数。

统计学第七章、第八章课后题答案

统计学第七章、第八章课后题答案

统计学第七章、第⼋章课后题答案统计学复习笔记第七章参数估计⼀、思考题1.解释估计量和估计值在参数估计中,⽤来估计总体参数的统计量称为估计量。

估计量也是随机变量。

如样本均值,样本⽐例、样本⽅差等。

根据⼀个具体的样本计算出来的估计量的数值称为估计值。

2.简述评价估计量好坏的标准(1)⽆偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的⽅差尽可能⼩。

对同⼀总体参数的两个⽆偏估计量,有更⼩⽅差的估计量更有效。

(3)⼀致性:是指随着样本量的增⼤,点估计量的值越来越接近被估总体的参数。

3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。

置信区间的论述是由区间和置信度两部分组成。

有些新闻媒体报道⼀些调查结果只给出百分⽐和误差(即置信区间),并不说明置信度,也不给出被调查的⼈数,这是不负责的表现。

因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。

在公布调查结果时给出被调查⼈数是负责任的表现。

这样则可以由此推算出置信度(由后⾯给出的公式),反之亦然。

4.解释95%的置信区间的含义是什么置信区间95%仅仅描述⽤来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

也就是说,⽆穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某⼀样本数据得到总体参数的某⼀个95%置信区间,就以为该区间以的概率覆盖总体参数。

5.简述样本量与置信⽔平、总体⽅差、估计误差的关系。

1. 估计总体均值时样本量n 为2. 样本量n 与置信⽔平1-α、总体⽅差、估计误差E 之间的关系为与置信⽔平成正⽐,在其他条件不变的情况下,置信⽔平越⼤,所其中: 2222α2222)(E z n σα=n z E σα2=需要的样本量越⼤;与总体⽅差成正⽐,总体的差异越⼤,所要求的样本量也越⼤;与与总体⽅差成正⽐,样本量与估计误差的平⽅成反⽐,即可以接受的估计误差的平⽅越⼤,所需的样本量越⼩。

吉珠统计学期末考试重点第7章 抽样及抽样分布

吉珠统计学期末考试重点第7章  抽样及抽样分布

x
时, f (x) 的曲线以 x 轴为渐近线。
第七章 抽样调查
4. 标准正态分布
标准正态分布的概率密度函数为:
1 ( z) e , <z< 2
若随机变量 Z 服从标准正态分布, 则记为 Z~ (0, 1)
z2 2
1. 任何一个一般的正态分布,可通过下面的 线性变换转化为标准正态分布
总体均值的区间估计
(一) 大样本时总体均值的区间估计
第七章 抽样调查
例:某企业生产A产品的工人有1000人, 某日采用不重复抽样从中随机抽取100人调查 他们的当日产量,样本人均产量为35件,产量 的样本标准差为4.5件。请以95.45%的臵信度
估计该日人均产量的臵信区间。
解:①计算抽样平均误差
x 0
x a
第七章 抽样调查
标准差 决定密度函数曲线 f (x) 的陡缓程度.
0.5
1
2
第七章 抽样调查
3. 正态分布密度函数的特点
(1) 对称性。 (2) 非负性。
(3) f (x) 在 X x 时达到极大值 f(x ) 1 2
(4) f (x) 的曲线在 X x 处有拐点。 (5 )当
Z X

x2 2
~ N (0,1)
2. 标准正态分布的概率密度函数
1 ( x) e 2 , x
3. 标准正态分布的分布函数 t2 x x 1 -2 ( x) (t )dt e dt 2
第七章 抽样调查
标准正态分布, 具有如下性质或结论:
③计算抽样极限误差
由 1 ) 0.95 ,查t分布表得, (
t n 1 t 2.5% (9)=2.2622

统计学原理任务七统计分析——抽样推断

统计学原理任务七统计分析——抽样推断
统计学原理
任务七

统计分析——抽样推断
掌握抽样推断基础知识 计算抽样误差 抽样估计 确定必要样本容量 认识抽样组织形式任务四 分任务五 分任务六
分任务一
掌握抽样推断基础知识
7.1
一、抽样推断的含义与作用
(一)抽样推断的含义 抽样推断是按照随机原则,从总体中抽出一 部分单位作为样本,对样本进行详细地调查 登记,并计算出样本指标数值,然后根据样 本指标数值对总体的数量特征(总体指标数 值)作出具有一定可靠程度的估计和判断的 一种统计分析方法。
7.1

三、抽样推断中的基本概念
(二)全及指标和抽样指标 1.全及指标 全及指标是指根据全及总体各个单位的标志值或标志特征计算的, 反映总体某一方面特征或属性的综合指标。由于全及总体是唯一 确定的,因而全及指标数值也是唯一确定的。
7.1

三、抽样推断中的基本概念
(二)全及指标和抽样指标 2.抽样指标 抽样指标是指由抽样总体各个单位标志值或标志特征计算的,反 映抽样总体某一方面特征或属性的综合指标。由于从一个全及总 体中可以抽出许多个样本,样本不同,抽样指标的数值也就可能 不同,所以抽样指标的数值不是唯一确定的。
7.2

三、抽样平均误差
7.1
三、抽样推断中的基本概念



(三)样本容量和样本个数 1.样本容量 样本容量是指一个样本所包含的单位数,通常用小 写英文字母n表示。 2.样本个数 从总体N个单位中随机抽选n个单位构成样本,通常 有多种抽选方法,每一种抽选方法实际上是n个总体 单位的一种排列组合,一种排列组合便构成一个可 能的样本,n个总体单位的排列组合总数,称为样本 个数或者样本的可能数目,常用小写英文字母k表示。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

x
x
则该市居民家庭年人均旅游消费支出额:
下限 x x 350 9.80 340.2( 0 元)
• 由以上计算结果,估计该批产品的合格率在94.05%~99.95% 之间,有91.46%的概率保证程度。
• 2.给定概率保证程度,求抽样极限误差并 对总体指标做出区间估计。
• 【例7—4】对我国某城市进行居民家庭人 均旅游消费支出调查,随机抽取400户居民 家庭,调查得知居民家庭人均年旅游消费 支出为350元,标准差为100元,要求以95 %的概率保证程度,估计该市人均年旅游 消费支出额。

③根据
t

x


10 5

2,查概率表得F(t)=95.45%
• 由以上计算结x 果,有95.45%的概率保证程度估计该批产品
的平均耐用时间在990~1010小时之间。
• 求(2)的计算步骤: • ①求样本指标:p=97%
p2=p(1-p)=0.97 0.03=0.0291


p
p(1-p)= n
• 2.样本指标,是反映样本数量特征的综合指标,又称 样本统计量。样本指标有样本平均数及样本标准差、样 本成数及样本成数标准差。由于从一个全及总体可以抽 取多个样本,样本不同,样本的数值就不同,所以样本 指标的数值不是惟一确定的,它是一个随机变量。全及 指标和样本指标的相关公式见表7—1。
•(三)重复抽样和不重复抽样
二、抽样平均误差
• (一)抽样平均数的抽样平均误差 • 在重复抽样条件下:
2
x
n
n
• 在不重复抽样条件下:


2

N

n)
x
n N 1
(二)抽样成数的抽样平均误差
• 如用表示抽样成数的抽样平均误差,其公 式为:
• 在重复抽样条件下:


p
P(1-P) n
• 在不重意义 • 基本特点: • (一)按照随机原则抽取样本单位 • (二)抽样调查的目的在于推断总体 • (三)抽样误差可以事先计算并加以控制 • 二、抽样调查的作用
三、抽样推断的几个基本概念
• (一)全及总体和样本总体
• 1.全及总体,也叫母体,简称总体,它是具有某 种共同性质或特征的许多单位的集合体,也就是 我们所要调查研究的现象的全体。全及总体的单 位数通常用N来表示。
• 解:第一步,根据抽样资料得: • 样本每户年人均消费支出=350(元) • 样本标准差σ =100(元)
100 5(元)
x
100
400
• 第二步,根据给定的概率保证程度F(t) =95%,查得正态分布概率表得t=1.96。
• 第三步,计算
, t 1.96 5 9.8( 0 元)
• 2.样本总体,又叫子样或抽样总体,简称样本。 它是从全及总体中随机抽取出来的那部分单位的 集合体。样本总体的单位数称为样本容量,通常 用n表示。一般来说,当时,称为大样本;当时, 称为小样本。社会经济现象的抽样调查多取大样 本。
(二)全及指标和样本指标
• 1.全及指标,是反映总体数量特征的综合指标,又叫 总体指标或母体参数。在一个总体中,总体指标是唯一 确定的量,而且是一个未知量,需要通过样本资料进行 推算。常用的全及指标有总体平均数及总体标准差、总 体成数及总体成熟的标准差。
第二节 抽样误差
• 一、抽样误差的意义 • (一)抽样误差的概念 • 抽样误差是指抽样调查所获得的数据与调
查总体真实结果之间的差异。 • 1.登记性误差 • 2. 代表性误差
(二)影响抽样误差大小的因素
• 1.样本单位数的多少。 • 2. 总体被研究标志的变异程度。 • 3.抽样方法。 • 4.抽样调查的组织形式。
p=
P(1-P) (1 n )
n
N
三、抽样极限误差
• (一)抽样极限误差的概念
• 抽样极限误差又称置信区间和抽样允许误
差范围,是指在一定的把握程度(P)下保
证样本指标与总体指标之间的抽样误差不
超过某一给定的最大可能范围,记作Δ 。
• 设△x、△p分别表示抽样平均数极限误 差和抽样成数的极限误差,则有:
• 1.重复抽样,也称重置抽样或有放回抽样。它是 指从总体中随机抽取一个样本单位,把结果登记 下来后,重新放回,再从全及总体中抽取下一个 样本单位。在这种抽样方式中,同一单位有多次 重复中选可能。
• 2.不重复抽样,也称不重置抽样或无放回抽样。 它是指从总体中随机抽取一个样本单位后不再放 回去,下一次则从剩下的总体单位中继续进行抽 取。在这种抽样方式中,每个总体单位只能被抽 中一次,不会被重复抽中。

x X x

pP p
(二)抽样极限误差的计算公式

t x x
t p
p
t
x
x
t
p
p
第三节 抽样估计的方法
• 一、点估计 • 二、区间估计 • (一)区间估计的思想 • 区间估计的计算公式如下:
x x X x x pp P pp
0.0291=1.71% 100
• ②根据给定的Δp=2.95%,求总体合格率的上、下限:
• 下限 p p=97%-2.95%=94.05%
• 上限 p+ p=97%+2.95%=99.95% • ③根据t=Δp /μp=2.95%/1.71%=1.725,
• 查概率表得F(t)=91.46%
(二)区间估计的模式
• 1.根据已给定的抽样误差范围,求概率保证程度。 • 【例7—3】某企业对某批电子元件进行检验,随
机抽取100只,测得平均耐用时间为1000小时,标 准差为50小时,合格率为97%,求: • (估计1)该以批耐产用品时平间均的耐允用许时误间差的范区围间Δ及x=其1概0小率时保,证 程度。 • (2)以合格率估计的误差范围不超过2.95%,估 计该批产品合格率的区间及其概率保证程度。
• 解:求(1)的计算步骤:
• ①求样本指标: x=1000小时
=5( 0 小时)
= = 50 =( 5 小时)
x
n
100
• ②根据给定的 x 10 小时,计算总体平均数的上、下限:
• 下限 x =1000-10=990(小时) x
• 上限 x+ =1000+10=1010(小时) x
相关文档
最新文档