统计学基础单元10抽样推断
统计学(选择,判断)
统计学(选择,判断)判断1.描述统计是用文字和图表对客观世界进行描述。
()2.箱线图主要展示分组的数值型数据的分布。
()3.抽样极限误差可以大于、小于或等于抽样平均误差。
4.直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。
()5.相关系数为0表明两个变量之间不存在任何关系。
()6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少()7.在单因素方差分析中,SST =SSE+SSA()。
()8.右侧检验中,如果P值<α,则拒绝H9.抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量与边际误差成正比。
()10.当原假设为假时接受原假设,称为假设检验的第一类错误。
()11.简单随机抽样由于样本是完全随机的,适用于任何情形。
12.采用多阶段抽样时,阶段数越多,结果越正确。
13.四分位差是下四分位数与上四分位数14.点估计就是用样本统计量代表总体参数15.总体比例标准差的最大值是116.在简单随机抽样时,当总体单位数较多时,若抽样比例为64%,则不重复抽样的抽样平均误差比重复抽样的抽样平均误差大约减少40%17.当置信水平一定时,置信区间的宽度随着样本量的增大而减少18.重复简单随机抽样的抽样平均误差小于不重复简单随机抽样的抽样平均误差。
19.平均差与标准差都表示各标志值对其算术平均数的平均离差。
20.单一表能容纳较多的标志,因而能把许多单位的资料填列于一张表中,这有利于比较和分析。
等距抽样在决定间距时要注意总体中有无周期性变化。
采用多阶段抽样时,阶段数越多,结果越正确。
两个变量的相关分析中要求其中一个是自变量,另一个是因变量。
标志是单位的属性或特征,指标是总体的数量特征,两者没有关系。
在评判估计量好坏中,有效性就是指估计的正确性。
21.如果总体情况复杂,适宜于采用分层抽样。
整群抽样要求群与群之间差异要大。
22.在评判估计量好坏中,无偏性就是指估计的正确性。
管理统计学之抽样推断
•2020/4/29
•管理统计学讲义 游士兵
特别注意
• 如果同时有几个方差供选择,则选择其 中最大的;
• 如果同时有几个成数供选择,则选择靠 近0.5的那个成数。
•2020/4/29
•管理统计学讲义 游士兵
(3)计算举例
例1:某企业生产一批产品20000件,今随 机抽样100件作耐用时间试验,结果表明 :每件样本的平均寿命为3600小时,所 抽样本的标准差为150小时,求抽样误差 。
•2020/4/29
•管理统计学讲义 游士兵
(2)公式应用
• 抽样误差的计算公式可分为两种条件下 的两种推断的计算公式: 两种条件:重复抽样和不重复抽样 两种推断:以样本平均数推断总体 平均数;以样本成数推断总体成数 这样,就有四个计算公式。
•2020/4/29
•管理统计学讲义 游士兵
公式的验证:
的一种方法。 点估计的特点是只考虑了样本指标,
而没有考虑抽样误差。
•2020/4/29
•管理统计学讲义 游士兵
2、区间估计
(1)理论准备
所谓区间估计就是在一定概率保证下, 确定总体参数值的可能范围。
所谓概率就是指在随机事件进行大量实 验中,某种事件出现的可能性的大小。
抽样估计的概率保证程度就是指抽样误 差不超过一定范围的概率大小。
•管理统计学讲义 游士兵
2、抽样误差的来源
• 一类:登记性误差 • 二类:代表性误差
A、系统性误差 B、偶然性误差 注意:抽样误差特指偶然性误差
•2020/4/29
•管理统计学讲义 游士兵
3、影响抽样误差的因素
• 抽样单位数的多少 • 总体中被研究标志的变动程度的大小
《统计学》第10讲 参数估计(复习+习题)
(二)方差的区间估计
1.总体方差的区间估计
对于来自正态总体的容量为n的简单随机样本,统 计量 n 1s 2 / 2 服从自由度为 n 1 的卡方分布。
n 1 s 2
2
~ 2 n 1
总体方差在1- 置信水平下的置信区间为
2 n 1 s
2
2 2 2 2 s1 s2 s1 s2 , F 2 F1 2
F分布两个自由度
24
(三)总体比率区间估计
1.单样本比率的区间估计
当样本容量充分大时,样本比率p近似服从以总体比
率P为数学期望,以P(1-P)/n为方差的正态分布。
1. 样本比率的数学期望
E (p) P
2. 样本比率的方差
P (1 P ) n
n1 n2
18
( n1 3 0, n 2 3 0 )
大样本,方差已知(两个总体分布没有要求)
1. 两个样本均值之差 x 1 x 2 的抽样分布服从正态
分布,其数学期望为两个总体均值之差
E (x1 x 2 ) 1
2
2. 方差为各自的方差之和
2 x1 x 2
12 22 n1 n2
•
分别从两个独立的随机总体中抽取容量为n1和n2的 独立样本,当两个样本都为大样本时,两个样本比 率之差的抽样分布可用正态分布来近似。 数学期望为
• •
E ( p 1 p 2 ) P1 P 2
方差为各自的方差之和
27
2 p1 p 2
P1 (1 P1 ) P2 (1 P2 ) n1 n2
2
2 2 x n
统计学简答题
统计学简答题1. 什么是标志?什么是指标?二者有什么联系与区别?P13-14标志:说明总体单位特征的名称。
指标:是说明客观现象总体数量特征的名称和具体数值的统一体。
联系:(1)有许多指标的数值是从总体单位数量标志的标志值汇总而来的;(2)统计指标和标志随着研究目的的不同是可以相互转化的。
区别:(1)统计指标是说明总体特征的,而标志是说明总体单位特征的;(2)所有的统计指标都是用数量表现的,而标志有能用数值表现得数量标志和不能用数值表示的品质标志。
2. 什么是变量?离散型变量?连续型变量?下列哪些属于连续型变量? P13变量:所有的统计指标和可变的数量标志。
离散型变量:是指只能取整数值的变量,它的取值是一一可数的。
(只能用计数的方法取得)连续型变量:是指其取值可以连续不断,相邻两个整数变量之间可以作多次分割的变量。
(连续型变量的数值靠测量或计算取得,既可以表现为整数,也可以表现为小数。
)以下属于连续变量的是:2;3;5;6;8;10⑴选民选票数;⑵存款余额;⑶车轮转速;⑷毕业生人数;⑸飞机耗油量;⑹零件尺寸偏差;⑺生猪存栏数;⑻森林覆盖面积;⑼企业数;⑽降雨量;3.什么是总体?什么是总体单位?总体有什么特征?P11总体:在某一性质上相同的许多个别事物集合起来形成的集合体。
总体单位:构成统计总体的各个个别事物。
总体的特征:(1)同质性;(2)差异性;(3)大量性;(4)客观性;4. 统计调查方案的内容有哪些? P27(1)确定调查目的(2)确定调查对象和调查单位(3)确定调查项目和调查表(一览表/单一表)(4)确定调查时间(指调查资料所属的时间)和调查期限(是进行调查工作的时限)(5)其他内容5. 什么是调查误差?调查误差有哪几种?应该怎样控制? P30调查误差:通常是指统计数据与客观现实之间的差距。
种类:(1)登记性误差;(2)代表性误差。
控制:(1)正确制定调查方案,力求调查的范围明确、调查项目解释清楚、方法科学适用;(2)加强调查人员培训,提高调查技术水平;(3)做好思想教育工作,坚持实事求是,加强法律观念;(4)严格要求调查人员认真细致,多加审查及时更正;(5)完善各种计量、测量工具。
统计学各章练习——抽样推断
第九章抽样推断一、名词1、抽样推断:即由样本指标来推断总体指标的统计方法。
2、抽样误差:是指抽样指标和全及指标之间的绝对离差。
3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。
4、点估计:就是直接用样本指标代表总体指标的估计方法。
5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。
6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。
二、填空题1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。
2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。
3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。
4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。
5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。
6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。
7.抽样估计的方法有(点估计)和(区间估计)两种。
8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。
9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。
10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。
11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。
12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。
统计学—抽样推断
解:已知样本的合格率= 3006 0.98 300
重复抽样: P (1 P )0 .9 8 (1 0 .9)8 0 .00 8 0 .80 % 0
p
n
300
不重复抽样:
P(1P)(1n) 0.980.02(1 300)0.80% 6
p
n
N
300 60,000
21
第六章 抽样推断
STAT
(二)分层(类型)抽样形式下
样本成数近似服从于以总体成数为P,方差为P(1-P)/n的正态12 分布。
第六章 抽样推断
STAT
第二节、抽样误差的计算
一、抽样误差的概念
登记性误差
调查误差 代表性误差
系统性误差
实际抽样误差
抽样误差 抽样平均误差
代表性误差是指 由于样本的结构不能完全代表总体的结构 所引起的误差。
系统性误差是指由于抽样调查违反随机原则引起的误差;
p
n N 1
nN
注:(1)可用样本成数方差代替总体成数方差;
(2)可用样本成数 p^ 代替总体成数P;
(3)有若干个P值时,取最接近0.5的P值;
(4)无P值时,取P=0.5 (此时方差最大)
20
第六章 抽样推断
STAT
例:一批食品罐头60,000桶,随机抽查300桶,发现有6桶不合 格,求合格率的抽样平均误差。
统计上讲的抽样一般都是指概率抽样。 二、抽样推断的特点
1、是非全面调查 与普查的区别;
2、按随机原则抽取样本 与典型调查和重点调查的区别; 3、根据样本指标推断总体指标 与重点调查的区别; 4、抽样误差可以事先计算与控制 与典型调查的区别。
3
第六章 抽样推断
《统计学原理》第5章:抽样推断
σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
统计学原理教案中的抽样与抽样分布揭示学生如何进行抽样和利用抽样分布进行推断
统计学原理教案中的抽样与抽样分布揭示学生如何进行抽样和利用抽样分布进行推断统计学是一门研究收集、分析和解释数据的学科,而抽样和抽样分布则是统计学中至关重要的概念。
本文将探讨统计学原理教案中的抽样和抽样分布,以揭示学生如何进行抽样和利用抽样分布进行推断。
首先,我们来理解抽样的概念。
在统计学中,抽样是指从总体中选择一部分个体进行观察和研究。
总体是指我们感兴趣的整体,而样本则是从总体中选取的一部分个体。
通过抽样,我们可以通过研究样本来推断总体的特征,这是由于抽样的随机性能够保证样本与总体的代表性。
接下来,让我们了解抽样的方法。
常见的抽样方法包括简单随机抽样、系统抽样、分层抽样和整群抽样等。
每种抽样方法都有其特点和适用范围。
简单随机抽样是一种随机选择样本的方法,每个个体被选择的概率相同。
系统抽样是按照一定的规律选择样本,例如每隔一定数量选择一个个体。
分层抽样是将总体分成若干层次,然后从每个层次中抽取样本。
整群抽样则是将总体分成若干群体,然后随机选择一些群体并全面调查其中的个体。
选择合适的抽样方法可以更好地保证样本的代表性和可靠性。
抽样之后,我们需要了解抽样分布的概念。
在统计学中,抽样分布是指根据大量抽样的结果所得到的分布。
常见的抽样分布包括正态分布、t分布和F分布等。
其中,正态分布是抽样分布的重要特例,它在许多情况下都可以作为近似的抽样分布来使用。
t分布则用于小样本情况下的推断,它相比于正态分布更为宽阔且更适用于样本数据较少的情况。
F分布常用于分析方差比较和回归模型中的显著性分析。
抽样分布的重要性在于它可以帮助我们进行推断。
根据抽样分布的性质,我们可以利用统计推断方法进行参数估计和假设检验。
参数估计是根据样本的统计量来估计总体的参数值,例如通过样本均值估计总体均值。
假设检验是用来判断总体参数是否在某个范围内或是否相等的统计方法。
通过抽样分布的理论知识,我们可以进行参数估计和假设检验,并对总体进行推断。
在统计学原理教案中,抽样和抽样分布是学生学习的重点内容。
抽样推断
.和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活抽样调查的调查单位比全面调查少得多,因而既能节约人力、费用和时间,又能比较快地得到调查的结果,这对许多工作都是很有利的。
2.有些情况下,抽样调查的结果比全面调查要准确全面调查只有登记误差而没有代表性误差,而抽样调查则两种误差全有。
因此,人们往往认为抽样调查不如全面调查准确,这种看法忽略了两种误差的大小。
全面调查的调查单位多,涉及面广,参加调查汇总的人员也多,水平不齐,因而发生登记误差的可能性就大。
抽样调查的调查单位少,参加调查汇总的人员也少,可以进行严格的培训,因而发生登记误差的可能性就少。
在这种情况下,抽样调查的结果会比全面凋查的结果更为准确。
3.抽选部分单位时要遵循随机原则其他非全面调查,如典型调查和重点调查等,一般是要根据统计调查任务的要求,有意识地选取若干个调查单位进行调查,而抽样调查不同,从总体中抽取部分单位时,必须非常客观,毫无偏见,也就是严格按照随机原则抽取调查单位,不受调查人员任何主观意图的影响,否则会带上个人偏见,挑中那部分单位的标志值可能偏高或偏低,失去对总体数量特征的代表性。
4.抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制在非全面调查方式中,典型调查固然也有可能用它所取得的部分单位的数量特征去推算全体的数量特征,但这种推算误差范围和保证程度,是无法事先计算并加以控制的。
而抽样调查则是在于对一部分单位的统计调查,在实际观察标志值的基础上,去推断总体的综合数量特征。
抽样调查是必不可少的一种调查方法,但是,抽样调查也有它的弱点。
例如,它只能提供说明整个总体情况的统计资料,而不能提供说明各级状况的详细的统计资料,这就难以满足各级领导和管理部门的要求。
抽样调查也很难提供各种详细分类的统计资料。
因此,抽样调查和全面调查是不能互相代替的。
(三)抽样调查的适用范围抽样调查适用的范围是广泛的,在许多场合都可以运用抽样调查方法取得;在某些特殊场合,甚至还必须应用抽样调查的方法取得。
统计学基础练习
1.“统计”一词的三种涵义是( B )。
A.统计调查统计整理统计分析 B.统计工作统计资料统计科学C.统计信息统计咨询统计监督 D.统计理论统计方法统计技能2.社会经济统计的研究对象是(C )。
A、抽象的数量特征和数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法3.统计研究的基本方法包括( D )。
A.调查方法汇总方法分析方法B.调查方法整理方法预测方法C.相对数法平均数法指数法D.大量观察法统计分组法综合指标法4.某工人月工资1000元,则“工资”是( A )。
A.数量标志 B.品质标志 C.质量指标 D.数量指标5.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。
A、品质标志B、数量标志C、标志值D、数量指标6.下述调查属于经常性调查的是()。
A.每隔10年进行一次人口普查B.对五年来商品价格变动情况进行调查C.对2000年职称评审结果进行调查D.按月上报商品销售额7.统计调查方案中的调查时限是指()A.调查工作的起讫时间B.搜集资料的时间C.时期现象资料所属的时间D.时点现象资料所属的时间8.某产品在检验和测量时常有破坏性,一般宜采用()A.全面调查B.典型调查C.抽样调查D.重点调查9.要对某工厂生产设备状况进行调查,则该厂“每一台生产设备”是()A.调查对象B.调查单位C.调查项目D.报告单位10.统计调查误差的代表性误差()A. 存在于所有的非全面调查中B.只在典型调查中存在C. 只在抽样调查中存在D.只在重点调查中存在11.抽样调查与典型调查都属于非全面调查,二者的根本区别在于()A.灵活程度不同 B.组织方式不同C.作用不同 D.选取调查单位的方法不同12.对医院的医疗设备普查时,每个医院是()A.调查对象 B.调查总体 C.调查单位D.填报单位13.重点调查中重点单位是指()A、标志总量在总体中占有很大比重的单位B、具有典型意义或代表性的单位C、那些具有反映事物属性差异的品质标志的单位D、能用以推算总体标志总量的单位14.对某省饮食业从业人员的健康状况进行调查,调查单位是()A.某省饮食业的全部网点 B.某省饮食业的每个网点C.某省饮食业所有从业人员数 D.某省饮食业每个从业人员15.统计分组的首要问题是()A.划分各组界限B.确定组数C.选择分组标志D.确定组距16.某连续型变量的组距数列,其末组为开口组,下限为600,其邻组的组中值为550,则末组的组中值为()A.550 B.650 C.700 D.75017.对一个总体选择三个标志做复合分组,按各个标志所分的组数分别为3、4、5,则所分的全部组数为()A.60 B.12 C.30 D.618.某小区居民人均月收入最高为5500元,最低为2500元,据此分为6组,形成等距数列,其组距应为()A.500 B.600 C.550 D.65019.年收入变量,其分组依次为5万元以下,5~10万元,10~15万元,15万元以上,则有()。
统计学课件:抽样推断
3.当总体X~N(, 2),从中抽取容量为n的样本,则
n
2
(n 1)s2
2
~
(2 n-1); 2
(xi x)2
i 1
2
~
(2 n-1)
4. 2—分布的性质 (1)分布可加性 若X ~ 2(n1),Y~ 2(n2 ), X,Y独立,则 X +Y ~ 2(n1+n2 ) (2)期望与方差 若X~ 2(n),则 E(X)= n,D(X)=2n
3、进行产品质量检验 4、进行假设检验
(一)总体和样本 1、总体 总体也称全及总体,指所有认识的研究对象全体,它是
有所研究范围内具有某种共同性质的全体单位所组成的 集合体。 一般用英文字母大写N来表示总体的单位数。 2、样本 样本又称子样,它是从全及总体中随机抽取出来,作为 代表这一总体的那部分单位组成的集合体。 一般用英文小写字母n来表示样本的单位数。
5. 分位点 设X ~ 2(n),若对于:0<<1,
存在 2 (n) 0 满足
P{X 2 (n)} ,
则称 2 (n) 为 2 (n) 分布的上分位点。
2
(n
)
(二)t 分布
若X 服从N (0,1),Y 服从自由度为n的 2分布, 且X 和Y 独立,则 X
Y /n 服从自由度为n的 t分布。
1、全及指标 根据各单位的标志值或标志属性计算的,反映总体
数量特征的综合指标称为全及指标,又称为参数。
设总体变量 X 为: X1, X 2 ,X N 则有:
X X XF N F
2 X X 2 X X 2 F
N
F
设总体 N 个单位,有 N1 个单位具有某种性质, N0 个单位不具有某种性质,
抽样推断 习题及答案
第六章抽样推断习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。
2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。
3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。
4. 样本容量:是指样本中的总体单位数量。
5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。
7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。
8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
二、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 抽样推断中,如果获取的样本数据准确,那么,由此推断的总体参数也一定准确。
(×)不一定2. 极限误差越大,则抽样估计的可靠性就越小。
(×)越大3. 抽样平均误差的大小与样本容量的大小成正比关系。
(×)反比4. 在一般的抽样推断中,抽样平均误差小于极限误差。
(×)不一定5. 重复抽样条件下的抽样平均误差,一定比不重复抽样条件下的抽样平均误差大。
(×)在其他条件相同的情况下6. 在不重复抽样的情况下,若调查的单位数为全及总体的10%,则所计算的抽样平均误差比重复抽样计算的抽样误差少10%。
【统计学概论】抽样推断
每包重量(克) 149以下 149—150
150—151 151以上
包数 10 20 50 20
(1)以99.73%的概率保证估计这批茶叶平均每包重量的 可能范围
(2)以同样的概率保证估计这批茶叶包装的合格率的可 能范围
• 三必要抽样数目的确定
• (一)影响抽样数目的因素
•
影响抽样数目的因素有:
(一)总体和样本
总体:调查研究的事物或现象的全体,所包含 的单位数用“N”表示。
样本:从总体中所抽取的部分个体所构成的小 的总体,当中所包含的单位数用“n”
表 示,称为“样本容量”。 样本可分为: 大样本 小样本
(二)全及指标与样本指标 (参数与统计量)
1、全及指标:说明全及总体的综合数量 特征,是唯一的,又称为“参数”。
尺度,用“ ”。
2、公式:
(1)重复抽样条件下:
(2)不重复抽样条件下:
五、抽样极限(允许)误差
1、概念:是在一定的概率保证下,用样本 指标估计全及指标时允许出现的
最 大误差,用“△”表示.
2、计算公式: 根据置信度(即可靠性,F(t)=1-α),
查正态概率分布表,查得对应的概率度t。 (在总体方差未知的情况下)
例3:P94
例4 P95
例5 P96
三、抽样误差
1、概念:是在遵循随机原则的条件下,用 样本指标来代表全及指标所不可避免 的误差。就是统计误差中的随机误差
抽样误差=样本指标 -全及指标 2、影响因素:
①抽取单位数n的多少 ②被研究标志的变异程度 ③抽样方法 ④抽样组织方式
四、抽样平均误差
1、概念:是所有可能组成的样本的抽样误 差的平均数,反映样本指标与全及指标的 平均误差程度,是衡量样本代表性大小的
(一)抽样推断的意义_统计学基础_[共2页]
234 统计学基础任务导入第二次世界大战中的抽样推断—德军有多少辆坦克?第二次世界大战期间,盟军非常想知道德军总共制造了多少辆坦克。
德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行连续编号。
在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。
那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数N ,而缴获坦克的编号则是样本。
假设我们是盟军手下负责解决这个问题的统计人员。
制造出来的坦克总数肯定大于等于记录的最大编号。
为了找到它比最大编号大多少,先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。
因此,样本均值乘以2就是总数的一个估计;当然,要特别假设缴获的坦克代表了所有坦克的一个随机样本。
这种估计N 的公式的缺点是不能保证均值的2倍一定大于记录中的最大编号。
N 的另一个估计公式是用观测到的最大编号乘以因子l+l/n ,其中,n 是被俘虏坦克个数。
假如俘虏了10辆坦克,其中最大编号是50,那么坦克总数的一个估计是(l+1/10)×50 =55。
此处认为坦克的实际数略大于最大编号。
从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。
记录仍然表明统计估计比通常通过其他情报方式做出估计要大大接近于真实数目。
统计学家做得比间谍们更漂亮!在前面的任务中,已经学习了计算综合指标来反映总体的数量特征。
然而,在社会经济统计中,经常遇到不可能全面调查和没必要全面调查的情况。
当遇到这些情况时,通常采用抽样调查,即用样本资料来估计和判断总体的数量特征,以达到对现象总体的认识。
但应该采用什么样的方式和方法来抽取样本?抽多少单位数组成样本?怎么来控制抽样误差?这些问题都是在实际工作中必须考虑的问题。
本项目具体讨论这些问题。
相关知识一、抽样推断概述在前面的任务中已经学习过用平均数来反映总体的集中趋势,通过标准差来反映总体的离散程度。
在有限总体且所有数据已知的情况下,可以通过公式将这些指标计算出来。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程单元教学设计
(2014—2015学年第一学期)
单元名称:抽样推断
所属分院:会计金融分院制定人: Nhomakorabea磊合作人:周建华
制定时间:2014年8月
江西旅游商贸职业学院
统计学原理及实务课程单元教学设计
单元标题:抽样推断
单元教学学时
6
在整体设计中的位置
第10次
授课班级
能力训练任务
任务一抽样估计方法
一、点估计
二、区间估计
任务二样本容量的确定
任务三案例分析—2011年国内旅游抽样调查综合分析
案例
案例1:某学校从全部学生中,随机抽取200名学生进行调查,他们的平均体重为60kg,抽样平均误差为1kg。如果要求抽样误差不超过1.96kg,试估计全部学生平均体重的可能范围。
2013统招13.14班
上课时间
2014年11月26日第一节至2014年12月8日第二节
上课地点
第五教学楼
一阶
教学目标
能力目标
知识目标
素质目标
1.知道如何进行假设检验
2.掌握点估计方法、区间估计方法
3.能根据有关资料计算必要抽取数目
1.能运用点估计、区间估计进行抽样推断
2.掌握样本容量确定的方法
能根据有关资料进行点估计、区间估计.
仪器:计算器设备:计算机
单元教学进度
步骤
教学内容及能力
知识目标
教师活动
学生活动
时间
(分钟)
1
抽样估计方法
掌握点估计和区间估计的概念和计算方法
教师讲解点估计
学生运用点估计方法进行抽样推断
120
教师讲解区间估计
学生运用区间估计方法进行抽样推断
2
样本容量的确定
掌握重复抽样下和不重复抽样下样本容量的确定
教师讲解重复抽样下样本容量的确定
案例2:某高校某届学生共3000人,参加英语考试。在不重复抽样的条件下,随机抽取30人调查其考试成绩,获得样本资料如下:
85, 92, 63, 56, 88, 67, 76, 95, 81, 87
86, 89, 57, 56, 90, 79, 71, 66, 69, 80
58, 76, 79, 88, 66, 77, 85, 81, 45, 80
学生根据资料进行样本容量的计算
60
教师讲解不重复抽样下样本容量的确定
学生根据资料进行样本容量的计算
教师简述抽样的组织形式
学生分析资料中各种抽样属于何种抽样形式
3
单元练习
教师讲解、分析、总结
学生练习
40
4
案例分析
教师举例:“2011年国内旅游抽样调查”
学生根据总体资料逆推样本平均数
20
作业
教材P158~ P160计算分析题
案例3:对1000份试卷随机抽样以推断学生的平均考分和及格率。据抽阅,考分的标准差为3分,及格率80%。现以95.45%的概率保证,分别以平均考分误差不超过1分和及格率误差不超过10%的条件下,最少应抽取多少份试卷?
案例4:某学院的会计系想对2013年的毕业生进行一次调查,以便了解他们本年度的就业倾向。该学院会计系共有4个专业:注册会计师、会计电算化、投资与理财与财务管理。2013年共有2000名毕业生,其中:注册会计师800名、会计电算化600名、投资与理财销400名、财务管理200名。假定要选取100人作为样本单位,各专业应抽取的人数分别为:注册会计师40名、会计电算化30名、投资与理财销20名、财务管理10名。
课后体会
学生对抽样推断法有基本了解,可以在一定概率保证下,用样本平均数和成数推断总体平均数和成数,但不熟练,需加大练习量。
案例5:2011年国内旅游抽样调查综合分析
(资料来源:中国旅游报,2012-08-08)
教学材料
(参考资料、仪器、设备)
资料:教材、授课PPT、教师讲义
参考书:1.《统计学》,阮红梅主编,2013年2月第一版,ISBN:97871211909402;
2.《统计学基础》,肖战峰主编,2009年2月第一版, ISBN:9787810889810。