最新统计学教案(第6章抽样推断)
统计学第六章抽样推断
尖山一委…
尖山二委
居民一组
居民二
组
…
第六章 抽样推断
某外国公司在##进行 微波炉市场调查:
STAT
在商场的大门口
在微波炉柜台前
在市区街道旁边
在某个住宅小区
时间表抽样框
第六章 抽样推断
连续出产的产品总体 可以编制抽样框:均STAT 匀的出产时间、可以 预见到的产品总量.
连续到加油站加油的 汽车总体无法编制抽 样框:时间不定、总 量也无法确定.
抽样估计的特点
第六章 抽样推断
按随机原则抽取样本单位
目的是推断总体的数量特征
抽样推断的结果具有一定的可靠程度, 抽样误差可以事先计算并控制
抽样估计的应用
第六章 抽样推断
不可能进行全面调查时 不必要进行全面调查时 来不及进行全面调查时 对全面调查资料进行补充修正时
抽样调查研究
Sampling Study
P N nN N NN n
共n个
⒉ 不重复抽样的可能样本数目:
C N n N N 1 N n 1
第六章 抽样推断
第六章 抽样推断
STAT
★§1.1 抽样方案的设计 ★§1.2 简单随机抽样的抽样误差的测定
§1.3 简单随机抽样的抽样估计
第六章 抽样推断
§1.2 简单随机抽样的抽样误差的测定 STAT
n1 1{i n1E(xiX)2nn(E xX)2} 由E(于 xX)2D (x)D (i1 nxi)n 1 2i n1D (xi)n2
E(sn21)n11{n2nn2}
2
⒋ 样本成数:
pn1,qn0 1p nn
⒌ 样本单位是非标志的标准差:
第六章 抽样推断
统计学基础课件(第六章抽样推断)
Fundamentals of Statistics
统计是指这种偶然性代表性误差。 即按随机原则抽样时,在没有登记性误差和系统性误 差的条件下单纯由于不同的随机样本得出不同估计量 而产生的误差。抽样误差是抽样调查所固有的,是无 法避免与消除的,但可以运用数学方法计算其数量界 限,并通过抽样设计程序控制其范围,所以这种抽样 误差也称为可控制误差。 需要指出,抽样误差不是 固定不变的数,它的数值是随样本不同而变化的,所 以它也是随机变量。
重复抽样 AA AB AC AD BA BB BC BD CA CB CC CD DA DB DC DD
N n = 42 =16 (个样本)
Fundamentals of Statistics
统计学基础
第六章 抽样推断
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
Fundamentals of Statistics
Fundamentals of Statistics
统计学基础
第六章 抽样推断
本章主要内容 •抽样推断概述 •抽样误差 •抽样估计的方法 •样本容量的确定
Fundamentals of Statistics
统计学基础
第第一六章节抽样推抽断样推断概述
一、抽样推断的概念和特点 概念
抽样推断是在抽样调查的基础上,用样 本实际资料计算样本指标,并据以推算总 体相应的数量特征的一种统计分析方法。
代表性误差的发生有以下两种情况:
一种是由于违反抽样调查的随机原则,如有意地多选较好的 单位或较坏的单位进行调查。这样做,所据以计算的抽样指标 必然出现偏高或偏低现象,造成系统性的误差。系统性误差和 登记性误差都是不应当发生的,是可以也应该采取措施避免发 生或将其减小到最小限度。
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
经济应用统计学-第六章抽样推断
非参数检验优缺点总结
• 易于理解和实现:非参数检验方法通常基于直观和易于理解的思想,计算和实现相对简单。
非参数检验优缺点总结
检验效能较低
与参数检验方法相比,非参数检 验方法的检验效能通常较低,即 当原假设为真时,非参数检验方 法更容易犯第二类错误(接受原 假设)。
对数据信息的利用不 充分
非参数检验方法通常只利用数据 的部分信息(如排序信息),而 忽略了数据的其他有用信息(如 数值大小),因此可能无法充分 利用数据信息。
两配对样本非参数检验
包括Wilcoxon 符号秩次检验、McNemar 检验 等方法,用于比较同一总体内两个配对样本的差 异是否显著。
两独立样本非参数检验
包括Mann-Whitney U 检验、Kruskal-Wallis H 检验等方法,用于比较两个独立样本所来自的 总体的分布位置或分布形状是否存在差异。
考虑样本量大小
在选择置信水平时,应充分考虑样本量的大小。当样本量较小时,应选择较低的置信水平以避免过大的估计误差;当 样本量较大时,可以选择较高的置信水平以获得更精确的估计结果。
参考相关文献或行业标准
在选择置信水平时,可以参考相关领域的文献或行业标准,了解通常采用的置信水平及其依据。这有助 于确保研究结果的可比性和可靠性。
04
假设检验原理与步骤
假设检验基本概念阐述
原假设与备择假设
原假设通常是研究者想要推翻的 假设,而备择假设则是研究者希 望证实的假设。
检验统计量与拒绝域
检验统计量是根据样本数据计算出 的用于检验原假设的统计量,而拒 绝域则是根据显著性水平和检验统 计量的分布确定的,当检验统计量 落入拒绝域时,我们拒绝原假设。
单侧检验
当研究者对备择假设的方向有明确预期时,即备择假设只可能大于或小于原假设时,应选择单侧检验 。例如,在比较两种药物疗效的研究中,如果研究者预期新药疗效优于旧药,则应选择单侧检验。
第6章抽样推断19619
1
e dx
(
x )2 22
2
x t 2
1 et2dt 1
(3)一般正态分布的标准化
若 X N , , 2
对其进行“标准化”变换,即令
Z X
则 Z N 0,1
2 、中心极限定理
一般意义: 无论随机变量服从何种分布,只要样本容量足够
大,都可以近似地看作是服从正态分布。中心极限 定理说明,大量相互独立的随机变量和的概率分布 是以正态分布为极限的。由于正态分布在概率论中 占有的中心地位,中心极限定理因此而得名。
(四)样本容量——指一个样本所包括的单位数。
(五)抽样比例——抽样比例是指在抽取样本时,所抽取的样 本单位数与总体单位数之比。
(六)样本个数——指从总体中可能抽取的最多的样本数量。
1、重复抽样: (1)考虑顺序: M = N n (2)不考虑顺序: M = (N + n- 1)! n!(N - 1)!
(一) 全及总体和抽样总体(总体和样本)
全及总体:所要调查观察的全部事物。
总体单位数用N表示。
抽样总体:抽取出来调查观察的单位。
抽样总体的单位数用n表示。 n ≥ 30 大样本 n < 30 小样本
(二) 抽样方法 1、重复抽样: 1
N
2、不重复抽样: 1 、 1 、 1 ...... 1 N N 1 N 2 N n
重复抽样和不重复抽样会产生三个差别: 抽取的样本数目不同 抽样误差的计算公式不同 抽样误差的大小不同
(三) 参数和统计量
(全及指标和抽样指标、总体指标和样本指标)
全及指标:全及总体的那些指标。 抽样指标:抽样总体的那些指标。
参数
研究总体中 的数量标志
统计学第6章抽样推断分析
在总体单位数为N的总体中抽取容量为n的样本, 样本个数可能有:
1、考虑顺序的不重复抽样:N(N-1)(N-2)…(N-n+1)
2、考虑顺序的重复抽样:Nn
3、不考虑顺序的不重复抽样:C
n N
N! n!(N n)!
4、不考虑顺序的重复抽样:
Cn N n1
在社会经济统计中,往往采用的是较大总体 (视为无限总体)下的无序不重复抽样。
简单随机抽样可根据总体的有限性或无限性分为 有限总体随机抽样与无限总体随机抽样。
有限总体简单随机抽样: 每个样本点(个体)能以相同的概率被抽出。
无限总体简单随机抽样: 1、每一个体来自同一总体; 2、每一个体是独立抽取的。
注意: 在有限总体的简单随机抽样中,由抽样是否具有可重
复性,又可分为重复抽样与不重复抽样。而且,根据抽样 中是否排序,所能抽到的样本个数往往不同。
如果总体单位数很“大”而样本容量很“小”,则该 修正因子趋近于1,这时,对有限总体可直接按无限总体的 公式去计算。
一个经验的衡量标准是n/N<=0.05。
例3中:
样本容量与总体单位数的比值为 n/N=30/2500=0.012,
因此,样本均值的标准差可计算如下:
x n 4000/ 30 730.30
of
(n=30)
x
II
III
x
x
x
x
x
x
x
x
2、样本均值抽样分布的数值特征
可证明在简单随机抽样中
E(x)
例3中,中层干部年薪的总体均值为51800,因此 所有可能的样本平均数的均值也为51800。
n=样本容量; N=总体单位个数 可以证明样本均值的标准差:
统计学 第6章 统计推断(1、2节)
即,我们有95%的把握认为,该外资 企业员工平均每周加班时间为52.3小时 至57.7小时之间。
第六章 统计推断
总体成数(比例)
1、假定条件
的区间估计
对于试验结果只有两种情况的总体(二项 总体),且为大样本,即满足
np 5和n(1 - p) 5
2、使用正态分布 z 统计量
第六章 统计推断
第六章 统计推断
设 是总体 的一个参数, 是参数 2的 1 和 X 两个统计量,且 ,对给定的常 1 2 数 ,及任意的 1) , 有 , (0 则称随机区间 ) 1 P( 1 2 是臵信度(臵信水平)为 的臵信区间 1 1 , 2 (区间估计)。其中 分别为臵信下限和 1 和 2 臵信上限。
(比例)为: 225 因为是大样本,故得: p 500 45% p (1 p ) p (1 p ) p z 2 , p z 2 n n
即,我们有95%的把握认为,19岁以下的青少年上网比例 在40.64%至49.36%之间。
第六章 统计推断
在简单随机抽样条件下,样本均值和样本 比例的抽样误差: 样本均值的抽样误差
重复抽样:
x
n
2
不重复抽样:
x
当总体方差 未知时,可用样本方差 代替。
第六章 统计推断
N n ( ) n N 1
2
s
2
样本比例的抽样误差
重复抽样: 不重复抽样:
p
1
n
p
2
第六章 统计推断
、1
2
方式一
《统计学》课件第6章抽样推断
01
定义
抽样推断是一种通过从总体中随 机抽取部分样本,并利用这些样 本数据来推断总体特性的统计方 法。
02
03
04
代表性
样本应具有代表性,能够反映总 体的特征和规律。
抽样推断的重要性
01
02
03
节省成本
通过抽样可以减少所需的 数据量,降低调查成本。
提高效率
通过快速收集样本数据, 能够快速获得总体信息, 提高调查效率。
对数据进行核查,确保 数据的准确性,及时纠
正错误或异常值。
分类与编码
对数据进行适当的分类 和编码,以便进行后续
的数据分析。
数据清理
删除或修正不准确、不 完整或重复的数据,提
高数据质量。
数据分析与解释
描述性统计
使用描述性统计方法,如平均 数、中位数、众数、标准差等
,对数据进行初步分析。
推断性统计
根据调查目的,选择合适的推 断性统计方法,如回归分析、 方差分析、卡方检验等,对总 体进行推断。
非参数假设检验的步骤
确定数据特征、提出假设、构造检验统计量、确定临界值、作出推 断结论。
非参数假设检验的优缺点
优点是适用范围广、灵活性高;缺点是计算较为复杂,需要更多的 样本数据支持。
05
样本量的确定
影响样本量的因素
总体标准差
总体标准差越大,需要的样本量 也越大,以减小估计误差。
置信水平置信水平越Biblioteka ,所需样本量也越 大,以减小估计误差。
《统计学》课件第6章抽样 推断
目录
• 抽样推断概述 • 抽样方法与技术 • 参数估计 • 假设检验 • 样本量的确定 • 实例分析
01
抽样推断概述
统计学原理第六章 抽样推断及参数估计
1.79%
(四)其他抽样组织方式抽样平均误差的计算 方法
1.类型比例抽样平均误差的计算。 (1)平均数的抽样平均误差
重复抽样条件下:
x
不重复抽样条件下:
n
2
2
[公式6—14]
x n
n 1 N
[公式6—15]
(2)成数的抽样平均误差
重复抽样条件下:
p
估计量评判标准:
ˆ 1.一致性。设 为未知参数θ 的估计量,
x
i
x
j 1
Mi
ij
Mi
r
(i 1,2,3, , r )
[公式6—4]
x
x M
i 1 r
i
i
M
i 1
(i 1,2,3, , r )
[公式6—5]
i
整群抽样的优点:易于组织,节省调查费用 缺点:调查的总体单位过于集中且在少数样 本群中。因此,在条件相同的情况下,整 群抽样的代表性低,通常需要扩大样本群 的数目来弥补这个缺点。
X ,P,然后,再
结合总体单位数N去推算总体的有关标志总
量。总体指标的推断有点估计和区估计两
种方法。
一、点估计
点估计也称定值估计,它是以抽样得到的
样本指标作为总体指标的估计量,并以样本指
标的实际值 x 、p 直接作为总体未知参 数 、P的估计值的一种推断方法。
X
比如:某电子元件厂,某天共生产电子元件 20000件,耐用时间和合格率没进行全面 检测,而是随机抽查5%检测,经计算, 样本的平均耐用时间 x 4120 小时, 合格率p=98.56%。因此,推算这天生 产的全部电子元件平均耐用时间 x 4120 小时 ,合格率 p=98.56%。
统计学教学课件:第六章 抽样推断
已知: N 5000, 300小时,x 25小时
F (t) 95% t 1.96
重复抽样:
二、区间估计
总体指标的推断(置信区间):
x x X x x pp P pp
说明在一定可能下,总 体指标落在抽样指标的 一定范围内。
置信区间: X [x x , x x ]
P [ p p, p p ]
置信区间是统计意义上的,即一定概率下,总体指标所 落在的区间长度,等于两倍的抽样极限误差。
第四节 全及指标的推断
抽样调查的目的是为了用样本指标推断总 体指标。对总体指标的估计有两种,一种是点 估计,一种是区间估计。
一、点估计(又称“定值估计”)
——不考虑抽样误差,直接用样本指标代替全及指标。即:
X x;P p
点估计不能说明误差大小,意义不大;而采用区间估 计,可以将误差控制在一定的范围内(即说明总体指标 在某一范围内的可能性大小) 。
1. 概念:先将总体单位按某一有关标志分类(组),再按
随机原则从各类(组)中抽取样本的组织形式。
(1)样本容量n的 分配方法:
① 等比例抽取
② 不等比例抽取 (标志变异大的组多抽,反之少抽。)
组与组之间是全面调查(组间方差不影响 ) (2)特点:
组内是非全面调查(组内方差影响 )
注:类型抽样的误差常小于简单随机抽样。
原则:
节省人力、物力、财力;
保证抽样推断能达到预期的可靠程度和精确 度的要求下,确定一个适当的样本容量。
确定必要抽样单位数n的依据
1、总体被研究标志的变异程度(变异大多抽,小则少抽) 2、抽样误差的范围(精确程度)(范围大少抽,小则多抽) 3、抽样推断的可靠程度(可靠程度高多抽,反之少抽)
统计学A第6章 抽样推断
2
样本可能数目
3 0.577 9
计算复杂,可对 定义公式变形为 更为简单的形式
3.2 抽样平均误差
(2)抽样平均误差的计算 1)抽样平均数的抽样平均误差 ① 重复抽样
第6章 抽样推断 第3节 抽样平均误差
x
(总体标准差)
n (样本容量)
在总体标准差未知, 且样本单位数较大时, 可用样本标准差代替。
解: 已知: n 100, x 58, x
则:
x
10
10 1(公斤) 100 n
x
即: 当根据样本学生的平均体重估计全部学生 的平均体重时,抽样平均误差为1公斤。
② 不重复抽样
1)抽样平均数的抽样平均误差
例2: 某厂生产一种新型灯泡共2000只,随机抽出400只作 耐用时间试验,测试结果平均使用寿命为4800小时, 样本标准差为300小时,求抽样推断的平均误差?
的数量特征做出具有一定可靠性的估计判断,从而达
到对全部研究对象的认识的一种统计方法。 一、 2.特点 ① 抽样调查建立在随机取样的基础上; ② 抽样推断是由部分推算总体的一种方法; ③ 抽样推断是运用概率估计的方法; ④ 抽样推断的抽样误差可以事先计算并加以控制。
1.2 抽样调查的作用
第6章 抽样推断 第1节 抽样调查的意义和作用
x E x
1 0.25 0 0.25 0 0.25 0 0.25 1
2
合计
—
—
27
3
3.2 抽样平均误差
第6章 抽样推断 第3节 抽样平均误差
例1 样本平均数的平均数(总体平均数)
27 23 4 E x 3(或X 3) 9 3
第六章 抽样推断
x 样本比率 p 或 q) (
样本方差: 样本方差: s 2 样本标准差: 样本标准差: s
第六章 抽样推断
第一节 抽样推断的一般问题
(三)抽样方法和样本可能数目 1、抽样方法 (1)重复抽样
重复抽样( replacement)也叫重置抽样, 重复抽样(sampling with replacement)也叫重置抽样, 是指每次抽取一个单位记录其标志表现后又放回, 是指每次抽取一个单位记录其标志表现后又放回,重新 参加下一次的抽选。 参加下一次的抽选。
第六章 抽样推断
第二节 抽样误差
大数定律可归纳如下: 大数定律可归纳如下: 4)各单位的共同倾向(这些表现为主要的、基本的因素) )各单位的共同倾向(这些表现为主要的、基本的因素) 决定着平均数(或比率)的水平,而各单位对平均数( 决定着平均数(或比率)的水平,而各单位对平均数(或比 的离差(这些表现为次要的、偶然的因素) 率)的离差(这些表现为次要的、偶然的因素)则会由于足 够多数单位的综合汇总的结果,而相互抵消,趋于消失。 够多数单位的综合汇总的结果,而相互抵消,趋于消失。 根据大数定律的内容特点,运用抽样法时, 根据大数定律的内容特点,运用抽样法时,必须注意以下两 个问题: 个问题: 第一、抽样必须遵循随机原则。 第一、抽样必须遵循随机原则。 第二、抽样必须遵循大量原则。 第二、抽样必须遵循大量原则。
抽样误差
第六章 抽样推断
第二节 抽样误差
二、影响抽样误差的主要因素
1、样本单位数(样本容量)的多少(反比) 、样本单位数(样本容量)的多少(反比) 2、总体被研究标志变异程度的大小σ(正比) 、总体被研究标志变异程度的大小σ 正比) 3、抽样组织方式 (简单随机抽样、类型抽样、等 、 简单随机抽样、类型抽样、 距抽样、整群抽样) 距抽样、整群抽样) 4、抽样方法(不重复抽样﹤重复抽样) 、抽样方法(不重复抽样﹤重复抽样)
统计基础知识项目六 抽样推断电子教案
第六章抽样推断教学要求学习目标:理解时间序列的概念、作用和分类,了解时间序列的编制原则,理解时间序列的构成要素;理解发展水平和平均发展水平的概念,掌握平均发展水平的计算方法;理解增长量和平均增长量的概念,掌握增长量、平均增长量的计算方法;理解发展速度和增长速度的概念,掌握发展速度和增长速度的计算方法;理解时间序列的影响因素及组合模型,掌握时间序列长期趋势分析和季节变动分析方法。
教学重点平均发展水平、增长量、平均增长量、发展速度、增长速度的计算。
时间序列长期趋势分析和季节变动分析方法。
教学难点时间序列、发展水平、平均发展水平、增长量、平均增长量、发展速度、增长速度。
课时安排本章安排12课时。
教学内容模块一时间序列概述一、时间序列的概念及作用(一)时间序列的概念时间序列又称时间数列或动态数列,是指将反映客观现象的同一指标在不同时间上的数值,按时间先后顺序排列而成的数列。
(二)时间序列的作用时间序列是观察、分析事物的一种方法,在社会经济现象动态分析中具有十分重要的作用。
其作用主要表现为以下几点:(1)时间序列可以表明社会经济现象的发展动态、变化趋势及规律性,提供反映社会经济现象发展速度和变化规律的数据,计算相关的指标体系,从而揭示规律,为统计预测提供依据。
(2)可以根据时间序列计算各种时间动态指标值,以便具体、深入地揭示现象发展变化的数量特征。
(3)运用时间序列可以预测现象的发展方向和发展速度,为经济决策或经营决策提供重要依据。
二、时间序列的种类按统计指标表现形式的不同,可将时间序列分为绝对数时间序列、相对数时间序列和平均数时间序列。
1. 绝对数时间序列绝对数时间序列又称总量指标时间序列,是由一系列同类总量指标的数值按照时间的先后次序排列而成的时间序列。
绝对数时间序列按照其总量指标所反映的现象总量性质、时间状况的不同,又可分为时期数列和时点数列。
2. 相对数时间序列相对数时间序列又称相对指标动态数列,是由一系列同类相对指标数值按时间先后顺序排列而成的时间序列。
统计学第6章抽样推断
t
x
S
X
,S
n
(x x)2
n 1
t
xX S
,S
n 1
(x x)2
n
t 分布
t分布是类似正态分布的一种对称分布,它通常要比 正态分布平坦和分散。一个特定的t分布依赖于称之 为自由度的参数。随着自由度的增大,t分布也逐渐 趋于正态分布
•
10、市场销售中最重要的字就是“问”。17:19:1217:19:1217:198/29/2021 5:19:12 PM
•
11、现今,每个人都在谈论着创意,坦白讲,我害怕我们会假创意之名犯下一切过失。21.8.2917:19:1217:19Aug-2129-Aug-21
•
12、在购买时,你可以用任何语言;但在销售时,你必须使用购买者的语言。17:19:1217:19:1217:19Sunday, August 29, 2021
• 抽样误差是由于随机原则导致的样本统计量 (如样本平均数、样本成数)与总体参数之间 的误差,主要包括:
xX
pP
抽样误差的影响因素
•样本容量的大小
容量大
抽样误差小
•总体的变异程度
变异大
抽样误差大
•抽样方法和抽样组织方式
不重复抽样的抽样误差比重复 抽样的抽样误差小;
抽样组织方式:简单随机抽样 的误差最大。
2x.中心极限定理
从非正态总体(平均数和标准差有限)中抽取的样本,当n足够 大时(n>30),样本平均数分布接近正态分布。n越大,分布越趋 近于正态分布。
正态总体或非正态总体、大样本
x
~
N(X
,
2 x
)
令Z x X , Z ~ N (0,1)
第六章 抽样推断
在不重复抽样下:
x
2
N
n
n N 1
2
53.63
10000
200
3.754小时
200 10000 1
23
第二十三页,共53页。
(2)计算灯泡的合格率和合格率的抽样平均误差。
求灯泡合格率的抽样平均误差
:
p
在重复抽样下:
p
p1 p
n
0.915 0.085 1.972% 200
⒉全及总体的分类
属性总体(是非总体)
变量总体
⒊总体单位数:N
4
第四页,共53页。
一、全及总体和抽样总体
(二)抽样总体
简称样本,是从全及总体中随机抽取出 来,作为代表这一总体的那部分单位组成的 集合体。
样本单位数:n
第五页,共53页。
返回
5
二、全及指标和抽样指标
(一)全及指标(参数): 1、概念:根据全及总体各单位标志值计
x i1
fi
m
(xi x )2 fi
2 i1
fi
m
( xi
i1
x)2 fi fi
10
第十页,共53页。
属性总体的抽样指标
抽样成数
抽样平均数
其中:
抽样标准差
p n1 n
q n0 n n1 1 p
n
n
n1:总体中具有某种属性的单位数目。
n0:总体中不具有某种属性的单位数目。
n0 n1 n
21
第二十一页,共53页。
(1)求灯泡平均使用时间、标准差和 灯泡合格率(样本)
x
xi fi fi
1057小时
2
xi x fi
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通俗地说,在点估计的基础上,给出总体参数的一个范围称为区间估计。
(二)总体均值的区间估计
1.正态总体且方差已知;或非正态总体、方差未知、大样本情况下
在这种情况下,样本均值的抽样分布呈正态分布,其数学期望为总体均值 ,方差为 。则 称为总体均值在 置信水平下的置信区间。
教学重点及难点提示:
重点:区间估计
难点:抽样平均误差的计算
案例导入:大学生消费调查:一个月你花多少?
第一节抽样推断概述
一、抽样推断的概念及特点
(一)概念
按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进行科学估计与推断的方法。
包括抽样调查和统计推断
抽样调查:一种非全面调查,按随机原则从总体中抽取部分单位进行调查以获得相
统计学
授课题目
第6章抽样推断
课次
第8-9次
授课方式
讲授
课时安排
第8教学周-第9教学周,共4课时
教学目的:
通过本章的学习,要求掌握利用样本统计资料来推断总体数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的方法;掌握必要样本单位数的确定方法。
2.根据部分推断总体的数量特征
3.抽样推断的结果具有一定的可靠性和准确性,抽样误差可以事先计算和控制(三)抽样推断的应用
1.不可能进行全面调查时
2.不必要进行全面调查时
3.检查生产过程正常与否
4.对全面调查资料进行补充修正时
二、抽样的几个基本概念
1.样本容量与样本个数
第二节抽样推断的方法
一、点估计
(一)点估计的概念及特点
参数估计:以样本统计量对总体参数进行估计,有点估计和区间估计两种。
点估计:直接以样本统计量作为相应的总体参数的估计量。
优点:直接给出了总体参数的具体数值
缺点:未能反映误差的大小
参数点估计有:
(1)样本均值估计总体均值
(2)样本成数估计总体成数
(3)样本方差估计总体方差
故全体投保人平均年龄的置信水平为99%的置信区间为[36.41,42.59]
例如
就是一个统计量,称为样本均值(Sample mean),
也是统计量,称为样本方差(Sample variance),
3.重复抽样与不重复抽样
(1)重复抽样:是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一次样本单位的抽取。
(2)不重复抽样:即每次从总体中抽取一个单位,登记后不放回原总体,不参加下一次抽样。
(2)有效性:
设 , 均为未知参数 的无偏估计量,如果对参数 的一切可能取值有 ,则称无偏估计量 比 有效
一个无偏估计量并不意味着他就非常接近被估计的参数,他还必须与总体参数的离散程度比较小。对同一总体参数的两个无偏点估计量,方差小者更有效。
(3)一致性:
指随着样本单位数n的增大,样本估计量将在概率意义下越来越接近于总体真实值
(二)估计的评价标准:
(1)无偏性:
设 是未知参数 的一个点估计量,若 满足 即估计量的数学期望等于被估计参数则称 是 的无偏估计量,否则称为有偏估计量。
需要注意的是,由于估计量 是样本 的函数,样本量是 维随机变量,所以对 求平均是按样本 的概率分布求平均。
无偏性是我们衡量点估计量好坏的一个评价标准,这个评价标准的直观意义如下:由于样本的出现带有随机性,所以基于一次具体抽样所得的参数估计值未必等于参数真值,这是由样本的随机性造成的。我们希望当大量使用这个估计量对参数进行估计时,一系列估计值的平均值应该与待估参数真值相等。这就从平均效果上对估计量的优劣给出一个评价标准。
2.总体参数与样本统计量
(1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总
体参数有:总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。
(2)样本统计量:与总体参数对应的是样本统计量。
设( )是总体 容量为n的样本,若样本函数
( )
中不含任何未知参数,则称 为一个统计量。
则称随机区间 [ , ]是参数 的置信水平为 的置信区间, 称为 [ , ]的置信度, , 称为置信限。
这里有几点需要说明:
(1)区间 [ , ]的端点 , 及长度 - 都是样本的函数,从而都是随机变量,因此 [ , ]是一个随机区间。
(2) 是说随机区间 [ , ]以 的概率包含未知参数真值,区间长度 - 描述估计的精度,置信水平 描述了估计的可靠度。
(1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。
(2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。
区间估计步骤:
1.计算样本统计量
2.计算抽样平均误差
3.计算极限误差
4.确定置信区间
5.估计总量指标
注意抽样方法的不同
[例]保险公司从投保人中随机抽取36人,计算得36人的平均年龄 岁,已知投保人平均年龄近似服从正态分布,标准差为7.2岁,试求全体投保人平均年龄的置信水平为99%的置信区间。
解: 查 表得
关资料,以推断总体
统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有一定程度的估
计和推断。
(二)特点
1.按随机原则(等可能性原则)抽取调查单位.随机抽样的目的是为了排除人的主观影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。随机性原则是保证抽样推断正确性的一个重要前提条件。随机抽样不是随便抽样。
若对于任意ε>0,有
二、区间估计法
在参数估计中,虽然点估计可以给出未知参数的一个估计,但不能给出估计的精度。为此人们希望利用样本给出一个范围,要求它以足够大的概率包含待估参数真值。这就是导致区间估计问题。
所谓区间估计,就是估计总体参数的区间范围,并要求给出区间估计成立的概率值。
设 是未知参数, 是来自总体的样本,构造两个统计量 , ,对于给定的 (0< <1),若 、 满足