第四章 抽样及抽样分布
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(2)不对称。但其形态随 n1和n2的 增大而逐渐趋于对称。
• 查F表 表中横向为大方差数据的自由度;纵向为 小方差数据的自由度(横是处理自由度; 纵为误差自由度),将自己计算出来的F值 与查表得到的F表值比较,如果 F < F表 表明两组数据没有显著差异; F ≥ F表 表明两组数据存在显著差异
6.3 两个样本方差比的分布-F分布
2 从N ( 1 , 12 )和N ( 2 , 2 )两个正态总体中,抽出 含量为n1和n2的样本, 2 分别求它们的方差 s12和s2 。
s12 / 12 s / s 是一个随机变量,在研 究它的分布前,一般先 标准化 2 2 , s2 / 2
2.抽样误差
2.1 抽样误差
抽样误差是指不包括登记性误差和系统性误差 在内的随机误差,它衡量了抽样估计的精确度。
2.2 与抽样误差有关的三个概念 (1)抽样实际误差:指某一次具体抽样中,样本指标 值与总体参数真实值之间的偏差。 (2)抽样平均误差:是指所有可能的样本指标与总体 指标之间的平均差异程度,即样本估计值的标准差。 (3)抽样极限/允许误差:又称置信区间,是指一定 概率下抽样误差的可能范围,说明样本估计量在总体参 数周围变动的范围,记作Δ。
6.2
2分布
设 x1 , x2 ,, xn 是独立同分布的随机变量,且 每个随机变量都服从标准正态分布,即 x i ~N(0, 1),则随机变量
=
2
2 x i 的分布称为自由度为 n 的 2 分布, i 1
n
Baidu Nhomakorabea记作:
2 n ( ) 2 2 当 n ∞时, 分布趋近于正态分布,即 ( n ) ~N( n ,2 n )。
(3)形状同标准正态曲线 类似。与标准正态曲线 相比, t分布曲线的顶部略低, 两尾部稍高而平。 df越小,这种 趋势越明显。 n 时,t分布与标准正态分布完 全一致。
(4) t分布的平均数和标准差 为t 0, t df /(df 2)
• t分布表怎么查
第一,要知道自己的实验的自由度。 第二,要确定下自己的置信度。 比如置信度在95%,自由度为6的一组数据, 查阅t分布表的时候就是查阅α=0.05(双 侧),n=6的一个数字。
因为从原总体中可抽出很多含 量为n的样本,由这些样本算出 的平均数有大有小
由样本平均数x 所有可能值构成的总体 称为样本平均数的抽样总体 , 其平均数和标准差分别 记为 x 和 x。 x 是样本平均数抽样总体 的标 准差,简称为标准误差 ,它表示平均数数值之 间的离散程度。
设有一N=3的近似正态总体,具有变量3,4, 5,根据平均数,方差和标准差的计算公式可 求的 =4, 2=0.6667, =0.8165.现以 n=2作独立的有放回抽样,总共可得 N n = 32 9个样本,其抽样结果列于表:
3. 无偏估计 在统计上,如果所有可能样本的某一统计 数的平均数等于总体的相应参数,则称该 统计数为总体相应参数的无偏估计值。
总体标准差σ已知时的平均数的分布
设有一个总体,总体平 均数为,总体标准差为 ,将此总体称为 原总体 。
现在从原总体中随机抽 取含量为n的样本,样本平均数记 为x。 很明显,样本平均数 x是一个随机变量。
5.2 种类
渐近分布/大样本分布:样本容量无限增 大时统计量的极限分布,可看作是抽样 分布的一种近似
6. 常见的抽样分布
6.1 t分布 前面在计算样本平均数分布概率时,需要总体方差为已 知,或者总体方差未知但样本容量较大,用样本方差估 计总体方差。但实际研究中,经常遇到总体方差未知且 样本容量不大的情况,如果仍用样本方差来估计,此时 x 就不正态分布了, 标准离差
2 1 2 2
它服从自由度分别为 n1 1和n2 1的分布,记为Fn1 1,n2 1
定理:
s / ~ Fn1 1,n2 1 s /
2 1 2 2 2 1 2 2
F分布的取值范围是( 0, ) .
• F分布的密度函数曲线的特点:
(1) F分布的密度曲线是受两 个 自由度df1 n1 1, df2 n2 1的 影响;自由度不同,曲 线的 形状也不同。
为总体方差;
N n N 1 为不重复抽样的修正因子。
5.抽样分布的概念和种类
5.1 概念
抽样分布是样本统计量的概率分布。从一个总体中 随机抽取容量相等的样本,根据样本资料计算某一统 计量所有可能的概率分布,称为这个统计量的抽样分 布。
精确分布/小样本分布:大多数是在正态 分布总体条件下得到的,但应用不广泛
由以上抽样试验,可得出样本平均数分布 有以下基本性质: • 样本平均数分布的平均数等于总体平均数, • 样本平均数分布的方差等于总体方差除以 样本容量。
实际抽样推断中采用的公式
重复简单随机抽样: ( x)
2
n
不重复简单随机抽样: ( x)
2 N n
n ( N 1
)
其中,
2
第四章 抽样及抽样分布
1. 抽样及抽样估计的概念 1.1 抽样即抽样调查,是指在总体中选取部分单位组成
样本并收集样本单位的数据资料的过程。在抽样中不 可能获得全部样本,在实践中则是仅抽取一部分样本 或对小的有限总体进行有放回的抽样。
1.2 抽样估计是在抽样调查的基础上,利用样本的数据
资料计算样本指标,以样本特征值对总体特征值做出 具有一定可靠程度的估计和判断。
4. 样本平均数的分布 将上述试验所得的9个样本平均数整理成 次数分布表:
样本平均数的分布与其它分布一样,有两个重 要参数,一个是样本平均数的平均数,记作 x 另一个是样本平均数的标准差,记作 X ,
x
X2
f x 36 4 n N 9
( f x) 2 2 2 1 1 362 n ( f x ) (147 ) 0.3333 n N N 9 9 n
s/ n 而是服从自由度为 df n 1的t分布。
u
x x t sx s/ n
式中 x 为样本平均数的标准误, s x 为 X 的估计值。
s
s sx n
• t分布的密度函数曲线的特点:
(1) t分布受自由度 df的制约,每一个自 由度对应一条密度函数 曲线;
(2)关于t 0对称;
由表中资料可求出: 样本平均数 x 的平均数 x =36/9=4= 2 2 样本方差 s 的平均数 s 2 =6/9=0.6667= 样本标准差 s 的平均数 s =5.6568/9=0.6285
根据上述计算结果可得: • 样本平均数是总体平均数的无偏估计值; • 样本方差是总体方差的无偏估计值; • 样本标准差不是总体标准差的无偏估计值。