4抽样误差与假设检验

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N(? ,? 2 n)
Z? X?? ?n
标准正态分布
N(0,12)
t? X?? ? X??,
S n SX
Student t分布 v ? n ? 1 自由度:n-1
在实际工作中,由于 ? x 未知,常用 sx
x??
代替,此时
服从 t 分布(t-distribution )即:
sx
t ? x ? ? ,v ? n?1
1.表 示个 体变量 值 的变异 度大 小, 即原 始变 量值的
离散程度。公式为: S ? ? (X ? X)2 n?1
2.计 算变 量值的 频数分 布范围 ,如 :
( X ? 1.96S )。
3.可 对某 一个变 量 值是否 在正 常值 范围 内作 出初步 判断。 4. 用 于计 算标准 误。
1. 表示 样本均数 抽样误差 的大小 ,即样 本均 数的 离散程
布,当υ =∞时,t分布就完全成正态分布 。
? t分布曲线是一簇曲线,而不是一条曲线。
?t分布下面积分布规律:查 t分布表。 ?t-分布曲线下面积为 1
t 分布表
同标准正态分布曲线一样,统计应用中最 为关心的是t分布曲线下的尾部面积(即概率p) 与横轴t值间的关系。
为使用方便,统计学家编制了不同自由度 v下的t界值表(附表2)。
当单侧概率 p=0.05 时,v=16,单侧 t0.05,16 ? 1.746 当双侧概率 p=0.05时,v=16,双侧 t0.05/2 ,16 ? 2.120
α
α/ 2
α/ 2
0

ห้องสมุดไป่ตู้
(a)
Tα为单侧临界值
-tα/2 0
tα/2
(b)
Tα/2为单侧临界值
单双侧t分布示意图
从t界值表中亦可看出:
在相同自由度时, t 值越大,概率 p越小;
在t界值表中,横标目为自由度v,纵标目 为概率p。表中数字表示当v和p确定时,对应的 t临界值(critical value)。
该表中分别给出了单侧概率和两侧尾部 面积之和的双侧概率所对应的t临界值。
单侧概率相对应的t临界值用符号 t? ,v 表示。 双侧概率相对应的t临界值用符号t? /2,v 表示。 例如:
? 与样本含量的关系
标准差:随样本含量的增多,逐渐趋于稳定
标准误:随样本含量的增多逐渐减小。
? 联系 1、标准差与标准误都是变异指标,说明个体值之间 差异是用标准差,说明样本均数之间差异时用标准 误。
2、当样本含量不变时,标准差越大,标准误越大。
标准差和标准误的区别
标 准 差 (S)
标 准 误S( ) X
参数估计
点估计(point estimation) 区间估计(interval estimation)
1.点估计 : 用样本统计量直接作为总体参数的估计值 。
而在相同t值时,双侧概率 p为单侧概率p的两倍。 即:
t0.10 / 2,16 ? t0.05,16 ? 1.746
第四章 抽样误差与假设检验
第四章 抽样误差与假设检验
第一节 均数的抽样误差与标准误差
第二节 总体均数的估计
第二节 总体均数的估计
一、参数估计的概念
统计推断包括参数估计和假设检验。参数估计就 是用样本指标(统计量)来估计总体指标(参数)。
第四章 抽样误差与假设检验
第四章 抽样误差与假设检验
第一节 均数的抽样误差与标准误差
第一节 均数的抽样误差与标准误
一、抽样误差 ? 从总体当中随机抽取一份样本,计算均数。 这个均数不同于总体的均数。为什么?
? 再从该总体中随机抽取一份样本,再计算均数。 前后两个均数不等。为什么?
——抽样误差!
样本均数抽样分布具有如下特点: 1、各样本均数未必等于总体均数; 2、各样本均数间存在差异; 3、样本均数围绕总体均数呈正态分布; 4、样本均数变异范围较原变量变异范围大大缩小, 这100个样本均数的均数为 167.69cm ,标准差为 1.69cm 。 在非正态分布总体中可进行类似抽样。
? ??
x
n
(标准误)
反映样本均数间的离散程度。
S? S
x
n
(标准误的估计值)
例1 2000年某研究所随机调查某地健康成年 男子27人,得到血红蛋白的均数为 125g/L,标准 差为15g/L 。试估计该样本均数的抽样误差。
SX ? S / n ? 15 / 27 ? 2.89g / l
标准差与标准误的区别与联系
度。公 式为 :S X ?
S n
2. 计算 总体均 数的可 信区 间,如 :
(X ? 1.96S )。 X 3. 可对 总体均 数的大 小作 出初步 的判断 。
4. 用于 进行假 设检验 。
t 分布
一、t分布的概念
随机变量X N(? ,? 2)
Z?
X?? ?
Z变换
标准正态分布
N(0,12)
均数 X
可得到如下结论: ? 若变量服从正态分布,则各样本均数也服从正态 分布。
? 若变量不服从正态分布,当样本量足够大时,各 样本均数 近似服从正态分布,当样本量很小时, 则样本均数为非正态分布。
样本均数的总体均数为μ,而样本均数的标准差比 原来个体值的标准差要小,为区别两者,我们用 ? x来表示,其计算公式为
? 标准差:描述个体值间的变异,标准差较小,表 示观察值围绕均数的波动较小,说明样本均数的代 表性就越好。
? 标准误:描述样本均数的抽样误差,标准误较小, 表示样本均数与总体均数较接近。说明样本均数的 可靠性。
? 用途 标准差:表示变量值离散程度的大小,结合均数估计
参考值范围。
标准误:表示抽样误差的大小,估计总体均数的可信 区间。
sx
从正态总体 N(μ,σ2)中进行无数次样本含量为 n 的随机抽样,每次均可得到一个 X 和一个S,通过
t? X?? ? X??
SX S n
公式转换,可得无数个 t值,t值的分
布即为含量为 n的t值的总体或称 t-分布。
? t值的分布与自由
度? 有关(实际
是样本含量 n不 同)。
? t 分布的图形不是 一条曲线,而是 一簇曲线。
二、t 分布的图形和t 分布表
t分布曲线特点:
?t分布曲线是单峰分布,以 0为中心,左右两侧对称
?曲线的中间比标准正态曲线( Z分布曲线)低,两 侧翘得比标准正态曲线略高。
?t分布曲线随自由度 υ而变化,当样本含量越小
(严格地说是自由度 υ =n-1越小),t分布与Z分
布差别越大;当逐渐增大时, t分布逐渐逼近于 Z分
相关文档
最新文档