统计推断原理和基本方法.ppt

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、抽样误差:
由个体变异产生的、抽样造成的样本 统计量与总体参数的差别
原因:1)抽样 2)个体差异
2、标准误(standard error, SE)
表示样本统计量抽样误差大小的统计
指标。
标准误:说明抽样误差的大小,总体
计算公式
X
n
(7-27)
实质:样本均数的标准差
若用样本标准差s 来估计 ,
双侧概率或双尾概率:用t /2, 表示。
自由度 单侧 双侧
1 2 3 4 5
6 7 8 9 10
21 22 23 24 25
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.718 0.711 0.706 0.703 0.700
0.686 0.686 0.685 0.685 0.684
均数的抽样误差和总体均数估计
统计推断的两部分内容:
1. 参数估计 2. 假设检验
参数估计
随机抽取部分观察单位
总体
样本
μ?
X
推断inference
一、抽样误差与标准误
若 某 市 2009 年 18 岁 男 生 身 高 服 从 均 数 μ =167.7cm、标准差 =5.3cm 的正态分布。对该总
1.943 1.895 1.860 1.833 1.812
2.447 2.365 2.306 2.262 2.228
3.143 2.998 2.896 2.821 2.764
均数 X
N (, 2 n )
z X / n
标准正态分布
N(0,12)
X X
Student t分布
t
, v n 1
S n SX
自由度:n-1
(二)t 分布的图形与特征
t 分布只有一个参数,即自由度
t 分布是一簇曲线。当自由度ν不同时,曲线 的形状不同。当ν 时,t 分布趋近于标准正 态分布,但当自由度ν较小时,与标准正态分布差
0.20 0.40
1.376 1.061 0.978 0.941 0.920
0.906 0.896 0.889 0.883 0.879
0.859 0.858 0.858 0.857 0.856
0.10 0.20
3.078 1.886 1.638 1.533 1.476
1.440 1.415 1.397 1.383 1.372
体进行随机抽样,每次抽 10 人,( n j =10),共抽得 100 个样本( g =100),计算得每个样本均数 X j 及 标准差 S j 。
=167.7cm =5.3cm X1,X2,X3,Xi,
nj=10
X j Sj
167.41, 2.74 165.56, 6.57 168.20, 5.36
标准误
( S X)
标准差和标准误的区别
意义
应用
衡量变量值变异程度,s 越大表示变量值变异程度 越大,s越小表示变量值 变异程度越小
描述正态分布(近似正态 分布)资料的频数分布; 医学参考值范围的估计
样本均数的变异程度,表 总体均数区间估计;两个 示抽样误差的大小。标准 或多个总体均数间比较
误越大表示抽样误差越大, 样本均数的可靠性越小;标 准误越小表示抽样误差越小, 样本均数的可靠性越大
总体标准差为 X的正态分布
N (,
2 X
)
,则通
过同样方式的
z
变换(
X
)也可将其转换为
X
标准正态分布 N(0, 12),即 z 分布。
3.实际工作中,由于 X未知,用 SX 代替,则
(X
)/ S X
不再服从标准正态分布,而服从t

布。
t X X , n 1
S X
Sn
式中为自由度(degree of freedom, df)
┆ 165.69, 5.09
100 个
2009年某市18岁男生身高N(167.7, 5.32)的抽样示意图
将此100个样本均数看成新变量值,ቤተ መጻሕፍቲ ባይዱ这100个 样本均数构成一新分布,绘制频数图
从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布
样本均数分布具有如下特点:
① X ,各样本均数 X未必等于总体均数; ② 各样本均数间存在差异; ③ 样本均数的分布为中间多,两边少,左右基本 对称。 ④ 样本均数的变异范围较之原变量的变异范围大 大缩小。 可算得这100个样本均数的均数为167.69cm、标准 差为1.69cm。
故标准正态分布是 t 分布的特例。
2.参数(only one):
23..参t 界数值(on表ly:o详ne见): 附 表 2,可反映 t 分布曲下的面 2、 t界值表:
3详.见t单界附侧值表概表,率:可或详反单见映尾附t概分表率布2:,曲用可线t反下,映表的t示面分;积布。曲下的面 单侧单概侧率概或率单或尾单尾概概率率::用用t , 表表示示;; 双侧双概侧率概或率双或尾双概尾率概率::用用t /2, 表表示示。。
异较大。
f(t)
ν─>∞(标准正态曲线)
ν=5
ν=1
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
图 不同自由度下的t 分布图
1.特征:
① 单峰分布,以 0 为中心,左右对称; ② 自由度ν越小,则 t 值越分散,t 分布的峰部
越矮而尾部翘得越高; ③当ν逼近, X 逼近 SX , t 分布逼近 z 分布,
1.323 1.321 1.319 1.318 1.316
附表2 t 界值表
概 率,P
0.05
0.025 0.01
0.10
0.05
0.02
6.314 12.706 31.821
2.920 2.353 2.132 2.015
4.303 3.182 2.776 2.571
6.965 4.541 3.747 3.365
二、t 分布
(一)t分布概念
1.若某一随机变量 X 服从总体均数为μ、总体标准差
X
为 的正态分布 N(, 2),则可通过 z 变换( )将
一般正态分布转化为标准正态分布 N(0,12),即 z 分布;
随机变量X N(,2)
z X
z变换
标准正态分布
N(0,12)
2.若样本均数 X 服从总体均数为μ、
SX
S n
(7-28)
✓ 当样本例数n一定时,标准误与标准差呈正比 ✓ 当标准差一定时,标准误与样本含量n的平方
根呈反比。
通过增加样本含量n来降低抽样误差。
例子:
随机抽样调查7岁男孩120名,的身高 均数为120.88,标准差为5.23,则其标准误 是多少?
s x
s
n 0.48
指标
标准差
(s)
相关文档
最新文档