定量资料的统计推断分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t分布曲线下面积(附表2)
双侧t0.05,9=2.262 =单侧t0.025,9
单侧t0.05,9=1.833 双侧t0.01,9=3.250
=单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05,∞=1.96
=单侧t0.025,∞ 单侧t0.05,∞ =1.64
万州疾控中心 陈春蓉
统计推断:用样本信息来推断相应总体的特征,这一 过程称为统计推断。统计推断包括两方面的内容:参数估 计和假设检验
参数?
( 、、)
随机抽样
总体
(一锅)
样本
(一勺)
统计推断
参数估计 假设检验
统计量
(X、s、p)
2
参数估计的概念
参数估计是统计推断中的一个重要内容。 在实际工作中,总体参数常是未知的或不可能 对总体进行研究,故需要用样本指标(统计量) 推断总体指标(参数),如用样本均数 X 估计 总体均数 等。
x
t ,v
s x
复习两个概念: ▲ 正态分布 ▲ 标准正态分布
N (0,1)
u x
14
样本均数的分布
样本均数
X
的分布服从正态分布N
(μ,
2 X
)
,按照标准
正态分布变换方法,也可变换成标准正态分布N(0,1):
X X
~N(0, 1 );
由于总体标准差σ往往未知或样本含量n较小(n≤50)
时,常用样本标准差s作为σ的估计值,则此时称为对变 量采用t变换,t变换后样本均数服从ν=n-1的t分布:
抽样误差在抽样研究中是不可避免的。但有一定的规律可循, 我们可以用特定的指标来描述抽样误差的大小。
❖样本均数的分布特点:
1.各样本均数未必等于总体均数; 2.样本均数之间也不一定相等; 3.样本均数的分布很有规律,围绕着总体 均数,中间多,两边少,左右基本对称,也服 从正态分布。
标准误的概念
标准误:为了与反映观察值离散程度的 标准差相区别,统计学上把样本均数的标 准差称为均数的标准误,简称为标准误, 统计符号 X,标准误的估计值符号 SX , 其值 越大就说明样本均数的离散程度越大,也 就是样本均数与总体均数间的抽样误差越 大,反之,抽样误差越小。
t
t 分布有如下性质:
自由度为1的t分布 自由度为9的t分布 标准正态分布
①单峰分布,曲线在t=0 处最高,并以t=0为中心
左右对称
②与正态分布相比,曲线 最高处较矮,两尾部翘得 高(见绿线)
③ 随自由度增大,曲线逐 渐接近正态分布;分布的 2 3 4 极限为标准正态分布。
t 分布的特征
通过以上学习,t分布是由标准正态分布派 生出来的,其形态变化与自由度v的大小有关, 因此t值的符号是 t ,v 。自由度v=n-1。当v和α确 定时,可查t界值表(附录3p327),表中数字表 示对应的t界值。
标准差与标准误的联系:标准差和标准误 都是描述变异程度的指标,标准误的大小与标 准差成正比,即个体差异越大,抽样误差越大。
总体均数的估计
总体均数的估计,即用样本均数估计总体均数,有以下两种方法: (1)点估计:直接用统计量 X 估计总体参数μ。 例:于2000年测得某地27例健康成年男性血红蛋白量的样 本均数为125g/L,试估计其总体均数。 X →μ,即认为2000年 该地所有健康成年男性血红蛋白量的总体均数为125g/L 。
(2)区间估计:即按一定的概率估计总体均数可能的数值范 围,统计学称这一范围为被估计参数的可信区间(CI),预先给 定的概率水准称为可信度1-α,常取95%CI或99%CI。
可信区间的计算
(1)当总体标准差σ已知或样本含量n足够大(n>50)时:
x
Leabharlann Baidu
s x
(2)当总体标准差σ未知或样本含量n较小(n≤50)时:
S SX n
例:某市110名12岁健康男孩平均身高为 144.67cm,标准差为6.42cm,求其标准误。
sX
S n
6.42 110
0.612 (cm)
标准误的作用
表示抽样误差的大小,衡量样本均数的 可靠性,标准误越小则用样本均数估计 总体均数越可靠;
结合样本均数和正态分布曲线下的面积 分布规律,可用于估计总体均数的可信 区间(后述);
由于存在个体差异,抽样研究必然有抽样 误差,所以统计推断必须考虑抽样误差的大小。
3
抽样误差的概念
均数的抽样误差:
均数的抽样误差是因抽样产生的样本均数与总体均数之间的 差异。由于存在个体差异,样本均数一般不恰好等于总体均数, 例如从同一个总体中随机抽取100次样本含量为n的样本,可以 计算出100个样本均数,这些样本均数与总体均数不一定相等, 样本均数之间彼此也不一定相等,这种由个体变异产生的、由 抽样误差造成的样本均数与样本均数之间以及样本均数与总体 均数之间的差异称为均数的抽样误差。
数理统计证明
➢从正态分布N(μ,σ2)中随机抽取例数为n的样
本,其样本均数的分布仍服从正态分布;即使
总体不呈正态分布,只要n>100,X 的分布也
近似服从正态分布N(μ, X2 )。
抽样误差的大小取决于总体中个体差异的
大小和抽样样本含量的大小,所以,均数标准
误的计算公式为:
X
n
而在实际工作中只有用样本标准差S估 计总体标准差σ,故标准误的估计值计算 公式为:
t X
sX
t变换
随机变量X N(,2)
u X
u变换
均数 X
N(, 2 n)
u X n
t X X , v n 1
S n SX
标准正态分布
N(0,12)
标准正态分布
N(0,12) Student t分布 自由度:n-1
17
t分布曲线
0.4 f( t) 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0.0 -4 -3 -2 -1 0 1
用于均数的假设检验(后述)。
思考!
标准差与标准误的区别:
(1)标准差表示各个观察值间的变异程度,即个体差异的大小。 标准误表示同质样本均数间的变异程度,即抽样误差的大小。 (2)标准差越小,样本均数的平均水平代表性越好,反之则越 差。标准误越小,由样本均数估计总体均数的可靠性越大,反 之则可靠性越小。 (3)标准差结合样本均数可确定正态分布资料的医学参考值范 围,标准误结合样本均数可估计总体的可信区间。 (4)标准差可用于计算变异系数,标准误。标准误用于计算可 信区间和进行均数间比较的假设检验。
相关文档
最新文档