第6周 理论课 参数估计和假设检验(研究生)

合集下载

参数估计与假设检验的区别和联系

参数估计与假设检验的区别和联系

参数估计与假设检验的区别和联系统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。

(一)参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。

点估计是用估计量的某个取值直接作为总体参数的估计值。

点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。

区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。

在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。

统计学家在某种程度上确信这个区间会包含真正的总体参数。

在区间估计中置信度越高,置信区间越大。

置信水平为1-a, a为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05, 0.1。

置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。

一个总体参数的区间估计需要考虑总体分布是否正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等。

(1)来自正态总体的样本均值,不论抽取的是大样本还是小样本,均服从正态分布。

(2)总体不是正态分布,大样本的样本均值服从正态分布,小样本的服从t 分布。

(3)不论已判断是正态分布还是t 分布,如果总体方差未知,都按t 分布来处理。

(4)t 分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近。

(5)样本均数服从的正态分布为N(u , a^2/n)远远小于原变量离散程度N (u, a^2) 。

(二)假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设,然后利用样本信息判断这一假设是否成立。

假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。

参数估计与假设检验ppt课件

参数估计与假设检验ppt课件

n
p ( x z
2

2018/10/22
xz 2
) 1 n
n
/2
1-
/2
-z值
0
统计量 临界值
13
5.1.3 点估计量与区间估计
3、区间估计
(3)区间估计的图示
xz 2 x
- 2.58x -1.65 x

x


n

+1.65x
2018/10/22
12
5.1.3 点估计量与区间估计
3、区间估计
(2)置信区间的构造 当总体服从正态分布N(μ,σ2)时(σ2已知),来自该总体 的所有容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
置信水平
p( x



z )
2
1
1)首先对所要研究的总体进行概率抽样,通过
随机样本获取相关统计量,然后利用这些统计量 与总体参数之间的联系(获得统计量的分布), 利用有关统计方法计算估计量,估计总体参数。 2)由此可以看出,统计量与总体参数、估计量 的不同:总体参数通常是未知的常数,是待估计 的量;统计量是根据样本计算的函数,通常是随 机变量(对于总体而言);估计量是用来对总体 参数进行估计的统计量。
参数估计与假设 检验
统计推断(Statistical inference)
统计推断就是根据随机样本的实际数据, 对总体的数量特征作出具有一定可靠程度的估 计和判断。统计推断的基本内容有参数估计和 假设检验两方面。概括地说,研究一个随机变 量,推断它具有什么样的数量特征,按什么样 的模式来变动,这属于估计理论的内容,而推 测这些随机变量的数量特征和变动模式是否符 合我们事先所作的假设,这属于检验理论的内 容。参数估计和假设检验的共同点是它们都对 总体无知或不很了解,都是利用样本观察值所 提供的信息,对总体的数量特征作出估计和判 断,但两者所要解决问题的着重点及所用方法 有所不同。

6参数估计与假设检验

6参数估计与假设检验

由于总体中的个体存在差异,有抽样就 必然有抽样误差,所以抽样误差是不可 避免的。 抽样必须遵循随机化原则,否则产生偏 倚。
三、抽样分布
从总体中随机地抽取若干样本,不同的样本 其统计量(如均数、标准差,率)也不相同, 因而样本的统计量也是随机变量,也有其概 率分布。我们把统计量的概率分布称为抽样 分布。 下面介绍样本均数的抽样分布。
参数估计与假设检验
童新元 中国人民解放军总医院
名人格言
大胆假设,小心求证。
--胡适( 1891—1962 )
引例
如何研究中国人的身体状况如身高,体 重等。
姚明---篮球巨星
1980年生于上海, 身高2.26米,曾 效力于中国国家 篮球队,NBA火 箭队。2011年7月 退役。被美国 《时代周刊》列 入“世界最具影 响力100人”。
CHISS软件实现*
1.进入数据模块 点击 数据→文件→建立数据库表 注: 三行数分别为例数,均数,标准差 2.进入统计模块 进行统计计算 点击 统计→统计推断→可信区间→均 数的可信区间 反应变量:→确认
均数的可信区间数据库要求
1每组各一列; 2 三行数据:第一行例数, 第二行均数, 第三行标准差.
置信区间的含义
95%置信区间的意思是在相同的条件下, 从同一总体中进行100次随机抽样,抽得的 100样本计算出100个置信区间,有95%个置 信区间包括总体的均数。 亦说明用这样的 范围估计总体均数,平均说来每100次有95 次是正确的。5%是小概率,因此,在实际 应用中,就认为总体均数在算得的区间内, 这种估计方法会冒5%犯错误的风险。
2. 标准误与样本含量n的平方根成反比;
3. 标准误计算方法为:
x / n
标准误与标准差的关系

参数估计假设检验PPT

参数估计假设检验PPT
02
参数假设检验的步骤包括提出假设、选择合适的统计量、确定临界值、 计算检验统计量、做出决策。
03
参数假设检验的优点是简单易行,适用于大样本数据,能够给出明确 的接受或拒绝假设的结论。
04
参数假设检验的缺点是它对总体分布的假设较为严格,有时难以满足。
非参数假设检验
非参数假设检验是一种不依赖于总体分布具体形式的检验方法,它通过对 样本数据本身的特性进行检验来推断总体特性。
优势原则与最小化最大后悔准则
优势原则
在多方案决策中,如果一个方案在其他所有方案中的优势超过某个阈值,则该 方案被视为最优。优势原则是决策理论中的一种准则,用于指导决策者选择最 优方案。
最小化最大后悔准则
该准则是为了避免做出可能带来最大损失的错误决策,而选择一个最优策略使 得最大后悔最小化。
熵准则与信息准则
随机区组设计
总结词
随机区组设计是一种将实验对象按照某些特征进行分组,并在组内进行不同处理的实验设计方法。
详细描述
在随机区组设计中,实验对象按照某些相似特征进行分组,并在组内随机分配不同的处理。这种设计 方法可以控制组间的干扰因素,减少误差,提高实验的精度。
拉丁方设计
总结词
拉丁方设计是一种用于多因素实验的实验设计方法,它将实验对象按照拉丁字母排列,以控制实验中的顺序效应 和边缘效应。
的影响。
CHAPTER 06
相关与回归分析
相关分析
确定变量间关系
通过相关分析,可以确定两个或 多个变量之间的关系,包括正相 关、负相关和无相关。
描述变量间关系强

相关系数(如皮尔逊相关系数、 斯皮尔曼秩相关系数等)可以用 来描述变量间关系的强度和方向。
控制其他变量的影

研究生统计学教案

研究生统计学教案

研究生统计学教案1.教学目标:-使学生了解统计学的基本概念和方法;-培养学生的数据分析能力和统计思维;-培养学生的数理逻辑和推理能力;-培养学生的实际问题解决能力。

2.教学内容:-统计学概述:统计学的定义、研究对象、研究方法和应用领域等;-描述统计学:数据的整理与描述、数据的图形表示、概率与统计、常见分布及其性质等;-推断统计学:参数估计、假设检验、方差分析、回归分析等;-统计学在实际问题中的应用:质量控制、市场调研、医学实验设计等。

3.教学方法:-讲授与实践相结合:通过讲解理论知识和实际案例,使学生理解统计学的概念和方法,并能运用于实际问题中;-问题导向学习:引导学生通过解决实际问题来学习统计学知识,培养学生的实际问题解决能力;-小组合作学习:通过小组讨论和合作,培养学生的团队合作和沟通能力。

4.教学评价:-统一考试:通过期末考试检测学生对统计学知识的掌握程度;-课堂互动:根据学生平时的表现、提问和参与讨论情况,评估学生课堂学习的积极性;-实践项目:要求学生完成一项实践项目,综合运用所学的统计学知识解决实际问题,评估学生的数据分析和问题解决能力。

5.教材与参考资料:-参考资料:6.教学进度安排:-第一周:统计学概述;-第二周:数据的整理与描述;-第三周:数据的图形表示;-第四周:概率与统计;-第五周:常见分布及其性质;-第六周:参数估计;-第七周:假设检验;-第八周:方差分析;-第九周:回归分析;-第十周:统计学在实际问题中的应用;-第十一周:复习备考。

7.教学资源:-教室设备:投影仪、电脑、白板;-实践项目需要的数据集、软件工具。

8.教学重点:-统计学的基本概念和方法;-描述统计学和推断统计学的原理和应用;-实践项目的设计和数据分析。

9.教学难点:-推断统计学中的参数估计和假设检验原理;-实践项目的设计和数据分析方法。

10.实践项目:-题目:市场调研与产品定价;-内容:学生需设计一项市场调研项目,并采集数据;然后利用所学的统计学知识,分析市场调研数据,确定产品的最佳定价策略。

统计学第六章 参数估计和假设检验

统计学第六章 参数估计和假设检验

n
2
2
x
26
【例】为估计市场上某产品的平均日销售额, 计划进行一次抽样调查。历史资料反映该产 品日销售额的标准差为20万元。如果要求这 次估计的可靠性为95%,估计允许的误差为5 万元。应抽取多少天的销售额进行调查?
nZ /22 22 1.962 5 2 202 61.46 x
因为n为整数,为保证目的调查天数应为62。
n
100
结论:统计量的值落在接受域内,所以不能 认为合格率不足98%。
49
用Excel进行参数估计
• Excel提供了抽样极限误差的计算方法。根 据抽样极限误差,可以自己定义函数求出 置信区间
50
样本均值服从正态分布情况
• Excel中的“CONFIDENCE”函数可以计算 样本均值服从正态分布条件下的抽样极限 误差
30
小概率事件原理
➢在一次试验中,小概率事件是不可能发生 的
➢显著性水平α:即小概率的大小界定。
31
原假设和备择假设
• 在参数检验中,首先要对某一总体参数提 出一个假设,然后通过抽样调查来验证其 可信与否。这一假设被称为原假设(零假 设、无效假设),记为H0。如果抽样调查 的结果拒绝了原假设,就必须接受另一个 假设——备择假设,记为H1。
样本
部分—整体 随机原则
总体
统计量
总体参数
4
参数估计的优良标准
1.无偏性。估计统计量的数学期望等于被估计参 数的真值。
2.一致性。当样本单位数充分大时,样本指标充 分靠近总体指标。
3.有效性。估计的方差比其他估计量小
5
点估计
➢也叫定值估计,就是根据总体指标的结构 形式设计样本指标,并直接以一个样本统 计量实现值来估计总体参数。

[课件]第6章 参数估计与假设检验PPT

[课件]第6章 参数估计与假设检验PPT
( X z 2
, X z )
n
2
n



n
为样本均值的抽样误差

2
Z
条件下对总体均值进行区间估计所允许的最大误差。
n
为抽样极限误差 ,表明在给定置信度的
ˆ 置 信 区 间 点 估 计 极 限 误 差 ( )

正态总体,方差未知(小样本)

X - T = ~t(n 1 ) S n
第6章 参数 估计与假设 检验
统 计 学 的 基 本 内 容
描述 指搜集、整理、分析、研究并提供统计资料 统计 的理论和方法,用来说明总体的情况和特征。
数据描述性分析、时间数列分析和指数分析
推断 利用样本统计量对总体某些性质或数量特征 统计 进行推断的方法。
参数估计和假设检验
描述统计是推断统计的前提, 推断统计是描述统计的发展。
2 X ~ N ( , n )
X
X
标准化
X - z ~N ( 0 , 1 ) n
非正态总体或总体分布未知 根据中心极限定理,当样本容量足够大时( n ) 30 不管总体分布如何,样本均值的抽样分布总可以 看作是正态分布。
X ~ N ( , n )
2
标准化
X - z ~N ( 0 , 1 ) n
建立总体假设抽样得到样本观察值选择检验统计量确定h根据具体决策要求确定确定分布上的临界点值及检验规则计算检验统计量的数值比较并作出检验判断检验规则双侧检验左侧检验右侧检验时接受原假设时拒绝原假设时接受原假设时拒绝原假设时接受原假设时拒绝原假设双侧检验拒绝域拒绝域拒绝域拒绝域接受域接受域左侧检验拒绝域拒绝域接受域接受域右侧检验拒绝域拒绝域接受域接受域检验规则双侧检验左侧检验右侧检验时接受原假设时拒绝原假设时接受原假设时拒绝原假设时接受原假设时拒绝原假设由置信区间方法到假设检验的运算过程

06参数估计与假设检验(医学统计学)

06参数估计与假设检验(医学统计学)

三、总体均数的区间估计
(一) 已知
95%可信区间:
一般情况
其中 为标准正态分布的双侧界值。
(二) 未知
Confidence interval
通常未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是服从
著名的t 分布。
William Gosset
图6-1 不同自由度的 t 分布图
t分布
四、两总体均数差的区间估计
实际中,有时需要计算两个总体均数差值的可信 区间,例如通过计算两种降压药物平均降压的差 值比较两种药物的差别,其双侧 100(1 )%可信 区间的计算公式为 ( X1 X 2 ) t /2, SX1X2 其中, n1 n2 2 为自由度,SX1X2 为两样本均数之 差的标准误。
样本率来代替总体率,其估计值为:
p(1 p)
Sp
n
二、参数估计
点估计: 是使用单一的数值直接作为总体参数的估 计值,如用估计相应的,用估计相应的。该法表 达简单,但未考虑抽样误差的影响,无法评价参 数估计的准确程度。
区间估计(interval estimation)是指按预先给定的概 率,计算出一个区间,使它能够包含未知的总体 均数。事先给定的概率称为可信度,计算得到的 区间称为可信区间(confidence interval,CI)。
n
250
六、两总体率差值的区间估计
在大样本情况下,可采用正态近似法对两总体率 差值进行可信区间估计,其计算公式为:
( p1 p2 ) z S /2 )( n1
1 n2
),pc =
X1 n1
X2 n2
X1和X2分别表示两组中某事件发生的例数。
例6-7 某医院口腔科医生用极固宁治疗牙本质过 敏症,以双氟涂料作对照,进行了1年的追踪观察 ,结果见表6-1所示,试估计两组有效率差别95% 的可信区间。

第六章 参数估计和假设检验第5页PPT课件

第六章  参数估计和假设检验第5页PPT课件

0x1
x
e
dx
0x
x
d(e
)
(xex)00exdx
(ex )0
由矩估计方,E法 (X)得 X,即ˆ
1 n
n
Xi
i1
例4:设X1, … , Xn为取自N(,2)总体的样本,求 参数 , 2 的矩估计。
解 因 E (X 为 ),D (X ) 2.
而 D (X)E(X2)[E(X)2 ],
所E 以 (X2)[E(X)2 ]D (X)22
解总体E(均 X)值 1/,样本均 X 值为
由矩估 ,E (X 计 )X 方 ,即 1 ˆ 法 X 得 ˆX 1.
x
例3
设总体 X的概率密度f (为 x)
1
e
2
X 1 ,X 2 , ,X n 为X 总 的体 ,样 求本 参 的数 矩 . 估
解总体的一阶原点矩为
x
E(X)
x
f(x)dx
x
1
2
e
dx
lnL() 由 L () p ( x 1 ;) p ( x 2 ;) p ( x n ;)
n
1
L( )
得ln L() ln p(xi;),
i1
d
ln
L( )
n
d
ln
p(xi ; )
d
i1 d
例1.设X1,…, Xn为取自参数为的泊松分布总体的样本, 求的极
大似然估计和矩估计.
解因总X服 体从参 的 数泊 为松 ,分 分布 布律为 P{Xk}ke
分析:矩估计方法就是用样本矩来估计总体矩.
解总体E 均 (X) 值 mp,样本均 X 值为
由矩估 ,E (X 计 )X 方 ,即 m p 法 X 得 p ˆX. m

参数估计与假设检验

参数估计与假设检验
29
抽样平均误差
抽样平均误差:样本均值的标准差,也就是前面说 的标准误。它反映样本均值(或比例)与总体均值 (比例)的平均差异程度。 ˆ E(ˆ )2
例如对简单随机抽样中的样本均值有:
x
n

x
nHale Waihona Puke N n (不重复抽样)N 1
我们通常说“抽样调查中可以对抽样误差进行控
制”,就是指的抽样平均误差。由上面的公式可知
z pˆ ~ N (0,1) (1 )
n
pˆ Z 2
pˆ (1 pˆ ) n
22
关于置信区间的补充说明
置信区间的推导:
P
x
n
Z
/2
1
x Z 2
n
x Z 2
n
有限总体不重复抽样时,样本均值或比例的方 差需要乘以“有限总体校正系数”(当抽样比 f=n/N小于0.05时可以忽略不计),前面的公 式需要进行相应的修改。
抽样分布一般利用概率统计的理论推导得出, 在应用中也是不能直接观测的。其形状和参数 可能完全不同于总体或样本数据的分布。
10
抽样分布的一个演示:重复抽样 时样本均值的抽样分布(1)
设一个总体含有4 个个体,分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下。
均值和方差
总体的频数分布
E2
本(没有可利用的 p估计值)?
(1.96)2 (0.5)(1 0.5) (0.05)2
385
36
4.2 假设检验
4.2.1 假设检验的基本问题 4.2.2 单个总体参数的检验 4.2.3 两个总体参数的检验
4.2.1 假设检验的基本问题
基本原理 零假设和备择假设 检验统计量和拒绝域 两类错误与显著性水平

参数估计和假设检验共240页PPT

参数估计和假设检验共240页PPT

第一个
第二个观察值
观察值 1
2
3
4
1 1.0 1.5 2.0 2.5
2 1.5 2.0 2.5 3.0
3 2.0 2.5 3.0 3.5
4 2.5 3.0 3.5 4.0
.3 P (X ) .2 .1 0
1.0 1.5 2.0 2.5 3.0 3.5 4.0 X
样本均值的抽样分布
1 - 20
2008年8月
参数估计和假设检验
服从真理,就能征服一切事物
统计学
STATISTICS
第 4 章 参数估计和假设检验
(第三版)
作者:西南大学商贸系
庞新军
1-2
2008年8月
统计学
STATISTICS (第三版)
1-3
统计学
STATISTICS (第三版)
1-4
统计学
STATISTICS (第三版)
1-5
统计学
2008年8月
统计学
STATISTICS (第三版)
样本均值的抽样分布
1. 容量相同的所有可能样本的样本均值的概 率分布
2. 一种理论概率分布
3. 进行推断总体总体均值的理论基础
1 - 17
2008年8月
统计学
STATISTICS (第三版)
样本均值的抽样分布
(例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 数N=4。4 个个体分别为x1=1、x2=2、x3=3 、x4=4 。总 体的均值、方差及分布如下
第一个
第二个观察值
观察值
1
2
3
4
1
1,1
1,2
1,3
1,4

第六章参数估计和假设检验(精)

第六章参数估计和假设检验(精)

第六章参数估计和假设检验教学目的及要求:了解参数的点估计、区间估计的含义,掌握区间估计的几个概念,包括置信水平、置信区间、小概率事件,熟练掌握参数区间估计的计算方法,了解不同抽样组织形式下的参数估计,掌握参数估计中样本量的确定。

了解假设检验的原假设和备择假设的含义,假设检验的两类错误,掌握总体均值的检验方法。

本章重点与难点:区间估计的计算与总体均值的假设检验方法。

计划课时:授课6课时;技能训练2课时。

授课特点:案例教学第一节点估计和区间估计一、总体参数估计概述•1、总体参数估计定义•就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。

•2、参数估计应满足的两个条件二、参数的点估计•用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:根据一个抽出的随机样本计算的平均分数为80分,我们就用80分作为全班考试成绩的平均分数的一个估计值,这就是点估计。

再例如,要估计一批产品的合格率,根据抽样结果合格率为96%,将96%直接作为这批产品合格率的估计值,这也是点估计三、参数的区间估计(一)参数的区间估计的含义•区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

(二)有关区间估计的几个概念 置信水平1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平2. 表示为 (1 - α% )α 为是总体参数未在区间内的比例3. 常用的置信水平值有99%, 95%, 90%相应的显著性水平α 为0.01,0.05,0.10置信区间1. 由样本统计量所构造的总体参数的估计区间称为置信区间2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个4. 由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值,5. 样本均值的标准差为由此可知样本均值落在总体均值μ的两侧各为一个抽样标准差范围内的概率为0。

医学统计课件人卫6版 第六章.参数估计与假设检验

医学统计课件人卫6版 第六章.参数估计与假设检验
造成两者数值不同的原因可能有两个: 1)抽样误差所致; 2)由于环境条件的影响,两均数之间有本质差异。
2019/10/24
西安医学院公共卫生系
先假定该山区所有男子脉搏数数值组成一个总体,
其总体均数和标准差均为未知数,分别以 、 表示。
若假设该山区男子的脉搏数与一般地区的男子相
同,即属于同一总体, =72,所测量的30名男子的
• 以0为中心,左右对称的单峰分布;
• t分布是一簇曲线,形态变化与n(ห้องสมุดไป่ตู้自由度)大 小有关。自由度ν越小,t分布曲线越低平;自 由度ν越大,t分布曲线越接近标准正态分布曲 线。
• t分布峰部较矮,尾部翘得较高,说明远侧的t值 的个数相对较多,即尾部面积(概率P)较大。 自由度ν越小这种情况越明显,ν渐大时,t分 布渐逼近标准正态分布;当ν=∞时,t分布就成 为标准正态分布了。
sx
其结果即为t分布。
见t分布曲线图
2019/10/24
西安医学院公共卫生系
f(t)
0.4
υ =∞
υ =5
0.3
υ =1
0.2
0.1
0.0
t
-5 -4 -3 -2 -1 0 1 2 3 4 5
2019/10/24
图5.1 自由度为1、5、∞的t分布
西安医学院公共卫生系
t分布的特征:(与标准正态分布相比?)
值在±1.96之间,即:
P(-1.96<Z<+1.96)=0.95
P(-1.96< (x<)+/1.9x6)=0.95
移项后整理得,总体均数μ的95%可信区间为
x 1 .96 x,x 1 .96 x
2019/10/24
西安医学院公共卫生系
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t分布曲线下面积规律

t分布曲线下总面积仍为1或100% t分布曲线下面积以0为中心左右对称。 由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或 99%)的界值不是一个常量,而是随自由度的大小而变化,如 附表3(P439) 。
f (t )

2
-4 -3 -2 -1
0.4 0.3 0.2 0.1 0 0 1 2 3 4
X t / 2, ) 1 sX
P(t / 2,

X 在 t , 到 t 之间的概率为1- , sX
t / 2,
X t / 2, sX
X t / 2, s X X t / 2, s X
⑴ 制定方法:

在医学科学研究中的配对设计主要有以下情况:
配对的两个受试对象分别接受两种处理之后的数据; 同一样品用两种方法(或仪器等)检验的结果; 同一受试对象两个部位的数据。其目的是推断两种处
理(或方法)的结果有无差别。
d 0 d t Sd Sd / n
例3.6 为探讨MRI无创性测量肺脉舒张压(PADP)的 新途径,分别用MRI和右心导管两种方法测量12名 患者的肺脉舒张压,资料如表3.1,问两种方法的检 测结果有无差别?
表3.1 两种方法检测12名患者的肺脉舒张压(kPa)结果
被检测者号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 MRI (2) 3.96 4.51 6.49 7.10 5.19 6.30 3.84 2.67 5.77 4.11 4.95 3.25 右心导管 (3) 3.42 4.53 5.85 6.79 5.53 5.76 3.68 2.42 5.81 4.12 5.32 2.85 ( d (4)=(2)–(3) 0.54 -0.02 0.64 0.31 -0.34 0.54 0.16 0.25 -0.04 -0.01 -0.37 0.40 d2 (5) 0.2916 0.0004 0.4096 0.0961 0.1156 0.2916 0.0256 0.0625 0.0016 0.0001 0.1369 0.1600 (
υ=25-1=24
P
>0.05
α=0.05
0
|t|=1.692
t
单侧t0.05,24= 1.711
假设检验基本步骤
第五步:统计推断
小概率事件:在一次抽样过程中是不会发生的
现在P>0.05,不拒绝H0,样本均数(76)与总体均数(72) 之间的差别可能是抽样误差引起的,差异没有统计学意义, 尚不能认为山区成年男子的脉搏次数高于一般成年男子的脉 搏次数。
返 回
例2:随机抽取某市200名7岁男孩的身高均数为 124.0 cm,标准差为4.6 cm,试估计改市7岁男孩身 高总体均数的95%置信区间。
X 1.96S /
n
(124.0 1.96 0.33,124.0 1.96 0.33) (123.4,124.6)cm
该地7岁男孩(cm)总体均数的95%CI为(123.4,124.6)
①由于抽样误差所致 ②样本来自另一总体
影响,山区成年男子的脉搏确实高于一般)
(由于环境条件的
假设检验基本步骤
第一步:建立假设 H0: 1 (72) 山区成年男子脉搏与一般成年 男子脉搏相同 μ=72
76
H1: 1 (72) 山区成年男子脉搏与一般成年 男子脉搏不同
μ1≠72 76 μ=72
假设检验基本步骤
第二步:确定检验水准(α)
α:概率标准,判断随机事件会不会发生的标准
常取0.05
若:P<0.05,拒绝H0,接受H1,差异有统计学意义
若:P>0.05,不拒绝H0,拒绝H1,差异无统计学意义
假设检验基本步骤
α取值可以是单侧的,也可以双侧的。根据α的取值 情况就有单侧检验和双侧检验。 α双=0.05,t分布曲线两侧的尾部面积之和为0.05 α单=0.05,t分布曲线一侧的尾部面积为0.05 判断单侧检验的方法:若根据专业知识知道A不可能 低于B,就可以只检验A是否大于B。 故:例1的H1: 1 (72) 采用单侧检验 注意:没有充分的依据作单侧检验,不要作单侧检验
X X t sX s n
(6.2)
同理,如果抽取例数n=15时,仍能得到一 条t分布曲线,因此,当n变化时,就可以得到 不同的t分布曲线,如下图
0.4
υ= (标准正态分布)
υ=4
0.3
υ=1
0.2
0.1
0.0
-5
-4
-3
-2
-1
0
1
2
3
4
5
图6.4 自由度分别为1、5、∞的t分布

图中非阴影部分面积的概率为,

P(-t/2,<t<t/2,)=1-
三、总体均数的估计

用样本指标估计总体指标称为参数估计,是 统计推断的一个重要方面。

总体均数估计的两种方法
点估计:是直接用统计量估计总体参数.
区间估计:由于抽样误差的客观存在,因而按一
定的概率(100(1-)%)估计总体均数所在的范围 (亦称置信区间CI,由Cl和Cu组成)。
t
2.045,
该地40~44岁哈萨克族成年男性的骨密度总体均数的95%CI为:
42.32 42.32 (187.11 2.045 ,187.11 2.045 ) (171.04,203.18) 30 29 29 30
所以该地40~44岁哈萨克族成年男性的骨密度(mg/cm2)均数95%可信 区间为(171.04,203.18)
sx
n
(二) t分布
1、t分布的由来
中心极限定理
总体 X ~ N ( , 2 )
变量变换
n
样本均数
X ~ N ( , X 2 )
变量变换
u
X

n较大时
n较小时 或 未知
标准正态分布 u ~ N (0,1)
u
X
X
X t sX

如果抽取例数n=5的样本k个,每个样本又都可 以按公式(6.2)计算出一个t值,可将k个t值 编制成频数表,作出直方图,当k无限增大时, 则可得到一条光滑的曲线即t分布曲线。
假设检验基本步骤
第三步:计算统计量 根据H0有:
X X 74.2 72.0 t 1.692 sX s/ n 6.5 / 25
假设检验基本步骤
第四步:确定P值
1.711 根据α 、υ值,查t分布表得 单侧t0.05,24= P >0.05 P值含义:从H0假设的总体中进行抽样,获得大于、 等于现有统计量(|t|=1.692)的概率。
(1 )

2
t
t分布表
——P439
查 双侧 t (0.05,28)=2.048;双侧 t (0.05,100)=1.984
单侧 t (0.05,28)=1.984;单侧 t (0.05,100)=1.660
t界值表
3
附表3,t 分布表的特点

附表3的横标目为自由度,纵标目为概率
P,表中数值为其相应的t界值,记作t, 。
① n较小(如n<100):见例1:
X t / 2, S X X t / 2, S /
② n足够大(如n>100): 见例2:
n
X Z / 2 S X X Z / 2 S /
n
例1:
随机抽查某地30名40~44岁哈萨克族成年男性的骨密 度,测得骨密 度均数187.11,标准差为42.32:试估计该地40~44岁哈萨克族成年男 性的骨密度总体均数的95%CI。 解: x 187.11(mg / cm2 ), s 42.32(mg / cm2 ) 本例n=30,则 30 1 29 ,查 t 界值表, 0.05,29
x
n
sx

s n
可以看出:标准误与标准差成正比,与 n成反 比;增大n可以减小标准误,也就是减小抽样误 差。
样本均数的分布特点——P73

从正态分布N(,2)中,以固定n抽取样本,样本均 数的分布仍服从正态分布;

即使是从偏态分布总体抽样,只要n足够大,样本 均数的分布也近似正态分布;
样本均 数的总 体均数 仍为 , 样本均 数的标准差 为 。
X


样本均数的变异较原始正态分布的变异小。且随样 本量的增加,样本均数的变异逐渐减小。
3、标准差与标准误的区别和联系——P75
区别: 1. 含义不同:⑴s描述个体变量值(x)之间的变异度大 小,s越大,变量值(x)越分散;反之变量值越集 中,均数的代表性越强。⑵ sx 描述样本均数( x) 之间的变异度大小, x 越大,样本均数与总体均数 s 间差异越大,抽样误差越大;反之,样本均数越接 近总体均数,抽样误差越小。 2. 与n的关系不同: n增大时,⑴s σ(恒定)。 ⑵ sx 0(不存在抽样误差)。 3. 用途不同: ⑴s:表示x的变异度大小,计算cv,估计 正常值范围,计算标准误等 ⑵ sx :参数估计和假设 检验。 联系: 二者均为变异度指标,样本均数的标准差即 为标准误, s
1、点估计

11名18岁男大学生身高均数资料得, X =172.25cm,S=3.31cm,试估计该 地18岁男大学生身高总体均数 ?
该地18岁男大学生身高总体均数为172.25cm
2、区间估计

概念:即按一定的概率(100(1-)%)估计总体 均数所在的范围(亦称置信区间)。
P(t / 2, t t / 2, ) 1
返 回
均数置信区间与参考值范围
相关文档
最新文档