医学统计学总复习_科学学位

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

t 检验
两独立样本(two independent sample)均数比较 的t检验 t’ 检验(当方差不齐时)
t 检验
亦称student's t 检验,应用t检验条件: 1)单因素两水平的定量效应指标 2)要求各组正态分布 3)要求方差齐性 如不满足条件,当满足正态性而方差不 齐时可进行t’检验,否则需采用变换或 非参数方法作统计分析
置信区间 概念:估计可能包含未知总体 参数的一个范围,范围内包括 总体参数的置信程度为(1-α)
(95%,99% 指可信度)
范畴:统计推断 用途:估计未知总体参数所在 范围 计算公式: 正态分布,σ未知:X t / 2, S X 非正态分布,但n≥30,有
X z / 2 X
参考值范围 概念:个体值的波动范围,即 按事先给定的范围绝大多数正 常人的某指标范围(1-α)所确 定的“正常人”解剖、生理、 生化指标的波动范围

二、定量资料的基本统计方法

有4个模块:

统计描述 区间估计 假设检验

相关与回归
1、统计描述——统计指标

描述集中趋势指标:
算术均数(简称均数)( X ) 几何均数(G) 中位数(M)

描述离散程度指标:
极差(R)
四分位数间距(Q) 方差(S2) 标准差(S) 变异系数(CV)
平均指标和变异指标分别反映资料的不同特征,常配套使用,根据 资料类型不同有不同组合, 如 正态分布: 均数、标准差 偏态分布: 中位数、四分位数间距
非参数检验

非参数方法应用的条件:


①未加精确测量的资料(包括等级资料) 如 “>50mg”、“<0.01mg”; ②偏态分布且无法转化为正态分布的资料; ③分布不清的资料。

需采用变换或非参数方法作统计分析
非参数检验的类型

(1) 配对设计的wilcoxon符号秩和检验 (2) 两样本的wilcoxon秩和检验 (3) 多个样本的Kruskal-Wallis秩和检验
总 处理 区组 误差
4、线性相关与回归
(linear correlation and regression)
线性相关
相关系数r (correlation coefficient) r的假设检验
回归方程 y a bX (regression equation) 其中a为截距(intercept); b为回归系数(coefficient of regression)
点估计 统 计 推 断
参数估计
区间估计 参数
假设检验
z 检验 t 检验 F 检验 直线相关与回归 卡方检验
非参
秩和检验
等级相关
2.资料类型

(1)定量资料
计量资料(measurement data):
对每个观察单位用定量方法测定某项指标
的数值大小所得的资料
2.资料类型

(2)定性资料

计数资料(enumeration data)按性质 或类别进行分组,然后再清点各组数目所 得的资料 等级资料(ranked data)将观察单位按 某项指标的等级顺序分组,再清点各组 观察单位的个数所得的资料
统计描述

1、描述偏态分布集中趋势(尿氟均值)
的指标:中位数

2、比较几组量纲不同的资料的离散程度
的指标:变异系数
1、统计描述——统计表与统计图
1)统计表
简单表 组合表 条图 圆图 线图 直方图 散点图
…….
2)统计图
*类型、适用条件*
2、区间估计
正常值(参考值)范围 总体均数的可(置)信区间 正态分布(normal distribution) 可信区间(confidence interval, CI)
注意: 95%CI与95%正常值范围区别
Hale Waihona Puke Baidu 2、区间估计
正常值(参考值)范围
X z / 2 S
X z / 2 S X
总体均数的可(置)信区间
正态分布(normal distribution) 置信限(confidence limit, CL)
注意: 95%CI与95%正常值范围区别
置信区间与参考值范围的区别
4、相关与一致性分析* (correlation and consistency analysis)

相关: 可采用spearman秩相关

(适用于双项有序且属性不同的列联表资料)

一致性分析: 可采用kappa一致性检验

(适用于双项有序且属性相同的列联表资料)
四、非参数检验的概念


参数检验(Parametric test) 基于总体为某一特定分布的前提下,对 参数进行的检验。 如:t检验、F检验等。 非参数检验(Nonparametric test) 不依赖于总体分布类型,也不对总体参 数进行统计推断的假设检验。 如:秩和检验、Ridit等。
t 检验的类型

主要用于下列三种情况:

(1) 样本均数与总体均数比较;

(2) 配对数值变量资料的比较;
(3) 两样本均数的比较。

3、假设检验(hypothesis test)
完全随机设计(completely random design) 随机区组设计(randomized block design)
1)正态近似法:当n足够大,且np及n(1-P) 均大
于5时,的抽样分布近似正态分布,(1-)总 体率的双侧可信区间近似为: ( p Z / 2 S p , p Z / 2 S p ) 2)查表法:对于小样本资料(n≤50),尤其是p很接近 0或100%时,直接查附表C3(百分率的置信区间),即 可得到其百分率的置信区间。
(95%,99%, 指绝大多数正常人)

X z / 2 S X
范畴:统计描述 用途:供判断观察个体的某项 指标是否“正常”时参考 计算公式: 正态分布: X z / 2 S 偏峰分布:(P100α/2 , P100(1-α/2) )
3、假设检验(hypothesis test)
单个样本(one sample) t 检验 配对资料 (paired sample)比较的t 检验


完全随机设计两样本资料的秩和检验
【检验步骤】
1. 建立检验假设,确定检验水准
H0:两总体分布相同,即患者与正常人的尺骨骨矿含量 总体分布相同
H1:两总体分布不同,即患者与正常人的尺骨骨矿含量
总体分布不同 α=0. 05
2.计算检验统计量T值
3、假设检验 (hypothesis test)
四格表资料 基本公式 专用公式 校正公式 确切概率法
差异性 一致性 基本公式 专用公式 确切概率法
计数资料
检验
2
Chi-square test
配对四格表 行×列表
卡方检验方法

卡方检验在不同的条件下有不同的计算 方法,常用的有 Pearson 卡方、校正的 卡方和Fisher精确概率 当四格表中 n≥40 ,但有 1≤Tij < 5 时, 应选用校正卡方 当四格表中出现n<40或Tij<1两种情形 之一时,需用Fisher的确切概率法
(3)确定P值,作出统计推断 自由度为:ν=1,查χ2 界值表得,P >0.05 按α=0.05的水准不拒绝H0 ,尚不能认为用复 合氨基酸胶囊对肝硬化病人实验室指标的改 善和恢复方面是有效的。
3、假设检验 (hypothesis test)
秩和检验 (rank sum test)
等级资料
Ridit 分析*: 是relative to an identified distribution 中3个字头 和unit的词尾缩写而成。
解:
(1)建立检验假设和确定检验水准 H0: π1=π2 ,即两总体恢复正常率相等;
H1: π1≠π2 ,即两总体恢复正常率不等;
α=0.05 。 (2)计算统计量χ2 值 各位置上的理论值见表5,因为有理论数小于5,样本 总例数大于40,所以使用四格表卡方检验的校正公式
n 2 ( ad bc ) n 2 2 (a b )( c d )( a c )( b d ) 42 2 ( 23 6 11 2 ) 42 2 34 8 25 17 3.2790
方差分析(ANOVA)
亦称F 检验,应用条件:

1)单因素或多因素定量效应指标 2)要求各组正态分布 3)要求方差齐性

如不满足条件,需采用变换或非参数方 法作统计分析
(1) 完全随机设计的方差分析
三种“变异”之间的关系
离均差平方和分解:
SS总 = SS 组间 + SS 组内 ,

ν总 =ν组间 +ν组内

直线回归

当两变量间存在着性线关系时,不仅可 以用相关系数r表示变量Y与X线性相关的
密切程度,还可以用一个二元一次方程
来表示
ˆ a bx y
回归方程的应用---预测与估计

应用最小二乘法求回归方程系数
求出回归方程后,如果方程拟合度好(决定系
数R),可根据X的值来求Y预测值
三、定性资料的基本统计方法
(2)收集资料(data collection ) (3)整理资料(data sorting)


(4)分析资料(data analysis)
统计分析
统计描述 参数估计
假设检验 点估计 区间估计
统计推断
统计推断
用样本的信息来推断总体的特征叫统计
推断


统计分析的主要目的是由样本推断总体, 故统计学的主体是统计推断
医学科研中的 统计学方法
宋曼殳 首都医科大学 公共卫生学院 流行病与卫生统计学系
关于考试

理论考试时间:
2015.12.11,上午10:00-11:30

方式:半开卷笔试
各自带计算器,不可考场借用 带1页A4纸 记参考公式

关于考试

总成绩100分:理论(80分)+上机(20分) 题型与分值: 1)填空题(20分) 2)选择题(30分) 3)简答与计算题(30分)
组内变异 SS 组内: 随机误差 组间变异 SS 组间:处理因素 + 随机误差
(2) 随机区组设计的方差分析
变异分解
(1) 总变异: 所有观察值之间的变异
(2) 处理间变异:处理因素+随机误差 (3) 区组间变异:区组因素+随机误差 (4) 误差变异: 随机误差
SS总 SS处理 SS区组 SS误差


2检验的适用条件
二、配对

2
检验
2 配对 检验专用公式为:
(b c) bc
2
2
若b+c<40,应该对上式进行校正,校正公式为:
2
( b c 1) 2 bc
例:某医生用复合氨基酸胶囊治疗肝硬化 病人,观察其对改善实验室指标的效果, 见表5。试对两组的改善及恢复正常率进 行比较。 表5 复合氨基酸胶囊对改善实验室指标的效果 分组 改善 未改善 合计 试验组 23 2 25 对照组 11 6 17 合计 34 8 42

计算题要求:1)统计分析方法
2)给出整理的统计结果表 3)结果解释及结论
一、概述 1. 科研统计工作的步骤

( 1 )研究设计 ( research design): 根据研究的目的,从统计学的角度对各 步提前做出的周密的计划和安排 调查设计 实验设计 科研设计 (临床设计、 新药设计)
一、概述 1. 科研统计工作的步骤
方差分析
(analysis of variance) ANOVA
析因设计(factorial design) 重复测量设计 (repeated measurement design)
多个样本均数的两两比较
(compare means between two sample in F analysis)

线性回归
直线相关与回归分析
应用条件: 研究两个定量变量间的相互关系或 依存关系


y 。 。 。 。。 。 。



。。
━━┻━━━━┻━━━━┻━━━> X 散点图
线性相关

是用相关系数r来表示两个变量X,Y间的 直线关系 相关系数r没有单位,在-1~+1范围内波动 其绝对值愈接近1,两个变量间的直线相关 愈密切,愈接近0,线性相关愈不密切

有4个模块:
1、统计描述 2、区间估计 3、假设检验 4、相关与一致性分析

1、统计描述
率(rate)
相对数
比(ratio)
百分比(构成比) 相对比 动态数列的定基比、环比
2、区间估计(interval estimation)
总体率的可信区间(置信区间) (confidence interval, CI)
相关文档
最新文档