分类变量的重复测量资料分析教学PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
20-,…”就是典型的例子。根据资料的性质,区间跨度有等距的,也有不等距
的。
2021/3/7
2
把分类变量作为反应变量进行重复观察的情形在工 作中应用较广。在本书第九章第五节中介绍了二分类反 应变量的重复测量资料分析方法。
本章将介绍分类反应变量重复测量资料的一般分析 方法。主要介绍加权最小二乘法分析方法。第一节一个 总体的二分类反应重复测量资料的分析。
2021/3/7
8
三、配合线性模型的步骤
表11.2为资料的原始记录形式,需要将其整理成边际频 数表的格式后再配合模型。计算步骤介绍如下。 1.首先用下列SAS程序计算边际合计数 程序中的subj 为受试者号,time1、time2、time3代表3个疗程。
2021/3/7
9
2021/3/7
10
计算出的边际频数列于表11.3中。
2021/3/7
12
2021/3/7
13
2021/3/7
14
2021/3/7
15
2021/3/7
16
以上分析可用SAS的CATMOD过程。程序如下:
PROC CATMOD DATA=exmp11_1 order=DATA;
RESPONSE MARGINALS;
MODEL time1*time2*time3=_RESPONSE_/ONEWAY COV;
第二种为有序刻度(ordinal scale)的分类变量,它是根据事物呈现出的程度或水 平不同进行赋值。如临床化验结果用符号“-、+、++、+++”,文化程度用 “文盲、小学、中学、大学、研究生”来划分等级,在进行数量化处理时赋 值1、2、3、…。这里需要注意的是,1与2之差不一定等于2与3之差。
第三种是区间刻度(interval scale),如人口学统计中的年龄分组,“0-,10-,
从而得到边际频数向量n及其函数边际频率向量m为:
n= (6 16 2
4
2 46
6)’
M=(6/46 0.3478 0.0435 0.0870 0.0435 0.0870 0.1304 0.1304)’
用nj及mj表示向量n及m中的元素。 2.给出转换矩阵A 本例的转换矩阵A的结构为
A的作用是将反应频率M转换成反应函数F。
2021/3/7
3
第一节 二分类反应重复测量 资料的分析
一、资料结构
设有n例受试者,反应变量y,分为 r水平(当r=2时称y为二 分类反应变量),有p个观测时间点,每一受试者可能出现的结果 共有rp种。当r=2、p=3时的所有可能结果共有8种。当对y用(0, 1)赋值方法时,n例受试者在这8种组合情况下出现的边际合计 数为n000至n111。详细分配情况见下面示意图图11 .1。
2021/3/7
6
由于每一个体在不同时间点的反应变量的取值是相关的, 因此,在配合模型时应将这种相关性纳入模型中。对式 (11.1)求参数估计值的加权最小二乘解法就是在考虑到这 种相关性的基础上建立起来的。模型(11.1)的加权最小二 乘解法求参数ß的估计值 的计算公式为
2021/3/7
7
例11.1一项药物对风湿性关节炎的治疗效果观察。用一 种药物对46名患风湿性关节炎的病人进行治疗,共三个 疗程。每个疗程结束后评价其治疗效果。有效者记为 yij=1,否则yij=0 i=1,…,46; j=1,2,3。资料列于表11.2中。 表中的T1,T2,T3分别代表三个疗程。本项研究的目的是 探讨不同疗程的疗差别。
分类变量wk.baidu.com重复测量 资料分析
流行病与卫生统计学教研室 沈毅
2005.3.15
2021/3/7
1
分类变量(categorical variable)又称为定性变量(qualitative variable),在工
作中应用甚广。根据其不同的取值性质,又可分为3种类型:
第一种是名义刻度(nominal scale)的分类变量,它是按事物属性分类的变量, 如性别、职业等。在统计学上为了计算方便,将这些不同的属性进行数量化 处理,如男性赋值为1,女性赋值为2。这种数值只是作为属性的代码,其间 并无大小之分。
REPEATED time3/_RESPONSE_=time;
RUN; 程序中的RESPONSE MARGINALS语句是指定反应函数为 在MODEL中规定的反应变量的边际概率。输出结果见表11.5、 表11.6、 表11.7。
2021/3/7
17
从输出的表11.5反应函数和协方差矩阵中看出,第一和第 二疗程的有效率都为0.6087(60.87%),第三疗程的有效 率为0.3478(34.78%)。从表11.6方差分析看,标记 ‘time’的有效率分析,第三疗程的效果显著低于前两个疗 程。对各疗程疗效一致性的假设检验可用下列公式计算。 令对比矩阵C为:
2021/3/7
5
二、模型结构
受试者i在时间点j的反应变量为yij ,其取值概率为pj, (j=1,…,p)。单总体重复测量资料的任务为是要分析这p 个概率p1,…,pp,是否相等。令反应频数的某种函数即 反应函数(response function)F=f(m),建立的线性模 型为:
式中X为d×q维的设计矩阵,d=(r-1)p,为反应函数。B为q 维未知参数。
2021/3/7
11
3. 求出反应函数F 它是每一时间点反应变量各个水平的边 际概率。但它不包含该反应变量最后一个水平的反应概率。 本例有3个时间点(time1 time2 time3),每个时间点的反 应变量为r=2水平,故每一时间点只有一个反应函数。共 有3个反应函数为:
如 f1=0.6086957=0.1304348+0.3478261+0.0434783+0.0869565
2021/3/7
4
边际合计数n000至n111是每种可能取值结果组合情况下的 观察例数。总例数n为边际合计数之和。如果将上述示意图 资料按独立观察资料整理各时间点的频数分布时(表11.1), 每一时间点的合计数都为n=n1+=n2+=n3+,总例数变成了3n而 不是n。但实际是观察例数为n,观察次数为3n。一般统计学 方法是以表11 .1的资料类型为出发点进行分析的。而本章介 绍的方法是以图11 .1的边际合计数为出发点进行分析的。