7.第七章t检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量t 作检验。 成立时, 计量t’作检验。H0成立时, t’服从t分布 服从t (Satterthwaite近似法 (Satterthwaite近似法) 近似法)
ν
概述
单样本u 单样本u 检验
前提:当样本较大(如 n>50)或总体方差已知 n>50)或总体方差已知 时
大样本(成组设计的两 样本)均数比较的u 样本)均数比较的u 检 验
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
5.PAIRED语句 PAIRED语句
paired语句用来指定配对t paired语句用来指定配对t检验中要进行比 较的变量对,组成变量对的变量或变量列 表之间可用星号“ 表之间可用星号“*”或冒号“:”相连接 或冒号“
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
6.VAR语句 VAR语句
用来指定要进行分析的变量(须为数值型) 如果使用var语句而不使用class语句,ttest过程将 如果使用var语句而不使用class语句,ttest过程将 执行单组样本均数比较的t 执行单组样本均数比较的t检验 如果var语句和class语句一同使用,则ttest过程执 如果var语句和class语句一同使用,则ttest过程执 行两组样本均数比较的t 行两组样本均数比较的t检验。 如忽略var语句,则输入数据集中的全部数值型变 如忽略var语句,则输入数据集中的全部数值型变 量(除了by语句、class语句、freq语句及weight语 除了by语句、class语句、freq语句及weight语 句中已使用的变量外) 句中已使用的变量外)将被作为分析变量来使用。 var语句不能和paired语句同时使用。 var语句不能和paired语句同时使用。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能 3. CLASS语句
class语句用来指定作为研究因素的分组变量, class语句用来指定作为研究因素的分组变量,组间均数比 较的t 较的t检验过程即在此变量所定义的分组之间进行。对于 两组独立样本均数比较的t检验,class语句是必需的,而 两组独立样本均数比较的t检验,class语句是必需的,而 对于单组样本或配对资料的t检验,则无需class语句。 对于单组样本或配对资料的t检验,则无需class语句。 class变量可为数值型或字符型,但均必须包含两个水平, class变量可为数值型或字符型,但均必须包含两个水平, 多于或少于两水平时都将出错。在两组独立样本比较的t 多于或少于两水平时都将出错。在两组独立样本比较的t 检验中,ttest过程依据class变量将输入数据集中的观测分 检验中,ttest过程依据class变量将输入数据集中的观测分 为两组,从而对两组的均数进行比较。class变量的水平由 为两组,从而对两组的均数进行比较。class变量的水平由 其格式化值来确定,我们可利用format语句来设置class变 其格式化值来确定,我们可利用format语句来设置class变 量的格式。
前提:样本足够大
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
SAS中具有t SAS中具有t检验功能的过程:
means过程、summary过程、univariate过程、tabulate means过程、summary过程、univariate过程、tabulate 过程。 过程。t检验均针对单组样本均数与已知总体均数的比 较(除univariate过程外,其余三个只能执行与0 较(除univariate过程外,其余三个只能执行与0的比较) ttest过程。是专门用来进行t ttest过程。是专门用来进行t检验功能的过程。可执行 单组样本均数的t检验、配对资料的t 单组样本均数的t检验、配对资料的t检验以及两组样本 均数比较的t 均数比较的t检验。
ttest过程的功能: ttest过程的功能:
对于单组样本的t 检验,ttest过程计算出指定变量的样 对于单组样本的t 检验 ,ttest 过程计算出指定变量的样 本均数并将它与给定的数值进行比较。 本均数并将它与给定的数值进行比较。 对于配对资料的t 检验, ttest过程将两个变量在每条观 对于配对资料的t 检验 , ttest 过程将两个变量在每条观 测上的差值作为待分析的变量,然后执行与单组样本t 测上的差值作为待分析的变量,然后执行与单组样本t 检验完全相同的过程。 在对ttest 过程的一次调用中, 检验完全相同的过程 。 在对 ttest过程的一次调用中 , 可同时在多对变量之间进行配对t检验。 可同时在多对变量之间进行配对t检验。 对于两组资料的t 检验,ttest过程分别计算出两组样本 对于两组资料的t 检验 ,ttest 过程分别计算出两组样本 的均数, 的均数 , 并检验两样本所代表的总体均数之差是否与 某一给定值有差别。 某一给定值有差别 。 此过程可看作方差分析的处理因 素为两水平的特殊情况。 素为两水平的特殊情况。
paired语句中变量对的定义形式及其所产生的效果 paired语句中变量对的定义形式及其所产生的效果 见表的例子。
Paired 语句的形式 Paired a*b; Paired a*b c*d; Paired (a b)*(c d); Paired (a b)*(c b); Paired (a1-a2)*(b1-b2); Paired (a1-a2):(bl-b2); 所产生的效果(组成变量对的两个变 量构成相减的关系) a-b a-b,c-d a-c,a-d,b-c,b-d a-c,a-b, b-c al-b1, a1-b2,a2-bl,a2-b2 a1-b1,a2-b2
概述
单组资料均数的比较是指对观察所得的样本均数 与已知的某个总体均数( 与已知的某个总体均数(一般为理论值、标准值或 经过大量观察所得的稳定值等) 经过大量观察所得的稳定值等)进行比较,以判断 样本是否来自该已知总体。 两组资料均数的比较是指对观察所得的两个样本 的均数进行比较,以判断两者是否来自同一个总 体。 对于这一类型的假设检验,采用的统计学方法主 要包括t检验和u 要包括t检验和u检验。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
wenku.baidu.com
5.PAIRED语句 PAIRED语句
对于每一个变量对, ttest过程用左侧的变 对于每一个变量对 , ttest 过程用左侧的变 量减去右侧的变量, 量减去右侧的变量 , 将所得的差值当作新 的变量执行单组样本均数比较( 的变量执行单组样本均数比较(与0或指定 的数值进行比较) 检验过程。 的数值进行比较)的t检验过程。 paired语句仅在配对资料的 t 检验时使用, paired 语句仅在配对资料的t 检验时使用 , 且不能和class语句和var语句一同使用。 且不能和class语句和var语句一同使用。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能 1.PROC TTEST语句 TTEST语句
格式 :PROC TTEST <options>; 选项:
COCHRAN:要求ttest过程在方差不齐情况下进 COCHRAN:要求ttest过程在方差不齐情况下进 行近似t检验时,使用Cochran-Cox近似法计算 行近似t检验时,使用Cochran-Cox近似法计算 近似t 近似t统计量对应的概率值 H0= :设置为任意实数,用以指定单组样本 (包括配对资料)t (包括配对资料)t检验中要与样本均数进行比 较的已知总体均数,或两组样本t 较的已知总体均数,或两组样本t检验中与两样 本均数差值比较的数值。默认值为0 本均数差值比较的数值。默认值为0
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能 1.PROC TTEST语句 TTEST语句
格式 :PROC TTEST <options>; 选项:
DATA=:指定ttest过程所要处理的输入数据集。 DATA=:指定ttest过程所要处理的输入数据集。 ALPHA=:指定统计量可信区间的置信水平。默认值为 ALPHA=:指定统计量可信区间的置信水平。默认值为 0.05。 0.05。 CI=:用以指定是否给出标准差的可信区间并指定可信 CI=:用以指定是否给出标准差的可信区间并指定可信 区间的类型。可设置的值及其含义:
以星号连接的变量列表表示星号左侧的每一个 变量将与星号右侧的每一个变量组成变量对 以冒号连接的变量列表则表示其左侧的变量只 与右侧相应排列位置上的变量组成变量对。以 冒号连接的两个变量列表必须包含相同数量的 变量。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
5.PAIRED语句 PAIRED语句
“equal”——给出对称的可信区间;默认设置为“ci=equal” equal”——给出对称的可信区间;默认设置为“ci=equal” “umpu”——给出基于UMPU(uniformly most powerful umpu”——给出基于UMPU(uniformly unbiased)检验的可信区间; unbiased)检验的可信区间; “none”——不给出标准差的可信区间。 none”——不给出标准差的可信区间。
SAS中没有专门进行u检验的过程,可通过data步 SAS中没有专门进行u检验的过程,可通过data步 的语句以及SAS所提供的函数和运算符来实现对 的语句以及SAS所提供的函数和运算符来实现对 均数比较的u 均数比较的u检验。
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
ttest过程对数据的要求: ttest过程对数据的要求:
所处理的样本来自正态分布的总体 对于两组资料均数比较的t 对于两组资料均数比较的t检验,还要求两组样本之间相互独立, 否则需考虑是否应作为配对资料来处理。
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
7.1.1 TTEST过程的一般格式 TTEST过程的一般格式
TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
7.1.1 TTEST过程的一般格式 TTEST过程的一般格式
PROC TTEST <options>; CLASS variable; PAIRED variables; BY variables; variables; VAR variable; FREQ variable; WEIGHT variable ; RUN; 以上语句均不能在对ttest过程的一次调用中使用两次或以 以上语句均不能在对ttest过程的一次调用中使用两次或以 上,除proc ttest语句之外,其余语句没有先后顺序的限制。 上,除proc ttest语句之外,其余语句没有先后顺序的限制。
第七章 单组或两组资料均数的比较
医学数据处理与SAS软件应用 医学数据处理与SAS软件应用 Medical data processing and the application of SAS
第七章 单组或两组资料均数的比较
概述 7.1 均数差别比较的SAS过程--TTEST过程 均数差别比较的SAS过程--TTEST过程 7.2 分析实例 用分析家进行T 用分析家进行T检验
在两组资料均数比较的t检验中,ttest过程除了在两组方 在两组资料均数比较的t检验中,ttest过程除了在两组方 差齐的假设条件下计算t 差齐的假设条件下计算t统计量之外,还在方差不齐的假 设条件下计算近似t 设条件下计算近似t统计量,同时给出两者所对应的自由 度以及概率值。其中近似t 度以及概率值。其中近似t统计量对应的自由度使用 Satterthwaite’ Satterthwaite’s近似法获得,我们还可以要求使用 Cochran-Cox近似法计算近似t Cochran-Cox近似法计算近似t统计量所对应的概率值。对 于方差齐性的假设检验,ttest过程将会给出双侧F 于方差齐性的假设检验,ttest过程将会给出双侧F检验的 结果。
概述
样本均数和总体均数比较的t 样本均数和总体均数比较的t检验
前提:服从正态分布
配对设计的t 配对设计的t 检验
前提:差值服从正态分布
概述
合并 方差
成组设计的两样本均 数比较的t 数比较的t 检验
前提:两组数据均服 从正态分布;两组总 体方差相等 前提:两组数据均服 从正态分布;两组总 体方差不相等 采用统
ν
概述
单样本u 单样本u 检验
前提:当样本较大(如 n>50)或总体方差已知 n>50)或总体方差已知 时
大样本(成组设计的两 样本)均数比较的u 样本)均数比较的u 检 验
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
5.PAIRED语句 PAIRED语句
paired语句用来指定配对t paired语句用来指定配对t检验中要进行比 较的变量对,组成变量对的变量或变量列 表之间可用星号“ 表之间可用星号“*”或冒号“:”相连接 或冒号“
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
6.VAR语句 VAR语句
用来指定要进行分析的变量(须为数值型) 如果使用var语句而不使用class语句,ttest过程将 如果使用var语句而不使用class语句,ttest过程将 执行单组样本均数比较的t 执行单组样本均数比较的t检验 如果var语句和class语句一同使用,则ttest过程执 如果var语句和class语句一同使用,则ttest过程执 行两组样本均数比较的t 行两组样本均数比较的t检验。 如忽略var语句,则输入数据集中的全部数值型变 如忽略var语句,则输入数据集中的全部数值型变 量(除了by语句、class语句、freq语句及weight语 除了by语句、class语句、freq语句及weight语 句中已使用的变量外) 句中已使用的变量外)将被作为分析变量来使用。 var语句不能和paired语句同时使用。 var语句不能和paired语句同时使用。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能 3. CLASS语句
class语句用来指定作为研究因素的分组变量, class语句用来指定作为研究因素的分组变量,组间均数比 较的t 较的t检验过程即在此变量所定义的分组之间进行。对于 两组独立样本均数比较的t检验,class语句是必需的,而 两组独立样本均数比较的t检验,class语句是必需的,而 对于单组样本或配对资料的t检验,则无需class语句。 对于单组样本或配对资料的t检验,则无需class语句。 class变量可为数值型或字符型,但均必须包含两个水平, class变量可为数值型或字符型,但均必须包含两个水平, 多于或少于两水平时都将出错。在两组独立样本比较的t 多于或少于两水平时都将出错。在两组独立样本比较的t 检验中,ttest过程依据class变量将输入数据集中的观测分 检验中,ttest过程依据class变量将输入数据集中的观测分 为两组,从而对两组的均数进行比较。class变量的水平由 为两组,从而对两组的均数进行比较。class变量的水平由 其格式化值来确定,我们可利用format语句来设置class变 其格式化值来确定,我们可利用format语句来设置class变 量的格式。
前提:样本足够大
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
SAS中具有t SAS中具有t检验功能的过程:
means过程、summary过程、univariate过程、tabulate means过程、summary过程、univariate过程、tabulate 过程。 过程。t检验均针对单组样本均数与已知总体均数的比 较(除univariate过程外,其余三个只能执行与0 较(除univariate过程外,其余三个只能执行与0的比较) ttest过程。是专门用来进行t ttest过程。是专门用来进行t检验功能的过程。可执行 单组样本均数的t检验、配对资料的t 单组样本均数的t检验、配对资料的t检验以及两组样本 均数比较的t 均数比较的t检验。
ttest过程的功能: ttest过程的功能:
对于单组样本的t 检验,ttest过程计算出指定变量的样 对于单组样本的t 检验 ,ttest 过程计算出指定变量的样 本均数并将它与给定的数值进行比较。 本均数并将它与给定的数值进行比较。 对于配对资料的t 检验, ttest过程将两个变量在每条观 对于配对资料的t 检验 , ttest 过程将两个变量在每条观 测上的差值作为待分析的变量,然后执行与单组样本t 测上的差值作为待分析的变量,然后执行与单组样本t 检验完全相同的过程。 在对ttest 过程的一次调用中, 检验完全相同的过程 。 在对 ttest过程的一次调用中 , 可同时在多对变量之间进行配对t检验。 可同时在多对变量之间进行配对t检验。 对于两组资料的t 检验,ttest过程分别计算出两组样本 对于两组资料的t 检验 ,ttest 过程分别计算出两组样本 的均数, 的均数 , 并检验两样本所代表的总体均数之差是否与 某一给定值有差别。 某一给定值有差别 。 此过程可看作方差分析的处理因 素为两水平的特殊情况。 素为两水平的特殊情况。
paired语句中变量对的定义形式及其所产生的效果 paired语句中变量对的定义形式及其所产生的效果 见表的例子。
Paired 语句的形式 Paired a*b; Paired a*b c*d; Paired (a b)*(c d); Paired (a b)*(c b); Paired (a1-a2)*(b1-b2); Paired (a1-a2):(bl-b2); 所产生的效果(组成变量对的两个变 量构成相减的关系) a-b a-b,c-d a-c,a-d,b-c,b-d a-c,a-b, b-c al-b1, a1-b2,a2-bl,a2-b2 a1-b1,a2-b2
概述
单组资料均数的比较是指对观察所得的样本均数 与已知的某个总体均数( 与已知的某个总体均数(一般为理论值、标准值或 经过大量观察所得的稳定值等) 经过大量观察所得的稳定值等)进行比较,以判断 样本是否来自该已知总体。 两组资料均数的比较是指对观察所得的两个样本 的均数进行比较,以判断两者是否来自同一个总 体。 对于这一类型的假设检验,采用的统计学方法主 要包括t检验和u 要包括t检验和u检验。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
wenku.baidu.com
5.PAIRED语句 PAIRED语句
对于每一个变量对, ttest过程用左侧的变 对于每一个变量对 , ttest 过程用左侧的变 量减去右侧的变量, 量减去右侧的变量 , 将所得的差值当作新 的变量执行单组样本均数比较( 的变量执行单组样本均数比较(与0或指定 的数值进行比较) 检验过程。 的数值进行比较)的t检验过程。 paired语句仅在配对资料的 t 检验时使用, paired 语句仅在配对资料的t 检验时使用 , 且不能和class语句和var语句一同使用。 且不能和class语句和var语句一同使用。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能 1.PROC TTEST语句 TTEST语句
格式 :PROC TTEST <options>; 选项:
COCHRAN:要求ttest过程在方差不齐情况下进 COCHRAN:要求ttest过程在方差不齐情况下进 行近似t检验时,使用Cochran-Cox近似法计算 行近似t检验时,使用Cochran-Cox近似法计算 近似t 近似t统计量对应的概率值 H0= :设置为任意实数,用以指定单组样本 (包括配对资料)t (包括配对资料)t检验中要与样本均数进行比 较的已知总体均数,或两组样本t 较的已知总体均数,或两组样本t检验中与两样 本均数差值比较的数值。默认值为0 本均数差值比较的数值。默认值为0
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能 1.PROC TTEST语句 TTEST语句
格式 :PROC TTEST <options>; 选项:
DATA=:指定ttest过程所要处理的输入数据集。 DATA=:指定ttest过程所要处理的输入数据集。 ALPHA=:指定统计量可信区间的置信水平。默认值为 ALPHA=:指定统计量可信区间的置信水平。默认值为 0.05。 0.05。 CI=:用以指定是否给出标准差的可信区间并指定可信 CI=:用以指定是否给出标准差的可信区间并指定可信 区间的类型。可设置的值及其含义:
以星号连接的变量列表表示星号左侧的每一个 变量将与星号右侧的每一个变量组成变量对 以冒号连接的变量列表则表示其左侧的变量只 与右侧相应排列位置上的变量组成变量对。以 冒号连接的两个变量列表必须包含相同数量的 变量。
7.1.2 TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
5.PAIRED语句 PAIRED语句
“equal”——给出对称的可信区间;默认设置为“ci=equal” equal”——给出对称的可信区间;默认设置为“ci=equal” “umpu”——给出基于UMPU(uniformly most powerful umpu”——给出基于UMPU(uniformly unbiased)检验的可信区间; unbiased)检验的可信区间; “none”——不给出标准差的可信区间。 none”——不给出标准差的可信区间。
SAS中没有专门进行u检验的过程,可通过data步 SAS中没有专门进行u检验的过程,可通过data步 的语句以及SAS所提供的函数和运算符来实现对 的语句以及SAS所提供的函数和运算符来实现对 均数比较的u 均数比较的u检验。
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
ttest过程对数据的要求: ttest过程对数据的要求:
所处理的样本来自正态分布的总体 对于两组资料均数比较的t 对于两组资料均数比较的t检验,还要求两组样本之间相互独立, 否则需考虑是否应作为配对资料来处理。
7.1 均数差别比较的SAS过程-均数差别比较的SAS过程-TTEST过程 TTEST过程
7.1.1 TTEST过程的一般格式 TTEST过程的一般格式
TTEST过程各条语句的用法和功能 TTEST过程各条语句的用法和功能
7.1.1 TTEST过程的一般格式 TTEST过程的一般格式
PROC TTEST <options>; CLASS variable; PAIRED variables; BY variables; variables; VAR variable; FREQ variable; WEIGHT variable ; RUN; 以上语句均不能在对ttest过程的一次调用中使用两次或以 以上语句均不能在对ttest过程的一次调用中使用两次或以 上,除proc ttest语句之外,其余语句没有先后顺序的限制。 上,除proc ttest语句之外,其余语句没有先后顺序的限制。
第七章 单组或两组资料均数的比较
医学数据处理与SAS软件应用 医学数据处理与SAS软件应用 Medical data processing and the application of SAS
第七章 单组或两组资料均数的比较
概述 7.1 均数差别比较的SAS过程--TTEST过程 均数差别比较的SAS过程--TTEST过程 7.2 分析实例 用分析家进行T 用分析家进行T检验
在两组资料均数比较的t检验中,ttest过程除了在两组方 在两组资料均数比较的t检验中,ttest过程除了在两组方 差齐的假设条件下计算t 差齐的假设条件下计算t统计量之外,还在方差不齐的假 设条件下计算近似t 设条件下计算近似t统计量,同时给出两者所对应的自由 度以及概率值。其中近似t 度以及概率值。其中近似t统计量对应的自由度使用 Satterthwaite’ Satterthwaite’s近似法获得,我们还可以要求使用 Cochran-Cox近似法计算近似t Cochran-Cox近似法计算近似t统计量所对应的概率值。对 于方差齐性的假设检验,ttest过程将会给出双侧F 于方差齐性的假设检验,ttest过程将会给出双侧F检验的 结果。
概述
样本均数和总体均数比较的t 样本均数和总体均数比较的t检验
前提:服从正态分布
配对设计的t 配对设计的t 检验
前提:差值服从正态分布
概述
合并 方差
成组设计的两样本均 数比较的t 数比较的t 检验
前提:两组数据均服 从正态分布;两组总 体方差相等 前提:两组数据均服 从正态分布;两组总 体方差不相等 采用统