第二章两组样本平均值比较

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ANOVA
Repeated measure ANOVA
correlation /Linear regression
常態假設或中央極限 定理不成立 類別資料
Wilcoxon
Rank sum test
Wilcoxon signed-rank test
Kruskal-Wallis test
Friedman test
鉀離子與磷離子在兩組洗腎病人中的分布都違反了常態假設,要比較這兩個 生化值在兩組病人中有無差異,合適的檢定方法應該是無母數的魏克森等級和檢 定,使用的語法為【程式 02-2】PROC NPAR1WAY。其中鉀離子的比較結果如圖 02-2 所示。判讀時應由報表中間的 Wilcoxon Two-Sample Test 段落中Two-sided Pr>|Z| 是否小於 0.05 來決定是否有顯著差異。 /*Wilcoxon rank sum test */ PROC NPAR1WAY DATA=esrd WILCOXON; CLASS treat; VAR k p; RUN; 【程式 02-2】 、PROC NPAR1WAY 語法
在 Base SAS 模組中,有兩個程序可以描述連續型資料,在本節中將分別介紹 這兩個程序語法的撰寫,以及呈現報表的判讀。
1-1. 資料描述-PROC UNIIVARIATE 的應用:
以腎臟科的資料庫為例,我們想要了解不同洗腎型態病人其生化值的描述性 統計量,可以藉由【程式 01-1】PROC UNIVARIATE 語法獲得各組別病人在各種生化 值上詳細的統計量。其中腹膜透析(treat=0)病人的白蛋白數值(Albumin)的描述性統 計量如圖 01-1 所示。
圖 01-2、PROC MEANS 的結果
第 1-2 節重要指令說明:
1. PROC MEANS 預設輸出的統計量有樣本數、平均值、標準差、最大值、最小值。 在此特別指定以下統計量-N: 樣本數; MEAN: 平均值; STD: 標準差; MEDIAN: 中位數; QRANGE: 四分位距。MAXDEC=設定輸出的最大小數位數。 2. CLASS 變項名稱(類別):依照 class 所宣告的類別變項分組呈現資料分析結果。 3. VAR 變項名稱串:列出要分析的變項。
中國醫藥大學 生物統計中心
2008/12
第二章
兩組樣本平均值比較
邱顯財 統計分析師
在分析資料的過程中,最常見的問題,就是比較兩組連續資料的集中趨勢 (central tendency)有無差異。本次內容將針對描述兩組連續型的資料,以及檢定兩 組的集中Biblioteka Baidu勢,說明如何撰寫 SAS 程式。
1-0. 資料描述語法介紹-連續型資料:
2-1
SAS 教戰手冊
中國醫藥大學 生物統計中心
2008/12
2-0. 資料類型與對應的統計方法:兩組樣本的比較
前一節我們已經學會撰寫語法以取得資料的描述性統計量,以對資料有概略 地認識。假設我們關心的研究問題是腹膜透析與血液透析的病人其生化值有無差 異,先以數值差異較大的鉀(K)離子濃度為例,腹膜透析病人平均濃度為 5.39 meq/l,血液透析病人平均濃度為 4.66 meq/l (圖 01-2),然而兩組病人在鉀濃度上 的差異是否有統計上顯著呢?要回答這個問題,我們可以從表 02-1 找到合適的統 計方法進行檢定。 如果我們想要檢定的變項為連續資料,且比較的兩個組別是獨立的,參考表 02-1 我們可以有兩種選擇:(1)當資料在比較的兩組中均服從常態假設或中央極限 定理成立時,可以使用獨立樣本 t 檢定(Independent t-test);(2)當兩組中任一組 資料違反常態假設或中央極限定理不成立時,則應使用魏克森等級和檢定 (Wilcoxon rank sum test)。因此,我們可以先利用【程式 01-1】PROC UNIVARIATE 語 法判定這些生化值是否服從常態分布,並評估樣本數大小,然後利用合適的統計 方法加以檢定。 表 02-1、資料型態與適用統計方法(1)
T
HD N 67 67 64 56 Mean ± SD 2.63 ± 0.67 4.66 ± 1.46 8.70 ± 1.01 4.43 ± 2.11 Median (25 pctl - 75th pctl)
th
Mean ± SD 2.47 ± 0.60 5.39 ± 6.65 8.67 ± 1.23 4.94 ± 2.04
SAS 教戰手冊
2-1
中國醫藥大學 生物統計中心
2008/12
PROC MEANS DATA=esrd N MEAN STD MEDIAN QRANGE MAXDEC=2; CLASS treat; VAR albumin k ca p; RUN; 【程式 01-2】 、PROC MEANS 語法

2-1
SAS 教戰手冊
中國醫藥大學 生物統計中心
2008/12
圖 02-2、PROC NPAR1WAY 的結果 (針對 K)
第 2-2 節重要指令說明:
1. WILCOXON:指定使用魏克森分數(Wilcoxon scores)進行分析,若不指定則數個 內建的無母數檢定都會執行。 2. CLASS 變項名稱:欲比較的分組變項。 3. VAR 變項名稱串:列出要分析的變項。 ※ 將本章第一節與第二節的結果整理之後,可以得到以下的表格。不論是白蛋 白、鉀離子、鈣離子或磷離子濃度,在腹膜透析與血液透析的病人之間並無統計 上顯著差異。 Table 1. Comparisons of biochemical indices between PD and HD patients PD N Albumin K Ca P 33 33 32 32
1-2. 資料描述-PROC MEANS 應用:
另一種呈現描述性統計量的方式,是使用【程式 01-2】PROC MEANS 語法獲得 比較精簡的摘要描述性統計量,輸出結果如圖 01-2 所示。在報表中,可以一目瞭 然地得知不同洗腎型態病人各種生化值的摘要統計量,例如平均值(mean)、標準差 (std deviation)、中位數(median)、四分位距(interquartile range)。
Median (25 pctl - 75th pctl)
th
p-value 0.261T 0.519W 0.889T 0.250W
2.60 (2.10 - 2.90) 4.30 (3.60 - 4.90) 8.50 (7.95 - 9.25) 4.45 (3.60 - 6.10)
2.70 (2.10 - 3.10) 4.30 (3.50 - 5.50) 8.80 (7.95 - 9.35) 4.40 (2.90 - 5.75)
2-1
SAS 教戰手冊
中國醫藥大學 生物統計中心
2008/12



圖 01-1、PROC UNIVARIATE 的輸出結果(腹膜透析、白蛋白)
第 1-1 節重要指令說明:
1. NORMAL:在報表中呈現常態檢定的結果。 2. CLASS 變項名稱(類別):依照 class 所宣告的類別變項分組呈現資料分析結果。 在這個例子中我們將資料分為腹膜透析(treat=0)與血液透析兩組(treat=1)來分 析。使用 CLASS 敘述不需要排序。 3. VAR 變項名稱串:列出要分析的變項。


2-1
SAS 教戰手冊
中國醫藥大學 生物統計中心
2008/12
圖 02-1、PROC TTEST 的結果
第 2-1 節重要指令說明:
1. CLASS 變項名稱:欲比較的分組變項(限兩組)。 2. VAR 變項名稱串:列出要分析的變項。
2-2. 兩組樣本中位數比較-PROC NPAR1WAY 應用:
: independent t-test; W: Wilcoxon rank sum test
2-1
SAS 教戰手冊
兩個類別
with Yate's correction Pearson Chi-square test
McNemar 's test
Cochran's Q test
三類以上
Cochran's Q test
Pearson Chi-square test
2-1
SAS 教戰手冊
中國醫藥大學 生物統計中心
2008/12
/* Independent t-test */ PROC TTEST DATA=esrd; CLASS treat; VAR Albumin Ca; RUN; 【程式 02-1】 、PROC TTEST 語法 在圖 02-1 呈現了獨立樣本 t 檢定的結果,描述性統計量的部分可以從 PROC UNIVARIATE 或 PROC MEANS 取得。要判定檢定的結果是否顯著要經過以下步驟: 從Equality of Variance 的檢定結果來研判兩組資料的變異數是否均等,若 Pr>F 的 數值大於 0.05 , 則T-Tests 應選擇 Variances 為 Equal 的檢定結果 , Pr>|t|若小於 0.05 代表兩組間均值有統計上顯著差異。若變異數均等的假設不成立(Pr>F 小於 0.05),則T-Tests 時選擇 Variances 為 Unequal 的檢定結果。
PROC UNIVARIATE DATA=esrd NORMAL; CLASS treat; VAR albumin k ca p; RUN; 【程式 01-1】 、PROC UNIVARIATE 語法 圖 01-1 中呈現的統計量有幾個部分,為有關動差(moment)的統計量,樣本 數(N)可以從此得知;為基本且常見的描述性統計量,集中趨勢有平均值(Mean)、 中位數(Median)、眾數(Mode),變異程度有標準差(Std Deviation)、變異數(Variance)、 全距(Range)、四分位距(Interquartile Range);為檢定資料是否成常態分布,較常 用來判定資料成常態分布的檢定是 Shapiro-Wilk,p-value<0.05 代表資料違反常態 假設。
Spearman correlation
關聯性(Association) Chi-square test Pearson Chi-square test Logistic regression Multinomial / Cochran's Q test Ordinal logistic regression
2-1. 兩組樣本平均值比較-PROC TTEST 應用:
整理【程式 01-1】PROC UNIVARIATE 語法的結果,可以得知白蛋白與鈣離子濃 度不論在腹膜透析或血液透析病人中,都符合常態分布的假設。因此【程式 02-1】 PROC TTEST 語法便可用來檢定兩組病人的白蛋白與鈣離子濃度平均值是否有顯著 差異。結果如圖 02-1 所示。
欲檢定的變項/ 依變項 (Y) 獨立樣本 連續資料 兩組 相依樣本 欲進行比較的組別數/自變項 (X) 三組或以上 獨立樣本 相依樣本 連續 相關分析 Pearson 常態假設或中央極限 定理成立
集中趨勢 (central tendency)
Independent
t-test
Paired t-test
相关文档
最新文档