第17章 判别分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、筛选判别指标
SAS中的STEPDISC过程用来筛选判别指标,在决定 某变量是否入选时,以已进入模型的变量作为协变量, 将待考察的某变量作为应变量,以各类别作为对比组, 采用协方差分析,比较各类别某考察变量的修正均数。
检验统计量为F统计量,并可通过前进法、后退 法或逐步法来实现,根据sle、sls的标准按P值 大小确定;一旦某些变量被选入后,检验它们 的鉴别能力时,用Wilks’ Lambda统计量及对应 P值来衡量。
data; input x1-x23 c@@; cards; 1 72 20 10 2 1 1 2 1 1 2 1 2 2 1 2 2 2 5.671 9.493 1.875 42 32 1 1 71 18 12 1 2 1 2 1 1 2 1 2 3 1 1 2 2 6.144 12.63 2.021 47 24 1 2 70 20 12 1 3 1 2 1 1 2 1 2 2 1 1 2 2 6.04 8.056 2 40 35 1 1 54 21 15 2 3 1 2 1 1 1 1 2 4 1 2 2 2 9.993 21.19 1.87 61 1 1 1 70 17 9 2 1 1 2 1 1 2 1 2 3 1 2 2 2 5.49 6.21 1.7 40 23 1 1 69 24 13 1 1 1 2 1 2 2 1 2 3 1 2 2 2 5.955 10.26 1.792 45 30 1
根据患者的主诉、体症、检查结果作疾病诊 断,常用于临床辅助鉴别诊断-计量诊断学 根据某细菌的形态、生化特点判为某种细菌 根据骨科X线的各项特征判为某种骨瘤 放射学诊断、病理学诊断 经典的方法: Fisher判别和Bayes判别
第一节 Bayes判 别
一、分析步骤
协方差分析:将对应变量Y有线性影响但未加 控制或难以控制的定量变量X看做协变量, 把X化为相等后比较各组Y的修正均数,是线 性回归与方差分析结合起来的一种统计分析 方法。模型中无任何协变量时即为方差分析。

Stepwise Selection Summary
Average Squared Number Partial Wilks' Pr < Canonical Pr > Step In Entered Removed R-Square F Value Pr > F Lambda Lambda Correlation ASCC 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1 2 3 4 5 6 7 8 9 10 11 12 13 12 13 x9 x6 x17 x16 x21 x13 x10 x4 x2 x7 x15 x12 x5 x2 x3 0.0562 0.0870 0.0874 0.0922 0.0523 0.0336 0.0302 0.0508 0.0464 0.0309 0.0329 0.0349 0.0265 0.0145 0.0256 4.53 7.14 7.09 7.41 3.97 2.47 2.18 3.69 3.31 2.14 2.24 2.35 1.74 0.94 1.68 0.0366 0.0092 0.0095 0.0081 0.0501 0.1206 0.1446 0.0588 0.0732 0.1484 0.1388 0.1299 0.1918 0.3363 0.1990 0.94376278 0.86168120 0.78634179 0.71383587 0.67651811 0.65378543 0.63406764 0.60185218 0.57390792 0.55616653 0.53787257 0.51908207 0.50533944 0.51274873 0.49960192 0.0366 0.0038 0.0005 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 0.05623722 0.13831880 0.21365821 0.28616413 0.32348189 0.34621457 0.36593236 0.39814782 0.42609208 0.44383347 0.46212743 0.48091793 0.49466056 0.48725127 0.50039808 0.0366 0.0038 0.0005 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001 <.0001
proc stepdisc sle=0.2 sls=0.2; class c; var x1x23;run;


SAS运行结果: Class Level Information Variable c Name Frequency Weight 1 2 _1 _2 33 45 33.0000 45.0000
第十七章 观察对象的分类分析方法
判别分析(discriminant analysis)是在已知分 为哪若干类的前提下,根据判别对象若干个指 标的观测结果判定其应属于哪一类的多元统 计学方法。当事先并不知道观察对象应分为 哪若干类别时,采用聚类分析方法 。 常用的判别分析的方法有Bayes判别、 Fisher判别、非参数判别、最大似然判别。
Stepwise Selection: Step 3







Variable R-Square F Value Pr > F x1 0.0535 4.18 0.0444 x2 0.0094 0.70 0.4044 x3 0.0085 0.63 0.4293 x4 0.0011 0.08 0.7740 x5 0.0031 0.23 0.6333 x7 0.0210 1.59 0.2112 x10 0.0412 3.18 0.0785 x11 0.0012 0.09 0.7632 x12 0.0112 0.84 0.3636 x13 0.0001 0.01 0.9290 x14 0.0049 0.37 0.5464 x15 0.0167 1.26 0.2656 x16 0.0653 5.17 0.0259 x17 0.0874 7.09 0.0095 x18 0.0874 7.09 0.0095 x19 0.0029 0.22 0.6420 x20 0.0028 0.21 0.6493 x21 0.0370 2.85 0.0958 x22 0.0003 0.03 0.8743 x23 0.0397 3.06 0.0844 Variable(s) that have been Entered x6 x9 x17
变 量
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
意义
性别 年龄 收缩压 舒张压 恶心,呕吐 意识 瞳孔大小 针尖样瞳 孔 对光反射 语言障碍 颈项强直 瘫痪
表 17-2 脑中风病人判别指标与分类变量 赋值(单位) 变量 意义 赋值(单位)
男=1,女=2 岁 kpa kpa 有=1,无=2 清醒=1,嗜睡 =2,昏迷=3 等大=1,不等大 =2 有=1,无=2 存在=1,不存在 =2 有=1,无=2 有=1,无=2 有=1,无=2 x13 x14 x15 x16 x17 x18 x19 x20 x21 x22 x23 g 感觉障碍 发病状态 起病方式 Babinski 症 风心病史 心脏杂音 全血粘度/高切 全血粘度/低切 血桨粘度 血沉 血球压积 分类变量 有=1,无=2 激动=1,运动=2,一般情 况=3,睡眠或安静=4 急性=1,慢性=2 阳性=1,阴性=2 有=1, 无=2 有=1,无=2 mpa•s mpa•s mpa•s 毫米/小时 % 脑出血=1,脑缺血=2

Multivariate Statistics
Statistic Value
F Value Num DF Den DF
1 1 76 76
Pr > F
0.0366 0.0366
Wilks' 0.943763 4.53 Lambda Pillai's 0.056237 4.53 Trace
Stepwise Selection: Step 2
表 13-3
X1
1 2 3 4 5 6 7 8 15 13 11 12 12 16 14 17
三种饲料喂养猪的初始重量与增重(kg)
A 饲料 B 饲料 C 饲料
Y1
85 83 65 76 80 91 84 90
X2
17 16 18 18 21 22 19 18
Y2
97 90 100 95 103 106 99 94
Pr > F 0.5321 0.4335 0.3161 0.7518 0.0668 0.0092 0.1637 0.4747 0.1189 0.2256 0.7815 0.4707 0.1774 0.1767 0.0533 0.0533 0.6281 0.5379 0.2524 0.8497 0.1114 x6 x9
X3
22 24 20 23 25 27 30 32
Y3
89 91 83 95 100 102 105 110 X
合计 Y
例17-1 脑中风是急诊医学中较为常见的严 重疾病,一般分为脑出血和脑缺血两类,对 中风类型的早期正确诊断具有十分重要的临 床意义。以头颅CT和核磁共振检查诊断较为 可靠,但其价格昂贵;且因CT和核磁共振检 查需搬动病人,易加重病情;我们收集了某 医院近年78例脑中风病人的数据,判别指标 与分类变量(以头颅CT和核磁共振检查诊断为 依据)见表16-1。



Baidu Nhomakorabea

Variable R-Square F Value x1 0.0052 0.39 x2 0.0082 0.62 x3 0.0134 1.02 x4 0.0013 0.10 x5 0.0441 3.46 x6 0.0870 7.14 x7 0.0257 1.98 x10 0.0068 0.52 x11 0.0321 2.49 x12 0.0195 1.49 x13 0.0010 0.08 x14 0.0070 0.53 x15 0.0241 1.85 x16 0.0242 1.86 x17 0.0489 3.86 x18 0.0489 3.86 x19 0.0031 0.24 x20 0.0051 0.38 x21 0.0174 1.33 x22 0.0005 0.04 x23 0.0334 2.59 Variable(s) that have been Entered
Proportion

0.423077 0.576923


Constant Variables that have been Excluded x8


Stepwise Selection: Step 1 Variable R-Square F Value Pr > F x1 0.0060 0.46 0.4994 x2 0.0226 1.76 0.1888 x3 0.0032 0.24 0.6231 x4 0.0065 0.50 0.4837 x5 0.0321 2.52 0.1168 x6 0.0492 3.94 0.0509 x7 0.0013 0.10 0.7530 x9 0.0562 4.53 0.0366 x10 0.0026 0.20 0.6589 x11 0.0203 1.57 0.2138 x12 0.0140 1.08 0.3028 x13 0.0002 0.01 0.9105 x14 0.0034 0.26 0.6134 x15 0.0152 1.17 0.2821 x16 0.0250 1.95 0.1664 x17 0.0396 3.14 0.0805 x18 0.0396 3.14 0.0805 x19 0.0011 0.08 0.7759 x20 0.0007 0.06 0.8145 x21 0.0288 2.25 0.1373 x22 0.0003 0.02 0.8875 x23 0.0513 4.11 0.0462 Variable x9 will be entered
相关文档
最新文档