05聚类分析-SAS实验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

变量聚类过程( 过程) 变量聚类过程(Varclus过程) 过程
proc varclus data=Protein outtree=tree maxclusters=4; var RedMeat--FruitVeg; run; proc tree data=tree spaces=1 pages=1 horizontal; id _name_; run;
Baidu Nhomakorabea
聚类分析常用指标
复相关系数的平方RSQ(squared multiple correlation):表示总体变异被类变异所解释的 比例 半偏复相关系数的平方SPRSQ(semipartial rsquared):表示合并两类后导致复相关系数的 平方的减少量
聚类分析常用指标
CCC(cubic clustering criterion) RMS(root-mean-square standard deviation) 表示所有距离平方的均数的平方根值
RMS = 2 2 d ij ∑ m( m 1 ) i < j
标准距离(normalized RMS distance):表示两 类合并时的距离与RMS之比。
快速聚类过程( 快速聚类过程(Fastclus过程 ) 过程
选择若干观测初始凝聚点 计算观测到凝聚点距离 计算观测到凝聚点距离 将观测按距离最小原则归类 将观测按距离最小原则归类 按距离最小原则 调整各类凝聚点 分类没有变化
系统聚类过程( 过程) 系统聚类过程(Cluster过程) 过程
Proc cluster data=example1 method=single std ccc; 输出聚类统计量 Var x1-x2; 指定计算类间距 原始变量标准化 离方法 Id name; run; Proc tree horizontal space=3; Id name; Run;
proc fastclus /*maxclusters=3*/ radius=4 distance ; 指定允许的最大 指定凝聚点间的 var x1-x3; 分类个数 最小距离 run;
计算类间距离
变量聚类过程( 过程) 变量聚类过程(Varclus过程) 过程
变量聚类 每一类的第一主成分所解释的方差为最大 可输出作树状图( 过程) 可输出作树状图(tree过程)的数据集 过程 可输出计算每一类主成分得分( 过程) 可输出计算每一类主成分得分(score过程) 过程 的数据集
聚类分析- 聚类分析-SAS实验 实验
广东药学院公共卫生学院
SAS聚类分析过程 聚类分析过程
系统聚类过程(Cluster过程) 快速聚类过程(Fastclus过程 ) 变量聚类过程(Varclus过程) 画树状图过程(Tree过程)
系统聚类过程( 过程) 系统聚类过程(Cluster过程) 过程
样本聚类(小样本)
原始数据:example1 距离矩阵(type=distance)
指标聚类(变量个数少)
距离矩阵(type=distance):example2
系统聚类过程( 过程) 系统聚类过程(Cluster过程) 过程
每个观测各成一类 计算两两类间距离 计算两两类间距离 距离最近的两类合并 所有观测合并为一类
快速聚类过程( 快速聚类过程(Fastclus过程 ) 过程
大样本快速聚类(n=100~100,000) 大样本快速聚类( = ~ , ) 输出类内指标均值, 输出类内指标均值,比较类间差异 没有原始数据标准化功能 需要指定类别数或初始凝聚点间最小距离 不能输出作树状图的聚类信息
快速聚类过程( 快速聚类过程(Fastclus过程 ) 过程
系统聚类过程( 过程) 系统聚类过程(Cluster过程) 过程
类平均法(method=ave) 重心法(method=cen) 最长距离法(method=com) 可变类平均法(method=fle) 最短距离法(method=sin) 中间距离法(method=med) Ward最小方差法(method=war) 密度估计法(method=den)
相关文档
最新文档