第七章 多元统计课件
《多元统计分析》课件

数据预处理和清洗
1
数据清洗
解决缺失值、异常值和重复数据问题。
2
标准化处理
对数据进行标准化、归一化和正态化处理。
3
变量选择
学习如何选择影响结果的重要变量。
描述性统计分析
1 中心趋势分析
运用平均值、中位数和众数等指标揭示数据的集中情况。
2 离散程度分析
探索数据的离散程度,如标准差和方差。
3 分布形态分析
识别数据分布的形态,如正态分布和偏态分布。
相关分析
线性相关
学习如何评估变量之间的 线性关系。
非线性相关
探索变量之间的非线性关 系,如曲线和曲面拟合。
相关系数
了解相关系数的计算方法 及其解释。
统计显著性检验
1
假设检验
学习如何根据样本数据推断总体参数。
2
置信区间
了解如何估计总体参数的范围。
3
显著性水平
确定显著性水平及其对推断的影响。
回归分析
线性回归
构建线性回归模型来预测因变量。
回归诊断
评估回归模型用。
多元方差分析
单因素设计
比较多个组之间的差异。
多重比较
确定组之间的具体差异。
二因素设计
考虑两个自变量对因变量的 影响。
《多元统计分析》PPT课件
探索多元统计分析的定义、概念和应用。从数据预处理到分析模型选择,帮 助解决实际问题。了解多元统计软件和未来发展方向。
数据结构和类型
结构
探索多元数据的各种结 构,包括矩阵、向量和 表格。
类型
了解多元数据的分类, 如连续型、离散型、定 类型和定序型。
示例
使用实际案例来展示多 元数据的结构和类型。
《应用多元统计分析》第五版PPT(第七章)-简化版(JMP13.1)

y1* 和 y2*累计贡献率3为 3
1* 2* 2.114 0.646 0.920
3
3
➢ 现比较本例中从R出发和例7.2.2中从 Σ出发的主成分
计算结果。从R出发的 y1*的贡献率0.705明显小于从Σ 出发的y1的贡献率0.938,事实上,原始变量方差之 间的差异越大,这一点也就倾向于越明显。
2
❖ 习题7.6 下表给出的是美国50个州每100 000个人中 七种犯罪的比率数据。这七种犯罪是:
x1:杀人罪
x5 :夜盗罪
x2:强奸罪
x6 :盗窃罪
x3:抢劫罪
x7 :汽车犯罪
x4:伤害罪
试图用降维的方式对50个州的犯罪情况进行比较分
析。
3
state Alabama Alaska Arizona Arkansas California Colorado Connecticut Delaware Florida Georgia Hawaii Idaho Illinois Indiana Iowa Kansas Kentucky Louisiana Maine
第七章 主成分分析
❖ §7.1 引言 ❖ §7.2 总体的主成分 ❖ §7.3 样本的主成分 ❖ §7.4 若干补充及应用中需注意的问题
1
§7.1 引言
❖ 主成分分析由皮尔逊(Pearson,1901)首先引入, 后来被霍特林(Hotelling,1933)发展了。
❖ 主成分分析是一种通过降维技术把多个变量化为少 数几个主成分(综合变量)的统计分析方法。这些 主成分能够反映原始变量的绝大部分信息,它们通 常表示为原始变量的某种线性组合,且彼此不相关。
153.5 1086.2 2498.7
应用统计学课件:实用多元统计分析

在线性回归分析中,自变量可以是连续的或离散的,因变量通常是连续的。
线性回归分析的假设包括误差项的独立性、同方差性和无偏性等。
线性回归分析的优点是简单易懂,可以用于解释自变量和因变量之间的关系,并且可以通过回归系数来度量自变量对因变量的影响程度。
非线性回归分析
非线性回归分析是指自变量和因变量之间存在非线性关系的回归分析方法。
详细描述
数据的收集与整理
总结词
描述性统计量是用来概括和描述数据分布特性的统计指标。
详细描述
描述性统计量包括均值、中位数、众数、标准差、方差等统计指标,以及偏度和峰度等统计量。这些统计量可以帮助我们了解数据的分布情况,如数据的集中趋势、离散程度和形状等。通过对这些统计量的计算和分析,可以进一步了解数据的特征和规律。
DBSCAN聚类分析
06
多元数据判别分析
基于距离度量的分类方法,通过最大化类间差异、最小化类内差异进行分类。
Fisher判别分析是一种线性判别分析方法,通过投影将高维数据降到低维空间,使得同一类别的数据尽可能接近,不同类别的数据尽可能远离。它基于距离度量,通过最大化类间差异、最小化类内差异进行分类。
数据的可视化方法
03
多元数据探索性分析
数据的相关性分析
总结词:通过计算变量间的相子分析用于探索隐藏在变量之间的潜在结构,即公共因子。
04
多元数据回归分析
线性回归分析
A
B
D
C
线性回归分析是一种常用的回归分析方法,通过建立自变量和因变量之间的线性关系,来预测因变量的取值。
01
02
03
04
05
多元统计分析的定义与特点
社会学
心理学
《多元统计分析》课件

采用L1正则化,通过惩罚项来选择最重要 的自变量,实现特征选择和模型简化。
比较
应用场景
岭回归适用于所有自变量都对因变量有影 响的情况,而套索回归更适用于特征选择 和模型压缩。
适用于数据集较大、自变量之间存在多重 共线性的情况,如生物信息学数据分析、 市场细分等。
主成分回归与偏最小二乘回归
主成分回归
适用于自变量之间存在多重 共线性的情况,同时要求高 预测精度,如金融市场预测 、化学计量学等。
06 多元数据的典型相关分析
典型相关分析的基本思想
01
典型相关分析是一种研究多个 随机变量之间相关性的多元统 计分析方法。
02
它通过寻找一对或多个线性组 合,使得这些线性组合之间的 相关性达到最大或最小,从而 揭示多个变量之间的关系。
原理
基于最小二乘法原理,通过最小化预 测值与实际值之间的平方误差来估计 回归系数。
应用场景
适用于因变量与自变量之间存在线性 关系的情况,如预测房价、股票价格 等。
注意事项
需对自变量进行筛选和多重共线性诊 断,以避免模型的不稳定性和误差。
岭回归与套索回归
岭回归
套索回归
是一种用于解决多重共线性的回归方法, 通过引入一个小的正则化项来稳定系数估 计。
层次聚类
01
步骤
02
1. 将每个数据点视为一个独立的集群。
2. 计算任意两个集群之间的距离或相似度。
03
层次聚类
01 3. 将最相近的两个集群合并为一个新的集群。 02 4. 重复步骤2和3,直到满足终止条件(如达到预
设的集群数量或最大距离阈值)。
03 应用:适用于探索性数据分析,帮助研究者了解 数据的分布和结构。
《多元统计方法》课件

DBSCAN聚类
DBSCAN聚类是一种基于密度的聚 类方法,可以有效地发现数据集 中的异常点和噪声。
结论和要点
多元统计方法的应用
通过本课程,您将学会如何运 用多元统计方法解析复杂的数 据,并从中获得有用的信息和 见解。
数据分析的关键技能
多元统计方法是数据分析的关 键技能之一,掌握它将使您在 职场中脱颖而出。
相关性分析
散点图
通过散点图,我们可以研究两个 变量之间的关系,并判断它们是 否存在相关性。
相关矩阵
相关矩阵可以帮助我们全面了解 不同变量之间的相关性,并帮助 我们进行更准确的数据分析。
折线图
通过折线图,我们可以观察变量 随时间的变化趋势,发现可能存 在的关联或趋势。
回归分析
1
线性回归
线性回归是回归分析的基础,通过拟合一条直线来描述自变量与因变量之间的关 系。
数据可视化
数据可视化的重要性
通过数据可视化,我们可以将 抽象的数据转化为直观的图表 和图像,帮助我们更好地理解 和解释数据。
常用的数据可视化工具
我们将介绍一些流行的数据可 视化工具,如Tableau和 Matplotlib,以及如何使用它们 创建令人惊叹的可视化效果。
最佳实践与技巧
掌握一些数据可视化的最佳实 践和技巧,使您的图表更具吸 引力和易读性。
了解如何计算因子载荷和解 释力,并利用它们来解释变 量之间的关系及其对因子的 贡献。
实例应用
通过实例应用,我们将演示 如何使用因子分析来提取潜 在的变量并简化数据集。
聚类分析
K均值聚类
通过K均值聚类,我们可以将数 据集划分为不同的组群,并发现 其中的模式和相似性。
层次聚类
层次聚类是一种通过构建聚类树 来分析数据相似性的方法,可以 帮助我们理解数据的结构。
多元统计分析及R语言建模课件07聚类分析及R使用

输出结果:
7 聚类分析及R使用
系统聚类分析的特点
综合性:聚类分析可以利用多个变量的信息对样本进行分类,克服单一指标分类的弊端。 形象性:聚类分析可以利用聚类图直观地表现其分类形态及类与类之间的内在关系。 客观性 :聚类分析结果克服主观因素,比传统分类方法更客观、细致、全面和合理。
关于kmeans算法
合并距离最近的两 类为1个新类
绘制 系统聚类图
计算新类与当前各类 的距离,若类个数为 1,转到第5步,否则
回到第3步
例7-1数据的系统聚类 最短距离法(采用欧氏距离)
例7-1数据的系统聚类
最长距离法(采用欧氏距离)
例7-1数据的系统聚类
7 聚类分析及R使用
2.Ward法(采用欧氏距离)
hc<-hclust(dist(X),"ward") #ward距离法 cbind(hc$merge,hc$height) #分类过程
多元统计分析及R语言建模
理解聚类分析的目的意义及统计思想
基
了解变量类型的几种尺度定义
本
熟悉Q型和R型聚类分析的统计量的定义
要
求
了解六种系统聚类方法及它们的统一公式
掌握R语言中六种方法的具体使用步骤
了解R语言中kmeans聚类的基本思想和用法
7 聚类分析及R使用
基本概念
聚类分析法(Cluster Analysis)是研究“物以类聚”的
x1=matrix(rnorm(1000,mean=0,sd=0.3),ncol=1 0) #均值1,标准差为0.3的100x10的正态随机数矩阵 x2=matrix(rnorm(1000,mean=1,sd=0.3),ncol=1 0) x=rbind(x1,x2) H.clust(x,"euclidean","complete")
第七章多元统计分析资料

17
性质1 设X N p (, ), 0,则 E(X ) , D(X )
性质2:正态随机变量的线性变换仍为正态变量 正态随机向量的线性变换仍为正态向量
即,设随机向量X Np (, ),C是任一r p
阶矩阵,b是r 1常数向量,记Y CX b,则
Y Nr (C b,CC )
18
性质3:设随机向量
X
X1 X2
N
p
1 2
,
11 21
12 22
其中X1是k维随机向量,X 2是p k维随机向量,
1是k 1常数向量,2是( p k)1常数向量,
11为k阶方阵,12为k ( p k)阵,21为( p k) k 阵,22为p k阶方阵,且 | 22 | 0,则
19
(1)E(AX ) AE(X )
(2)E(AXB) AE(X )B
(3)D( AX ) AD( X ) A (4)Cov( AX , BY ) ACov( X ,Y )B
14
一元:X~N(μ,σ2),密度函数
1
2
exp{
1
2 2
(x
)2}
15
定义5:设U (U1,U2, ,Uq ) 是随机向量,且 Ui (i 1, 2, , q)独立同分布,其中Ui N(0,1),
4
众所周知,一元正态分布在数理统计的 理论及应用中都占据着重要的地位,主 要因为 (1)很多随机变量服从正态分布;
(2)根据中心极限定理,当样本容量很 大时,许多统计量的极限分布往往都 与正态分布有关.
5
多元统计分析中,多元正态分布也占据 着重要的地位. 原因也是相当多的实际 问题中,高维数据服从或近似服从正态 分布.
数理统计课件 多元统计分析

7 知,给定 X 2 = x2 , X1 的条件分布为 N1(µ1,2 , Σ11,2 ) ,其中
, , µ1,2 ⎜⎜⎝⎛
σ2 σ1
⎟⎟⎠⎞( x2
−
µ2 )
Σ11,2
=
σ
2 1
(1
−
ρ
2)
同理可得,在给定 X1 = x1 时 X 2 的条件分布为 N (µ2,1,Σ22,1 ) , 其中
知, X ~ N p (µ, ∑)
性质
7
若
X
=
⎡ ⎢ ⎣
X1 X2
⎤ ⎥ ⎦
,
X
~
N p (µ, ∑), X1, X 2
分别是 m
维和
p − m 维向量,且| ∑ |≠ 0, µ 和 ∑ 也有相应的分块表示
µ
def
=
⎡ µ1 ⎢⎣µ2
⎤ ⎥⎦
,
∑
def
=
⎡ ∑11 ⎢⎣∑21
∑12 ⎤ ∑22 ⎥⎦
性质 3 若 C 为 m × p 矩阵, b 为 m × 1 向量,Y = CX + b , 且 X 服 从 Np(µ,Σ) 分 布 , 则 Y 服 从 m 维 正 态 分 布 , 且
E(Y ) = Cµ + b ,Cov(Y ,Y ) = C ∑C T ,即 Y 服从 N m (Cµ + b,CΣC T ) 分布. 性质 3 说明,多维正态分布在线性变换下仍为多维
y = Q( x − µ) ,则 ( x − µ)T Σ−1( x − µ) = ( x − µ)T QT Q( x − µ) = yT y .这个变
换
的
雅
可
比
行
列
多元统计分析ppt课件

dij xik x jk
k 1
❖ 当各变量的单位不同或测量值范围相差很大时,应
先对各变量的数据作标准化处理。最常用的标准化
处理是,令
xi*j
xij
xj s jj
,
i 1, 2,
, n,
j 1, 2,
,p
变其量中的xj样 本1n i均n1 x值ij 和和样s jj 本 n方1差1 i。n1 xij xj
则可求得第一主成分为
y1 t11x1 t21x2 t p1xp t1x
它的方差具有最大值 1 。
❖ 如果第一主成分所含信息不够多,还不足以代表原 始的 p 个变量,则需考虑再使用一个综合变
量 y2 a2x ,为使 y2所含的信息与y1 不重叠,应要求
Cov y1, y2 0
我们在此条件和约束条件 a2a2 1 下寻求向量a2 ,使
❖ 主成分分析的目的就是为了减少变量的个数,因而 一般是不会使用所有 p个主成分的,忽略一些带有
较小方差的主成分将不会给总方差带来大的影响。
❖ 前 m个主成分的贡献率之和
称为主成分 y1, y2,
m
p
i i
i 1
i 1
, ym 的累计贡献率,它表明
y1, y2, , ym解释 x1, x2, , xp的能力。
动态聚类法
❖ 动态聚类法的基本思想是,选择一批凝聚点或给出 一个初始的分类,让样品按某种原则向凝聚点凝聚, 对凝聚点进行不断的修改或迭代,直至分类比较合 理或迭代稳定为止。类的个数k可以事先指定,也可 以在聚类过程中确定。选择初始凝聚点(或给出初始 分类)的一种简单方法是采用随机抽选(或随机分割) 样品的方法。
最短距离法
❖ 定义类与类之间的距离为两类最近样品间的距离, 即
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 回归分析回归分析已经成为多因素数据统计分析的重要工具。
因为它为研究变量间的关系提供了简单的方法。
在回归分析中,标准的方法是对数据拟合数据,然后使用如,F 和t 2R 等统计量方法评价模型。
例如,我们要研究香烟消费与年龄,教育,收入和香烟价格诸多指标的关系。
这种关系可用方程或模型将响应变量(RESPONSE V ARIABLE )与因变量(DEPENDENT V ARIABLE )联系起来。
设Y 为响应变量(或称为因变量),12,,,p X X X 为因变量,这里p 表示因变量的个数。
Y 与12,,,p X X X 的关系能用回归模型:12(,,,)p Y f X X X ,ε=+近似表示。
这里ε表示随机误差。
函数12(,,,)p f X X X 描述了Y 与12,,,p X X X 的关系。
例如线性回归模型为:01122,p p Y X X X ββββ=+++++ ε这里012,,,,,p ββββ 叫做回归参数或回归系数,它们是由数据决定的未知常数。
7.1 REG 过程REG 过程可将参数估计值代入线性回归模型中以便进行回归分析的预测。
参数估计值是利用最小二乘估计获得的。
REG 过程是SAS 统计分析中所有回归分析过程中,用途最为广泛的一种。
其它回归分析的过程各有其特殊的用途。
REG 过程的主要功能有:同时考虑几个线性模型,并进行交互式回归分析;输出数据可以是相关系数等;可以输出预测值、误差、标准化残差、置信区间等;输出偏回归图;利用最小二乘法估计参数;检验线性回归系数;诊断自变量之间线性相关的程度等。
一、语句格式语句格式为: PROCREG MODEL BY FREQ ID VAR PLOTRESTRICT选项一;因变量名=回归变量名 / 选项二; 变量名; 变量名; 变量名; 变量名;Y 轴变量名*X 轴变量名/选项三; 方程;SAS统计分析二、语句说明1、选项一(1) DATA=数据集名:要分析的数据集。
可以原始数据也可以是相关系数矩阵或协差阵等。
(2) OUTTEST=数据集名:输出包含参数估计值和某些统计量的数据集。
(3) CORR:输出在MODEL语句或V AR语句中所列变量的相关矩阵。
(4) ALL:输出所有结果。
(5) SIMPLE:输出均值、标准差等描述性统计量。
2、MODEL语句REG过程必须要有MODEL语句。
“/”前面的部分很显然。
而“/”后的选项二有很多,常用的有:(1) SELECTION= 方法名称:对回归分析指定分析方法。
主要有:FORWARD|F(顺向选择法)、BACKWARD|B(反向淘汰法)、STEPWISE(逐步筛选法)、MAXR(最大相关法)、MINR (最小相关法)、CP(Cp法)、RSQUARE(复相关系数平方法)、ADJRSQ(调整后的复相关系数平方法)、NONE(全型回归分析,系统缺省的方法)。
(2) SLENTRY= 显著度值:在顺向选择法与逐步筛选法中,指定变量进入回归模型的显著性水平。
缺省值分别为0.50(顺向选择法)和0.15(逐步筛选法)。
(3) SLSTAY= 显著度值:在反向淘汰法与逐步筛选法中,指定变量能否在回归模型的显著性水平。
缺省值分别是0.10(反向淘汰法)和0.15(逐步筛选法)。
(4) BEST= 正整数:指定选择最好的几个变量保留在回归模型中。
只可与RSQUARE,ADJRSQ或CP等联用。
(5) COLLIN |COLLINOINT:进行自变量之间的共线性分析。
但后者不包括截距。
(6) P:输入数据和回归模型预测因变量的值。
可产生原始数据、因变量的实际值与预测值以及残差。
(7) R:要求REG过程对残差进行分析。
可产生包括P选项输出的结果,还有预测值、残差的标准误差。
标准化残差及Cook’s D值。
由D值可找到原始数据中的强影响点。
(8) CLM:输出预测值均值的95%的置信上限和下限。
(9) CLI:输出预测的95%的置信上限和下限。
比CLM的区间要宽,更不精确。
(10) NOINT:规定回归模型中不包括截距。
(11) AIC:输出AIC统计量(Akaike’s Information Criterion)。
(12) BIC:输出每个模型的贝叶斯信息准则(Bayeisan Information Criterion)。
(13) CP:输出每个模型的Mallow的C(p)统计量。
3、PLOT语句每个MODEL语句可以规定几个PLOT语句,每个PLOT语句可以规定多个散点图。
当REG 过程的数据类型为TYPE=CORR、TYPE=COV时,不能使用PLOT语句。
4、选项三选项三常用的选项有:(1) SYMBOL=‘绘图的符号’:规定绘图的符号。
(2) OVERLAY:要求将两个或两个以上的图形重叠在一起。
(3) VPLOTS=正整数:规定一页从上到下可输出的散点图的个数。
(4) HPLOTS=正整数:规定从左到右输出散点图的个数。
例:PLOT RESIDUAL.*PREDICTED;对模型的残差和预测值产生一张散点图。
例:PLOT (Y1 Y2)*(X1 X2 X3)/VPLOT=3 HPLOTS=2;产生六个图形两两并排,分三段输出在同一页。
回归分析5、RESTRICT 语句此语句限制MODEL 语句中参数的估计。
这些方程之间用逗号分开。
指令中所用的变量必须 是MODEL 中出现的变量。
例如:RESTRICT A+B=1; RESTRICT A=B=C ; RESTRICT A=B ,B=C ; RESTRICT 2*F=G + H , INTERCEPT=0; RESTRICT F=G=H=INTERCEPT ;7.2 简单线性回归一、简单线性回归概述若响应变量Y 可用回归变量X 的线性函数进行表示,即对每对观测有:01i i i Y X ββε++2(0,)i N ,=εσ∼其中0β称为截距,1β称为模型的回归系数或斜率。
i ε称为随机误差。
在SAS 软件中,使用下面的REG 过程的MODEL 语句就能实现模型的拟合。
MODEL 中的Y 表示输出变量,X 表示回归变量。
PROC REG ; MODEL Y=X ;利用REG 过程,可以得到简单线性回归模型的系数的参数估计及其参数的显著性检验,还可以得到预测值、预测限并输出相应的图形。
二、应用举例例7.1:研究某电脑公司维修电脑服务时间与需维修的电脑元件数之间的关系,数据见程序行。
其中, Minutes 表示电脑的维修时间(单位:分钟),Units 表示需要维修的电脑元件数。
SAS 程序为: data ch7_1;input Minutes Units @@; cards ;23 1 29 2 49 3 64 4 74 4 87 5 96 6 97 6 109 7 119 8 149 9 145 9 154 10 166 10 ;proc reg ;model Minutes=Units; print cli ;plot Minutes*Units p.*Units l95.*Units u95.*Units/overlay ; symbol1 c =black v =triangle; symbol2 c =blue v =circle; symbol3 c =green v =square; symbol4 c =red v =star; run ;SAS统计分析程序说明:首先利用DATA步建立SAS数据集ch7_1,INPUT语句中的Minutes表示电脑的维修时间,Units表示需要维修的电脑元件数。
REG过程中的MODEL语句,Units作为回归变量或自变量,而把Minutes作为响应变量或因变量。
Print cli可以得到预测值、95%预测上限与下限、残差。
Plot选项可以制出数据点、回归直线和预测界限的图形。
输出分析:输出7.1.1给出了由REG过程得到的方差分析与参数估计。
方差分析(Analysis of Variance)给出了直线拟合这组数据的效果的信息。
与第六章的方差分析是不同的。
①与②表示用于识别这组数据中方差的来源及相应的自由度。
总方差用Corrected Total标记,DF为样本容量减1(DF=14-1=13)。
这个模型解释的偏差标记为Model,相应的自由度为1。
Error 的自由度是两个自由度的差(12=13-1)。
③表示平方和,这组数据的总偏差平方和可分解为模型平方和和误差平方和两部分,即有一般形式:Total SS=Model SS+Error SS。
容易看出总偏差平方和、模型平方和和误差平方和分别为27768、27420和348.85。
④表示均方(MS)。
均方等于平方和除以自由度。
Error MS=348.85/12=29.07,它是模型中误差方差的估计。
输出7.1.1 REG过程输出的方差分析与参数估计The REG ProcedureModel: MODEL1Dependent Variable: Weight(因变量)Analysis of Variance(方差分析)① ② ③ ④ ⑤ ⑥Source DF Sum of Squares Mean Square F Value Pr > FModel 1 27420 27420 943.20 <.0001Error 12 348.84837 29.07070Corrected Total 13 27768Root MSE 5.39172 R-Square 0.9874Dependent Mean 97.21429 Adj R-Sq 0.9864Coeff Var 5.54623Parameter Estimates(参数估计)⑦ ⑧ ⑨ ⑩Parameter StandardVariable DF Estimate Error t Value Pr > |t|Intercept 1 4.16165 3.35510 1.24 0.2385Units 1 15.50877 0.50498 30.71 <.0001⑤和⑥给出了检验统计量的F值及相应的P值。
F值等于MMS(模型均方)除以EMS(误差均方)。
它用于检验这样的假设:该回归模型是显著的。
对于这组数据拟合后F值等于943.20,相应的P值小于0.0001,说明拟合的模型解释了这组数据总偏差的主要部分。
R-Square(R平方)和Adj R-Sq(调整后的R平方):它们评价模型优劣的量,R平方等于Model SS除以Total SS。
因为Total SS=Model SS+Error SS,所以R平方是Total SS中由Model SS 构成的比值。