生物统计学:第七章 直线回归与相关分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y)2 y)2
SPxy 2 SSxSS y
SPxy SS x
SPxy SS y
byx
bxy
决定系数的大小表示了回归方程估测可靠程度的
高低,或者说表示了Байду номын сангаас归直线拟合度的高低。
显然有0≤r2≤1。
若求r2的平方根,并赋予相应的符号, 这样求出的平方根既可表示y与x的直线相关 的程度,也可表示直线相关的性质。统计学 上把这样计算所得的统计量称为x与y的相关 系数(coefficient of correlation),记 为r。
由于利用查表法对相关系数进行检验十分简便,因此 在实际进行直线回归分析时,可用相关系数显著性检 验代替直线回归关系显著性检验,即可先计算出相关 系数r并对其进行显著性检验,若检验结果r不显著, 则用不着建立直线回归方程;若r显著,再计算回归 系数b、回归截距a,建立直线回归方程,此时所建立 的直线回归方程代表的直线关系是真实的,可利用它 来进行预测和控制。
散点图直观地、定性地表示了两个变量之间 的关系。为了探讨它们之间的规律性,还必须 根据观测值将其内在关系定量地表达出来。
回归分析主要包括:找出回归方程;检验回 归方程是否显著;通过回归方程来预测或控制 另一变量。
在x、y直角坐标平面上可以作出无数条直线, 我们把所有直线中最接近散点图中全部散点的 直线用来表示x与y的直线关系,这条直线称为 回归直线。
第七章 直线回归与相关分析
在试验研究中常常要研究两个变量间的关系。 如:人的身高与体重、作物种植密度与产量、食品价格与需
求量的关系等。 两个关系 依存关系:依变量Y随自变量X变化而变化。
—— 回归分析 互依关系:依变量Y与自变量X间的彼此关系.
—— 相关分析
一 直线回归
(一)、直线回归方程的建立 对于两个相关变量x和y,如果通过试验或调查 获得它们的n对观测值: (x1,y1),(x2,y2),……,(xn,yn) 为了直观地看出x和y间的变化趋势,可将每一 对观测值在平面直角坐标系描点,作出散点图。
二 直线相关
进行直线相关分析的基本任务在于根据
x、y的实际观测值,计算表示两个相关变量 x、y间线性相关程度和性质的统计量——相
关系数r并进行显著性检验。
(一)、决定系数和相关系数
x 对 y 的决定系数(coefficient of
determination),记为 r2,
r 2
( yˆ (y
特别要指出的是:利用直线回归方程进行预 测或控制时,一般只适用于原来研究的范围,不 能随意把范围扩大,因为在研究的范围内两变量 是直线关系,这并不能保证在这研究范围之外仍 然是直线关系。若需要扩大预测和控制范围,则 要有充分的理论依据或进一步的实验依据。利用 直线回归方程进行预测或控制,一般只能内插, 不要轻易外延。
(二)、相关系数的计算
【例】计算10只绵羊的胸围(cm)和体重(kg) 的相关 系数。
表7.1 10只绵羊胸围和体重资料
计算出胸围与体重的相关系数为0.8475。
上述根据实际观测值计算得来的相关系数r是样本 相关系数, 它是双变量正态总体中的总体相关系数ρ 的估计值。样本相关系数r是否来自ρ≠0的总体,还 须对样本相关系数r 进行显著性检验。 此时无效假设、 备择假设为HO:ρ=0,HA:ρ≠0。与直线回归关系显 著性检验一样,可采用t检验法与F检验法对相关系数 r的显著性进行检验。
对于【例】,因为 df =n-2=10-2=8,
查附表8得:r0.05(8) =0.632, r0.01(8)
=0.765,而r=0.8475> r0.01(8) ,P<0.01, 表明绵羊胸围与体重的相关系数极显著。
(四)、相关系数与回归系数的关系
直线相关分析与回归分析的研究对象都是呈直线关 系的相关变量。直线回归分析将二个相关变量区分为 自变量和依变量,侧重于寻求它们之间的联系形式— —直线回归方程;直线相关分析不区分自变量和依变 量,侧重于揭示它们之间的联系程度和性质——计算 出相关系数。两种分析所进行的显著性检验都是解决 y与x间是否存在直线关系。因而二者的检验是等价 的。即相关系数显著,回归系数亦显著;相关系数不 显著,回归系数也必然不显著。
例如: 某地方病研究所调查了8名正常儿童的尿肌酐
含量(mmol/24h)。估计尿肌酐含量(Y)对其年龄 (X)的回归方程。
从散点图可以看出: ①两个变量间有关或无关;若有关,两个变量 间关系类型,是直线型还是曲线型; ②两个变量间直线关系的性质(是正相关还是 负相关)和程度(是相关密切还是不密切);
(五)、应用直线回归与相关的注意事项 直线回归分析与相关分析在生物科学研究领
域中已得到了广泛的应用,但在实际工作中却 很容易被误用或作出错误的解释。为了正确地 应用直线回归分析和相关分析这一工具,必须 注意以下几点:
1、变量间是否存在相关 直线回归分析和相关分析毕竟是处理变量间关系 的数学方法,在将这些方法应用于生物科学研究时要 考虑到生物本身的客观实际情况,譬如变量间是否存 在直线相关以及在什么条件下会发生直线相关,求出 的直线回归方程是否有意义,某性状作为自变量或依 变量的确定等等,都必须由生物科学相应的专业知识 来决定,并且还要用到生物科学实践中去检验。如果 不以一定的生物科学依据为前提,把风马牛不相及的 资料随意凑到一块作直线回归分析或相关分析,那将 是根本性的错误。
(三)、相关系数的显著性检验
统计学家已根据相关系数r显著性t检验法计算出了 临界r值并列出了表格。 所以可以直接采用查表法对相 关系数r进行显著性检验。
先根据自由度 n-2 查临界 r 值 ( 附表8 ), 得 r0.05(n2) ,r0.01(n2)。若|r|< r0.05(n2),P>0.05,则相 关系数r不显著,在r的右上方标记“ns”;若 r0.05(n2) ≤|r|< r0.01(n2) ,0.01<P≤0.05,则相关系数 r 显 著,在r的右上方标记“*”;若|r|≥ r0.01(n2) ,P ≤ 0.01, 则相关系数 r 极显著,在 r 的右上方标记 “**”。