医学统计学简单回归分析精品PPT课件
医学统计学十六篇Logisic回归分析精品PPT课件
4
1
1
416
265 151
2021/1/6
医学统计学
18
经 logistic 回归计算后得
经经lol经 og经igslitlsoioctgigics回 ist经回 itci归回cl归o回 归计g计 is计归 算ti算 c算计 后回后 后算 得归得得后计: b得 0算=后 -0.得9099, Sb0 =0.1358;b1 =0.885 b0b=0 =-0-b.009.=09-90099., 9b0,09=S9b-S00, b=0.9=00S.091b0.931=, 53085.S; 18b03;=5Sb018bb1.=; 11==0305.0b.8811.88; =558065b0.1, 86;=8,05b.682, 8=506.,5261, Sb2 =0.15 SSb1 b=1 =0S.01b.151=05000.; 10S5;b01b=02b0; =2.1=05b.0502.025=; 62016.b, 5122,吸 =6S01Sb烟 .2, 5b=22与 =06S.10b1不 , 2.51=75吸 S027b.212烟 =507的 .215优72势比:ORˆ1 exp 吸吸烟烟吸 与与烟 不不与 吸吸吸不 烟烟 烟吸 的与 的烟 优不 优的 势吸势优 比烟比势 : 的:O比 优 OROR1ˆ: 势 1R的ˆ1比 Oe9xReˆ: p51xbp1Obe1可 Rˆx1epx信 ebpe1xxp0区 p.08eb.18x8间5p8650e:=x6.8p2=8.0245..82648=2526.=422.42 OORR1 的1O的R9159的5可 O9可 5R信 1 的 信可 区区 9信 间 5间区 :可: 间信:区ex间 p[b:1 u0.05/ 2Sb1 ] exp(0.8856 1.96 0 饮 ex饮 epx酒[p酒 b[饮 1与 ebx1与p酒 u不[0u不 b.010与 5饮 .0/52饮 饮 e/Su不 2酒 xbS01p酒 酒 .0]b[15饮 的 b/]12与 的Se酒 优bxeu1不优 p]x0.的 (势 0p5饮 0(/势e2.08优 S比 x酒 .8b8p比 15]8(势 :的 605:饮 .6e8比 O优 x81pR酒5.ˆ19(势 :260.69.与 86比e810x5不 .:.9p0616.b51饮2015.009酒).0e61x)5p的00(01.0(1..1优 5)85.21086,0势 13(1),1.32.比 8.521(11).5,6.:3)89.12, 35.)25) OOORO2RRˆ的 22RˆO的 2OOReeR92xRxe2ˆ59p的 2px5bp(的b2b可 eO2929x可 OR5e5pex信 21Rxˆbep的 2.信 p2x9(可可 b区 0p62.e区 09S5信ex信 .间 52bx5p126p间 2区).b91区 620:6可 1.间:5Se1间 e2bx信 2:x.616)pp1.9:O6(区 009.eRe5.1x5间 x22.p62p6的(196(:0b1.52192.6651191..99661可.S9b06信 2 .)105区.71e25x间7)p2(:0) (.15(2.126.421,42, 2.13..30906)) 0
精品课程医学统计学教学logistic回归分析 ppt课件
性结果发生的概率。阳性结果时,Yi 1 ;阴性结
果时,Yi 0 。
精品课程医学统计学教学logistic回 归分析
例15-1
表 15-1 为吸烟、饮酒与食管癌关系的病例-对照研究调查 资料,试进行 logistic 回归分析。
表 15-1 吸烟、饮酒与食管癌关系的病例-对照研究资料
分层 g 吸烟 X1 饮酒 X 2
符号
X 1
X 2
X 3
X4
X 5
Y
表 15-4 与肾细胞癌转移有关的因素及说明 说明
确诊时患者年龄(岁)
肾细胞癌血管内皮生长因子(VEGF),阳性表述由低到高共 3 级
肾细胞癌组织内微血管数(MVC)
肾癌细胞核组织学分级,由低到高共 4 级
肾细胞癌分期,由低到高共 4 期
肾细胞癌转移情况(有转移 Y =1; 无转移 Y =0)
或率比(rate ratio)。 RR Ie a /n1 、 I e a / n1 、 I 0 c / n2
I0 c / n0
RR(相对危险度relative risk):表示暴露组与非暴露组 发病率(或死亡率)的比值。也称为危险比(risk ratio)。 反映了暴露与疾病发生的关联强度。
精品课程医学统计学教学logistic回 归分析
logistic回归:不仅适用于病因学分析,也可用于其他方面的研究,研 究某个二分类(或无序及有序多分类)目标变量与有关因素的关 系。
logistic回归的分类: (1)二分类资料logistic回归: 因变量为两分类变量的资料,可用非
条件logistic回归和条件logistic回归进行分析。非条件logistic回归 多用于非配比病例-对照研究或队列研究资料,条件logistic回归多 用于配对或配比资料。
医学统计学课件:回归分析
线性回归模型的预测
利用模型进行预测
根据建立的模型,可以利用自变量值预测因变量值。
预测精度评估
通过比较预测值与真实值的差异,评估模型的预测精度。
预测范围扩展
如果仅有一个样本的数据,则可以利用该样本建立模型并预测其他 类似样本的数据。
03
逻辑回归分析
逻辑回归模型的建立
01
确定自变量和因变量
02
数据的概率化
04
多元线性回归分析
多元线性回归模型的建立
确定自变量和因变量
根据研究目的和已有的知识,确定影响因变量的自变量。
数据预处理
对数据进行清理、缩放和标准化等预处理,以提高模型的准确性和稳定性。
模型拟合
使用最小二乘法等数学优化方法,拟合出多元线性回归模型。
多元线性回归模型的评估
01
02
03
残差分析
观察残差是否符合假设, 如正态分布、独立同分布 等。
偏最小二乘回归分析
总结词
偏最小二乘回归分析是一种广泛应用的回归方法,它 通过构建两个投影矩阵,将自变量和因变量同时进行 线性投影,以解决传统最小二乘法在处理具有多重共 线性的自变量时的不足。
详细描述
偏最小二乘回归分析通过迭代的方式,分别计算自变 量和因变量的投影矩阵,从而对数据进行最佳投影, 以获得更准确的回归系数估计。这种方法能够有效地 处理具有多重共线性的自变量,提高回归模型的精度 和预测能力。在医学领域,偏最小二乘回归分析可以 应用于研究多个生物标志物对某种疾病的影响,以及 疾病的诊断和预测。
通过对手术患者的康复情况、生存率等指标进行数据分析, 评估手术效果及并发症风险。
评估药物疗效
通过对比药物治疗前后的生化指标、症状改善情况等数据, 评估药物治疗效果及不良反应发生风险。
第十二章 简单的回归分析卫生统计学考研PPT课件
到这条直线的上纵向距离的平方和为最小,
则称这一对a和b为与的最小二乘估计
(least estimation,LES)。
8
二)回归参数的估计方法 Yˆ abX
a为Y轴上的截距;b为斜率,表示X每改变 一个单位,Y的变化的值,称为回归系数;表 示 系数在,X值根处据Y数Y的ˆ 学总上体的均最数小估二计乘值法。原为理求,a和可b导两 出a和b的算式如下:
在通常情况下,研究者只能获取一定数 量的样本数据,用该样本数据建立的有关Y 与X变化的线性方程称为回归方程
(regression equYˆatioan)即b:X
3
在描述两变量的关系时,一般把两个变量中能 精确容易测量的作自变量,不易测量作为因变量。 即用易测量的数据X估计不易测量的另一数据。如 年龄估算小儿体重等。在描述凝血时间与凝血浓度 的依存关系中,将凝血酶浓度作为自变量( X ), 凝血时间作为应变量(Y)。由图12-1可见,凝 血时间随凝血酶浓度增大而减少且呈直线趋势,但 并非15点恰好全部都在一直线上。两变量数量间虽 然存在一定关系,但不是十分确定的。这与两变量 间严格对应的函数关系不同,称为直线回归 (Linear regression)。直线回归是回归分析中 最基本、最简单的一种,故又称简单simple regression)。
4
凝 20 血 时 19 间 ( 18 秒 ) 17
16
15
14
13
12
.5
.6
.7
.8
.9
1.0 1.1
1.2 1.3
凝血酶浓度(毫升)
图 12-1 凝血浓度与凝血时间的散点分布 5
二、回归模型的前提假设 线性回归模型的前提条件是:线性 (linear)、独立(independent),正态 (normal),等方差(equal variance) 1、线性是指反应变量Y的总体平均值与自 变量X呈线性关系。 2、独立是指任意两观察值互相独立。 3、正态性假定是指线性模型的误差项i服 从正态分布。 4、等方差是指在自变量X取值范围内,不 论X取什么值,Y都具有相同的方差。
医学统计学课件:回归分析
生存分析模型
生存分析模型概述
生存分析模型是用于研究生存时间与相关因素 之间关系的一种统计分析方法。
模型的建立与拟合
通过Cox比例风险模型等统计技术,拟合生存分 析模型,并评估模型的拟合效果。
生存曲线与影响因素
利用生存曲线描述生存时间与影响因素之间的关系,并评估不同因素对生存时 间的影响。
正态性
误差项应服从正态分布,即近似于钟形曲线。如 果误差项存在偏离正态分布的情况,需要采取措 施进行调整。
多重共线性诊断
定义:多重共线性是指自变量之间存在 较强的线性相关关系,导致模型估计失 真或不稳定。
特征值:如果特征值接近于0,则表明存 在严重的多重共线性问题。
条件指数:条件指数大于10表明模型受 到多重共线性的影响。
模型构建流程
数据清洗
对数据进行预处理,包括缺失值填充、异常值处理等,以确保数 据的质量和可靠性。
模型构建
根据已知的变量和因变量之间的关系,构建线性回归模型。
模型优化
通过逐步回归等方法对模型进行优化,以提高模型的预测精度和 稳定性。
模型评估指标
拟合优度
通过计算模型的R²值等指标,评估模型对数 据的拟合程度。
回归分析的分类
线性回归分析和非线性回归分析。
线性回归模型
线性回归模型的定义
线性回归模型是一种最常用的回归分析模型,其形式为Y = β0 + β1X1 + β2X2 + ... + βnXn。
线性回归模型的基本要素
因变量Y,自变量X1, X2, ..., Xn,以及模型中的系数β0, β1, ..., βn。
医学统计学课件:回归分析
03
信息提取
从回归模型中提取有意义的自变量组合和系数,为研究提供新的思路和方向。
多元回归模型的应用
01
预测
利用已建立的多元回归模型,预测新数据或未来数据的因变量值。
02
分类
结合回归模型和分类算法,将因变量进行分类,实现对数据的深度挖掘。
05
其他回归分析方法
总结词
岭回归分析是一种用于处理共线性数据的线性回归方法,通过引入一个惩罚项来改善模型的稳定性和预测精度。
通过线性回归模型,可以估计自变量对因变量的影响程度和方向。
在线性回归模型中,可以考察自变量之间的交互作用,以及自变量与因变量的交互作用。
03
逻辑回归分析
逻辑回归模型的建立
确定自变量和因变量
首先需要确定影响因变量哪些因素作为自变量,并明确因变量和自变量的关系。
数据的正态性检验
对各变量进行正态性检验,以确保数据满足正态分布的要求。
逻辑回归模型的检验
逻辑回归模型的应用
分层分析
根据预测结果,将研究对象分成不同的层,针对不同层进行差异性分析。
风险评估
根据预测结果,对研究对象进行风险评估,以更好地进行临床决策。
预测
利用训练好的模型,输入自变量的值,得到预测的概率值。
04
多元回归分析
多元回归模型的建立
确定自变量
根据研究目的和已有知识,选择与因变量相关的多个自变量。
线性回归分析
假设自变量和因变量之间存在非线性关系,通过建立非线性回归模型来预测因变量的取值。
非线性回归分析
回归分析的分类
回归分析的基本步骤
数据清洗
对收集到的数据进行清洗,包括处理缺失值、异常值、重复数据等。
精品课程医学统计学教学课件-logistic回归分析
详细描述
队列研究在医学中常用于评估危险因素对疾病发生和发展的影响,以及评估预防 措施的效果。通过长期追踪和研究对象的定期随访,收集各组人群的结局数据, 分析暴露因素与结局之间的关联。
随机对照试验
随着大数据和人工智能技术的不断发 展,Logistic回归分析在医学领域的 应用越来越广泛。未来的研究将更加 注重Logistic回归分析与其他先进技 术的结合,如深度学习、机器学习等 ,以提高模型的预测精度和稳定性。
未来的研究将更加关注Logistic回归 分析在临床实践中的应用,如疾病预 测、诊断和治疗方案的制定等。同时 ,如何将Logistic回归分析与其他统 计方法结合,以更好地解决医学实际 问题,也是值得探讨的方向。
课件采用了多种教学方法,如理论讲解、案例分析、软件操作等,使学生能够全面了解和 掌握Logistic回归分析的技能。
教学效果
通过本课件的学习,学生能够熟练掌握Logistic回归分析的基本原理和应用,提高解决实 际问题的能力,为后续的医学研究和临床实践打下坚实的基础。
研究展望
研究前沿
研究方向
教学改进
03
Logistic回归分析在医学 中的应用
病例对照研究
总结词
病例对照研究是一种回顾性研究方法,通过比较病例组和对 照组的暴露情况,探讨疾病与暴露因素之间的关联。
详细描述
在医学领域,病例对照研究常用于探讨病因、预测风险和评 估干预措施的效果。通过收集病例组和对照组的相关信息, 分析暴露因素与疾病发生之间的关系,为病因推断提供依据 。
利用样本数据,建立Logistic回归模 型,描述自变量与因变量之间的关系。
医学统计学课件:回归分析
回归分析在医学中的应用
05
疾病风险预测
利用回归分析,研究疾病发生的相关因素,如年龄、性别、遗传等,从而预测个体或群体在未来患某种疾病的风险。
预防措施制定
通过了解疾病影响因素,制定针对性强的预防措施,如控烟、控糖、加强锻炼等,以降低疾病发生概率。
疾病预测与预防
治疗效果评估与优化治疗方案
通过对比治疗前后的数据,利用回归分析研究治疗效果的影响因素,如治疗方式、病情严重程度等,为改进治疗方案提供依据。
时间序列回归分析
分位数回归分析是一种非参数回归方法,用于估计因变量的分位数与自变量之间的关系。
总结词
在分位数回归分析中,我们通常将因变量的值分成一系列的分位数,然后估计每个分位数与自变量之间的关系。这种方法可以更加灵活地描述因变量与自变量之间的关系,并且可以更好地适应各种不同的数据类型。
详细描述
分位数回归分析
总结词
多元回归分析
总结词
时间序列回归分析是一种特殊的回归方法,用于研究时间序列数据之间的依赖关系和预测未来趋势。
详细描述
在时间序列回归分析中,我们通常有两个或更多的时间序列数据,它们在时间上具有连续性。通过时间序列回归分析,我们可以估计各个时间序列对目标时间序列的影响程度,并对目标时间序列的未来趋势进行预测。
回归分析的基本步骤
线性回归分析
02
ቤተ መጻሕፍቲ ባይዱ
确定自变量和因变量
建立回归模型
模型假设检验
线性回归模型的建立
03
模型诊断
通过残差图、残差与预测值图等图形工具,对模型的假设和适应性进行诊断。
线性回归模型的评价与诊断
01
模型拟合度评估
应用R^2、校正R^2等指标,评估回归模型对数据的拟合程度。
医学统计学课件:回归分析
《医学统计学课件:回归分析》xx年xx月xx日CATALOGUE目录•回归分析概述•线性回归分析•逻辑回归分析•多重回归分析•回归分析的软件实现•回归分析的应用场景与实例01回归分析概述回归分析是一种统计学方法,研究因变量与自变量之间的关系,并预测因变量在给定自变量值下的值。
定义回归分析旨在找出一个或多个自变量与因变量之间的定量关系,以便根据自变量的值预测因变量的值,或者评估因变量在自变量变化时的稳定性。
目的定义与目的线性回归研究因变量与一个或多个自变量之间的线性关系。
多重回归研究因变量与多个自变量之间的关系,同时考虑它们之间的相互作用。
逻辑回归研究分类因变量与一个或多个自变量之间的关系,主要用于二元分类问题。
非线性回归研究因变量与一个或多个自变量之间的非线性关系,如曲线、曲面等。
回归分析的种类0102确定研究问题和研究设计明确要研究的问题和设计实验或收集数据的方式。
数据收集和整理收集与问题相关的数据,并进行整理和清洗。
选择合适的回归模型根据数据的特征和问题的需求选择合适的回归模型。
拟合模型使用选定的模型对数据进行拟合,得到回归系数。
模型评估评估模型的性能和预测能力,通常使用统计指标如R²、均方误差等。
回归分析的基本步骤03040502线性回归分析线性回归分析是一种预测性的统计方法,它通过研究自变量(通常是多个)与因变量(我们想要预测或解释的变量)之间的关系,建立它们之间的线性关系模型。
模型线性回归模型通常表示为 y = β0 +β1*x1 + β2*x2 + ... + βn*xn + ε,其中 y 是因变量,x1, x2, ..., xn 是自变量,β0, β1, ..., βn 是模型参数,ε 是误差项。
定义定义与模型VS参数估计线性回归分析的参数通常通过最小二乘法进行估计,这种方法试图找到最适合数据的一组参数值,使得因变量的观察值与预测值之间的平方误差最小。
假设检验在检验自变量与因变量之间是否存在显著线性关系时,通常会使用 F 检验或 t 检验。
【医学PPT课件】简单回归分析
2. 以各组的染毒剂量和钙调素的组均值计算的相关系 数r=-0.9996,P<0.05,故有染毒剂量与钙调素 含量呈负相关;
3. 通过染毒剂量预测钙调素含量效果很好。
请讨论:
1. 对该研究数据进行方差分析的目的是什么?
2. 染毒剂量和钙调素的相关分析应该怎么做?
3. 为了探讨小鼠脾淋巴细胞内钙调素含量与氯 化镉染毒剂量的剂量—反应关系,应采用何 种分析方法?
4. 研究人员上述做法存在何种问题?
小结:
1. 相关表示两变量关系的方向和密切程度。 而回归则用函数方程表示应变量随自变 量变化的数量关系;
2. 对资料的要求不同:
染毒剂量与钙调素含量的分组信息
染毒剂量 (mg/kg/d)
样本含量
钙调素含量 (105ng/kg)
对照组
20
5.38±2.86
0.3
20
4.68±2.72
1.2Βιβλιοθήκη 204.32±2.26
2.4
20
3.70±2.67
对这份资料,研究人员坐了如下的统计分析:四个 剂量组间比较的方差分析、钙调素均值与染毒剂量 的相关系数、钙调素均值关于染毒剂量的线性回归。 结论为:
简单回归分析
胎龄(月)与胎儿身长均数(cm)统计结果
胎龄
4
5
6
7
8
9
10
身长均数 22.54 31.97 39.32 41.95 44.62 48.24 50.73
请讨论:
该研究的线性相关分析结果是否准确?用线性相 关分析来表达胎儿身长与胎龄之间的关系是否合 理?
《医学统计学教学课件》10简单回归分析
14 名中年健康妇女的基础代谢(kJ/d)与体重的测量值
编号 基础代谢 体重(kg) 编号 基础代谢 体重(kg)
1
4175.6
50.7
8
3970.6
48.6
2
4435.0
53.7
9
3983.2
44.6
3
3460.2
37.1
大长度)做了测量,发现:
儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关系:
Y ˆ33.730.516X
即高个子父代的子代在成年之后的身高平均来说不是 更高,而是稍矮于其父代水平,而矮个子父代的子 代的平均身高不是更矮,而是稍高于其父代水平。 Galton将这种趋向于种族稳定的现象称之“回归”。
1.方差分析
理解回归中方差分析的基本思想,需要 对应变量Y的离均差平方和lYY作分解。
Y的离均差, 总变异
残差 回归变异
最小二乘法 标准误计算
图中,任意一点 P 的纵坐标被回归直线Yˆ 与均数 Y 截成三个线段,其中:Y Y (Yˆ Y ) (Y Yˆ ) 。由于 P 点是散点图中任取的一点,将全部数据点都按上法 处理,并将等式两端平方后再求和则有
Regression 释义
14 名中年健康妇女的基础代谢(kJ/d)与体重的测量值
编号 基础代谢 体重(kg) 编号 基础代谢 体重(kg)
1
4175.6
50.7
8
3970.6
48.6
2
4435.0
53.7
9
3983.2
44.6
3
3460.2
37.1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
体重(kg)
变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定。 当变量 X 取某个值时,变量Y取值可能有几个。 各观测点分布在直线周围
误差与残差
Y xYY|X称为随机误差
ˆ Y Y Y a b x 称为残差(residual)
30 35 40 45 50 55 60 65 70 75
体重(kg)
图11-1 14名健康中年妇女的基础代谢与体重的散点图
散点图显示年龄组的基础代谢的样本均数与体重 几乎在一条直线上,略有些偏离直线的点可以理解 为样本均数的抽样误差所致,因此可以假定固定基
础代谢的总体均数μ Y∣X与体重X 的关系可能是直线
关系,即有:
回归直线的截距参数 (intercept)
μ = Y∣X α+βX
回归直线的斜率参数(slope) 又称回归系数(regression coefficient)
上述直线方程称为线性回归模型 linear regression model
通常情况下,研究者只能获得一定数量的样本数 据,用样本数据建立的有关Y依从X变化的线性表达 式称为回归方程(regression equation),记为:
矮个子父子 高个子父子
线性回归(linear regression )又称简单回归
(simple regression ) :讨论两个变量间的数量依存关
系的统计方法,即研究一个变量如何随另一个变量变化 的常用方法。
两个变量:
因变量dependent variable 反应变量 response variable
normal 正态性
equal variance 等方差性
因变量Y 的总 体平均值与 自变量X呈线
第十二章 简单回归分析
统计推断的两个主要内容:
参数估计和假设检验
t 检验 方差分析 卡方检验 秩和检验
指标变量之间关系 相关分析
回归分析
简单回归分析
1.1 线性回归的概念及其统计描述 1.2 线性回归模型的适用条件 1.3 回归参数的估计 1.4 总体回归系数β的统计推断 1.5 线性回归的应用
表11-1 14名健康中年妇女的基础代谢与体重的测量值
编号
1 2 3 4 5 6 7
基础代谢 (kg/d)
4175.6 4435.0 3460.2 4020.8 3987.4 4970.6 5359.7
体重 (kg)
50.7 53.7 37.1 51.7 47.8 62.8 67.3
编号
8 9 10 11 12 13 14
Yˆ abx
➢ 称 Y ˆ 为Y 的预测值;其意义为固定 x,Y 的
总体均数 μ Y∣X 的估计值。
➢ a与b分别为回归模型参数α和β的估计值。
以样本数据,可算出α和β的估计值a 和 b。后在 直角坐标系以X为横坐标,Y 为纵坐标作图,图 形是一条直线,斜率为b,截距为a。
5800
5300
基础代谢(kJ/d)
根据上述,直线回归分析要求资料满足固定X, 则Y 服从正态分布等价于残差服从正态分布。
直线回归原理示意图:
所以如果固定X,Y 服从正态分布,其 散点图呈直线带状分布
线性回归的分类:
I 型回归 :因变量(Y)是随机变化的,但自变量
(X)可以不随机 ,当它是能够精确测量和严密控制 的量时,叫Y 关于X 的I型回归。
基础代谢 (kg/d)
3970.6 3983.2 5050.1 5355.5 4560.6 4874.4 5029.2
体重 (kg)
48.6 44.6 58.6 71.0 59.7 62.1 61.5
基础代谢(kJ/d)
由散点图看基础代谢与体重可能是直线关系
5800 5300 4800 4300 3800 3300 2800
类
化趋势,叫~。
多重线性回归 muptiple linear regression
:涉及多个变量了1087对父子:
1.父代的总均数=68英寸 子代的总均数=69英寸
2.高个子的父代:72英寸 而它子代:71英寸
矮个子的父代:64英寸 而它子代:67英寸
2. 对这些关系式的可信程度进行各种统计检验, 并从影响某一特定变量的诸多变量中找出具有 统计学意义的变量;
3. 利用所求的关系式,根据一个或几个变量的取 值来预测或控制另一个特定变量的取值,并给 出这种预测或控制的精确程度。
二、线性回归模型的适用条件
line
linear 线性
independent 独立性
4800
4300
Yˆ abx
3800
3300
2800 30 35 40 45 50 55 60 65 70 75
体重(kg)
利用回归方程,只要给定一个40-60岁的健康妇女的 体重值,就可估计出该个体的基础代谢值Y的平均值Y ˆ 。
基础代谢(kJ/d)
线性回归关系的特点:
5800 5300 4800 4300 3800 3300 2800
10.1 什么是回归?
1. 线性回归分析 linear regression analysis
:研究一个变量和另外一些变量间线性数量关系的 统计分析方法。
简单线性回归 simple linear regression
:模型中只包含两个有“依存关系”的变量,一
分
个变量随另一个变量的变化而变化,且呈直线变
II型回归 :因变量(Y)和自变量(X)都是随机
变化的,叫Y 关于X 的II型回归。
表12-1 不同IgG浓度下的沉淀环数据
IgG浓度(IU/ml)X
1
2
3
4
5
沉淀环直径(mm)Y 4.0
5.5 6.2 7.7
8.5
小结:回归分析(Regression analysis)
1. 从一组样本数据出发,确定变量之间的数学关 系式;
:非独立的、受其它变量影响的变量,常用 “Y”表示。
自变量 independent variable或预测因子 predictor 或 解释变量explanatory variable
:能独立自由变化的变量,常用“X”表示。
例11-1:对14名40-60岁健康妇女的基础代谢(Y) 与体重(X)的相关系数r =0.964,现问基础代谢 (Y)是如何依存体重(X)变化而变化的?