生物医学统计分析实验7报告汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大理大学实验报告
2015—2016学年度第 2 学期
课程名称生物医学统计分析
实验名称回归分析
专业班级 2013级生物医学工程
姓名朱广能马凯
学号 44 24
实验日期 2015年12月31日
实验地点工科楼503
一、实验目的
1.熟悉数据管理的相关操作。
2.学会数据的一些基本统计分析方法及操作。
二、实验环境
1.硬件配置:处理器(Intel(R) Pentium(R) 4 cpu
2.80GHz)、CD-ROM驱动器、鼠
标、内存1GB(1024MB)、32位操作系统
2.软件环境:IBM SPSS_Statistics_19_win32
三、实验内容
(一)回归分析
回归分析通过“回归”过程来实现,该模块主要包括以下几个命令:
自动线性建模;线性(线性回归分析);曲线估计(曲线回归分析);二元Logistic(二元Logistic回归分析);非线性回归分析等。
(二)回归分析的一般方法
1.确定回归方程中的因变量和自变量
2.确定回归模型
3.建立回归方程
4.对回归方程进行各种检验
5.利用回归方程进行检验
(三)一元线性回归分析 [Eg8.1]
其分析的任务是根据若干个观测值(x i,y i)i=1,2,…,n找出描述两个变量x与
y
之间关系的线性回归方程:
(四)多元线性回归分析(linear过程) [Eg8.2]、[习题1]
在生物医学领域的许多实际问题中,常常需要研究一个因变量与多个自变量间的相关关系。比如动物的体重同时受体长、身高、胸围等性状的影响。因此需要进行一个因变量与对个自变量间的回归分析,即多元回归分析。在多元线性回归分析中,用户可以根据需要,选用不同删选自变量的方法(如:逐步法、向前法、向后法等)
(五)曲线回归分析(Curve Estimation过程)[Eg8.3]、[习题2]
在实际生产中,因变量x与自变量y间的相关关系并非一定是线性关系,更多的是各种各样的曲线关系。在许多情况下,曲线回归可以通过变量转运转换成线性形式来解决。曲线回归的基本分析过程是:先通过变量替换的方法把不满足线性关系的数据转换为符合线性回归模型的数据,再利用线性回归分析方法建立线性回归方程并进行显著性检验,然后再转换成曲线回归方程。
(六)生长曲线的方程拟合 [Eg8.4]
在生物生长过程中,初始阶段的生物量增长较缓慢,继之速度加快进入快速期,而后又转入缓慢期,直至停止生长,呈“S”型,称为生长曲线,属于非线性回归。
1.Logistic曲线方程的拟合
2.Gompertz和Von Bertalanffy曲线方程的拟合
表8.1-1给出了饲料消耗和体重的描述性统计量;
表8.1-2可见,相关系数r=0.818,显著概率(Sig.)P=0.002<0.01,即体重和饲料消耗之间是极显著正相关关系;
表8.1-3是有关线性回归模型的参数,“R”相当于两个变量的简单相关系数r;
“R方”即相关系数的平方值,也称为决定系数r2或拟合度R2,其值为0.670,表示因变量饲料消耗量的变异中有67.0%是由自变量体重的不同造成;“调整R方”
是修正的决定系数,为0.629.“标准估计的误差”是估计值的标准误差,记为S yx。即:
表8.1-4为回归关系的显著性检验的方差分析结果。可见 F =16.232,P =0.004<0.01
表明体重对饲料消耗量存在极显著的线性回归关系,所建立的回归方程是有意义的。
表8.1-5为回归系数表,可见回归系数,可见回归系数b=7.690,截距(常数项)a=55.263,因此可建立以下回归方程:
截距的标准误差为9.535。回归系数b的标准误差S b为1.909,其公式为:
表8-6还给出了回归系数显著性检验结果:回归系数b检验的统计量t值为
4.029,
P =0.004<0.01,截距a检验的统计量t值为5.796,P =0.000<0.01,即体重与饲消
耗量的回归系数均极显著,表明体重与饲料消耗量间存在极显著地线性关系,可用
所建立的回归方程来进行预测和控制。
[例8.2]根据某猪场25头育肥猪4个胴体性状的数据资料,然后进行廋肉量y对其眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的多元线性回归分析
表8.2-1 廋肉量y、眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的相关性分析
瘦肉量眼肌面积腿肉量腰肉量
Pearson 相关性瘦肉量 1.000 .279 .851 .606
眼肌面积.279 1.000 .220 .183
腿肉量.851 .220 1.000 .340
腰肉量.606 .183 .340 1.000
Sig. (单侧)瘦肉量. .088 .000 .001
眼肌面积.088 . .146 .190
腿肉量.000 .146 . .048
腰肉量.001 .190 .048 .
N 瘦肉量25 25 25 25
图8.3-2体重和体长的S型曲线的拟合效果图
分析:
表8.3-1列出所选择的10种曲线方程的回归系数b0(常数项)、b1、b2、b3,拟合
度R2,自由度(df),回归方程显著性检验的F值,显著性概率P(sig.)。
10中曲线拟合结果为:
(1) 线性方程: y=-18.221+0.2373x
(2) 对数曲线方程:y=-110.782+25.4810 lnx
(3) 逆函数曲线方程:y=33.0626+(-2523.610/x)
(4) 二次曲线方程:y=9.4158-0.2658x+0.0021x2
(5) 三次曲线方程:y=0.2157+0.000x-0.0003x2+7.08*10-6x3
(6) 复合曲线方程:y=0.1491(1.0327)x
(7) 幂函数曲线方程:y=2.07*107x3.6492
(8) S曲线方程:y=e(5.3920-382.771)/x
(9) 生长曲线方方程:y=e(-1.9034+0.0322)*x
(10) 指数曲线方程:y=0.149 le0.0322x
从表8.3-1中可见,10个曲线模型的F检验的P(sig.)值都远小于0.01,说明模型成
立的统计学意义都非常显著,这可能与样本含量太少有关。拟合度R2的大小表
示了回归曲线方程估测的可靠程度的高低,本例拟合度R2最大的是S曲线方程
R2=0.989,故相对而言S曲线方程为描述体重与体长关系的最优方程。
图8.3-2是10种曲线方程的拟合效果图。
[例8.4] 拟合猪的生长曲线
表8.4-1 Logistic模型迭代历史记录b
迭代数a残差平方和
参数
A B K