生物统计学 实验报告 大肠杆菌
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A 题 细胞体内代谢物浓度预测
随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。
对代谢物的检测及浓度测定主要采用实验方法,包括核磁共振、气相色谱-质谱联用和液相色谱-质谱联用等技术。但由于代谢物种类繁多,且大部分浓度较低(μM 数量级),尤其是胞内代谢物提取难度非常大,精确测定其浓度异常困难,而且实验测定需要消耗大量财力物力和人力,因此通过计算机方法对代谢物浓度预测和分析变得越来越重要。
活细胞的代谢物浓度由什么决定?除了一些特定的代谢和酶的作用以外,有没有那种能全局影响浓度值的性质?
试根据附件中的数据完成如下问题:
1 根据不同类型的数据,分析代谢物浓度与其物理化学性质之间的关系。
2 筛选合适的物理化学性质,建立预测代谢物浓度的预测模型,并对此模型进行评价;
1.线性插补法处理缺失数据
原理:用该列数据缺失值前一个数据和后一个数据建立线性插值,然后用缺
在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。 代谢物浓度:取对数 代谢物理化性质:标准差标准化法
)1,1( m j n i S x x x j j ij ij
≤≤≤≤-=' 式中:.)(11,1121
∑∑==--==n i j ij j n i ij j x x n S x n x 3.SAS 软件建立多元线性回归方程
回归模型一般形式:
u X b X b X b b Y k k +++++= (22110)
上式表示数据中应变量Y 可以近似地表示为自变量1X ,
2X …k X 的线性函数。0b 为常数项,1b …k b 为偏回归系数,表示在其它自变量保持不变时,i X 增加或减少一个单位时Y 的平均变化量,u 是去除k 个自变量对Y 影响后的随机误差(残差)。
适用条件:
1、解释变量 Xi 是确定性变量,不是随机变量;
2、解释变量之间互不相关,即无多重共线性。
3、随机误差项不存在序列相关关系
4、随机误差项与解释变量之间不相关
5、随机误差项服从0均值、同方差的正态分布
检验的目的:检验Y 与解释变量1X ,2X ,……k X 之间的线性关系是否显著。
检验的步骤:
第一步,提出假设:
原假设:H 0:b 1=b 2=……b k =0
备择假设:H 1:b i 不全为0 (i=1,2,…,k )
第二步,计算统计量:
)1,( )
1/(/----=k n k F k n SSE k SSR F 第三步,查表,得:)1,(--=k n k F F αα
第四步,做检验:
对大肠杆菌(E.coli) 的建模
首先对各个大肠杆菌代谢物浓度进行数据整理,取各大肠杆菌代谢物浓度的平均值作为大肠杆菌真实代谢物浓度。用SAS 软件建立回归方程并进行显著性检验,可以得到以下结果:
表1 大肠杆菌代谢物浓度与理化性质回归分析
来源 自由度 平方和 均方和 F 值 Pr>F
样本 17 29.60566 1.74151 6.76 <0.0001
误差 195 50.23727 0.25763
总和 212 79.84294
由方差分析表可知,其F value=6.76,pr>F 的值小于0.0001,远小于0.05,
故拒绝原假设,接受备择假设,认为y1与x1-x17之间具有显著性的线性关系,即大肠杆菌代谢物浓度与其物理化学性质之间有非常显著的线性关系的关系。
参数估计公式:Y X X X B T T ^
1)(-=
大肠杆菌(E.coli) 代谢物浓度的预测模型
回归方程显著性检验:
Variable x6 Entered: R-Square = 0.5534 and C(p) = 7.0551
由方差分析表可知,其F value=494.06,pr>F 的值<0.0001,远小于0.05,故拒绝原假设,接受备择假设,认为y1与筛选后的理化性质之间具有极显著性的线性关系。
参数显著性检验:
由参数估计表可知,在置信水平为85%情况下,对常数检验F 值为F=4.16578,Pr>F 的值<0.0001,远小于0.05,说明截距项通过检验,估计值为
4.16578。同理可知其余筛选后的变量均通过检验,由上表可建立线性回归方程:
--++++-=138764318945.021380.010880.018029.014304.059655.0x x x x x x y
16578.420786.019695.010081.0171514+-+x x x