统计案例分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

哺乳动物大脑发育水平相关因素回归分析

小组成员:

目录

一、数据来源及背景 (1)

1.数据来源 (1)

2.数据背景及研究目的 (1)

3.数据说明 (1)

二、统计分析 (1)

1.数据描述性分析 (1)

1.1 数据基本描述 (1)

1.2 置信区间分析 (2)

1.3 brain weight与body weight的数据相关性 (2)

1.4 所有参数的相关性 (3)

2.数据图形化分析 (3)

3.多元回归分析 (5)

3.1 原始数据直接多元回归分析 (5)

3.2 对多元回归原始数据处理和调整 (8)

3.3 数据模型的确定 (12)

3.4 对Cook距离的分析 (17)

三、总结 (18)

附录:研究数据 (19)

统计案例分析

一、数据来源及背景

1.数据来源

数据来源于American Naturalist (1974)杂志p.593-613.

2.数据背景及研究目的

达尔文在他的《进化论》一书中指出“生物之间存在着生存斗争,适应者生存下来,不适者则被淘汰,这就是自然的选择。生物正是通过遗传、变异和自然选择,从低级到高级,从简单到复杂,种类由少到多地进化着、发展着。”从达尔文的观点中我们可以得出动物具备使它们自身更好的生存和繁衍后代的能力,这是一种内在的属性。有一种观点认为,具备更大大脑容量的动物,比如哺乳动物在生存和繁衍方面一般会表现得更好。虽然,哺乳动物的自然选择有一些限制,比如他们通常需要更长的怀孕期并且一次孕育后代的数量更少。这些负面因素在一定程度上削弱了哺乳动物的优势。但是总体来说,哺乳动物的优势要大于它们的劣势。通常情况下,较大的大脑意味着躯体也更加的硕大。我们尝试用统计的方法,研究和分析一下具备更大大脑容量的哺乳动物之间具有什么样相同和不同的特征,在这些特征中是否会存在某些特别突出的因素。众所周知,哺乳动物是动物发展史上最高级的阶段,也是与人类关系最密切的一个类群。我们希望通过此次的论证和研究,能够得到关于一些哺乳动物大脑重量的信息,并找到与之相关联的因素,为促进哺乳动物大脑重量的研究提供可以参考的依据。

3.数据说明

我们小组分析的案例,是研究哺乳动物大脑重量和其他几种因素的关系。这些因素主要包括哺乳动物的妊娠期天数、身体重量以及平均每窝产仔数量。数据总共采集了96种不同哺乳动物的信息。当模型具有显著的统计意义并且样本足够大(n=96)时,可以获得比较准确的估计值。

二、统计分析

1.数据描述性分析

1.1 数据基本描述

我们对所采用的数据首先进行了简单的描述性分析,具体信息见下图。

从上图的描述性分析初步可知,哺乳动物的平均怀孕期为151天,平均大脑重量为219毫克,平均体重108公斤,平均每次产仔数量为2.3。

对数据置信区间的分析使我们得知了:

对数据gestation period,样本均值为151.3,标准误11.0,由此构造的区间(129.4, 173.2)有95%包括gestation period总体均值。

对数据brain weight,样本均值为219.0,标准误51.7,由此构造的区间(116.3, 321.7)有95%包括brain weight总体均值。

对数据body weight,样本均值为108.3,标准误33.6,由此构造的区间(41.6, 175.1)有95%包括body weight总体均值。

对数据av. Litter size,样本均值为2.310,标准误0.178,由此构造的区间(1.956, 2.664)有95%包括av. Litter size总体均值。

根据结果显示,哺乳动物的大脑重量和躯体重量是有非常强的相关性的。但是对brain weight取对数后,ln brain weight和body weight之间的相关性减弱。而ln brain weight和ln body

对brain weight和body weight取对数以后的整体相关性分析,可以粗略的看到,数据之间的相关性更加紧密,整体感觉好于之前的分析。

2.数据图形化分析

这里,我们分别观察了brain weight和body weight的散点图,以及ln brain weight和ln body weight的散点图。从第一张图上可以看到,绝大多数哺乳动物集中在图的左下角,也就是体重小于500公斤,大脑重量小于1000毫克的范围里。哺乳动物的体重变化范围还是相对较大的,下图中最大的体重是非洲象,体重2800公斤同时其大脑重量也达到了4480毫克,其次

是河马体重1400公斤。相对于体重,脑容量更重的两个物种则是人类和海豚。海豚的脑重量

我们还尝试使用箱线图的方式对四种变量进行简单的探索性数据分析,以便更直观的看到几种数据的分布概况。

3.多元回归分析

3.1 原始数据直接多元回归分析

我们以大脑重量为因变量,其他3种数据作为自变量,直接进行回归分析。回归结果如下:

数据分析:

根据假设检验的定义来初步分析一下回归结果,假设检验:⎩⎨⎧≠=0:0

:0μμa

H H

从回归方程上分析,常数项,gestation period 和body weight 的P-值很小,说明可以明显

拒绝原假设H 0。但是av. litter size 的P-值为0.116,不能拒绝原假设。因此,对数据的回归分析还需要进一步的分析和验证。

Brain weight 残差正态图和残差与拟合值图如下:

数据分析:

从残差的正态分布图和残差与拟合值图分析,明显可以看到残差和正态分布拟合的不好,具有异方差的特性,是非常数方差。因此,初始的设置对数据进行直接回归分析是不恰当的。考虑采用其他模型来重新进行回归分析。

相关文档
最新文档