生物统计学_(新)ioz2010
生物统计学第一章知识总结
掌握生物统计学的概念和特点
生物统计学(biostatistics): 数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。
特点:1 通过样本推断总体(基本特点)
2 有很大的可靠性,但有一定的错误率
3 生物统计学研究对象是生物有机体,具有特殊的变异性,随机性和复杂性。
掌握总体与样本,样本含量,参数与统计量的概念
总体:具有相同性质的个体所组成集合
样本:从总体中抽出的若干个体所构成的集合
样本含量:样本中个体的数目
参数:对一个总体特征的度量
统计量:由样本计算所得到的数值
掌握统计分析的基本要求
了解生物统计的作用及其主要内容
作用:1 提供整理和描述数据资料的科学方法,确定某些形状和特性和数量特征2判断试验结果的可靠性
3提供由样本推断总体的方法
4提供试验设计的一些重要原则
主要内容:试验设计和统计分析
试验设计:试验设计的基本原则,试验设计的方案的制定和常用试验设计的方法
统计分析:数据资料的搜集,整理和特征数的计算,统计推断,方差分析,回归
和相关分析,协方差分析。
了解错误与误差,准确性和精确性的概念
错误:在试验过程中,人为因素所引起的差错。
误差:试验中不可控因素所引起的观测值骗离真值的差异。
准确性:在调查或试验中某一试验指标或性状的观测值与真值接近的程度
精确性:在调查或试验中同一试验指标或形状的重复观测值彼此接近程度的大小。
第一章绪论生物统计学演示文档
三、准确性与精确性
• (一)准确性(accuracy)也叫准确度,指在 调查或试验中某一试验指标或性状的观测值与其 真值接近的程度。
• (二)精确性(precision)也叫精确度,指调 查或试验中同一试验指标或性状的重复观测值彼 此接近的程度。
• 调查或试验的准确性、精确性合称为正确性。
A 准确度和可靠度都好
• 随机误差影响试验的精确性。统计学上的试验 误差指随机误差。
(二)系统误差也叫片面误差(lopsided error),这是由于试验动物的品种、年龄、性别、 病程等不同,饲料种类、品质、数量、管理指施 相差较大,仪器不准、标准试剂未经校正,药品 批次不同、药品用量以及种类不符合试验计划的 要求,以及观测、记载、抄录、计算中的错误所 引起。在试验中是可以避免的。
系统误差影响试验的准确性。
第四节 平均数、标准差与变异系数
• 次数分布表和次数分布图,可以形象、直观地 表示出资料的两个特征——集中性和离散性。为 了更简单、精确地描述资料的特征,本节介绍三 个统计量:平均数、标准差和变异系数。
• 平均数反应资料的集中性,标准差和变异系数 反应资料的离散性。
•
一 、 平均数(Mean)
• (一)算术平均数的定义 • 资料中各观察值的总和除以观察值的个数所得
的商,称为算术平均数。在统计学中,简称为平
均数或均数。用符号 x表示。
• (二)计算方法 • 1、直接法 对样本含量较小,未分组的资料
适用。
n
xx1x2 xn i1 xi
n
n
n
• 其中,(Sigma)为总和符号,i 1 x i表示从第
第一章绪论生物统计学
优选第一章绪论生物统计学
第一章 绪 论(perface)
生物统计学
退 出
样本容量(sample size)
样本中所包含的个体数目叫或大小,
样本容量常记为n。
通常把n≤30的样本叫小样本,n
>30的样本叫大样本。
上一张 下一张 主 页
退 出
随机抽样(random sampling)
所谓随机抽取的样本是指总体中的每一个 个体都有同等的机会被抽取组成样本。 样本毕竟只是总体的一部分,尽管样本具有 一定的含量也具有代表性,通过样本来推断总体 也不可能是百分之百的正确。有很大的可靠性但
精确性(precision)也叫精确度,指调查或试 验中同一试验指标或性状的重复观测值彼此接近 的程度。 若观测值彼此接近,即任意二个观测值xi 、xj
相差的绝对值|xi -xj |小,则观测值精确性高;
反之则低。
准确性、精确性的意义见图1-1。
调查或试验的准确性、精确性合称为正确性。
上一张 下一张 主 页
总体的一部分称为样本(sample);
含有有限个个体的总体称为有限总体;
包含有无限多个个体的总体叫无限总体;
上一张 下一张 主 页 退 出
假想总体
例如进行几种饲料的饲养试验,实际 上并不存在用这几种饲料进行饲养的总体, 只是假设有这样的总体存在,把所进行的
试验看成是假想总体的一个样本;
上一张 下一张 主 页
退 出
在调查或试验中应严格按照调查或试验计
划进行,准确地进行观测记载,力求避免人为
差错,特别要注意试验条件的一致性,即除所
研究的各个处理外,供试畜禽的初始条件如品 种、性别、年龄、健康状况、饲养条件、管理 措施等应尽量控制一致,并通过合理的调查或 试验设计努力提高试验的准确性和精确性。 由于真值μ常常不知道,所以准确性不易 度量,但利用统计方法可度量精确性。
生物统计学
• 主要内容: 1)数据的审核与修订 2)数据的汇总与分组 3)基本统计特征计算 4)用图表展示结果
1.资料的分类
什么是资料(data)? 资料有哪些种类?
连续性资料(comtinuous data)? 离散性(间断性)资料(discrete data)? 离散性资料又分成哪两类?
计数资料(counting data) 分类资料(categorical data)
1 资料的分类
特点:数字性、大量性、具体性 类型:
连续性资料:一定范围内可取任何实数值的 数据资料。如:身高 离散性资料:一定范围内只取有限值的数据。
计数资料:用计数的方式得到的数据资料, 如:人数,鸡蛋数
分类资料:以类别作为分类对象,如:性别
(variate)。
变量在某一个体具体表现出来的数值又称为变数或 称观测值(observed value)、数据(data)、 资料(data)
变量是和常量(constant)相对应的一个概念
参数和统计量 用来描述总体特征的数值称为参数(parameter) 由样本观测值计算得到的描述样本特征的数值称为
第二章 资料整理
1 资料的分类 2 数据的频率分布 3 数据的表示方法 4 集中趋势的度量计资料:指反映事物、现象或过程的数据资料。 包括原始资料和次级资料。
特点:
(1)数字性:数字形式或者可以转换为数字形式。 (2)大量性:大量相像或对同类相像观察所取得的
总体与样本的关系:样本必须来自于总体 样本必须能代表总体
如: 一叶知秋
管窥蠡测 尝鼎一脔
总体与样本关系不好的例子:
一叶障目 瞎子摸象
变异和变量
在实践中,无论是总体还是样本,无论是调查还是 试验,所得到的数值都是有差别的,这种差别在 统计学中称为统计数据的变异(variation)
生物统计学(第1讲)
式进行计算,其公式为:
举例说明
例1.5 根据例1.3中数据,计算20株小麦 株高的标准差。 解:由例1.3中的数据可知,fx = 1646, fx2 = 135524,将它们代入上述公式可得:
标准差的特性
(l)标准差的大小,受多个观测数的影响,
如果观测数与观测数间差异较大,其离均差也 大.因而标准差也大,反之则小。 (2)在计算标准差时,对在各观测数加上或 减去一个常数,其标准差不变。如果给各观测 数乘以或除以一个常数a,则所得的标准差扩 大或缩小了a倍。
极差、标准差、方差和变异系数等,其
中以标准差和变异系数应用最为广泛。
极差的定义及计算
极差又称全距,它是样本变量 中最大值和最小值之差,一般用R 表示。
方差的定义
为了度量其变异程度,对含有n个观测
数x1,x2,,xn的样本,可以用各观测
数离均差的大小来表示。但由于(x - x)
=0,不能反映其变异程度。若将离均差先 平方再求和,即(x - x)2,就可消除上
性的特征是平均数,其中应用最普遍的
是算术平均数。此外,还有几何平均数、 中位数和众数等。反映离散性的特征数 为变异数,常用的指标是极差、方差、 标准差和变异系数等,其中最为常用的
是标准差,它是变量的平均变异程度的
度量。
平均数的定义与作用
平均数是计量资料的代表
值,表示资料中观测数的中
心位置,并且可作为资料的
制,则其自由度为n-k。
标准差的计算
在计算标准差时,首先要先求
出平均数,然后求出(x - x)2 ,
再代入前面提到的公式进行计算。
标准差计算的简易公式
举例说明
例1.4 测得9名男子前臂长(cm)的样本数据,
生物统计学
• Neyman(1894~1981)和S.Pearson进行了统 计理论的研究工作,分别于 1936年和1938年提 出了一种统计假说检验学说。假说检验和区间估 计作为数学上的最优化问题,对促进统计理论研 究和对试验作出正确结论具有非常实用的价值。 • 另外,P.C.Mabellnrobis对作物抽样调查、 A. Waecl对序贯抽样、 Finney对毒理统计、 K. Mather对生统遗传学、F. Yates对田间试验 设计等都做出了杰出的贡献。
• 统计学用于生物学的研究,开始于19世纪末。1870年, 美国遗传学家Gallon(1822~1911)在19世纪末应用统 计方法研究人种特性,分析父母与子女的变异,探索其 遗传规律,提出了相关与回归的概念,开辟了生物学研 究的新领域。尽管他的研究当时并未成功,但由于他开 创性将统计方法应用于生物学研究,后人推崇他为生物 统计学的创始人。 • 在此之后,Gallon和他的继承人K.Plarson(1857~ 1936)经过共同努力于1895年成立了伦敦大学生物统计 实验室,于1889年发表了《自然的遗传》一书。在该书 中,K.Plarson首先提出了回归分析问题,并给出了计 算简单相关系数和复相关系数的计算公式。K.Plarson 在研究样本误差效应时,提出了测量实际值与理论值之 间偏离度的指数卡方(X’)的检验问题,它在属性统计 分析中有着广泛的应用。例如,在遗传上孟德尔豌豆杂 交试验,高豌豆品种与低豌豆品种杂交后,它的后代理 论比率应该是3:1,但实际后代数是否符合3:1,需用 进行检验。
•
(3)提供由样本推断总体的方法。试验的目的在于认识总体规 律,但由于总体庞大,一般无法实施,在研究过程中都是抽取总 体中的部分作为样本,用统计方法以样本来推断总体的规律性, 在这种推断中,统计原理和方法起到了理论上的保证作用。 • (4)提供试验设计的一些重要原则。为了以较少的人力、物 力和财力取得较多的试验信息和较好的试验结果,在一些生物学 研究中,就需要科学地进行试验设计,如对样本容量的确定、抽 样方法、处理设置、重复次数的确定以及试验的安排等,都必须 以统计学原理为依据。从统计分析和试验设计的关系来看,统计 学原理可以为试验设计提供合理的依据,而试验设计又是统计分 析方法的进一步运用。以统计学原理为指导,进行科学合理的试 验设计时,可以使在较少人力、物力、时间和条件下,得出可靠 而准确的数据和信息。以往有一些试验资料,由于设计不当而丧 失了大量的试验信息,究其原因多半是由于缺乏一定的统计知识, 使试验的效率大大降低。当然,统计原理和分析方法对试验设计 有着积极的指导意义,但它绝对不可能代替试验设计。如果试验 目的、要求不明确,设计不合理,试验条件不合适,统计数据不 准确,这种试验也绝对不会成功,统计原理和分析方法都不可能 挽救试验的这种失败。
生物统计学课后习题
2010级生物科学(师范) 王芳 1011410062 第五次作业 2012/9/28习题7.5 在研究代乳粉营养价值时,用大白鼠做实验,得大白鼠进食量(x,g )和 体重增加量(y,g )数据如下表:鼠号1 2 3 4 5 6 7 8进食量/g 800 780 720 867 690 787 934 750 增重量/g 185 158 130 180 134 167 186 133 (1) 建立直线回归方程(2) 对所建的直线回归方程进行显著性检验解:由题意知,进食量为自变量x ,体重增加量为依变量y (一)建立直线回归方程(1)计算回归分析的6个一级数据810182631337501869341587801858002066191273133186158185504881463287509347808001331861581857509347808002222222222==⨯+⨯++⨯+⨯=∑=++++=∑=++++=∑=++++=∑=++++=∑n xy y x y x(3) 依一级变量计算5个二级变量125.1598127379186328113208127363281018263))((875.4052820661943366850488141273)(6328)(222222=======⨯-=-==-=∑-==-=∑-=∑∑∑∑∑∑∑--n y n x n y x xy sp n ny x y yss x xss yx(4) 计算b 值和a 值535.4679126.0125.15926.04336611320-=⨯-=-====--x y ssb a spb x(5) 建立大白鼠体重增加量依进食量的直线回归方程:)791(26.0125.159-+=∧x y 从回归方程可知,大白鼠进食量每增加1g,其体重增加0.26g. (二)所建直线回归方程进行显著性检验(F 检验) (1)假设H:两变量间无线性关系,对HA:两变量间有线性关系(2)显著水平05.0=α (3)计算F 值675.11092.2943875.40522.29431132026.0=-=-==⨯==U Q bSP U SS y91.15)28(675.11092.2943)2(1=-⨯=-=n Q U F(4)依F 值进行统计推断表7-1回归关系的假设检验F >F 01.0,说明大白鼠进食量与体重增加量之间有极显著的直线回归关系。
生物统计学 第一章 生物统计学概述
xi fi
i 1 k
fi
k
xi wi
k
xi
fi
k
i 1
i 1
fi
i 1
i 1
【例 3】
组中值=(下限值+上限值)/2 表 1.2 150 名成年男子血清总胆固醇水平(mmol/L)
组段(i)
(1)
组中值(xi)
(2)
频数(fi)
(3)
fixi
(4)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75
n
举例1:试计算1,3,7,9的均数?
x x1 x2 ... xn 1 3 7 9 5
n
4
例2:试计算1,3,3,7,7,9,9,9的均数?
x x1 x2 ... xn 1 3 3 7 7 9 9 9 48 6
n
8
8
k
11 3 2 7 2 93 1 2 2 3
(1)
2.5~ 3.0~ 3.5~ 4.0~ 4.5~ 5.0~ 5.5~ 6.0~ 6.5~6.75
合计
150 名成年男子血清总胆固醇水平(mmol/L)测定
频数(fi)
(2)
累计频数(cfi)
(3)
累计频率 (4)
1
1
0~0.0067
9
10
0.0067~0.0667
26
36
0.0667~0.2400
(2) 120 99% 118.8 ,带有小数,
故取整 trunc(118.8)= 118
P99 Xtrunc(nX %)1 X(119) 42(天)
公式:
2.频数表法
生物统计学
生物统计学是数理统计在生物学研究中的应用,它是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的科学。
生物统计学的主要内容:1.试验设计(调查设计),广义的试验设计是指试验研究课题设计,狭义的试验设计主要是指试验单位 (如动物试验的畜、禽 )的选取、重复数目的确定及试验单位的分组。
广义的调查设计是指整个调查计划的制定,狭义的调查设计主要包含抽样方法的选取,抽样单位、抽样数目的确定等内容。
2.统计分析,统计分析最重要的内容是差异显著性检验。
另一个重要内容即进行相关分析与回归分析.总体:根据研究目的确定的研究对象的全体称为总体(population);个体:组成总体的基本单元称为个体(individual);样本:总体的一部分称为样本(sample);有限总体:含有有限个个体的总体称为有限总体;无限总体:包含有无限多个个体的总体叫无限总体;样本容量:样本中所包含的个体数目叫样本容量或大小(sample size),样本容量常记为n。
通常把n≤30的样本叫小样本,n >30的样本叫大样本;随机抽取(random sampling) 的样本:是指总体中的每一个个体都有同等的机会被抽取组成样本;统计分析的特点:通过样本来推断总体是统计分析的基本特点;有很大的可靠性但有一定的错误率这是统计分析的又一特点。
变量:相同性质的事物间表现差异性或差异特征的数据;通常用xi表示。
连续变量:表示在变量范围内可抽出某一范围的所有值,这种变量之间是连续的、无限的。
如小麦的株高。
非连续变量(离散变量):表示在变量数列中,仅能取得固定数值。
如菌落数、动物产仔数等。
常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
如样本的平均数、标准差等。
参数:由总体计算的特征数叫参数(parameter),是对一个总体特征的度量;统计数:由样本计算的特征数叫统计量(staistic),它是总体参数的估计值。
生物统计学课件
第二节 数据类型及频数(率)分布
1. 数据类型 2. 用图和表对样本数据进行定性归纳:
频数表和频数图
1. 数据类型:连续型数据和离散型 数据
数据
连续型数据: (度量数据)
指用量测手段得到的数量性状资料,即用度、 量、衡等计量工具直接测定的数量性状资料。 其数据是长度、容积、重量等来表示。例如: 身高、产奶量、体重、绵羊剪毛量等。这类 数据通常是非整数,数据的变异是连续的。
第一章 统计数据的收集与整理
第一节 总体与样本
1. 什么是生物统计学? 2. 生物统计学的一些重要术语 3. 本课程的主线
1.什么是生物统计学
• 生物统计学(Biostatistics)是数理统计学 的原理和方法在生物科学研究中的应用, 是用统计学方法分析和解释生物界各种现 象与数量资料的一门学科
组限 37~39 40~42 43~45 46~48 49~51 52~54 55~57 58~60 61~63 64~66
组限
组界
组中值
频数
频率
37
40
43
组下限
。。。
64
组限 37~39 40~42 43~45 。。。 64~66
组界
组中值
频数
频率
(4)在频数表中列出组界和中值。
由于测量精度的原因,第一组(组限为37~39)实际代表从36.5kg到39.5kg的 所有数据,因为连续型数据一般是小数,这里只是因为测量精度以及记录的方便 以整数表示出来。
3230 …
0032 …
选出位于1~2000的数:411,1828,32,768,1024,…,满20 个数为止。
• 这20个数对应的学生就是一个随机样本
生物统计学
BY pisces (仅作参考)生物统计学(Biostatistics )是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
属于生物数学的范畴。
P2生物统计学的基本作用:提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
运用显著检验,判断试验结果的可靠性或可行性提供由样本推断总体的方法。
提供试验设计的的一些重要原则。
具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;个体:组成总体的基本单元称为个体;样本:从总体中抽出若干个体所构成的集合称为样本 构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小,样本容量常记为n 。
一般在生物学研究中,通常把n ≤30的样本叫小样本,n >30的样本叫大样本。
对于小样本和大样本,在一些统计数的计算和分析检验上是不一样的。
研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。
变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。
常数,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
连续变量-- 可以有任何小树出现 变 定量变量 非连续变量--只有整数出现量 定性变量为了表示总体和样本的数量特征,需要计算出几个特征数,包括平均数和变异数(极差、方差、标准差等)。
描述总体特征的数量称为参数(parameter),也称参量。
常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差; 描述样本特征的数量称为统计数,也称统计量。
常用拉丁字母表示统计数,例如用表示样本平均数,用s 表示样本标准差。
通过施加试验处理,引起试验差异的作用称为效应。
效应是一个相对量,而非绝对量,表现为施加处理前后的差异。
效应有正效应与负效应之分。
互作,又叫连应,是指两个或两个以上处理因素间相互作用产生的效应。
生物统计学
第一章概论一、什么是生物统计学生物统计学主要内容和作用1、生物统计学是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。
属于生物数学的范畴2、主要内容基本原则对比设计试验设计方案制定随机区组设计常用试验设计方法裂区设计资料的搜集和整理拉丁方设计、正交设计统计分析数据特征数的计算统计推断、方差分析协方差分析、回归和相关分析主成分分析、聚类分析3、生物统计学的基本作用:(1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征(2)运用显著检验,判断试验结果的可靠性或可行性(3)提供由样本推断总体的方法(4)提供试验设计的一些重要原则二、解释概念:总体、个体、样本、变量、参数、统计数、效应、试验误差总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全体;个体:组成总体的基本单元称为个体样本:从总体中抽出若干个体所构成的集合称为样本变量:变量,或变数,指相同性质的事物间表现差异性或差异特征的数据参数:描述总体特征的数量称为参数,也称参量统计数:描述样本特征的数量称为统计数,也称统计量效应:通过施加试验处理,引起试验差异的作用称为效应试验误差:误差也称为实验误差,是指观测值偏离真值的差异,可分为随机误差和系统误差三、准确性与精确性有何区别准确性,也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。
精确性,也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。
准确性反应测量值与真值符合程度的大小,而精确性则是反映多次测定值的变异程度。
(具体在课本第7页)第二章样本统计量与次数分布一、算数平均数与加权平均数形式上有何不同为什么说它们的实质是一致的1. 算术平均数定义:总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值直接计算法或减去(加上)常数法加权平均数2、实质是一样的,是因为它们都反映的一组数据的平均水平二、为了评价两种药物对于小鼠体重的影响,随机从两组各抽出20只测定其体重(g),结果如下:药物A处理组: 15, 15, 23, 24, 26, 25, 22, 19, 15, 17, 15, 20, 23, 21, 19, 22, 26, 21, 18, 23药物B处理组: 31, 28, 26, 31, 28, 34, 32, 29, 32, 35, 28, 29, 33, 30, 34, 32, 36, 38, 40, 38试从平均数、极差、标准差、变异系数几个指标评价两种药物对于小鼠体重的影响,并给出结论。
《生物统计学》PPT课件
课程内容
一、试验方案设计的内容与要求 二、设计方案 三、田间区域 四、方案汇报 五、利用SPSS软件进行数据分析
第一次课
• 第一节 试验方案设计的定义 • 第二节试验方案设计方法 • 第三节 田间试验方案设计 • 第四节 常用的田间试验设计方法 • 第五节 田间试验的实施步骤 • 第六节田间试验的抽样方法
2、等比法 各相邻两个水平的数量比值相同。 油菜喷施不同浓度硼肥的各水平分别为7.5、 15、30、60(mg/kg),相邻两水平之比为1:2。 3、随机法 用随机的方法确定因素内的数量水平。 例如把喷施调节剂的浓度随机设定为0, 0.5,2,6,9(mg/kg)。
4、选优法
先选出因素水平的两个端点值,再以 G=(最大值-最小值)×0.618为水平间 距,用(最小值+G)和(最大值-G)的 方法确定因素水平。
精选ppt101品种试验2栽培试验3品种和栽培相结合的试验下一张下一张上一张上一张精选ppt111一年试验2多年试验1单点试验2多点试验下一张下一张上一张上一张精选ppt121预备试验2主要试验3示范试验1田间试验2温室试验3实验室试验下一张下一张上一张上一张精选ppt13小区试验大区试验下一张下一张上一张上一张精选ppt14一明确试验目的二根据试验目的确定参试因素三合理确定参试因素的水平下一张下一张上一张上一张精选ppt15各因素水平间间距的确定方法
• 播种时应力求种子分布均匀,深浅一致, 注意避免漏播和种子混杂,播完几行后检 查
• 进行移栽的作物,移栽时,要注意挑选大 小均匀一致的秧苗或分等级按比例混合后 等量分配于各小区。
五、栽培管理
• 保证除试验方案所规定的处理间差异小外, 其他栽培管理措施均应力求质量一致。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物统计学
教学目的和要求
本课程为生态学专业研究生的基础课,也可作为生物系相关专业研究生的选修课。
统计分析是大多数现代生物学的核心。
通过本课程的学习,要求学生较好地掌握生物统计学的原理和方法,以及常见的应用。
主要内容:
Lecture 1History and development of biostatistics 生物统计学的历史和发展
●Brief history of biostatistics 生物统计学简史
●Development and major contents of biostatistics 生物统计学的发展和主要内容
●Basic concepts 基本概念
✧Data types 数据类型
✧Descriptive statistics 描述性统计
●R code R程序
Lecture 2Probability distribution 概率分布
●Probability theory 概率论
●Common distributions of random variables 常见的随机变量的分布
✧Binomial distribution 二项分布
✧Poisson distribution 泊松分布
✧Negative binomial distribution 负二项分布
✧Normal distribution 正态分布
✧Chi square distribution 卡方分布
●R code R程序
Lecture 3Sampling and experiment design 抽样及實验设计的原理
✧理论抽样数的确定
✧抽样设计:随机抽样,分层随机抽样,系统抽样,适应性抽样,序贯抽样
✧实验设计的一般原理
✧随机化
✧重复和伪重复
✧平衡和区组
✧几种类型的实验设计
Lecture 4Hypothesis testing 1 假设检验1
●What is hypothesis testing? 什么是假设检验?
●Standard procedures 标准步骤
●Case studies 案例分析
✧T test and Z test T检验和Z检验
✧Situations of one tail and two tails 单尾和双尾的情况
✧One sample hypothesis tests and two samples hypothesis tests 单样本和双样本的
假设检验
✧Paired test 配对检验
●R code R程序
Lecture 5Hypothesis testing 2 假设检验2
●Type I and Type II Errors 第一和第二类错误
●Chi-square test 卡方检验
●Effective size 有效大小
●Power of test 统计功效
●R code R程序
Lecture 6Analysis of variance (ANOV A) 1 方差分析1
●Biological rationale of ANOV A 方差分析的生物学原理
●One-way ANOVA 单因素方差分析
●Random blocked design 随机区组设计
●Two-way ANOV A 双因素方差分析
●R code R程序
Lecture 7Analysis of variance (ANOV A) 2 方差分析2
●Repeated measures ANOV A 重复实验的方差分析
●Hierarchical ANOV A 嵌套方差分析
●Three-way ANOV A 三因素方差分析
●Latin Square Design 拉丁方实验设计
●Split Plot Design 裂区设计
●R code R程序
Lecture 8Simple linear regression and correlation 简单线性回归和相关
●Biological rationale of simple linear regression简单线性回归的生物学原理
●Least square 最小二乘法
●Regression coefficient (slope) and intercept 斜率和截距
●Significance of a regression 回归的显著性
●Assumptions of regression analysis 线性回归的假设
●Applications of simple linear regression 简单线性回归的应用
✧Comparing two slopes 两个回归斜率的比较
✧Comparing two elevations 两个回归截距的比较
✧Comparing more than two slopes 多个回归斜率的比较
●Biological rationale of simple linear correlation 简单线性相关的生物学原理
●Coefficient of Correlation 相关系数
●Power and sample size in correlation 相关分析的统计功效和样本量
●R code R程序
Lecture 9协方差分析Analysis of covariance (ANCOV A)
●Biological rationale of Analysis of covariance 协方差分析的生物学原理
●Assumptions of Analysis of covariance 协方差的假设条件
●Compared with ANOV A and regression 同方差分析和回归的比较
●Case studies 案例分析
●R code R程序
Lecture 10数据转化和非参数检验Data transformation and Nonparametric statistics
●数据转化Data transformation
✧Logarithmic transformation 对数转化
✧Square root transformation 平方根转化
✧Arcsine transformation 反正旋转化
✧Reciprocal transformation 倒数转化
✧Square transformation 平方转化
●Biological rationale of nonparametric statistics 非参数检验的生物学原理
●Sign test 符号检验
●Wilcoxon signed rank test 符号秩检验
●Wilcoxon rank sum test 秩和检验
●Kruskal-Wallis test Kruskal-Wallis检验
●Friedman’s Test Friedman检验
●R code R程序
Lecture 11Multivariate analysis 1 多元统计分析1
●Multiple regression 多元回归
✧Linear regression 线性回归
✧Non-linear regression 非线性回归
✧Evaluating Multiple Regression Model 模型评价
●Multiple correlation 多元相关
●Partial correlation 偏相关
●R code R程序
Lecture 12Multivariate analysis 2 多元统计分析2
●Cluster analysis 聚类分析
●Discriminant analysis 判别分析
●Principal component analysis 主成分分析
●R code R程序
Lecture 13Generalized linear model 广义线形模型
●Biological rationale of Generalized linear model广义线形模型的生物学原理
●Logistic Regression 逻辑斯蒂回归
✧Assumptions 假设
✧Biological means of coefficients 系数的生物学意义
✧Maximum likelihood estimation 最大似然估计
✧Goodness of fit 拟合优度
●Structure of Generalized linear model 广义线形模型的结构
✧Random component 随机组分
✧Systematic Component 系统组分
✧Link Function 连接方程
●Compared with general linear model 同一般线性方程的比较●Case studies 案例分析
●R code R程序。