1 绪论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节
生物统计的常见术语
Today: 2015-6-15
6、中位数和众数median and mode 中位数:在累积频数图中1/2总频数位置上的数值。 众数:离散型数据的众数是频数图中频数最高的组 值;连续型数据的众数是频数图中频数最高的中值。
第四节
生物统计的常见术语
Today: 2015-6-15
Experimental execution
Statistical analysis Interpretation
第三节
生物统计的主要内容
Today: 2015-6-15
统计分析
统计研究设计
统计描述
调查设计 指调查研究工作全过程的计划。 试验设计 指对实验因素作合理、有效的安排,最大限度地减少 试验误差,使之达到高效,快速、准确、可靠和经济的目 的。 两者的区别 前者:是被动地进行观察,希望干扰因素的影响尽可 能减少; 后者:研究者能较主动地安排试验因素,控制实验条 件,尽可能排除或抵消非试验因素的干扰和影响。
推 断
第四节
生物统计的常见术语
Today: 2015-6-15
3、平均数mean 算术平均数:
几何平均数:
x1 x2 xn x n
x
i 1
n
i
n
G = n x1x 2....xn
加权平均数:
f1x1 +f 2 x 2 + +f k x k x= f1 +f 2 + +f k
也叫片面误差(lopsided error) 。是由试验对象的差异、 仪器的灵敏度、药品的用量或种类不符合试验要求以及观测、 记录、计算中的错误引起的。
7、中心矩、原点矩、偏斜度和峭度 central monent, moment about the origin, skewness and kurtosis i 中心矩: 原点矩: mi' ( x-x) ( x-x)i
mi n
n
偏斜度:度量数据围绕众数呈不对称的程度。 m3 计算公式:
5、数据类型与频数(率)分布
1)连续型数据和离散型数据 与某种标准做比较所得到的数据称为连续型数据(continuous data),又称度量数据(measurement data); 例如,长度、时间、 重量等。对连续型数据进行分析的方法,通常称为变量的方 法(method of variable)。 由记录不同类别个体的数目所得到的数据,称为离散型数据 (discrete data),又称为计数数据(count data);例如种子数、 株数、人头等。对离散型数据进行分析的方法,通常称为属 性的方法(method of attribute)。 2)频数(率)表frequency table 用频数分布或频率分布清楚地描述数据变化规律的表格。 3)频数(率)图frequency graph 用频数分布或频率分布清楚地描述数据变化规律的图形。3种 最常用的频数图为直方图、多边形图和累积频数图。
K.Plarson的学生Gosset (1876-1937)在1908年以“student”笔名 发表了“t分布和t检验法”创立了小样本检验代替大样本检 验的理论和方法。 Fisher于1923年发展了显著性检验及估计理论,提出了F分 布和F检验,创立了正交试验设计和方差分析。 1901年英国著名统计学家Pearson创办了《生物统计学杂志》 (Biometrika),标志着生物数学发展的起点。
第一节
生物统计学的地位意义
Today: 2015-6-15
四、生物统计学的特点 Characteristics 1、 根据有限数量的样本观察数据来推断和估计事物的总体, 是生物统计的基本特点。 2、 用样本来推断总体,要求样本具有一定的含量和代表性。 3、推断有很大的可靠性,但有一定的错误率。
4、实验设计应该先于生物统计分析的思考?
第四节
生物统计学的常见术语
Today: 2015-6-15
1、总体与样本 Population and sample
1) 总体 根据研究目的确定的研究对象的全体称为总体。构成总体 的每个成员称为个体(individual)。含有有限个个体的总体称 为有限总体(finite population)。包含有无限多个个体的总体 叫无限总体(infinite population)。 2) 样本 总体的一部分称为样本。 样本中所包含的个体数目叫样本容量或大小(sample size)。 样本容量常记为n。通常n≤30的样本叫小样本,n>30的样 本叫大样本。 3)抽样sampling 从总体中获得样本的过程。可分为放回式抽样(sampling with replacement)和非放回式抽样(without replacement)。随 机抽样(random sampling)是确定样本代表性的有效方法。
第三节
生物统计的主要内容
Today: 2015-6-15
统计分析
统计研究设计
统计描述
a.假设检验 b.区间估计 c.研究变量之间的关系 无自变量与因变量之分:直线相关分析、典型相关分析 研究多变量内部的从属关系:主成分分析、因子分析等。 多变量之间亲疏关系:聚类分析 有自变量与因变量之分:直线回归分析、曲线回归分析、 多项式回归分析、Logistic概率模型回归分析等 d.判别分析 根据一些明确分类的总体所提供的信息,对未知个体的归 属进行分类的判别分析。
3)标准差 样本标准差:
S
总体标准差:
2 ( x — x ) /( n — 1)
σ=
2 (x — μ) /N
4)变异系数:是样本变量的相对变异量, 是不带单位的纯数。 用变异系数可以比较不同样本相对变异程度的大小。
s cv = x × 100%
第四节
生物统计的常见术语
Today: 2015-6-15
f x fx f f
i 1 k i i i 1 i
k
第四节
生物统计的常见术语
Today: 2015-6-15
4、方差、标准差和变异系数variance, standard deviation and variation coefficient
1)极差,又称范围range:它是样本变量中最大值和最小值之差, 一般用R表示。
R = max{ x1, x 2,....xn}-min{ x1, x 2,....xn}
2) 方差 样本方差:
S = (x — x) /(n — 1)
2 2
总体方差:
σ = (x — μ) /N
2 2
第四节
生物统计的常见术语
Today: 2015-6-15
4、方差、标准差和变异系数variance, standard deviation and variation coefficient
第二节
生物统计学发展简史
Today: 2015-6-15
Neyman (1894-1981)和S.Pearson进行了统计理论的研究工作, 提出统计假设检验系统,标志着统计学真正形成。 There are five components to an experiment: Hypothesis Experimental design
第四节
生物统计的常见术语
Today: 2015-6-15
2、特征数 总 体 表示总体和样本的数量特 征的量称为特征数。 1) 参数Parameter :由总体计 抽样 算得来的特征数,常用希腊字 母表示。用μ表示总体平均数, 样 本 用σ表示总体标准差。 2) 统计量statistics :由样本计 算得来的特征数, 常用拉丁字 计算统计量 描述 母表示统计量。用 x 表示样本 平均数,用S表示样本标准差。 3) 总体参数由相应的统计量来 统计量 估计,例如用 x 估计μ,用S 估计σ等。
第一节
生物统计学的地位意义
Today: 2015-6-15
三、生物统计的意义 W.Gosset 于 1908 年以“ Student” 笔名将“ t- 检验”发表于 《Biometrika》上,文章说:“任何实验可以作为是许多可 能在相同条件下作出的实验的总体中的一个个体,一系列的 实验则是从这个总体所抽得的一个样品。” 21世纪是生命科学的世纪,无疑也为生物统计学的发展与 应用拓展了广阔的空间。生物医学期刊杂志社聘请统计学专 家为期刊论文把握统计处理的质量,《新英格兰医学杂志》、 《柳叶刀》等著名的医学期刊还增设了负责处理统计学问题 常务编委。 生物统计分析软件包的普及将生物统计学从统计学家的书 本里解放出来,成为生物学研究者的常用工具。但它也带来 了一个严重的弊端——对生物统计方法的误用与滥用。如果 把整个统计分析过程变成一个黑箱, 那就有可能垃圾进, 垃圾出(garbage in, garbage out)。
一门应用数学,是现代生物学研究中不可缺少的工具。
学科归属虽存在争议,但是每一位生物科学工作者必备 的基础。
第一节
生物统计学的地位意义
Today: 2015-6-15
二、生物统计学的作用 1、提供试验或调查设计的方法。 2、提供整理资料的方法,确定某些性状和特性的数量特征; 3、提供分析资料的方法 1) 判断试验结果的可靠性 ,包括两类: ① 判断试验结果与理论数值之间的符合程度,χ2检验; ② 判断试验处理间差异的可靠或差异的显著性程度,T-test、 F检验等。 2) 作统计推断 estimative statistics 测定两个或两个以上变数群之间的关系,了解两种事物或 现象之间的内在联系,了解它们之间联系的形式、方向和程 度,进而了解一事物变化对另一事物变化的影响程度,从而 对现象进行预测和判断。
g1 =
/2 m3 2
其中:m3为三阶中心矩;m2为二阶中心矩。
峭度:度量曲线形状的量。 计算公式: g = m 4 -3
2
m2 2
其中: m4为四阶中心矩。
第四节
生物统计的常见术语
Today: 2015-6-15
8、随机误差与系统误差
1) 随机误差 random error 也叫抽样误差(sampling error),是由于许多无法控制的内 在和外在的偶然因素所造成。统计学上的试验误差指随机误 差。 2) 系统误差 systematic error
第二节
生物统计学发展简史
Today: 2015-6-15
统计学用于生物学的研究,开始于19世纪末,1870年,英 国遗传学家,Galton (1822-1911)提出了相关与回归的概念,被 公认为生物统计学的创始人。
Galton和他的继承人K.Plarson (1857-1936)于1895年成立了伦 2 敦大学生物统计实验室,提出了 检验方法。
Today: 2015-6-15
绪 论
第一节 第二节 第三节 第四节 第五节 生物统计的地位意义 生物统计学发展简史 生物统计的主要内容 生物统计的常用术语 生物统计学教学要求
第一节
生物统计学的地位意义
Today: 2015-6-15
一、生物统计的概念与地位
生物数学(Biomathematics):以数学方法研究和解决生物学 问题,并对生物学有关的数学方法进行理论研究,介于生物 学和数学之间的边缘学科。从研究使用的数学方法划分,生 物数学可分为生物统计学、生物信息学、生物系统论、生物 控制论和生物方程等分支。 生物统计学:把概率论和数理统计的科学原理和方法应用于 生物科学研究中的数量资料的搜集、整理和分析的科学,是
Today: 2015-6-15
授课人:阮禄章 Email: ruanluzhang@sina.com
南昌大学生命科学学院
名人名言
Today: 2015-6-15
• 生活中最重要的问题,其中占大多数实际上只是概 率的问题。 ——拉普拉斯 • 在终极的分析中,一切知识都是历史。 在抽象的意义下,一切科学都是数学。 在理性的世界里,所有的判断都是统计学。 ——C.R劳
第三节
生物Байду номын сангаас计的主要内容
Today: 2015-6-15
统计分析
统计研究设计
统计表和统计图
统计描述
定量资料集中趋势的度量 算术均数、几何均数、调和均数、中位数、分位数和众数 定量资料离散趋势的度量
标准差、标准误差、变异系数、极差和四分位数间距
随机变量及其概率分布 离散型:二项分布、波松分布 连续型:正态分布、t分布、χ2分布、F分布