生物统计学课件-01
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节 生物统计的主要内容
统计研究设计
统计表和统计图
统计描述
统计分析
定量资料集中趋势的度量 算术均数、几何均数、调和均数、中位数、分位数和众数 定量资料离散趋势的度量
标准差、标准误差、变异系数、极差和四分位数间距
随机变量及其概率分布 离散型:二项分布、波松分布 连续型:正态分布、t分布、χ2分布、F分布
第四节 生物统计的常见术语
2、特征数 总 体 表示总体和样本的数量特 征的量称为特征数。 1) 参数Parameter :由总体计 抽样 算得来的特征数,常用希腊字 母表示。用μ表示总体平均数, 样 本 用σ表示总体标准差。 2) 统计量statistics :由样本计 算得来的特征数, 常用拉丁字 计算统计量 描述 母表示统计量。用 x 表示样本 平均数,用S表示样本标准差。 3) 总体参数由相应的统计量来 统计量 估计,例如用 x 估计μ,用S 估计σ等。
生活中的统计学
国家统计局相关官员表示,我国居民消费增 长较慢,居民消费支出在GDP中的比重较低。据 悉,2008年中国居民消费率(居民消费占GDP的比 重)为35.3%,美国为70.1%,印度为54.7%。(09 年12月3日新华网) “前三季度中国国内生产总值(GDP)同比增长 7.7%,其中第三季度增长8.9%”、“中国城市 化率已达45.68%”、“97%外出农民工已就业”
第一节 生物统计的地位意义
五、生物统计学的特点 Characteristics 1、 根据有限数量的样本观察数据来推断和估计事物的总体, 是生物统计的基本特点。 2、 用样本来推断总体,要求样本具有一定的含量和代表性。 3、推断有很大的可靠性,但有一定的错误率(如假阳性)。
4、实验设计应该先于生物统计分析的思考!
第四节 生物统计的常见术语
第四节 生物统计的常见术语
1、总体与样本 Population and sample
1) 总体 根据研究目的确定的研究对象的全体称为总体。构成总体 的每个成员称为个体(individual)。含有有限个个体的总体称 为有限总体(finite population)。包含有无限多个个体的总体 叫无限总体(infinite population)。 2) 样本 总体的一部分称为样本。 样本中所包含的个体数目叫样本容量或大小(sample size)。 样本容量常记为n。通常n≤30的样本叫小样本,n>30的样 本叫大样本。 3)抽样sampling 从总体中获得样本的过程。可分为放回式抽样(sampling with replacement)和非放回式抽样(without replacement)。随 机抽样(random sampling)是确定样本代表性的有效方法。
推 断
第四节 生物统计的常见术语
3、平均数mean 算术平均数:
x1 x2 ... xn 1 n x xi n n i 1
几何平均数:
G n x1 x2 xn n xi
i 1
n
加权平均数:
n1 x1 n2 x 2 x n1 n2
第四节 生物统计的常见术语
6、中位数和众数median and mode 中位数:在累积频数图中1/2总频数位置上的数值。 众数:离散型数据的众数是频数图中频数最高的组 值;连续型数据的众数是频数图中频数最高的中值。
第四节 生物统计的常见术语
7、中心矩、原点矩、偏斜度和峭度 central monent, moment about the origin, skewness and kurtosis 中心矩: ( x x)i 原点矩: ' x i
授课人:田雪
Email: tianxue19871224@126.com
杭州电子科技大学 统计教研室
成绩评定: •平时 30%:作业、考勤。 •期末 70% 参考教材:
知识回顾
数理统计:应用概率论的原理,通过搜集、整理、
分析数据,发现总体内在规律并给出判断和预测。
主要内容:参数估计、假设检验。
第一节 生物统计的地位意义
三、生物统计的作用 1、为科学地整理、描述数据提供方法 2、判断试验结果的可靠性
由于存在试验误差,从试验所得的数据资料必须借助于统 计分析方法才能获得可靠的结论。
3、提供由样本推断总体的方法。 4、提供试验设计的原则和方法
第一节 生物统计的地位意义
四、生物统计的意义 21 世纪是生命科学的世纪,无疑也为生物统计学 的发展与应用拓展了广阔的空间。
第三节 生物统计的主要内容
统计研究设计
统计描述
统计分析
a.假设检验 b.统计推断 estimative statistics c.研究变量之间的关系 无自变量与因变量之分:直线相关分析、典型相关分析 研究多变量内部的从属关系:主成分分析、因子分析等。 多变量之间亲疏关系:聚类分析 有自变量与因变量之分:直线回归分析、曲线回归分析、 多项式回归分析、Logistic概率模型回归分析等 d.判别分析 根据一些明确分类的总体所提供的信息,对未知个体的归 属进行分类的判别分析。
央视网消息,CTR市场研究公司通过随机抽样,电话调查了 2290个收看家庭,结果显示,96.1%的用户收看了今年春晚, 其中81.6%认为今年春晚办得好。 而15日的《广州日报》报道,在某门户网站对今年春晚的满意 度调查上,截至今日零时记者截稿前,认为“好”的只占 15.2%,不到两成,46.5%的人认为不好。 春晚的满意度每年都有两个版本,央视永远志得意满,神 采飞扬,民间许多人并不买账,骂声不绝。《京华时报》 15日报道,央视市场研究公司公布历年的调查结果,近5年 来,央视春晚的叫好率逐年走低。其中,2006年叫好率为 85.5%,2007年为83.6%,2008年为81.1%,2009年为81.1%。
K.Plarson的学生Gosset (1876-1937)在1908年以“student”笔名 发表了“t分布和t检验法”创立了小样本检验代替大样本检 验的理论和方法。 Fisher于1923年发展了显著性检验及估计理论,提出了F分 布和F检验,创立了正交试验设计和方差分析。 1901年英国著名统计学家Pearson创办了《生物统计学杂志》 (Biometrika),标志着生物数学发展的起点。
第四节 生物统计的常见术语
2)频数(率)表frequency table 用频数分布或频率分布清楚地描述数据变化规律的表格。 3)频数(率)图frequency graph 用频数分布或频率分布清楚地描述数据变化规律的图形。3 种最常用的频数图为直方图、多边形图和累积频数图。
第四节 生物统计的常见术语
第一节 生物统计的地位意义
生物统计分析软件包的普及将生物统计学从统计
学家的书本里解放出来,成为生物学研究者的常 用工具。但它也带来了一个严重的弊端——对生 物统计方法的误用与滥用。如果把整个统计分析 过程变成一个黑箱, 那就有可能垃圾进,垃圾出 (garbage in, garbage out)。
第二节 生物统计学发展简史
统计学用于生物学的研究,开始于19世纪末,1870年,英 国遗传学家,Galton (1822-1911)提出了相关与回归的概念,被 公认为生物统计学的创始人。
Galton和他的继承人K.Plarson (1857-1936)于1895年成立了伦 2 敦大学生物统计实验室,提出了 检验方法。
2) 方差 2 ( x x ) i 样本方差: S 2
n 1
总体方差:
2
2 ( x ) i
N
第四节 生物统计的常见术语
4、方差、标准差和变异系数variance, standard deviation and variation coefficient
3)标准差 样本标准差:
统计学分支
概 论
第一节 第二节 第三节 第四节 第五节 生物统计的地位意义 生物统计学发展简史 生物统计的主要内容 生物统计的常用术语 生物统计学教学要求
第一节 生物统计的地位意义
第一节
生物统计的地位意义
一、概念 生物统计学:把概率论和数理统计的科学原理和方法应用 于生物科学研究中的数量资料的搜集、整理和分析的科学, 是一门应用数学,是现代生物学研究中不可缺少的工具。
S
2 ( x x ) i
n 1
总体标准差:
2 ( x ) i
N
4)变异系数:是样本变量的相对变异量, 是不带单位的纯数。 用变异系数可以比较不同样本相对变异程度的大小。
s CV 100% x
第四节 生物统计的常见术语
5、数据类型与频数(率)分布
1)连续型数据和离散型数据 与某种标准做比较所得到的数据称为连续型数据 (continuous data),又称度量数据(measurement data); 例如, 长度、时间、重量等。对连续型数据进行分析的方法,通常 称为变量的方法(method of variable)。 由记录不同类别个体的数目所得到的数据,称为离散型 数据(discrete data),又称为计数数据(count data);例如种子 数、株数、人头等。对离散型数据进行分析的方法,通常称 为属性的方法(method of attribute)。
4、方差、标准差和变异系数variance, standard deviation and variation coefficient
1)极差,又称范围range:它是样本变量中最大值和最小值之差, 一般用R表示。
R max{x1, x2 , xn } min{x1, x2 , xn}
Experimental execution(实验实施)
Statistical analysis(数据分析) Interpretation(描述)
第三节 生物统计的主要内容
第三节 生物统计的主要内容
统计研究设计
统计描述
统计分析
调查设计 指调查研究工作全过程的计划。 试验设计 是指试验研究工作进行前应用数理统计原理,制定试 验方案,选择试验材料,对实验因素作合理、有效的安排 ,最大限度地减少 试验误差,使之达到高效,快速、准 确、可靠和经济的目的。 两者的区别 前者:是被动地进行观察,希望干扰因素的影响尽可 能减少; 后者:研究者能较主动地安排试验因素,控制实验条 件,尽可能排除或抵消非试验因素的干扰和影响。
第二节 生物统计学发展简史
Neyman (1894-1981)和S.Pearson进行了统计理论的研究工作, 提出统计假设检验系统,标志着统计学真正形成。 There are five components to an experiment: Hypothesis(假设) Experimental design(实验设计)
第二节 生物统计学发展简史
第二节 生物统计学发展简史
最早建立生物统计思想的是A.Quetelet(1796-1874),把
统计学应用于解决生物学、医学和社会学中的问题,第一 个认识到大量变异数据中蕴涵规律性(近代统计学的重要 思想) 最早应用生物统计学的是C.Darwin(1809-1882),进 化论的本质是生物统计 遗传学奠基人G.Mendel的豌豆杂交实验结果也证实了生 物统计的规律
第一节 生物统计的地位意义
二、生物统计的地位
生物数学(Biomathematics):以数学方法研究和解决生物学 问题,并对生物学有关的数学方法进行理论研究,介于生物 学和数学之间的边缘学科。从研究使用的数学方法划分,生 物数学可分为生物统计学、生物信息学、生物系统论、生物 控制论和生物方程等分支。
mi n
mi
n
偏斜度:度量数据围绕众数呈不对称的程度。 计算公式:g m3
1 3/ 2 m2
其中:m3为三阶中心矩;m2为二阶中心矩。
峭度:度量曲线形状的量。 计算公式: g m 3
2
m
4 2 2
Βιβλιοθήκη Baidu
其中: m4为四阶中心矩。
第四节 生物统计的常见术语
8、随机误差与系统误差
1) 随机误差 random error 也叫抽样误差(sampling error),是由于许多无法控制的内 在和外在的偶然因素所造成。统计学上的试验误差指随机误 差。 2) 系统误差 systematic error