1生物统计学课件第一部分

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
纳出一般的原理并把它应用于较大的范围。 特殊—一般;样本—总体。
生物统计学(biostatistics):是数理统计(mathematical statistics)在生物学研究中的应用,它是用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查 资料的一门学科,属于应用统计学的一个分支。
三、学习生物统计学的意义
四、统计学的常用术语
5 . 随机误差(sampling error)与系统误差(lopsided error)
随机误差也叫抽样误差,这是由于许多无法控制的内在和外在的 偶然因素所造成。 系统误差也叫片面误差,这是由于试验的初始条件相差较大,测 量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、 计算中的错误所引起。
第二章 资料的描述性统计分析
“大量”和“杂乱无章”---“条理化,便于统计分析的形式”
1. 数据资料的审核与订正 2. 统计数据的分组与汇总 3. 由原始数据或汇总资料计算各种资料Байду номын сангаас基本统 计特征,包括集中趋势特征、离散趋势特征 4. 用统计表或统计图展示资料
2.1 异常数据的判断和处理
观察数据中存在的极端值,来源: 1. 变量内在随机变异性的一种极端表现; 2. 试验或数据记录过程中出现的操作错误或试验 条件发生异常所致。
异常数据的处理办法:
1. 进行采集过程的检查 2. 分析发生该数据的个体特征 3. 统计学的方法验证
四分位数检验(Quartile)
:即把所有数值由小到大排列并分成四等份,处于三 个分割点位置的得分就是四分位数。
第一四分位数 (Q1),等于该样本中所有数值由小到大排列后 第25%的数字,又称下四分数(LQ)。 第二四分位数 (Q2),又称“中位数”,等于该样本中所有数 值由小到大排列后第50%的数字。 第三四分位数 (Q3),等于该样本中所有数值由小到大排列后 第75%的数字,又称上四分数(UQ) 。
随机抽取(random sampling):是指总体中的每一个 个体都有同等的机会被抽取以组成样本。
四、统计学的常用术语
3. 参数(parameter)与统计量(statistic)
参数:描述总体特征的数: 总体平均数: 集中趋势;总体方差:变异程度;相关系数:相关 关系。 统计量:描述样本特征的量,样本平均数、样本方差、样本相关 系数。 一个总体参数::一个样本统计量
t检验
t检验的适用条件:正态分布资料
亦称student t检验(Student's t test), t检验是用于小样本(样本 容量小于30)的两个平均值差异程 度的检验方法。它是用t分布理论 来推断差异发生的概率,从而判定 两个平均数的差异是否显著。
p值是将观察结果认为有效即具有总体代表性的犯 错概率。
生物现象的基本特征: 1. 变异性(variability) 2. 不确定性(随机性)(uncertainty) 3. 复杂性(complexity)
描述性的定性科学 决定性的数量科学 吸烟与肺癌是否有关 两种饲料的配方哪种更好
四、生物统计学的功能
1、生物统计学的内容:试验设计和统计分析 试验设计:应用数理统计的原理与方法,制订试验 方案,选择试验材料,合理分组,降低实验误差, 使我们利用较少的人力、物力和时间,获得多而可 靠的数据资料。 统计分析:应用数理统计的原理与方法对数据资料 进行分析与推断,认识客观事物的本质和规律性, 使人们对所研究的资料做出合理的结论。 二者不可分割
统计分析的目的就是要对总体的特征,不同总体间 的差异等作出推断。 样本:从总体中按一定方法抽取部分具有代表性 的个体, 这部分个体称为样本。
样本容量(sample size):样本中所包含个体数目叫 样本容量或大小,样本容量常记为n。 通常把n<30的样本叫小样本,n ≥30的样本叫 大样本。
统计分析的基本特点: (1)通过样本来推断总体是统计分析的基本 特点。 (2)有很大的可靠性但有一定的错误率这是 统计分析的又一特点。
的基本特征,并以适当的形式(如表、图等)展示这些数据 资料,以便对数据的基本特征有清晰、直观的了解。
分析资料:是针对要研究的问题,通过对数据的深入分析,
从数据资料中获取所需要有关信息的过程。
解释资料:是在分析结果的基础上,对所研究的问题作出统
计推断。
二、统计学的基本特点
1. 概率性(probability):概率论是统计学的理论基础。 2. 二元性(duality):理论 + 实际数据 3. 归纳性(induction): 主要精神,从现实资料中归
课程内容简介
本课程的性质是应用性理论与实践操作课,主要任 务是使学生学习运用统计学的原理和方法,研究和 处理生物学的数据资料,正确认识生物学实验中客 观存在的规律性。主要内容包括:绪论、实验数据 统计整理、统计分析的基本指标、方差分析、相关 与回归分析、生物学实验设计等。
各部分教学纲要
课堂讲授部分教学内容与要求
t值与差异显著性关系表 t t ≥ t(df)0.01 t ≥ t(df)0.05 t < t(df)0.05 P值 P ≤ 0.01 P ≤ 0.05 P > 0.05 差异显著程度 差异非常显著 差异显著 差异不显著
通常,许多的科学领域中产生p值的结果≤0.05被认为是统计学意 义的边界线,但是这显著性水平还包含了相当高的犯错可能性。 结果0.05≥p>0.01被认为是具有统计学意义,而0.01≥p≥0.001被认 为具有高度统计学意义。
例:一群仔猪的体重, 以千克为单位,最小值12 kg, 最大值为20 kg,差8个单位; 以0.1 kg为单位,最小值为12.3kg,最大为19.8 kg,差75个 单位。
统计计算过程中有效位数的取舍问题 基本原则是在计算过程中尽可能多地保留有效位数 计算机连续计算,有效位数的取舍-对变量类型的定义: 整型:只保留其整数部分。 单精度实型:保留7位有效位数。 123 456 789—123 456 800 双精度实型:保留15位有效位数。 手工计算:计算过程保留比原始数据多两位的有效数据 最终结果—与原始数据一致的精确度
例如:某车间某月份的工人生产某产品的数量分别为13、 13.5、13.8、13.9、14、14.6、14.8、15、15.2、 15.4、15.7公斤,是否有异常数据:
Q1的位置 Q2的位置 Q3的位置
即变量数列中的第三个、第六个、第九个工人的某种产品产量分别为下 四分位数、中位数和上四分位数。即: Q1 = 13.8公斤、Q2 = 14.6公斤、Q3 = 15.2公斤, IQR=1.4
某车间某月份的工人生产某产品的数量分别为13、13.5、 13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,则 三个四分位数的位置分别为:
2、生物统计学的功能 1). 为科学地整理分析数据提供方法; 2). 判断试验结果的可靠性:两种饲料对仔鸡增重和饲料利用率 3). 确定事物之间的相互关系:第一胎的产乳量和以后几胎的
产乳量之间的相关关系
4). 提供试验设计的原理和方法; 5). 为学习其他课程提供基础。
四、统计学的常用术语
1. 变量(Variable)与观测值(Observation) 变 量:指某种特征,它的表现在不同个体间或不同 组间存在变异性,如体重。 观测值:对变量的表现进行观察或测量所获得的数 据,这些数值也被称为变数(variate)。
2. 总体(population)、个体(individual)与样本 (sample) 统计总体:是一个统计问题研究对象的全体,它是具 有某种或某些共同特征的元素的集合。 个体:总体中的每一个研究对象。 有限总体和无限总体、动态总体和固定总体、 现实总体和假想总体。 北京地区2002年长白猪的日增量— 有限、固定、现实 研究某药物对某种疾病的治疗效果,利用一些发病个 体进行试验,这部分个体可以看成来自一个假想的总 体的样本。
UQ:上四分位数; LQ:下四分位数 IQR (InterQuartile Range):四分位距:上四分位数与
。 下四分位数的差距
异常数据>UQ+1.5*IQR 或 异常数据<LQ-1.5*IQR
第一步:确定四分位数的位置。
Q1的位置 Q2的位置
Q3的位置
式中n表示资料的项数
第二步:根据第一步所确定的四分位数的位置,确 定其相应的四分位数。
4. 准确性(accuracy) 与精确性 (precision)
准确性:观测值或估计值与真值的接近程度。 精确性:对同一物体的重复观察值或估计值彼此 之间的接近程度。
与数据的有效位数有关。 与测量仪器的精密度有关。
15.6 kg与16.4 kg
30~300规则:以数据间差异的最小单位计算,最小 值与最大值间的差异应在30~300个单位。
方差分析 方差, variance:是各个数据与平均数之差的平 方的平均数。
在概率论和数理统计中,方差(英文Variance)用来 度量随机变量和其数学期望(即均值)之间的偏离程 度。在许多实际问题中,研究随机变量和均值之间的 偏离程度有着很重要的意义。
两台仪器的测量结果 的均值都是 a
方差,通俗点讲,就是和中心偏离的程度!用来衡量一 批数据的波动大小(即这批数据偏离平均数的大小)并 把它叫做这组数据的方差。 在样本容量相同的情况下,方差越大,说明数据的波动 越大,越不稳定 。
生物统计学的概念与特点 生物统计学的意义、功能与学习方法
一、统计学的含义
统计学(statistics)是把数学的语言引入具体的科学研究 领域,将所研究的问题抽象为数学问题的过程,是收 集、整理、分析和解释数据的一门科学。
收集数据:是取得数据资料的过程—科学试验或者抽样调查。 整理资料:是对数据资料进行初步归纳分析,找出数据资料
实验练习部分教学内容与要求
平时 40%+笔试 60%
使用教材或主要参考书
《生物统计学》,张勤,中国农业大学出版社, 2008年2月第2版。 《生物统计学》,杜荣骞,高等教育出版社,2009 年6月第3版。 《统计学导论》,孙文生,中国农业大学出版社, 2010年3月第1版。
第一章 绪论
方差是实际值与期望值之差平方的平均值,而标准 差是方差算术平方根。
x2检验,亦称卡方检验,统计学中假设检验的方式之一。
X2检验是一种用途广、简单常用的差异显著性检验方法之一。 主要可以用于计数资料的两组或两组以上的两类属性、两类或 两类以上现象之间的比较,如检验两个样本率、构成比等之间 的差别。 基本原理和步骤: 是假设各个样本来自同一属性的总体,各组中 实际数之间的差别仅仅由于抽样误差造成的;通过分别计算各 组实际数与理论数的离散情况,求得总的误差X2值,从而测定 假设存在的概率, 即可能性 P。
显著性检验的目的就在于承认并尽量排除这些无法 控制的偶然因素的干扰,将处理间是否存在本质差 异揭示出来。
显著性检验的方法很多,常用的有: 显著性检验的方法很多,常用的有: t 检 验 —— 主要用于检验两个处理平均数差异 是否显著; 方差分析—— 主要用于检验多个处理平均数间 差异是否显著; x2检验 —— 主要用于由质量性状得来的次数资 料的显著性检验等。
★系统误差影响试验的准确性;随机误差影响试验的精 确性。
提供整理、分析资料的方法
整理资料的基本方法是: 根据资料的特性将其整理成统计表、绘制成统计图。 通过统计表、图可以大致看到所得资料集中、离散的 情况。并利用所收集得来的数据计算出几个统计量, 以表示该资料的数量特征、估计相应的总体参数。 统计分析最重要的内容是差异显著性检验。
如果假设成立,那么X2值就不会很大,而保持在一定范 围内,相应的 P值就大于 5%(P>0.05),即仅仅由于抽 样误差而造成样本之间这么大小差别的可能性大于5% ,说明各样本间的差别本质上无明显差异,它们来之于 同一属性的总体,假设被肯定。 反过来说,如果推算出的X2值很大,而超出了一定范围 ,相应的P 值就小于 5%或1%,即由于抽样误差造成 样本之间如此大的差别的可能性小于5%或1%;说明各 组间差别不是由于抽样造成的,可能两者的确有差别, 它们不是来自于同一属性的总体,假设被否定。
相关文档
最新文档