第1章+统计数据的收集与整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程类型:专业选修课
总学时:32学时
生物统计学是应用数理统计的原理和方法
来分析和解释生物界数量现象的科学,也可以
性的认识。
人们在从事科学研究时,总是通过事物一部分(样本)
来估计事物全体(总体)的性质特征,即从样本推断总体,课程特点与学习方法(二)建议学习方法
第
§一、总体二、样本
从总体中抽取的一部分个体则构成
三、抽样
从总体中获得样本的过程称为
(一)随机抽样的(二)随机抽样的
1 放回式抽样
§§1.2.1
用计数方式所得到的数据称为离散型数据(discrete data),又称为计数数据(count data)。例如,某一
§1.2.2 频数(率)表与频数(率)图的编绘一、离散型数据
15
012
二、
例1.2 表1-2列出了某农场在做高粱“三尺三”提纯时所调查的100个数据。
/cm
(一)连续型数据的频数(率)表的编制
1 计算极差原始数据表中找出最大值和最小值。
2 决定划分的组数分组数是由数据的多少决定的。在数据较少时,
如50~100个数可以分7~10组。数据较多时,可分为
组距
组限
中值(141+143)/2=142,(144+146)/2=145,…,(168+170)/2=169
在横轴上标明各组的组界,纵轴标明频数,然后以每
一组的组界为一个边,相应的频数为另一个边作矩形,构
histogram)(图1-2)。若纵轴改为频率则得
到频率直方图。直方图又称组织图。
(二)连续型数据的频数(率)图
2 多边形图
在横轴上标出各组的中值,纵轴上标出频数(率),在坐标平面内标出相应的每个点(以中值为横坐标,以该中值对应的频数(率)为纵坐标),用线段连接各点。最低一组非零频数的点,应该直接与相邻的零频数中值相连;最高一组非零频数点,亦应该与相邻的零频数中值点相连。最后得到一个多边)(图1-3)。3 累积频数图
经常使用的第三种频数图称为累积频数图(cumulative frequency graph)。作图法为:首先根据表1-3制成累积频数表(表1-4)、在横轴上标出各级的中值,纵轴上标出累积频数(率)。在坐标平面内标出相应的点(以中值为横坐标,以该中值对应的累积频数(率)为纵坐标),连接各点,从而得到累积频数(率)图。
§§
§一、算术平均数
(一)算术平均数定义
其中,Σ为总和符号;表示从第一个观测
∑n
x y i 2 (离散型数据的频数资料)
n fy
个新生儿中,大约有7个体重超过3kg 。
y f fy
例1.2 数据的平均数计算(连续型数据的频数资料)
m =中值、f =频数、n =总数、k =组数、fm 代表f 和m 相乘。计算结果:高粱三尺三平均株高为156.22cm 。
y
y
(三)算术平均数的重要特性
1 样本各观察值与其平均数的差数(简称离均差,deviation from mean 二、中(位)数
三、众数
具有最高频数的组值或中值称为众数。§1.3.2 方差与标准差
一、离均差离均差平方和的平均数为2
−∑y y
n
)(和=1.056 88
和=2.048
和=0
y=6.072
三、标准差(标准离差)
自由度标准差的计算方法1直接法
2
表√
2 2
22
−∑∑n y y
)(列成右表计算
结果和直接法算得相同。
y y 2y y 2
3加权法§
变异系数是一个不带单位的纯数,可用以比较两个
本章小结现有小麦品种A和B,它们株高(单位:cm)的平
均数和标准差分别为:A=120
单看标准差,后者应比前者整齐。但是,前者
的变化幅度是基于平均高度为