生物统计第1章 统计数据的搜集与整理.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019/5/22
表1-1每10名新生儿体重超过3kg的人数频数(率)表
2019/5/22
图1-1每10名新生儿体重超过3kg的人数频数图
50 45 40 35 30 25 20 15 10
5 0
0 1 2 3 4 5 6 7 8 9 10
2019/5/22
连续型数据频数(率)表和频数(率)图。
2019/5/22
编制连续型数据的频数(率)表的步骤:
1、从原始数据中找出最大值和最小值,并求出极 差。R=mamx-minx (R=170-141=30)
2、决定划分的组数,分组数是由数据的多少决定 的,美国统计学家斯特吉斯提出分组数公式: n=1+3.322lgN(式中N为样本数)。 3、根据极差与决定划分的组数、确定组限。 (30/10=3) 4、在频数表中列出全部组限、组界及中值。 5、将原始数据表中数据,填入频数表中,计算出 每组的频数和频率。
第一章 统计数据的搜集与整理
1.1 总体与样本 1.2 数据类型及频数(率)分布 1.3 样本的几个特征数
2019/5/22
第一章 统计数据的搜集与整理
1.1 总体与样本
1.1.1 统计数据的不齐性
• 遗传因素 • 环境因素
1.1.2 总体与样本 统计学研究的核心问题是如何通过样本 来推断总体。总体与样本是生物统计学 最基本的两个概念
2019/5/22
wenku.baidu.com
1.1.5 放回式抽样和非放回式抽样
•放回式抽样:从总体中抽出一个个体,记下它的特 征后,放回总体中,再做第二次抽样。 •非放回式抽样:从总体中抽出个体后,不再放回。 有限总体中的抽样:放回式的抽样可能会重复抽 中某一个体。尤其是总体量不大,或抽样范围小 的时候。 •无限总体在同等抽样条件下,放回式抽样和非放 回式抽样没有区别。 •一般情况样本的含量越大越有代表性。
2019/5/22
表1-3 “三尺三”株高频数(率)表
2019/5/22
直方图
直方图:又 称组织图, 横轴表示组 界,纵轴表 示频数(频 数图)或频 率(频率 图),两者 图形完全一 样。
2019/5/22
频数(率)图的编绘
•多边形图(折线图):横轴表示各组中值, 纵轴表示频数(率),连接各点得到多边 形图。
2019/5/22
1.1.2总体与样本
•总体(Population) 指研究的全部对象, 是由所研究具有某种共同性质的全部个体 所组成的集合体。分为有限总体(finite population)和无限总体(infinite population)。 •样本(Sample) 为总体的一部分,样本内 包含的个体数目称为样本含量。
例:表1-2列出了某农场做高粱“三尺三”提 纯时所调查的100个数据,试做其频数(率) 表和频数(率)图。
表1-2 “三尺三”株高测量结果
155 159 150 159 157 161 158 148 164 158 153 158 150 161 149 159 155 163 155 166 159 153 160 156 153 161 153 156 156 154 155 153 156 141 153 156 151 163 158 154 150 144 160 156 155 162 157 154 164 157 159 156 155 145 162 151 156 158 148 167 157 150 160 156 154 152 153 152 164 157 159 157 151 153 152 154 147 163 154 159 151 160 157 158 162 157 158 158 157 170 152 150 155 161 155 162 155 154 165 158
2019/5/22
1.2.2 频数(率)表和频数(率)图的编绘
离散型数据与连续型数据的频数(率)表和频 数(率)图略有不同。
离散型数据频数(率)表和频数(率)图。
例:调查每天出生的10名新生儿中,体重 超过3kg的人数,共调查120天。每天的10 名新生儿中,体重超过3kg的人数,可能有 11种情况:1名也没有,有1名,有2名,…, 10名都是,如表1-1的第一列所示,这一组 称为组值。
•累积频数图:横轴表示各组中值,纵轴表 示累积频数(率),连接各点得到累积频 数(率)图(向上累积与向下累积)。
2019/5/22
1.2.3 研究频数(率)分布的意义
根据频数(率)表或频数(率)图,可以 看出数据的三个重要特征。 –集中情况:平均数,中位数,众数。 –变异情况:集中在平均数两侧的程度, 越集中在平均数附近说明数据越整齐。 –图形的形状:对称与不对称,也可能显 示异常分布,出现一些不规则的情况,需 要寻找原因。
2019/5/22
1.2 数据类型及频率分布
1.2.1 连续型数据和离散型数据
统计学的最基本工作是收集数据,数据收集得越 多越有可能揭示客观现象的特性和变化规律。 数据类型:
•连续型数据(度量数据):与某种标准做比较 所得到的数据.例如:长度,时间,重量。对连续 型数据进行分析的方法,通常称为变量的方法。 •离散型数据(记数数据):由记录不同类别个 体的数目所得到的数据.例如:尾数,成活或死亡 个数对离散型数据进行分析的方法,通常称为属 性的方法。
2019/5/22
1.1.3 抽样
从总体获得样本的过程称抽样,抽样 的目的是希望通过对样本的研究推断 其总体。抽样方法有随机抽样、分类 抽样等。生物统计学上要求抽样具有 代表性,应是一个总体的缩影,因此 要根据具体情况采用不同抽样方法。
2019/5/22
1.1.4 随机抽样
要求总体中的任何个体都有同等的机会 被抽到;要求抽样时不受任何主观因素 的影响。如抽签,抓阄,用随机数字表 等。随机表的用法(附表1,自习)
2019/5/22
1.2.4 频数分布的不恒定性
• 同一总体中随机抽取的样本,其频数分 布不完全相同,有时差距还很大。
• 由于样本分布的不恒定性,当用样本去 推断总体时,推断的结果也会有不同, 因此,需要考察结果的可信度。为了回 答这一问题,首先要对总体分布有所了解。 后面的第二、三章的内容就是围绕总体 展开的。
表1-1每10名新生儿体重超过3kg的人数频数(率)表
2019/5/22
图1-1每10名新生儿体重超过3kg的人数频数图
50 45 40 35 30 25 20 15 10
5 0
0 1 2 3 4 5 6 7 8 9 10
2019/5/22
连续型数据频数(率)表和频数(率)图。
2019/5/22
编制连续型数据的频数(率)表的步骤:
1、从原始数据中找出最大值和最小值,并求出极 差。R=mamx-minx (R=170-141=30)
2、决定划分的组数,分组数是由数据的多少决定 的,美国统计学家斯特吉斯提出分组数公式: n=1+3.322lgN(式中N为样本数)。 3、根据极差与决定划分的组数、确定组限。 (30/10=3) 4、在频数表中列出全部组限、组界及中值。 5、将原始数据表中数据,填入频数表中,计算出 每组的频数和频率。
第一章 统计数据的搜集与整理
1.1 总体与样本 1.2 数据类型及频数(率)分布 1.3 样本的几个特征数
2019/5/22
第一章 统计数据的搜集与整理
1.1 总体与样本
1.1.1 统计数据的不齐性
• 遗传因素 • 环境因素
1.1.2 总体与样本 统计学研究的核心问题是如何通过样本 来推断总体。总体与样本是生物统计学 最基本的两个概念
2019/5/22
wenku.baidu.com
1.1.5 放回式抽样和非放回式抽样
•放回式抽样:从总体中抽出一个个体,记下它的特 征后,放回总体中,再做第二次抽样。 •非放回式抽样:从总体中抽出个体后,不再放回。 有限总体中的抽样:放回式的抽样可能会重复抽 中某一个体。尤其是总体量不大,或抽样范围小 的时候。 •无限总体在同等抽样条件下,放回式抽样和非放 回式抽样没有区别。 •一般情况样本的含量越大越有代表性。
2019/5/22
表1-3 “三尺三”株高频数(率)表
2019/5/22
直方图
直方图:又 称组织图, 横轴表示组 界,纵轴表 示频数(频 数图)或频 率(频率 图),两者 图形完全一 样。
2019/5/22
频数(率)图的编绘
•多边形图(折线图):横轴表示各组中值, 纵轴表示频数(率),连接各点得到多边 形图。
2019/5/22
1.1.2总体与样本
•总体(Population) 指研究的全部对象, 是由所研究具有某种共同性质的全部个体 所组成的集合体。分为有限总体(finite population)和无限总体(infinite population)。 •样本(Sample) 为总体的一部分,样本内 包含的个体数目称为样本含量。
例:表1-2列出了某农场做高粱“三尺三”提 纯时所调查的100个数据,试做其频数(率) 表和频数(率)图。
表1-2 “三尺三”株高测量结果
155 159 150 159 157 161 158 148 164 158 153 158 150 161 149 159 155 163 155 166 159 153 160 156 153 161 153 156 156 154 155 153 156 141 153 156 151 163 158 154 150 144 160 156 155 162 157 154 164 157 159 156 155 145 162 151 156 158 148 167 157 150 160 156 154 152 153 152 164 157 159 157 151 153 152 154 147 163 154 159 151 160 157 158 162 157 158 158 157 170 152 150 155 161 155 162 155 154 165 158
2019/5/22
1.2.2 频数(率)表和频数(率)图的编绘
离散型数据与连续型数据的频数(率)表和频 数(率)图略有不同。
离散型数据频数(率)表和频数(率)图。
例:调查每天出生的10名新生儿中,体重 超过3kg的人数,共调查120天。每天的10 名新生儿中,体重超过3kg的人数,可能有 11种情况:1名也没有,有1名,有2名,…, 10名都是,如表1-1的第一列所示,这一组 称为组值。
•累积频数图:横轴表示各组中值,纵轴表 示累积频数(率),连接各点得到累积频 数(率)图(向上累积与向下累积)。
2019/5/22
1.2.3 研究频数(率)分布的意义
根据频数(率)表或频数(率)图,可以 看出数据的三个重要特征。 –集中情况:平均数,中位数,众数。 –变异情况:集中在平均数两侧的程度, 越集中在平均数附近说明数据越整齐。 –图形的形状:对称与不对称,也可能显 示异常分布,出现一些不规则的情况,需 要寻找原因。
2019/5/22
1.2 数据类型及频率分布
1.2.1 连续型数据和离散型数据
统计学的最基本工作是收集数据,数据收集得越 多越有可能揭示客观现象的特性和变化规律。 数据类型:
•连续型数据(度量数据):与某种标准做比较 所得到的数据.例如:长度,时间,重量。对连续 型数据进行分析的方法,通常称为变量的方法。 •离散型数据(记数数据):由记录不同类别个 体的数目所得到的数据.例如:尾数,成活或死亡 个数对离散型数据进行分析的方法,通常称为属 性的方法。
2019/5/22
1.1.3 抽样
从总体获得样本的过程称抽样,抽样 的目的是希望通过对样本的研究推断 其总体。抽样方法有随机抽样、分类 抽样等。生物统计学上要求抽样具有 代表性,应是一个总体的缩影,因此 要根据具体情况采用不同抽样方法。
2019/5/22
1.1.4 随机抽样
要求总体中的任何个体都有同等的机会 被抽到;要求抽样时不受任何主观因素 的影响。如抽签,抓阄,用随机数字表 等。随机表的用法(附表1,自习)
2019/5/22
1.2.4 频数分布的不恒定性
• 同一总体中随机抽取的样本,其频数分 布不完全相同,有时差距还很大。
• 由于样本分布的不恒定性,当用样本去 推断总体时,推断的结果也会有不同, 因此,需要考察结果的可信度。为了回 答这一问题,首先要对总体分布有所了解。 后面的第二、三章的内容就是围绕总体 展开的。