第二章生物统计基础知识2正态与抽样分布剖析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
性质 Property 1)0 ≤ P(A)≤ 1 2)P(A)= 1,表明该事件为必然事件; P(A)= 0,表明该事件为不可能事件; 0 < P(A)< 1,表明该事件为随机事件。
运算法则 Calculation rule
1)若事件 A 的概率为 P(A),那么其对立事件 B 的概率为: P(B)=1 - P(A)
1. 频数与频率分布
频数
Number
频数分布
Number distribution
在一定条件下,总体或样本中某观察值 或某区间(Interval)的观察值所出现的 次数。
总体或样本中某观察值或某区间的观察 值出现的次数在整个区间的分布情况。
频率分布
Frequency distribution
总体或样本中某观察值或某区间的观察 值出现的频率整个区间的分布情况。
株高
90 104 103 102 106 106 83 106 105 99 99 93 102 101 94 96 97 105 89 96
行号
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
表1 100株小麦株高(cm)
株高
83 99 101 93 99 93 90 95 102 95 90 91 96 98 90 95 99 93 95 106
行号
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
株高
98 99 93 101 94 93 94 89 92 98 103 86 95 85 96 96 95 96 97 91
行号
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
2. 概率 Probability
定义 Definition:同一条件下,试验或观察次数 n 无限 增大,随机事件 A 发生的频率 a / n 必然稳定接近某一常数P, P就称为随机事件 A 的概率。
取值 Evaluation:一般情况下 P 的取值不可能准确获 得,以 n 充分大时事件 A 发生的频率α/ n 作为 P 的近似值。
(1) 求出极差:R=106-83=23 cm
(2) 确定组数(G)及组距 (B)
组数:G = 9
Hale Waihona Puke Baidu
表2 100株小麦株高频数与频率分布表
(3)组确距定:组B限=23/9=2.56 cm组号 1 第 1 组:81.5 ~ 84.49 2
组限
81.5-84.49 84.5-87.49
中值数
83 86
频数
99.5 102.5 105.5
0.09 0.08 0.07 0.06 0.05 频 0.04 率 0.03 0.02 0.01 0
图2 100株小麦的频率分布
三、正态分布 Normal distribution
1. 概念 Definition
1)概念 正态分布随机变量的概率密度函数 为:
1
1( )2
2. 统计方法 Presentation method of data
(1) 求出极差(R)
(2) 确定组数(G)及组距(B)
组数:n≥100时, G:8~15 n < 100时, G:不少于 6 组; n 很大时, G:不大于 30 组。
组距:B = R/G 对于连续变量,组距精度与观察值相同; 对于非连续变量,组距取整数。
2)若事件 A 和 B 是互斥的,其概率各为 P(A) 和 P(B), 那么两事件的和事件的概率为: P(A+B)= P(A)+ P(B)
3)若事件 A 和 B 是独立的,其概率各为P(A)和 P(B),
那么两事件同时出现的概率为: P(A·B)= P(A) ·P(B)
二、频数与频率分布 Number and frequency distribution
2 4
频率 %
2 4
第 2 组:84.5 ~ 87.49 3 87.5-90.49 89
8
8
第 3 组:87.5 ~ 90.49 4
90.5-93.49
92
14
14
5
93.5-96.49
95
30
30
……
6
96.5-99.49
98
20
20
7 99.5-102.49 101
10
10
(4) 统计频数和频率
(3) 确定组限 Group limit 组限就是每一组的上限(Upper limit)和下限(Lower
limit) 。
(4) 统计频数和频率 通常是采用制作频数(频率)分布表或频数(频率)分
布图的方法。
例1:有一小麦品种,随机采集100株,量其株高,试说明不同 株高的理论分布规律。
行号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
P(x)
e 2
2
式中: x —— 正态分布中的随机变量; e —— 2.718,是自然对数的底数;
第二节 正态分布与抽样分布
一、频率与概率 Frequency and probability
1. 频率 Frequency
定义 Definition:在大量重复试验中,事件A已发生的 次数a占试验总次数的比率。
fn
( A)
a n
特 点 ( Characteristics ) : 一 个 事 件 的 频 率 不 是 常 数 , 但随重复试验或观察次数 n 增加,频率的波动会不断减小, 逐步趋于稳定,称为频率的稳定性。
株高
94 102 95 93 97 88 91 94 104 98 97 100 92 99 88 98 98 95 94 104
行号
81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
株高
100 96 94 94 91 96 96 85 96 93 101 86 97 95 97 99 95 96 104 96
8 102.5-105.49 104
8
8
9 105.5-108.49 107
4
4
35 30 25
频 20 次 15
10 5 0
频数
小麦株高 (cm) 图1 100株小麦的频数分布
35 30 25 频 20 次 15 10
5 0
频数 正态分布曲线
81.5 84.5 87.5 90.5 93.5 96.5 小麦株高 (cm)
运算法则 Calculation rule
1)若事件 A 的概率为 P(A),那么其对立事件 B 的概率为: P(B)=1 - P(A)
1. 频数与频率分布
频数
Number
频数分布
Number distribution
在一定条件下,总体或样本中某观察值 或某区间(Interval)的观察值所出现的 次数。
总体或样本中某观察值或某区间的观察 值出现的次数在整个区间的分布情况。
频率分布
Frequency distribution
总体或样本中某观察值或某区间的观察 值出现的频率整个区间的分布情况。
株高
90 104 103 102 106 106 83 106 105 99 99 93 102 101 94 96 97 105 89 96
行号
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
表1 100株小麦株高(cm)
株高
83 99 101 93 99 93 90 95 102 95 90 91 96 98 90 95 99 93 95 106
行号
41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
株高
98 99 93 101 94 93 94 89 92 98 103 86 95 85 96 96 95 96 97 91
行号
61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
2. 概率 Probability
定义 Definition:同一条件下,试验或观察次数 n 无限 增大,随机事件 A 发生的频率 a / n 必然稳定接近某一常数P, P就称为随机事件 A 的概率。
取值 Evaluation:一般情况下 P 的取值不可能准确获 得,以 n 充分大时事件 A 发生的频率α/ n 作为 P 的近似值。
(1) 求出极差:R=106-83=23 cm
(2) 确定组数(G)及组距 (B)
组数:G = 9
Hale Waihona Puke Baidu
表2 100株小麦株高频数与频率分布表
(3)组确距定:组B限=23/9=2.56 cm组号 1 第 1 组:81.5 ~ 84.49 2
组限
81.5-84.49 84.5-87.49
中值数
83 86
频数
99.5 102.5 105.5
0.09 0.08 0.07 0.06 0.05 频 0.04 率 0.03 0.02 0.01 0
图2 100株小麦的频率分布
三、正态分布 Normal distribution
1. 概念 Definition
1)概念 正态分布随机变量的概率密度函数 为:
1
1( )2
2. 统计方法 Presentation method of data
(1) 求出极差(R)
(2) 确定组数(G)及组距(B)
组数:n≥100时, G:8~15 n < 100时, G:不少于 6 组; n 很大时, G:不大于 30 组。
组距:B = R/G 对于连续变量,组距精度与观察值相同; 对于非连续变量,组距取整数。
2)若事件 A 和 B 是互斥的,其概率各为 P(A) 和 P(B), 那么两事件的和事件的概率为: P(A+B)= P(A)+ P(B)
3)若事件 A 和 B 是独立的,其概率各为P(A)和 P(B),
那么两事件同时出现的概率为: P(A·B)= P(A) ·P(B)
二、频数与频率分布 Number and frequency distribution
2 4
频率 %
2 4
第 2 组:84.5 ~ 87.49 3 87.5-90.49 89
8
8
第 3 组:87.5 ~ 90.49 4
90.5-93.49
92
14
14
5
93.5-96.49
95
30
30
……
6
96.5-99.49
98
20
20
7 99.5-102.49 101
10
10
(4) 统计频数和频率
(3) 确定组限 Group limit 组限就是每一组的上限(Upper limit)和下限(Lower
limit) 。
(4) 统计频数和频率 通常是采用制作频数(频率)分布表或频数(频率)分
布图的方法。
例1:有一小麦品种,随机采集100株,量其株高,试说明不同 株高的理论分布规律。
行号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
P(x)
e 2
2
式中: x —— 正态分布中的随机变量; e —— 2.718,是自然对数的底数;
第二节 正态分布与抽样分布
一、频率与概率 Frequency and probability
1. 频率 Frequency
定义 Definition:在大量重复试验中,事件A已发生的 次数a占试验总次数的比率。
fn
( A)
a n
特 点 ( Characteristics ) : 一 个 事 件 的 频 率 不 是 常 数 , 但随重复试验或观察次数 n 增加,频率的波动会不断减小, 逐步趋于稳定,称为频率的稳定性。
株高
94 102 95 93 97 88 91 94 104 98 97 100 92 99 88 98 98 95 94 104
行号
81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
株高
100 96 94 94 91 96 96 85 96 93 101 86 97 95 97 99 95 96 104 96
8 102.5-105.49 104
8
8
9 105.5-108.49 107
4
4
35 30 25
频 20 次 15
10 5 0
频数
小麦株高 (cm) 图1 100株小麦的频数分布
35 30 25 频 20 次 15 10
5 0
频数 正态分布曲线
81.5 84.5 87.5 90.5 93.5 96.5 小麦株高 (cm)