生物统计学 第三章 概率分布09
生物统计学欧阳乐军
随机事件(random event):若某特定事件只 是可能发生的几种事件中的一种,这种事 件称为随机事件。
2019/8/8
湛江师范学院生科院欧阳乐军制作
3
要认识随机事件的规律性,个别的试验或观察 是不适用的,必须在大量的实验中才能观察到。
下面用棉田发生盲椿象为害的情况来说明这一 问题。
调查株
数(n)
5
25
50 100 200 500 1000 1500 2000
受害株
数(a)
2
12
15
33
72 177 351 525 704
受害频 率(a/n) .40 .48 .30 .33 .36 .354 .351 .350 .352
2019/8/8
2019/8/8
湛江师范学院生科院欧阳乐军制作
7
二、事件的交(积事件)
事件A和B同时发生而构成的新事件, 称为事件A和B的积事件,记为AB,读作“A 和B同时发生”。
例如某小麦品种,以发生锈病赤霉病 为事件A,发生白粉病赤霉病为事件B,则 赤霉病发生这一新事件为AB,记为A∩B 。
2019/8/8
2019/8/8
湛江师范学院生科院欧阳乐军制作
23
例如,观察施用某种农药后蚜虫的死亡数,记 “死”为0,“活”为1。如果每次观察5只,则 观察的结果将有0(5只全死)、1(4死1活)、2(3 死2活)、3(2死3活)、4(1死4活)、5(5只全活), 共6种变量。由这6种变量的相应概率组成的分
布,就是n=5时活虫数的二项分布。
0.05 0 012345
(p=0.5,n=5)的概率分布图
生物统计学第三章 概率和概率分布(2)
的第x 1项,所以有“二项分布”这个名称。
0 0 1 1 x x n n [ (1 )]n Cn (1 )n Cn (1 )n1 Cn (1 )nx Cn (1 )0
x x (2) P(x) Cn (1 )nx [ (1 )]n 1n 1 x 0 x 0
2. 二项分布的常用符号
n :贝努利试验的次数(或 样本含量)
x : 在n次试验中事件A出现的次数,即二项分布变量X 的取值
: 事件A发生的概率 (每次试验都是恒定的 )
1 - : 事件A发生的概率
p(x) : X的概率函数即P(X x)
F( x) P(X x) p(xi )
2014-4-21
二项分布的程序计算方法
二项分布函数Binomdist(k,n,p,false/true) 某数阶乘的计算函数Fact 从给定元素数目m的集合中抽取若干n元素的排 列组合数C n m 计算函数Combin(m,n)
2014-4-21
二、 泊松分布 (Poisson Distribution)
2014-4-21
二项分布
(实例)
【例】已知 100 件产品中有 5 件次品,现从中任取一件,有 放回地抽取3次。求在所抽取的3件产品中恰好有2件次品的 概率 解:设 X 为所抽取的3件产品中的次品数,则根据二项分 布公式有
P X 2 C32 (0.05)2 (0.95)32 0.007125
二项分布变量的一些例子:
(1)连续抛硬币100次,统计总共出现正面的次数。次数X服从二项分布。 (2)调查250名新生婴儿的性别,记男婴的总数为X,则X服从二项分布。 (3)调查n枚种蛋的出雏数,出雏数X服从二项分布。 (4)n头病畜治疗后的治愈数X,X服从二项分布。
生物统计学 几种常见的概率分布律
非此即彼
随机试验有两种互不相容不同结果。 重要条件: 1. 每次试验两个结果(互为对立事件),每一种结果在每次 试验中都有恒定的概率; 2. 试验之间应是独立的。
P(AB)=P(A)P(B)
2.14
二项分布的概率函数
服从二项分布的随机变量的特征数
方差 当以比率表示时
偏斜度
了解
峭度
做题时请先 写公式,代 数字,出结 果,描述结 果的意义。
正态分布表的单侧临界值
上侧临界值
下侧临界值
双侧临界值
§3.5 另外几种连续型概率分布
指数分布(exponential distribution)
了解
Γ分布(gamma distribution)
了解
了解
随着p的增加, Γ分布愈来愈 接近于正态分 布。
§3.6 中心极限定理 (Central Limit Theorem) 假设被研究的随机变量X可以表 示为许多相互独立的随机变量Xi 的和。如果Xi的数量很大,而且 每一个别的Xi对于X所起的作用 又很小,则X可以被认为服从或 近似地服从正态分布。
作业
P51
3.1, 3.2(算出各表现型概率即可); 3.12, 3.18
正态分布的密度函数和分布函数 正态分布(normal distribution) 高斯分布(Gauss distribution) 正态曲线(normal curve) 连续型概率分布律 两头少,中间多,两侧对称
了解
标准正态分布
/fai/
标准正态分布的特性
ቤተ መጻሕፍቲ ባይዱ
正态分布表的使用方法
正态分布标准化
生物统计学
第三章 几种常见的概率 分布律
2010.9
生物统计学:第三章随机变量与概率分布
例:用复合饲料饲养动物,每天增重的kg数及 其相应的概率如下:
每天增重xi /kg 0.5
概率 0.10
1.0
0.20
1.5
0.50
2.0
0.20
问每天增重的数学期望和方差是多少?
解: μ=E(X)=1.40
E(X2 ) =2.15
var=σ2 = E(X2 ) –μ2=2.15-1.42=0.19
15.167
(4)随机变量的方差(variance) - 总体方差
度量随机变量取值的变异程度的指标,其定义式:
Var( X ) 2 ( xi )2 E[( X )2 ]
N
E[( X )2 ] E( X 2 2 X 2 )]
E(X 2) 2E(X ) 2
对于例1:
件的集合)的概率有以下关系:P(A )=1-P(A)
2 )条件概率
➢ 已知事件B发生的条件下,事件A发生的概率 称为条件概率,记为P(A︱B) P(A∣B)=P(AB)/P(B) P(B∣A)=P(AB)/P(A)
例:一周的天气情况如下:
周日
日
一
二
三
四
五
六
预报
晴
阴
雨
雨
雨
晴
雨
实际
晴
雨
阴
雨
雨
晴
晴
设A表示预报有雨的事件,B表示实际下雨的事件
些值的概率p(x1),p(x2),…,p(xn),…,排列起来,构 成了离散型随机变量的概率分布。常用概率分布表或概 率分布图表示(如,p28表与p29图3-1)。
例3.1 掷一次骰子所得点数的概率函数
f (x) 1 , x 1, 2, 3, 4, 5, 6 6
生物统计学03概率和概率分布
e
−λ
(λ = np)
x = 0, 1, 2…, n
第二节 常用的概率分布 二、泊松分布
☆ 参数 参数:
µ= λ
2 = λ σ
☆ 形状
λ=0.5 λ=1.5 λ=2.5
λ→20
泊松分布→正态分布 泊松分布 正态分布
第二节 常用的概率分布 三、正态分布
☆ 是一种连续随机变量的概率分布 ☆ 许多生物现象的计量资料均服从正态分布 ☆ 一般假定试验误差的分布服从正态分布 ☆ 非正态总体统计数的抽样分布近似服从正态分布
☆当 p 值较小且 n 值不
0.25 0.2 0.15 0.1 0.05 0 1 3 5 7
p=0.3
p=0.5
p=0.75
大时, 大时,图形是偏倚的
☆当 p 值趋于 时,分 值趋于0.5时
布趋于对称
9
11
13
15
17
19
21
第二节 常用的概率分布 二、泊松分布
☆ 概率函数
P( x ) =
λ
x
x!
第二节 常用的概率分布
随机抽取20株小麦 测得平均株高为82.3cm,标准差为 株小麦, cm, 例3.4 随机抽取 株小麦,测得平均株高为 cm 1.7502cm,试计算: cm,试计算: cm 1)株高≥85cm的概率; 的概率; 的概率 的正常值范围。 2)小麦株高的95%的正常值范围。 小麦株高的 的正常值范围
第二节 常用的概率分布 三、正态分布
1. 概率函数
f (x) = 1
− ( x−µ)2 2σ 2
σ 2 π
e
记为x~ 记为 ~N(µ,σ2)
第二节 常用的概率分布
2. 正态曲线的特点
生物统计学 第三章 概率分布09
2
2 2
x
= 期望 2 = 方差
X ~ N(, 2)
正态分布
正态分布概率密度函数的几何表示
f (x)
正态曲线
x
曲线下某区间的面积即为随机变量在该区间取值的概率
正态分布
正态分布的特点
➢只有一个峰,峰值在x = 处 ➢曲线关于x = 对称,因而平均数=众数=中
位数 ➢x轴为曲线向左、右延伸的渐进线
P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
1
30!0 e331 1!e3 Nhomakorabea32 2!
e3
33 3!
e3
=0.3528
连续型随机变量的概率分布
正态分布(normal distribution)
➢具有如下概率密度函数的随机变量称为正态 分布随机变量:
f (x) 1 e[ (x )2 ]
第三章 常用概率分布
二项分布 普哇松分布 正态分布 抽样分布
离散型随机变量的概率分布
二项分布(binomial distribution)
假设:1. 在相同条件下进行了n次试验 2. 每次试验只有两种可能结果(1或0) 3. 结果为1的概率为p,为0的概率为1-p 4. 各次试验彼此间是独立的
在n次试验中,结果为1的次数(X = 0,1,2, ,n)服从二项分布,表示为
较大,顶部略低,尾部略高。自由度小的t 分布,更为明显。 n>30时, t 分布接近于标准正态分布; n>100时,t 分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。 3. t 分布概率求法 可查P302 t 分布的双侧分位表。
例:df=4 双侧 t0.05=2.776 t0.01=4.604 单侧 t0.05=2.132 t0.01=3.747
最新生物统计学课后习题解答-李春喜
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地100 例30 ~40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种10 个果穗长度(cm) 的标准差和变异系数,并解释所得结果。
24 号:19 ,21 ,20 ,20 ,18 ,19 ,22 ,21 ,21 ,19 ;金皇后:16 ,21 ,24 ,15 ,26 ,18 ,20 ,19 ,22 ,19 。
【答案】 1 =20, s 1 =1.247, CV 1 =6.235% ; 2 =20, s 2 =3.400, CV 2 =17.0% 。
第三章 概率和概率分布
三、概率分布
(一)离散型变量的概率分布
要了解离散型随机变量x 的统计规律,必须知道它 的一切可能值xi及取每种可能值的概率pi。
1. 列出离散型随机变量X的所有可能取值. 2. 列出随机变量取这些值的概率. 3. 通常用下面的表格来表示:
表3.3 离散型变量的概率分布
变量(x) 概率(P) x1 p1 x2 p2 x3 p3 x4 p4 …….. ……. xn pn
Jocob Bernoulli(16541705年):瑞士数学家
当实验次数足够多时,某一事件出现的频率与概率有较 大偏差的可能性很小
2、辛钦大数定律(Khinchine theorem)
设x1,x2,x3,…,xn是来自同一总体的变量, 对于任意小的正数ε 。
lim P{ x } 1
A3、…、An为完全事件系。
(二)概率的计算法则 1 互斥事件加法定理 若事件A与B互斥,则 P(A+B)=P(A)+P(B) 推理1 P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An) 推理2 P(A)=1-P(A) 推理3 完全事件系的和事件的概率为1。
2 独立事件乘法定理 事件A和事件B为独立事件,则事件A与事件B同 时发生的概率为各自概率的积。
n
Khinchine(1894~1959) 苏联数学家
只要从总体中抽取 的随机变量相当
多,就可以用样本的统计数来估计总体的
参数。
统计数
参数
样本容量越大,样本统计数与总体参数之差越小。
第二节 几种常见的理论分布
随机变量的分布可用分布函数来表述概率
二项分布
离散型变量
生物统计学(第3版)杜荣骞 课后习题答案 第三章 几种常见的概率分布律
第三章 几种常见的概率分布律3.1 有4对相互独立的等位基因自由组合,问有3个显性基因和5个隐性基因的组合有多少种?每种的概率是多少?这一类型总的概率是多少?答:代入二项分布概率函数,这里φ=1/2。
()75218.02565621562121!5!3!83835==⎪⎭⎫⎝⎛=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=p结论:共有56种,每种的概率为0.003 906 25(1/256 ),这一类型总的概率为0.218 75。
3.2 5对相互独立的等位基因间自由组合,表型共有多少种?它们的比如何? 答:(1)543223455414143541431041431041435434143⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛+⎪⎭⎫ ⎝⎛=⎪⎭⎫⎝⎛+ 表型共有1+5+10+10+5+1 = 32种。
(2)()()()()()()6976000.0024114165014.00241354143589087.002419104143107263.0024127104143105395.00241815414353237.0024124343554322345541322314==⎪⎭⎫⎝⎛==⨯=⎪⎭⎫⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛==⨯=⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛===⎪⎭⎫⎝⎛=隐隐显隐显隐显隐显显P P P P P P它们的比为:243∶81(×5)∶27(×10)∶9(×10)∶3(×5)∶1 。
3.3 在辐射育种实验中,已知经过处理的单株至少发生一个有利突变的概率是φ,群体中至少出现一株有利突变单株的概率为P a ,问为了至少得到一株有利突变的单株,群体n 应多大?答: 已知φ为单株至少发生一个有利突变的概率,则1―φ为单株不发生一个有利突变的概率为:()()()()()φφφ--=-=--=-1lg 1lg 1lg 1lg 11a a an P n P n P3.4 根据以往的经验,用一般的方法治疗某疾病,其死亡率为40%,治愈率为60%。
生物统计学课件ch3常用的概率分布
(3) 各次试验独立。即一次试验出现什么样的 结果与前面已出现的结果无关。
成功次数的概率分布——二项分布
• 例 设某毒理试验采用白鼠共3只,它们有 相同的死亡概率π,相应存活概率为1-π。记 试验后白鼠死亡的例数为X,分别求X=0、 1、2和3的概率
35
30
25
人数
20
15
10
5
0
2.7~ 3.1~ 3.5~ 3.9~ 4.3~ 4.7~ 5.1~ 5.9~56..53~
血清总胆固醇(mmol/L)
如果样本量很大,组段很多,矩形顶端组 成的阶梯型曲线可变成光滑的分布曲线。
大多数情况下,可采用一个函数拟合这 一光滑曲线。这种函数称为概率密度函数
把钱分成7份,赢了4局的就拿4份,赢了3局 的就拿3份呢?或者一人分一半呢?
频率与概率 frequency and probability
样本的实际发生率称为频率。设在相同条 件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。
概率:随机事件发生的可能性大小,用大 写的P 表示;取值[0,1]。
p(X=xi) p(x1) p(x2) …… p(xk) ……
离散型随机变量分布的特点:
(1) 0 p(xi ) 1(i 1, 2,...)
(2) p(xi ) 1 所有xi
离散型随机变量的概率分布举例
f(x)
抗体滴度 人数, x 比例, f(x)
1:10
4
.058
1:20
3
.043
二项分布的概率计算
例 如 果 =0.4,
生物统计学概率及概率分布幻灯片
第四节 数据整理
例1.5 研究广西“霞烟鸡〞品种的 母 鸡所生鸡蛋的个头大小,将所得N=623 个鸡蛋一个个地称重,再将得到的数据 进展分组归类并统计各组次数如右。
利用次数分布表计算出反映果实 平均大小和彼此悬殊程度〔变异度〕 的指标,即总体平均数μ= 43.5g和总 体标准差σ= 4.65g,它们也是“单个鸡 蛋重〞这一连续性变量的两个最重要的 参数,实际决定其概率分布的特征。
第二节 概率计算法那么
一、加法定理
• 靶标被击中92次又分三种情况:
• P〔A+B〕=P〔A〕+P〔B〕-P〔AB〕
⑴ 两人同时击中:
例1.2 考察甲乙两人分别使用手
•
枪和步枪朝同一靶标射击的结果。定
n·P〔A·B〕= 48
• 义A为“甲击中〞,B为“乙击中〞。假
⑵ 甲击中且乙未击中:
• 定统计次数 n = 100 得P〔A〕= 0.6,
还可以是标准误,标准差和标准误〔平均数的标准差〕都是反映数据变异 性的数量指标,各自蕴藏着误差和抽样误差〔如样本平均数和真值的差异〕 变异幅度的信息,但它们决非〔抽样〕误差本身。
连续性数据〔含质量性状的指标〕大多可依据其性状自然归组。 连续性数据那么需要人为地进展分组,方法是先根据观察值〔也称原始 数据〕的个数确定大致的组数,然后按数据的极差范围计算组距、调整组 数,最后依最大的观察值和最小的观察值确定组限。
得 到 的 概
q
, 只 要
续 性 变 量
看 出 , 服
布 , 绘 成
上 种 子 发
按 贝 努 利
n
的发分着性 的,次变趋大边、数率 不从条芽概
生物统计学第三章
250
249 251 246 250
252
251 249 247 252
254
246 245 250 255
250
253 248 247 252
254
245
250
251
251
4
資料表格化法
Tabulation of Data
50粒四環素按重量大小排列後次數分配表(未分組)
組值 244 245 246 247 248 249 250 251 252 253 254 255 256 合計 次數登記 / // // /// //// ///// //////// /////// ///// /// /// / // 次數 1 2 2 3 4 6 9 8 6 3 3 1 2 50 累計次數 1 3 5 8 12 18 27 35 41 44 47 48 50 相對次數 2% 4% 4% 6% 8% 12% 18% 16% 12% 6% 6% 2% 4% 100% 累計相對次數 2% 6% 10% 16% 24% 36% 54% 70% 82% 88% 94% 96% 100%
9
長條圖
bar chart
25 20 15 10 5 0 < 250 = 250 > 250
10
23 18
9
圓形圖
pie chart
= 250, 9, (18%)
< 250, 18, (36%)
> 250, 23, (46%)
11
製圖法
Graph
連續變數(continuous variable)的統計圖:
莖葉圖(stem-leaf plot):為Tukey(1960)提出 的,將資料由小到大依序排列,將每一觀察 值分成兩部分,一部分屬於「莖」(stem), 其餘的屬於「葉」(leaf),可以洞悉資料的集 中與分散情形。 直方圖(histogram):與長條圖非常類似,適 用於連續變數並且分組的資料,作法如同長 條圖,橫軸代表各組的組值,縱軸代表各組 的次數。
第三章常用概率分布生物统计学课件
上一张 下一张 主 页 退 出
【例3·3】 抛掷一枚硬币,其可能结 果是“币值一面朝上” 、“币值一面朝 下”。“币值一面朝上”用1表示,“币 值一面朝下”用0表示,用x表示试验结果, 则x的取值为0、1。
如“取得1个数字是2的倍数”是一个复合 事件,它由“取得1个数字是2”、“是4”、 “是6”、…… 、“是20”10个基本事件组合 而成。
(2)必然事件 在一定条件下必然会发生的事件称为必然
事件,用Ω表示。
上一张 下一张 主 页 退 出
(3)不可能事件 在一定条件下不可能发生的事件称为不可
能事件,用ф表示。 必然事件与不可能事件实际上是确定性现
第三章 常用概率分布
本章在介绍概率论中最基本的两个概念— —事件、概率的基础上,重点介绍生物科学研 究中常用的几种随机变量的概率分布——二项 分布、正态分布以及样本平均数的抽样分布、t 分布、 2 分布和F分布。
上一张 下一张 主 页 退 出
第一节 事件与概率
一、事 件 (一)必然现象与随机现象
在自然界与生产实践和科学试验中,人 们会观察到各种各样的现象,把它们归纳起 来,大体上分为两大类:
上一张 下一张 主 页 退 出
从表3-1可看出,随着实验次数的增多, 1粒小麦种子发芽这个事件的概率越来越稳定地 接近0.7,我们就把0.7作为这个事件的概率。
在一般情况下,随机事件的概率 p 是不可 能准确得到的。通常以试验次数n充分大时随机 事件A的频率作为该随机事件概率的近似值。
第三章 概率与概率分布 华中农业大学生物统计学讲义
该试验样本空间由10个等可能的基本事件构成,即n=10,而事 件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一 个,事件A便发生。
P(A)=3/10=0.3
P(B)=5/10=0.5
12 3 4 5
6
7
8 9 10
一、概率基本概念
A=“一次取一个球,取得红球的概率”
10个球中取一个球,其可能结果有10个基本事件(即每个球 被取到的可能性是相等的),即n=10 事件A:取得红球,则A事件包含3个基本事件,即m=3
P(A)=3/10=0.3
12 3 4 5
6
7
8
9 10
一、概率基本概念
B= “一次取5个球,其中有2个红球的概率” 10个球中任意取5个,其可能结果有C105个基本事件,即n= C105 事件B =5个球中有2个红球,则B包含的基本事件数m= C32 C73
P(B) = C32 C73 / C105 = 0.417
2、在一定条件下可能发生也可能不 发生。
(二)频率(frequency)
一、概率基本概念
若在相同的条件下,进行了n次试验,在这n 次试验中,事件A出现的次数m称为事件A出现的 频数,比值m/n称为事件A出现的频率(frequency), 记为W(A)=m/n。
0≤W(A) ≤1
例:
一、概率基本概念
设样本空间有n个等可能的基本事件所构成,其中事件A包 含有m个基本事件,则事件A的概率为m/n,即P(A)=m/n。
古典概率(classical probability) 先验概率(prior probability)
一、概率基本概念
1 2 3 4 5 6 7 8 9 10
随机抽取一个球,求下列事件的概率; (1)事件A=抽得一个编号< 4 (2)事件B =抽得一个编号是2的倍数
生物统计学课后习题解答李春喜
生物统计学课后习题解答李春喜第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2、1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4、77 3、37 6、14 3、95 3、56 4、23 4、31 4、715、69 4、124、56 4、375、396、30 5、217、22 5、54 3、93 5、21 6、515、18 5、77 4、79 5、12 5、20 5、10 4、70 4、74 3、50 4、694、38 4、89 6、255、32 4、50 4、63 3、61 4、44 4、43 4、254、035、85 4、09 3、35 4、08 4、79 5、30 4、97 3、18 3、975、16 5、10 5、85 4、79 5、34 4、24 4、32 4、776、36 6、384、885、55 3、04 4、55 3、35 4、87 4、17 5、85 5、16 5、094、52 4、38 4、31 4、585、726、55 4、76 4、61 4、17 4、034、47 3、40 3、91 2、70 4、60 4、095、96 5、48 4、40 4、555、38 3、89 4、60 4、47 3、64 4、34 5、186、14 3、24 4、90计算平均数、标准差与变异系数。
【答案】=4、7398, s=0、866, CV =18、27 %2、2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差与变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。
生物统计学课后习题解答
第一章概论解释以下概念:总体、个体、样本、样本容量、变量、参数、统计数、效应、互作、随机误差、系统误差、准确性、精确性。
第二章试验资料的整理与特征数的计算习题2.1 某地 100 例 30 ~ 40 岁健康男子血清总胆固醇(mol · L -1 ) 测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.124.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.515.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.694.38 4.89 6.255.32 4.50 4.63 3.61 4.44 4.43 4.254.035.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.975.16 5.10 5.85 4.79 5.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.094.52 4.38 4.31 4.585.726.55 4.76 4.61 4.17 4.034.47 3.40 3.91 2.70 4.60 4.095.96 5.48 4.40 4.555.38 3.89 4.60 4.47 3.64 4.34 5.186.14 3.24 4.90计算平均数、标准差和变异系数。
【答案】=4.7398, s=0.866, CV =18.27 %2.2 试计算下列两个玉米品种 10 个果穗长度 (cm) 的标准差和变异系数,并解释所得结果。
24 号: 19 , 21 , 20 , 20 , 18 , 19 , 22 , 21 , 21 , 19 ;金皇后: 16 , 21 , 24 , 15 , 26 , 18 , 20 , 19 , 22 , 19 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0.0439
0.2051
产公猪头数的期望值: E(X ) np 100.5 5 产公猪头数的方差:
Var(X ) np(1 p) 10 0.5 0.5 0.25
离散型随机变量的概率分布
普哇松分布(Poisson distribution)
描述稀有事件的试验,对于二项分布 X ~ B(n, p) 如果概率P很小,试验次数n很大 ,则二项分布 趋近普哇松分布,表示为:
第三章 常用概率分布
二项分布 普哇松分布 正态分布 抽样分布
离散型随机变量的概率分布
二项分布(binomial distribution)
假设:1. 在相同条件下进行了n次试验 2. 每次试验只有两种可能结果(1或0) 3. 结果为1的概率为p,为0的概率为1-p 4. 各次试验彼此间是独立的
在n次试验中,结果为1的次数(X = 0,1,2, ,n)服从二项分布,表示为
X
)
Var( )]
1
2
(
2
0)
1
Z服从正态分布 Z ~ N(0,1) 标准正态分布
正态分布
标准正态分布的概率密度函数
f (z) 1 e[ z2 ]
2 2
z
0
正态分布
标准正态分布的概率计算
➢ 附表1 (p. 297)
u
u
P(Z u) f (z)dz
1 e( z 2 )dz
2
2
正态分布
(1) P( Z u) 或 P(Z -u) (u > 0)
P(Z u) P(Z u) 直接查表
标准正态分布的概率计算
标准正态分布函数表----附表1 (p. 297)
(1) 直接查附表1,P(Z 0.64)= 0.7389; (2) P( Z 1.53)= 1 - P( Z 1.53)= 1 – 0.9370 = 0.0630; (3) P (2.12 Z 0.53)= P (Z -0.53)- P (Z 2.12)
T表
自由度
F分布(F-distribution) 2分布(Chi-Square)
➢由两个参数决定: 平均数 和 标准差 • 决定曲线在x 轴上的位置 • 决定曲线的形状
正态分布
平均数的影响
标准差的影响
正态分布
标准正态分布(standard normal distribution)
对于 X ~ N(, 2)
令
Z
X
标准化
E(Z)
1
[E(X
)
]
1
(
)
0
Var(Z
)
1
2
[Var(
= 0.2981 – 0.0136 = 0.2811。
标准正态分布的双侧分位数
标准正态分布的双侧分位数表 ----附表2 (p. 299)
对于给定的两尾概率求标准正态分布在x 轴上的分位点
/2
/2
(1)设标准正态分布的两尾概率之和 0.05 ,求分位数u值。
由附表2可直接查得分位数为u = 1.959964
2
2 2
x
= 期望 2 = 方差
X ~ N(, 2)
正态分布
正态分布概率密度函数的几何表示
f (x)
正态曲线
x
曲线下某区间的面积即为随机变量在该区间取值的概率
正态分布
正态分布的特点
➢只有一个峰,峰值在x = 处 ➢曲线关于x = 对称,因而平均数=众数=中
位数 ➢x轴为曲线向左、右延伸的渐进线
1908年以“Student(学生)”为笔名在该年的 Biometrika上发表了论文《平均数的概率误差》, 创立了小样本检验代替大样本检验的理论,即t分布 和t检验法,也称为学生氏分布。
1. t 分布图像类似于标准正态分布,两侧对称,均数为 0。 2. t 分布曲线随样本自由度不同而异, 与正态曲线相比,离散度
x ~ p()
离散型随机变量的概率分布
普哇松分布的概率函数
p(X x) x e
x!
普哇松分布的期望与方差
2
离散型随机变量的概率分布
例2:某遗传病的发病率为0.0003,某鸡场有10000头 肉鸡,问今年发生该遗传病4头及4头以上的概率有 多少?
λ=μ=np=10000×0.0003=3 x=4
样本均数的分布亦接2近正态分布。
的期望为
2、设原总体的期望为,方差为 ,则样本平均数
x
样,本方均差数为的均2 x/数n(期n 望) x — N(,
2
)
样本均数的标准差
n
故样本均数的分布是服从
的正态
t 分布
当以样本s 估计 时(n < 30 ),得到统计量:
t x
sx
W.S.Gosset(歌赛特,英国,1777~1855)
X ~ B(n, p)
离散型随机变量的概率分布
二项分布的概率函数
f (x) Cnx px (1 p)nx
E(X ) xi f (xi ) np
n! px (1 p)nx (x 0,1,2, , n) x!(n x)!
二项分布的期望
E(X ) xi f (xi ) np
二项分布的方差
(2) 0.01 , 分位数为u = 2.575829
标准正态分布的双侧分位数表 ----附表2 (p. 299)
对于给定的一尾概率求标准正态分布在x 轴上的分位点
0.05
/2
0.01
/2
(1)设标准正态分布的右尾(左尾)概率为 0.05 ,求分位数u值
用2 查附表2,可得一尾概率为 时的分位数u值 = 20.05 = 0.1查表得u = 1.644854 。
2 Var(X ) np(1 p)
离散型随机变量的概率分布
例1:一头母猪一窝产了10头仔猪,分别求其
中有2头公猪和6头公猪的概率。
f (2) C120 0.52 (1 0.5)102 10! 0.520.58 2!(10 2)!
f (6) C160 0.56 (1 0.5)106 10! 0.560.54 6!(10 6)!
较大,顶部略低,尾部略高。自由度小的t 分布,更为明显。 n>30时, t 分布接近于标准正态分布; n>100时,t 分布基本与标准正态分布相同; n→∞时,t 分布与标准正态分布完全一致。 3. t 分布概率求法 可查P302 t 分布的双侧分位表。
例:df=4 双侧 t0.05=2.776 t0.01=4.604 单侧 t0.05=2.132 t0.01=3.747
(2) 0.01 , = 20.01 = 0.02查表得u = 2.326348
标准正态分布几个常用的分位数值:
双侧(尾)概率:
下面是标0准.05正态时分,布u的=几个1.特96殊的且常用的分位数值:
0.01 时,当u双=尾概2.率58为0.05时,u = 1.96
当双尾概率为0.01时,u = 2.58 当右尾概率(左尾概率)为0.05 时,u = 1.64(-1.64) 当右尾概率(左尾概率)为0.01 时,u = 2.33(-2.33)
P(x≥4)=1-P(x<4)=1-P(0)-P(1)-P(2)-P(3)
1
30!0 e3
31 1!
e3
32 2!
e3
33 3!
e3
=0.3528
连续型随机变量的概率分布
正态分布(normal distribution)
➢具有如下概率密度函数的随机变量称为正态 分布 ]
单侧(尾)概率:
0.05 时,u = 1.64(-1.64)
0.01 时,u = 2.33(-2.33)
抽样分布 P43 原总体
样本统计量的概率分布 称为抽样分布
样本1 样本2
x1
x2
新总体
样本n n
xn
统计量
正态总体样本平均数的抽样分布
数的分 (n>30)
1、中心极限定理:从正态总体N(µ,σ2)抽样,样本均 布服从正态分布;若从非正态总体抽样,当n→∞