第七章 拟合优度检验

合集下载

拟合优度检验课件

拟合优度检验课件
统计量的选择
为了解决上述问题,以 Ti 为权求加权值
自由度的确定
变量之间存在着一个制约关系: 故统计量 渐近 (k-1) 个自由度的 分布。
在 F(x) 尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个。
1
若有 r 个未知参数需用相应的估计量来代替,自由度就减少 r 个。
【例1】
子二代
子一代

黄色纯系

绿色纯系
他的一组观察结果为:
黄70,绿27
近似为2.59:1,与理论值相近。
根据他的理论,子二代中,黄、绿之比 近似为3:1,
添加标题
提出假设H0: O-T=0 (p1=3/4,p2=1/4)
添加标题
这里,n=70+27=97,k=2,
添加标题
检验孟德尔的3:1理论:
04解:05 Nhomakorabea将有关计算结果列表如下:
06
因H0所假设的理论分布中有一个未知参数 λ,故自由度为4-1-1=2。
将npi < 5的组予以合并,即将发生3次及4次战争的组归并为一组。
按α =0.05,自由度为4-1-1=2,查表得: 统计量: 未落入拒绝域。 故认为每年发生战争的次数 X 服从参数为 0.69的泊松分布。
【例】下表给出不同给药方式与给药效果,求证:给药方式与给药效果有无关联。
若事件 A 和事件 B 是相互独立的,则
提出零假设:假设实测数与理论数无差异。即H0:O-T=0。 计算理论数:若事件 A 和事件 B 是相互独立的,则 P(AB)=P(A)P(B)。 例如:在给药方式和效果之间是相互独立的前提下,计算口服(事件B)有效(事件A)的概率 P(BA)=P(B)P(A) = (98/193) (122/193)。其理论数T1=(98/193)(122/193) 193 = (98)(122)/193 。 每个理论值用Tij表示,Tij=(i行总数)(j列总数)/总数。

第七章 拟合优度检验

第七章    拟合优度检验

• 1.拟合优度检验的一般原理(※)
• 2.拟合优度检验 • 3.独立性检验
难点
统计学家推荐的拟合检验方法是: Shapiro-Wilk检验 Kolmogorov-Smirnov检验
7.3 独立性检验
难点
一、列联表的独立性检验
原理:Pearson定理
用途:检验事物之间的独立性
1. 2×2列联表检验 2. r×c列联表检验
四格表资料的基本形式
处理组
甲 乙 合计
阳性事件发 阳性事件未发
生数
生数
a
b
c
d
a+c
b+d
合计
a+b c+d
n
四格表的前提条件:双边固定
1 . 2 2列联表(四格表 fourfold table)
处理 方式
口服
效 有效 a
果 无效 b
2 2列联表
注射 c
d
自由度 df = 1
四个表资料 检验的专用公式:
和前面的结果 一样
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
需要解决的问题:
1.用古典概型求2 2列联表出现某一组数值的概率 2.离散分布尾区建立的方法。
1. 2 2列联表概率的计算方法
a
b
a+bcdc+da +c b +d
N
2.离散分布尾区概率的计算方法:
从实际观测值开始,把对 成立不利的方向上 的概率全加起来,作为尾区概率。
3. 2 2列联表的精确检验
Goodness Of Fit Test
※7.1 拟合优度检验的一般原理 7.2 拟合优度检验 7.3 独立性检验(难点)

大学《概率统计》第七章 数理统计的基本概念 拟合优度检验介绍

大学《概率统计》第七章 数理统计的基本概念 拟合优度检验介绍
10
嘿嘿、告诉过你啦, 好玩吧?
统计真好玩!
11
拟合优度检验
例:为了检查一颗骰子是否均匀,把这颗骰子 掷了120 次,得结果如下表: 出现点数 1 2 3 4 5 6 问:骰子均匀吗?
频数 15 15 20 21 23 26
(试在显著性水平 =0.1下作 2拟合优度检验。)
12
如果骰子是均匀的,那么出现各点的次数大致上应该是 20次左右.设 X 表示骰子掷一次后出现的点数.当骰子 均匀时,X 的概率函数为
22 30 112
2
4
22 82 112
2
i1 j1
ni n j
22 30
22 82
n
112
112
12
90
30
2
112
78
ቤተ መጻሕፍቲ ባይዱ
90 82 112
2
24.875 9.100 6.080 2.225
42.28
90 30
90 82
112
112
42.28 6.64拒绝原假设,即可以认为吸烟和患肺癌有关.
4, 78
试问,在显著性水平 1%下,能否认为吸烟习惯 与患肺癌无关?
16
原假设:H0 :吸烟和患肺癌无关, 0.01
人数 患肺癌 未患肺癌 ni
吸烟 18
4
22
不吸烟 12
78
90
nj
30
82 n 112
2 1
a 1b 1
2 0.99
1
6.64
2
2
2
nij
ni
n n
j
2
18
17
6
数据经过加工处理后即得到 所谓的“统计量的观测值”!

矿产

矿产

矿产资源开发利用方案编写内容要求及审查大纲
矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述
㈠矿区位置、隶属关系和企业性质。

如为改扩建矿山, 应说明矿山现状、
特点及存在的主要问题。

㈡编制依据
(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。

(2 列出开发利用方案编制所依据的主要基础性资料的名称。

如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。

对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。

二、矿产品需求现状和预测
㈠该矿产在国内需求情况和市场供应情况
1、矿产品现状及加工利用趋向。

2、国内近、远期的需求量及主要销向预测。

㈡产品价格分析
1、国内矿产品价格现状。

2、矿产品价格稳定性及变化趋势。

三、矿产资源概况
㈠矿区总体概况
1、矿区总体规划情况。

2、矿区矿产资源概况。

3、该设计与矿区总体开发的关系。

㈡该设计项目的资源概况
1、矿床地质及构造特征。

2、矿床开采技术条件及水文地质条件。

拟合优度检验

拟合优度检验
战争次数X 发生 X次战争的年数 223 0 142 1 48 2 15 3 4 4
在概率论中,大家对泊松分布产生的一 般条件已有所了解,容易想到,每年爆发战 争的次数,可以用一个泊松随机变量来近似 描述 . 也就是说,我们可以假设每年爆发战 争次数分布X近似泊松分布. 现在的问题是: 上面的数据能否证实X 具有 泊松分布的假设是正确的?
2
根据这个定理,对给定的显著性水平 , 2 2 查 分布表可得临界值 ,使得
P ( )
2 2
得拒绝域:
(r 1)
2 2 2 2
(不需估计参数)
(r m 1) (估计 r 个参数)
如果根据所给的样本值 X1,X2, …,Xn算得 2 统计量 的实测值落入拒绝域,则拒绝原假 设,否则就认为差异不显著而接受原假设.
X ~ N ( , )
2
2.
,则
z
X

~ N (0,1)
3.
4.
令 Y z 2 ,则 Y 服从自由度为1的2分布,即
Y ~ (1)
2
4.
当总体 X
~ N ( , )
2
n i 1
,从中抽取容量为n的样本,则
2
( xi x )

2
~ ( n 1)
2
2分布
i 1 i
并证明在H0 成立时对充分大的n, (7.4.2) 给出的 2 分布。 检验统计量近似服从自由度为k-1的
拒绝域为:
27 August 2012
W
2
1 k 1
2
华东师范大学
第七章 假设检验
第31页
例1 为募集社会福利基金,某地方政府发 行福利彩票,中彩者用摇大转盘的方法确定 最后中奖金额。大转盘均分为20份,其中金 额为5万、10万、20万、30万、50万、100万 的分别占2份、4份、6份、4份、2份、2份。 假定大转盘是均匀的,则每一点朝下是等可 能的,于是摇出各个奖项的概率如下:

拟合优度检验

拟合优度检验

计算上例的χ 值并做推断。先计算各理论数Ti。
2
给药方式 口服
(B )
有效( A )
O1=58 ( 98)(122 ) = 61.95 T1 = 193 O3=64 ( 95)(122 ) = 60.05 T3 = 193
无效( A )
总数
T2
( 98)( 71) = 36.5 =
193
O4=31 ( 95)( 71)
列联表中的数据可以用以下符号表示: a c a+c b d b+d a+b c+d N
在行总数和列总数及N都保持不变的情况下,a、b、c、d的各种组合 的概率可以由下式给出:
P=
( a + b )!( c + d )!( a + c )!( d + b )!
N !a !b !c !d !
零假设:不存在处理效应。若P > α 则接受零假设;反之则拒绝。 若a、b、c、d中的任何一个出现0时,则直接用该概率值作为判断标 准。若无,则应当将这个组合的概率以及从最接近于0的哪个观测值到 0的各种组合的概率都计入。这样才能构成一个尾区的概率。
将以上数据列成下表:
Y_R_ 实际观测数O 理论频率p 理论数T O-T (O-T) 2/ T 315 9/16 312.75 2.25 0.016
Y_rr 101 3/16 104.25 -3.25 0.101
yyR_ 108 3/16 104.25 3.75 0.135
yyrr 32 1/16 34.75 -2.75 0.218
2. 总体参数未知 例 调查到幼儿园接小孩的家长性别,以10人为一组,记录每组女性的人数,共得到
100组,列入下表的第2列中。问女性家长人数是否符合二项分布。 解:人群中男女比率各 占一半,但去接小孩的 家长中是否也是这个比 率就不一定。因此二项 分布的参数ϕ 是未知 的,需从样本数据估 计。

拟合优度检验-

拟合优度检验-
对性状杂 交 二 代
的 分 离 现 象 符 合 孟 德 尔遗传规律中9∶3∶3∶1 的遗传比例。
例7.1;7.2(P93;94)
• 总体参数未知 例P95,表7-1 不同之处:要由样本估计出总体参数。
7.2.3 对正态分布的检验(P96) 7.2.4 其他类型问题的检验(P97)

性别
动物性别实际观察次数与理论次数
实际观察 理论次 次数Oi 数Ti O i-T i (Oi-Ti)2/Ti

雄 合计
428
448 876
438
438 876
-10
10 0
0.2283
0.2283 0.4563
从上表可以看到 ,实际观察次数与理论次数存在
一定的差异。 这个差异是属于抽样误差、还是其性别
§7.3、独立性检验
7.3.1 列联表2 检验(P97)
一、独立性检验的意义
对次数资料,除进行拟合优度检验外,有时需 要分析两类因子是相互独立还是彼此相关。如研究 两类药物对实验动物某种疾病治疗效果的好坏,先 将动物分为两组,一组用第一种药物治疗,另一组 用第二种药物治疗,然后统计每种药物的治愈头数 和未治愈头数。
当自由度大于1时,原公式的2分布与连续型随机
变量2分布相近似,这时,可不作连续性矫正,但要
求各组内的理论次数不小于5。若某组的理论次数小 于5,则应把它与其相邻的一组或几组合并,直到理 论次数大 于5 为止。
• 统计量:
(Oi Ti ) Ti i 1
2 r
2
• 使用条件:
– 各理论值均大于5。 – 若自由度为1,则应作连续性矫正:
比例发生了实质性的变化?
要回答这个问题: ①首先需要确定一个统计量用以表示实际观察次数与 理论次数偏离的程度; ②然后判断这一偏离程度是否属于抽样误差,即进行 显著性检验。

SPSS软件应用-第七章非参数检验

SPSS软件应用-第七章非参数检验

病例号 照射前 照射后
1
1.0 0.0
2
1.0 18.0
3
0.0 6.7
4
1.2 0.0
5
1.0 29.0
6
1.0 17.0
7
1.0 5.0
8
1.0 6.0
9
1.0 10.0
10
4.0
7.0
Questions &
Answers
饲料
肝脏内铁含量(μg)
A 2.23 1.14 2.63 1.00 1.35
B 5.59 0.96 6.96 1.23 1.61
C 4.50 3.92 10.33 8.23 2.07
练习2
10例食管癌病人在某种药物保护下,做 6000γ的放射照射,观察血中淋巴细胞 畸变百分数,结果如下表。问照射前后 血中淋巴细胞畸变百分数有无差别。
7.1 拟合优度检验(1-Sample K-S Test)
以例7-1数据(数据文件名“diameter_sub.sav”)为例,试检验变量 “trueap_mean”(矢状面管径)是否服从正态分布。
7.1 拟合优度检验(1-Sample K-S Test)
7.1 拟合优度检验(1-Sample K-S Test)
第二步:Analyze Nonparametric Test Legacy Dialogs 2 Related Samples Test
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.6 多个相关样本的非参数检验
牙齿 普通 RPI Y型 编号 卡环 卡环 卡环
7.2 样本率与总体率比较的二项分布检验(Binomial)

卡方-拟合优度检验

卡方-拟合优度检验

黑色无角牛的理论次数T1:360×9/16=202.5;
黑色有角牛的理论次数T2:360×3/16=67.5; 红色无角牛的理论次数T3:360×3/16=67.5;
红色有角牛的理论次数T4:360×1/16=22.5。
或 T4=360-202.5-67.5-67.5=22.5
(四)列表计算2
表 2计算表
~ 2 (n);

2
若用样本平均数

n
x 代替总体平均数μ,则随机变
2 i
x
2
(x x)
i 1

2

(n 1) S 2
2
服从自由度为n-1的2分布,记为
(n 1) S
2


2

2
( n 1)
显 然 ,2≥0 , 即 2 的 取 值 范 围 是[0,+∞;2 分布密度曲线是随自由度不同而改变的一组曲线。随 自由度的增大, 曲线由偏斜渐趋于对称;df≥30时, 接近正态分布。下面给出了几个不同自由度的2概率 分布密度曲线。
比例发生了实质性的变化?
要回答这个问题: ①首先需要确定一个统计量用以表示实际观察次数与 理论次数偏离的程度; ②然后判断这一偏离程度是否属于抽样误差,即进行 显著性检验。
为了度量实际观察次数与理论次数偏离程度:
A:最简单的办法是求出实际观察次数与理论次数的 差数。如上表:O1-T1 =-10,O2-T2=10,由于这两个 差数之和为0,显然此方法不可行; B:计算∑(O-T)2,其值越大,实际观察次数与理论次 数相差亦越大,反之则越小。但尚有不足。例如某一 组 实 际 观 察 次 数为505、理论次数为500,相差5; 而另一组实际观察次数为26、 理论次数为21,相差亦 为 5。

第7章 拟合优度检验

第7章 拟合优度检验
第七章 拟合优度检验
§7.1拟合优度检验的一般原理 拟合优度检验的一般原理
7.1.1 什么是拟合优度检验
拟合优度检验( 拟合优度检验(goodness of fit test) ) 是用来检验实际观测数与依照某种假设或模型 计算出来的理论数之间的一致性,以便判断该 计算出来的理论数之间的一致性, 假设或模型是否与观测数相配合。拟合优度检 假设或模型是否与观测数相配合。 验也会出现Ⅰ型错误(弃真) 验也会出现Ⅰ型错误(弃真)和Ⅱ型错误(取伪)。 型错误(取伪)
上一张 下一张 主 页 退 出
7.2.2 对二项分布的检验 1.总体参数 ϕ 已知 纯合的黄圆豌豆与绿皱豌豆杂交,F 例7.1 纯合的黄圆豌豆与绿皱豌豆杂交,F1 代自交,第二代分离数目如下: 代自交,第二代分离数目如下:
Y_R_ (黄圆) 黄圆) 315 Y_rr (黄皱) 黄皱) 101 yyR_ yyR_ (绿圆) 绿圆) 108 yyrr (绿皱) 绿皱) 32 556
χ2检验是对一个正态总体的标准差所作的检验。 检验是对一个正态总体的标准差所作的检验。
引例: 引例: 根据遗传学理论,动物的性别比例是1:1。 根据遗传学理论,动物的性别比例是1:1。 统计某羊场一年所产的876只羔羊中 只羔羊中, 统计某羊场一年所产的876只羔羊中,有 公羔428只 母羔448只 1:1的性别 公羔428只,母羔448只。按1:1的性别 比例计算, 母羔均应为438只 比例计算,公、母羔均应为438只。以A 表示实际观察次数, 论次数, 表示实际观察次数,T 表 示 理 论次数, 可将上述情况列成表7 可将上述情况列成表7-1。
从上述结果可以看出,矫正后的χ2比矫正前 从上述结果可以看出, 的低,若未加矫正,就已经接受H0,矫正后的χ2 的低,若未加矫正,就已经接受H 更低,不会影响结论,可以不加矫正。若未矫正 更低,不会影响结论,可以不加矫正。 时χ2> χ2α,一定要计算矫正的χ2。

《拟合优度检验》课件

《拟合优度检验》课件

柯克伦科夫勒检验
总结词
柯克伦科夫勒检验是一种基于概率的拟合优度检验方法,用于检验观测频数与期望频数之间的差异是否显著。
详细描述
柯克伦科夫勒检验基于二项分布,通过计算观测频数与期望频数的离差平方和,得到柯克伦科夫勒统计量。在样 本量足够大的情况下,柯克伦科夫勒统计量近似服从正态分布。通过比较柯克伦科夫勒统计量与临界值,可以判 断观测频数与期望频数是否存在显著差异。
03
拟合优度检验的步骤
Chapter
确定检验假设
零假设(H0)
样本数据与理论分布无显著差异。
对立假设(H1)
样本数据与理论分布存在显著差异。
计算检验统计量
统计量计算
根据样本数据和理论分布的性质,计 算相应的统计量,如卡方统计量、熵 值统计量等。
统计量性质
了解统计量的分布特性,以便后续的 临界值判断。
斯皮尔曼秩检验
总结词
斯皮尔曼秩检验是一种非参数拟合优度检验方法,用于检验观测频数与期望频数之间的差异是否显著 。
详细描述
斯皮尔曼秩检验基于秩次,通过将观测频数与期望频数按照大小排序,并计算秩次之差得到秩次统计 量。在自由度等于分类数减一的情况下,秩次统计量服从F分布。通过比较秩次统计量与临界值,可 以判断观测频数与期望频数是否存在显著差异。
Chapter
皮尔逊卡方检验
总结词
皮尔逊卡方检验是最常用的拟合优度检验方法之一 ,用于检验观测频数与期望频数之间的差异是否显 著。
详细描述
皮尔逊卡方检验基于卡方分布,通过计算观测频数 与期望频数的离差平方和,得到卡方统计量。在自 由度等于分类数减一的情况下,卡方统计量服从卡 方分布。通过比较卡方统计量与临界值,可以判断 观测频数与期望频数是否存在显著差异。

第七章 拟合优度检验

第七章  拟合优度检验

例7.2
用正常翅的野生型果蝇(vg+ vg+ )与残翅(vg
vg )的果蝇杂交,F1代均表现正常( vg+
vg )。 F1自交,所得F2代中311个正常翅和
81个残翅。问这一分离比是否符合孟德尔
3:1的理论比。
正常翅
实际观测值 理论频率 311 3/4
残翅
81 1/4
总 数
392
理论数(未矫正)
第七章
第一节
拟合优度检验
拟合优度检验的一般原理
什么是拟合优度检验
拟合优度检验是用来检验实际观测数与依照某种假
设或模型计算出来的理论数之间的一致性,以便判 断假设或模型是否与观测数相配合。 包括两种类型,第一种是检验观测数与理论数之间 的一致性,第二种是通过检验观测数与理论数之间 的一致性来判断事件之间的独立性。
Y_R_
实际观测值 理论频率 理论数 O-T (O-T)2 (O-T)2/T 315 9/16 312.75 2.25 5.0625 0.016
Y_rr
101 3/16 104.25 -3.25
yyR_
108 3/16 104.25 3.75
yyrr
32 1/16 34.75 -2.75
10.5625 14.0625 7.5625 0.101 0.135 0.218
1、对数据进行分组
2、根据总体分布类型和样本含量计算理论数 3、有时需用样本数据估计总体参数。计所估计参数的 个数为a 4、分别合并两个尾区的理论数,使之不小于5,合并 后的组数计为k 5、相应于2的自由度为k-1,相对于3的自由度为k-1-a
6、零假设:因为拟合优度检验不是针对总体参数

第7章 拟合优度检验

第7章 拟合优度检验

Chi-square统计量的极限分布
• 因为似然比的对数以卡方分布作为极限分 布,容易想见Chi-square统计量也以卡方分 布作为其极限分布。 • 定理 7.1 在零假设 square统计量有 下,Chi-
自由度修正
• 上面定理中零假设参数是给定的,但更多 的时候只是将分布的形式给出,参数需要 从数据中估计,这时候需要对自由度进行 修正 • 此时问题可以这样表述:理论分布F含有s 个位置参数,样本空间分割成k个互不相交 的区域, • 根据样本可以得到参数的估计值 由相应 的 构造chi-square统计量
KS检验的应用-GSEA
• Gene Set Enrichment Analysis (GSEA) • References
– Subramanian et al. PNAS 102:15546, 2005. – Tian et al. PNAS 102:13544, 2005. – Mootha et al. Nature Genetics 2003.
Overview of GSEA
• Given a prior defined gene set S , GSEA is to determine whether members of S are randomly distributed throughout the list, or primarily found at the top or bottom in the list. • Step of GSEA:
• Interpreting the results to gain insights into biological mechanisms remains a major challenge; • For a typical study (e.g., experimental condition vs. control, disease state vs. normal, tumor type A vs. tumor type B), a standard approach has been to produce a list of differentially expressed genes (DEGs);

生物统计学(第3版)杜荣骞 课后习题答案 第七章 拟合优度检验

生物统计学(第3版)杜荣骞 课后习题答案 第七章  拟合优度检验

第七章拟合优度检验7.12000年在5 760 295名成年人群中和1 596 734名儿童群体中严重CDH(先天性心脏病)和其他程度CDH的流行病学患者数如下表[36]:尚存活的成年人 2 205 21 358 23 563尚存活的儿童 2 316 16 663 18 979 合计 4 521 38 021 42 542检验在尚存活的成年人和儿童中受损害的程度,差异是否显著?答:这是2×2列联表χ2检验,使用程序如下:options linesize=76 nodate;data;do a=1 to 2;do b=1 to 2;input case @@;output;end;end;cards;2205 213582316 16663;proc freq formchar(1,2,7)='|-+';weight case;tables a*b/cellchi2 expected nocol norow nopercent chisq;title '2*2 Contingency Table Test';run;程序运行结果见下表:2*2 Contingency Table TestTABLE OF A BY BA BFrequency |Expected |Cell Chi-Square| 1| 2| Total---------------+--------+--------+1 | 2205 | 21358 | 23563| 2504.1 | 21059 || 35.72 | 4.2474 |---------------+--------+--------+2 | 2316 | 16663 | 18979| 2016.9 | 16962 || 44.347 | 5.2733 |---------------+--------+--------+Total 4521 38021 42542STATISTICS FOR TABLE OF A BY BStatistic DF Value Prob------------------------------------------------------Chi-Square 1 89.588 0.001Likelihood Ratio Chi-Square 1 89.070 0.001Continuity Adj. Chi-Square 1 89.289 0.001Mantel-Haenszel Chi-Square 1 89.586 0.001Fisher's Exact Test (Left) 2.21E-21(Right) 1.000(2-Tail) 4.20E-21Phi Coefficient -0.046Contingency Coefficient 0.046Cramer's V -0.046Sample Size = 42542从“A×B列联表的统计量”部分可以得出,连续性矫正的χ2显著性概率P=0.001,P <0.01,故拒绝H0,在尚存活的成年人和儿童中受损害的程度差异极显著。

第7章拟合优度检验

第7章拟合优度检验

312.75 104.25 104.25 34.75
2.25 -3.25 3.75 -2.75
5.0625 10.5625 14.0625 7.5625
0.016 0.101 0.135 0.218
X^2=0.016+0.101+0.135+0.218=0.470
§7.2.2 二项分布的检验
解:
提出假设
(Oi- Ei)2 Ei
0.0606 0.3125
0.15 0.4932 0.1176 0.625
0.3 0.973
计算检验的统计量 =3.0319 df=8-1=7 7,0.05=14.067 > =3.0319
结论:观测值与理论值是一致的。
§7.2 拟合优度检验
§7.2.1 检验步骤 §7.2.2 二项分布的检验 §7.2.3 对正态性的检验
接受零假 设:即女性 家长人数符 合二项分 布。
§7.2.3 对正态性的检验
1. 例:1000个调查数据 该观测数是否服从正态分布?
组限 观测数 编码变量
原始数据 (f) (Y)
(3.92,3.96)
4
0
(3.97,4.01) 36
1
为此,我们可以构建一组服从正
态分布的理论数,然后利用2检
验,比较观测数和理论数是否相
32
556
问是否符合自由组合律?
解:已知 Y_R_:Y_rr:yyR_:yyrr =9/16:3/16:3/16:1/16
实际观测数(O) 理论频率(p) 理论数(E) O-E (O-E)^2 (O-E)^2/E
Y_R_ Y_rr yyR_ yyrr
315
101
108

第七章_拟合优度检验

第七章_拟合优度检验

例4
表型
观察频数( Oi 理论频数(Ti) Oi)
卡方值
抗性植株
敏感植株 总计
14
6 20
10
10 20
1.225
1.225 2.45
题解

按照孟德尔分离定律,Ss与ss的杂交后代代表型的比例应该 为1:1,即10个抗性植株和10个敏感植株

Байду номын сангаас(1)提出假设 H0:O-T=0;HA: O-T≠0 ( 2)计算理论值和卡方值:理论值就是根据孟德尔遗传定 律计算得到的后代分离理论数量
烟草种子发芽率的观察频数和理论频数表
每皿发芽种子数Xi 观察频数(Oi) OiXi
0 1 0 0 0 0
理论频率(P) 理论频数(Ti)
0.0001 0.0019
卡方值
2
3 4 5 6 7 8 9 10 总计
0
4 14 22 27 19 9 5 0 100
0
12 56 110 162 133 72 45 0 590
三、独立性检验

原理:通过观测数与理论数之间的一致性判断事件 之间的独立性,即判断两个事件是否是独立事件或 处理间差异是否显著。

方法:将数据列成列联表,也称列联表卡方检验。
一、2×2列联表卡方检验

(一)原理:例5 青霉素可以注射,也可以口服,每天给感冒患者 口服或注射 80 万单位的青霉素,调查两种给药方 式的药效,结果如下表所示,试分析青霉素的两种 给药方式的药用效果是否有差异?
4
5 6 7 8~10 总计
149.5~152.5
152.5~155.5 155.5~158.5 158.5~161.5 161.5~164.5 ——

生物统计第七章 拟合优度检验

生物统计第七章 拟合优度检验

(三)
χ 2统计量的计算 2 K.Pearson根据的 定义,根据 属性性状资料的分布,推导出用 2 于次数资料分析的 公式

2
O E
E
2
上式中O为观察次数,E为理论次 数,自由度为df.
• 卡方分布
( n 1) S 2

2

2
( n 1)
图7-1
几个自由度的概率分布密度曲线
表 7—9
结核菌数 x(1) 0 1 2 3 4 5 6 7 8 9 总计
结核菌数服从波松分布适合性检验计算表
理论概率(3) 0.0506 0.1511 0.2253 0.2240 0.1671 0.0997 0.0496 5.9708 17.8298 26.5854 26.4320 19.7178 5.8528 2.4898 0.9322 0.3068 117.8820 0.7288 9.5818 0.1297 0.2611 0.1578 0.1768 0.0129 0.0071 0.0834 理论格子数(T)(4)
1.016 1.704 3.720 6.920 12.060 18.120 23.180 27.700 28.400 24.960 20.480 14.040 8.980 4.880 2.288 1.552 200.00 8.7308 8.72 0.3393 0.6252 0.3519 1.4467 1.6476 0.1043 1.5338 0.3703 0.0132 0.2736 0.1069 6.44 1.9680
• 1、先将资料(原始数据略)整理成次数分布 表,组限、组中值、各组的次数列于表7-7的 (1)、(2)、(3)栏,再将各组上限列于 第(4)栏中。 • 2、计算各组组上限与均数( x =65.6kg)之差, 列于第(5)栏。 • 3、计算校正标准差Sc。由于由分组资料求得 的标准差较不分组时所得标准差为大,故需作 校正。

生物统计学第7章拟合优度检验

生物统计学第7章拟合优度检验
拟合优度检验的两种类型 (1)检验观测数与理论值之间的一致性 (2)检验观测数与理论数之间的一致性判断事件之 间的独立性
7.1.2 拟合优度检验的统计量
• 拟合优度检验一般方法是: (1)将观测值分为k种不同的类别。 (2)共获得n个独立观测值,第i类观测值的数目为
Oi, (3)求第i类的概率Pi (4)第i类的期望数即理论数为Ti,Ti=nPi (5)Oi与Ti进行比较,判断二者之间总的不符合程
例7.3 表7-3是不同给药方式与给药效果表。
解:因为零假设是给药方式与给药效果之间无
关联,则口服与有效同时出现的理论频率应为
口服的频率与有效的频率的乘积, P(BA)=P(B)P(A)=(98/193)(122/193)。其理 论数 由理T论i 频率乘以总数得出,
Ti
( 98 )(122 )193 193 193
7.2.2 对二项分布的检验
1.总体参数已知 【例7.1】纯合的黄圆豌豆与绿皱豌豆杂交,F1代自交,第
二代分离数目如下,问是否符合自由组合律?
1. 分组,根据孟德尔独立分配规律,YyRr×YyRr= Y_R_ :Y_rr :yyR_ :yyrr=9/16:3/16:3/16: 1/16,因此可分4组。
度是否由于机会所造成的。
2 k (Oi Ti )2
i 1
Ti
若理论数小于5 时应将相邻组 合并,直到大
于5为止。
当df=1时
2 k | oi Ti |2 0.5
i 1
Ti
Χ2的自由度:df=k-1-a
a为需要由样本估计的参数个数
7.2 拟合优度检验
7.2.1一般程序 (1)对数据进行分组(离散型数据组间距通常是1) (2)根据总体分布类型和样本含量n 计算理论数Ti。 (3)有时需用样本数据估计总体参数。记所估计的参数的个 数为a。 (4)分别合并两个尾区的理论数,使之不小于5,合并后的 组数计为k。 (5)相应于2的自由度为k-1, 相应于3的自由度为k-1-a。 (6)零假设:因为拟合优度检验不是针对总体参数做检验的, 因而零假设不需提出具体参数值,只需判断观测数是否符合理 论数或某一理论分布。它的零假设是观测数与理论数相符合, 可以形象化地记为H0:O-T=0。 (7)计算χ2值。

拟合优度检验

拟合优度检验

52 .479
df=(3-1)×(2-1)=2,查表得χ22,0.05=5.991, χ2> χ20.05,结论是拒绝H0:O-T=0,3种处理方式引 起的染色体畸变数是不同的。
作业
习题7.1,7.2
7.2.2 对二项分布的检验
1、总体参数已知
例1 纯合的黄圆豌豆与绿皱豌豆杂交,第二代律
解:当性状间相互独立时,根据孟德尔独立 分配定律,两对独立基因自由组合,表现型出现 的概率p=3/4,F2代各表现型出现的概率为 (3/4+1/4)2=9/16+3/16+3/16+1/16, 即黄圆,黄皱,绿圆,绿皱出现的概率分别 为9/16、3/16、3/16及1/16。
2
i 1
4
Oi Ti 2
Ti
1.391
df=(2-1)×(2-1)=1,查表得χ20.05=3.841, χ2< χ20.05 ,即口服给药与注射给药的效果没有显 著不同。因为已经接受H0,不必再矫正。
例题2 行数与列数大于2的r×c列连表χ2检验
各行列对应的理论数的计算方法:
5.相应于2的自由度为k-1,相应于3的自由度为 k-1-a; 6.零假设:因为拟合优度χ2 检验不是针对总体 参数做检验的,因而零假设不需提出具体参数 值,只需要判断观测数是否符合理论数或者某 一理论分布。它的零假设是观测数与理论数相 符合。可以记为H0:O-T=0; 7.按上述公式计算出χ2值,并与χ2临界值做比较, 当χ2>χ2α时拒绝H0;当χ2<χ2α时接受H0。
生物统计学
第七章 拟合优度检验
7.1 拟合优度检验的一般原理
7.1.1 拟合优度检验的概念 拟合优度检验是用来检验实际观测数与依照 某种假设或模型计算出来的理论数之间的一致 性,以便判断该假设或模型是否与观测数相配 合。 该检验包括两种类型:第一种类型是检验观 测数与理论数之间的一致性;第二种类型是通 过检验观测数与理论数之间的一致性来判断事 件之间的独立性。这两种类型的问题都使用χ2检 验,但这个χ2 检验与假设检验中所讲的χ2检验是 不同的,假设检验中的χ2检验是对一个正态总体 的方差差异显著性进行检验的方法。

[课件]第07章 拟合优度检验PPT

[课件]第07章  拟合优度检验PPT

解:假设3种方法增重不显著。 2lnP服从2自由度的x2分布
判断: x2=13.90 > x26, 0.05=12.592 ,拒绝假设
解:假设两种饲料饲养增重没差异。 因为有一个值为0,所以可以直接计算组合概率。
5 ! 6 ! 4 ! 7 ! P 0 . 015 判断:计算的P=0.015 < P=0.025 11 ! 4 ! 1 ! 0 ! 6 !
拒绝假设。
第七章 拟合优度检验——x2-检验
三、独立性检验——列联表x2检验
(无重复试验x2检验)
例题分析 精确列联表x2检验对于2×2列联表
性别 有 无 小计 例7.6 观测性别对药物的 4 1 5 男 0组合的概率都计入, 反应见右侧表: 之所以将这种组合的概率以及最小值变为 3 6 9 女 问男女对药物反应有无差异? 是因为这样才能构成一个尾区的概率。 7 7 14 解:假设男女对药物反应没差异。 小计
判断:接受假设。
第七章 拟合优度检验——x2-检验
四、x2的可加性
(一) x2的齐性检验
例1 试验绿玉米G对黄玉米Y的理论比为3:1。共收集了11个 谱系,每一个谱系的x2值都不具显著性,即都可能是从3:1 的总体中抽取的,问这11个谱系是否具齐性? 绿x2 +黄x2 解:假设具齐性。 3 1
Ni 4 Ni 4
第七章 拟合优度检验——x2-检验
二、一致性检验 解:假设该试验结果符合自由组合律。
有许多质量性状表型比值为: 9 1:1, 3 32:1, 1 3:1, 9:7, 13:3, Y-R-:Y-rr:yyR-:yyrr= : : :2 15:1, 63:1, 1:2:1, 9:3:3:1 对这些试验进行检验, 16 等。用 16 16x 16 都属适合度检验,它们的共同特点是总体参数概率 φ已知。 根据公式计算理论值 T =NP ,此例中N=556
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)获得的n次观测值中,第i组的观测频数记为Oi,
∑ O i = n , n = 100
i =1
k
(3)第i组的理论频率为Pi,其计算方法如下:
① 先计算样本平均数和标准差
y = 156.1cm
2
s = 4.98cm
( , ②假设高粱“三尺三”符合正态分布 σ
)
。根据参数估计
σ y 原理, 用 估计 , 用s/c4=4.98/0.9975=4.99估计。即假
题解
(1)零假设:H0:O-T=0;备择假设HA: O-T≠0 (2)分组:样本容量n=100,取组数m=10,组距为8g (3)计算理论频率pi和理论频数Ti (4)检验统计量的计算
χ2 =
k

i =1
(O i
Ti ) = 6 .1 638 Ti
2
(5)自由度df=k-1-a=8-1-1=6 (6)拒绝域的建立 (7)接受H0,服从正态分布
2 df , 0 . 05
= χ
= 7 . 815
④结论:高粱株高服从正态分布
(二)总体参数已知的正态性检验
例2 自动包装的袋装食盐的重量是否服从正态分布?已知每 袋标准重量为500g,调查了100袋,结果如下表所示。 袋装食盐重量调查表
500 497 493 498 502 494 499 490 488 494 512 500 491 494 496 518 484 496 518 500 515 518 506 482 494 503 517 491 516 511 522 530 486 512 488 503 506 490 530 506 514 508 491 527 505 485 500 520 508 493 488 500 505 522 472 529 503 512 492 522 497 479 478 470 482 476 527 482 486 524 475 506 492 493 506 496 500 488 492 492 487 504 512 548 478 500 499 509 536 478
(O i Ti )2
Ti
= 1.539
4、拒绝域的建立 5、结论:种子发芽率服从二项分布
(四)总体参数已知的二项分布检验
例4 水稻植株中对白叶枯病有抗性的纯合体的基因型为SS, 对白叶枯病敏感的纯合体为ss,杂合体的基因型为Ss。 其中抗性为显性性状,敏感为隐性性状,将Ss与ss进行 杂交,20个后代中有14株抗性植株,6株敏感植株。问后 代的分离比是否符合孟德尔分离定律?
(5)Oi与Ti进行比较,判断两者之间的不符合度,检验程序 如下:①零假设:H0:O-T=0;HA: O-T≠0 ②检验统计量:
χ2
( O i T i) =∑ Ti i =1
k
2
高粱“三尺三”株高观察频数和理论频数表 合并后 合并后) 高粱“三尺三”株高观察频数和理论频数表(合并后 组号 1 ~3 4 5 6 7 8~10 总计 组界/cm 组界/cm 140.5~ 140.5~149.5 149.5~ 149.5~152.5 152.5~ 152.5~155.5 155.5~ 155.5~158.5 158.5~ 158.5~161.5 161.5~ 161.5~164.5 —— 观察频数(Oi) 观察频数(Oi) 7 13 23 28 15 14 100 观察频率 Pi) (Pi) 0.07 0.13 0.23 0.28 0.15 0.14 1.00 理论频率 (P ) 0.093 0.142 0.216 0.232 0.176 0.138 1.00 理论频数 Ti) (Ti) 9.30 14.2 21.6 23.2 17.6 13.8 100 卡方值 0.569 0.101 0.091 0.993 0.384 0.003 2.141
(三)总体参数未知的二项分布检验
例3 检验烟草种子的发芽率,每个培养皿放10粒 种子,共100个培养皿,实验结果如下表所示。 1000粒种子有590粒发芽,检验发芽的种子数 是否符合二项分布。
烟草种子发芽率的观察频数和理论频数表
每皿发芽种子数Xi 观察频数(Oi) 每皿发芽种子数Xi 观察频数(Oi) OiXi 0 1 2 3 4 5 6 7 8 9 10 总计 0 0 0 4 14 22 27 19 9 5 0 100 0 0 0 12 56 110 162 133 72 45 0 590 理论频率( 理论频数(Ti) 理论频率(P) 理论频数(Ti) 0.0001 0.0019 0.0125 0.0480 0.1209 0.2087 0.2503 0.2058 0.1111 0.0355 0.0051 1 100 1.539 15.71 0.09 12.09 20.87 25.03 20.58 0.302 0.061 0.155 0.121 6.25 0.81 卡方值
χ2 = ∑
i =1
k
(O
i
Ti 0.5) Ti
2
= 2.45
(4)拒绝域的建立 (5)结论:符合孟德尔分离定律 拟合优度检验的自动程序:P=Chitest(Oi,Ti): Oi表示观 察值区域;Ti表示理论值区域;用于拟合优度卡方检验
三、独立性检验
原理:通过观测数与理论数之间的一致性判断事件 之间的独立性,即判断两个事件是否是独立事件或 处理间差异是否显著。 方法:将数据列成列联表,也称列联表卡方检验。
题解
(1)将观测值分为k组;按照分组原理分成10组,制成频数 分布表
高粱“三尺三” 高粱“三尺三”株高频数分布表
组号 1 2 3 4 5 6 7 8 9 10 —— 组限/cm 组限/cm 141~ 141~143 144~ 144~146 147~ 147~149 150~ 150~152 153~ 153~155 156~ 156~158 159~ 159~161 162~ 162~164 165~ 165~167 168~ 168~170 总计 组界/cm 组界/cm 140.5~ 140.5~143.5 143.5~ 143.5~146.5 146.5~ 146.5~149.5 149.5~ 149.5~152.5 152.5~ 152.5~155.5 155.5~ 155.5~158.5 158.5~ 158.5~161.5 161.5~ 161.5~164.5 164.5~ 164.5~167.5 167.5~ 167.5~170.5 —— 中值 142 145 148 151 154 157 160 163 166 169 —— 频数 1 2 4 13 23 28 15 10 3 1 100 频率 0.01 0.02 0.04 0.13 0.23 0.28 0.15 0.10 0.03 0.01 1
一、2×2列联表卡方检验
(一)原理:例5 青霉素可以注射,也可以口服,每天给感冒患者 口服或注射80万单位的青霉素,调查两种给药方 式的药效,结果如下表所示,试分析青霉素的两种 给药方式的药用效果是否有差异?
题解
1、提出假设 H0:O-T=0;HA: O-T≠0 2、总体参数未知,需要由样本比例估计P=590/1000=0.59 3、计算理论值和卡方值,理论频率Pi按照二项分布公式计 算——n=10,0≤k ≤10,理论数Ti=NPi
p i = C p (1 p)
k n k
nk
χ2 = ∑
i =1
k
2 χ df
( O i T i) =∑ Ti i =1
k
2
c、建立拒绝域 d、作出统计学结论
二、拟合优度检验
(一)总体参数未知的正态性检验
高粱“三尺三”株高测定结果(cm) 例1 高粱“三尺三”株高测定结果(cm)
155 159 150 159 157 161 158 148 164 158 153 158 150 161 149 159 155 163 155 166 159 153 160 156 153 161 153 156 156 154 155 153 156 141 153 156 151 163 158 154 150 144 160 156 155 162 157 154 164 157 159 156 155 145 162 151 156 158 148 167 157 150 160 156 154 152 153 152 164 157 159 157 151 153 152 154 147 163 154 159 151 160 157 158 162 157 158 158 157 170 152 150 155 161 155 162 155 154 165 158
第七章 拟合优度检验

教学目的要求
掌握:拟优合度检验的基本原理和步骤,不 同资料类型分布的拟合度检验,独立性测验 方法。 熟悉:拟合优度检验和独立性检验的应用。 了解:拟合优度检验在遗传学及其他生物学 科中上的应用。
讲授内容
一、拟合优度检验的一般原理 二、拟合优度检验 三、独立性检验
一、拟合优度检验的一般原理
卡方值的自由度df=k-1-a,其中k为合并后的组数,a为 需要由样估计的总体参数的个数;合并后的组数k=6, 由样本估计了总体的平均数和标准差,故a=2,df=3, 不用校正,计算卡方值
χ2 = ∑
i =1 k
(O i Ti )2
Ti
2 3 , 0 . 05
= 2.141
③建立拒绝域 χ
2
> χ
1、拟合优度检验(goodness of fit)定义:
用来检验观测数与依照某种假设或分布模型计算 得到的理论数之间一致性的一种统计假设检验,以 便判断该假设或模型是否与实际观测数相吻合。
吻合度检验
检验观测数与理论数之间的一致性。 检验观测数与理论数之间的一致性。
拟 合 优 度 检 验
相关文档
最新文档