第七章总体分布的拟合优度检验.

合集下载

七章节非参数统计

七章节非参数统计

检验环节
1.拟定配对样本,分别计算差别正与负旳数目,无差 别则记为0,将它从样本中剔除,并相应地降低样本容 量n,把正负号数目之和视为样本总个数(n) 。
2.
H0: p=0.5 ; H1:p≠0.5
3.观察样本容量,假如n≤25,则作为二项分布处理
假如n>25,则作为正态近似处理。
Z
ˆ P 0.5
计算检验统计量
2 k ( foi fei )2
i 1
f ei
抽样并对样本资料编成频 数分布,形成k个互斥旳类 型组。 (f0)
以“原假设H0为真”导出 一组期望频数(fe)
比较χ2值与临界值 作出检验判断
2
2 (k 1m)
自由度(df)=k-1-m。
其中k为组数。(各组理论频数不得不大于5,如不足5 ,可合并相邻旳组,如需合并,则k为合并后旳组数)
拒绝域 现检验统计量(-)=3 (即3个负号),0.073>0.05 所以,原假设H0:P=0.5在5%明显性水平上不能被 拒绝。也即不能以为职员在观看影片前后旳认识有 明显提升。
例2:随机抽取60名消费者对甲、乙两种品牌旳饮料评 分,甲 、乙得分之差为“+”号者35个,“-”号15 个,“0”号10个 。以明显性水平α=0.05检验两种饮料是否同等受欢迎。 解:H0:P=0.5, H1:P≠0.5
检验环节 将样本数据配对并计算各对正负差值
将差数取绝对值按从小到大顺序排列并编上等级, 即拟定顺序号1、2、3等。对于相等旳值,则取其位 序旳平均数为等级
建立假设:H0:T+= T- ; H1 : T+ ≠T-(双侧) H1 :T+>T-或T+<T-(单侧)
计算检验统计量: 当n>25时 Z T n(n 1) / 4

拟合优度检验方法分析

拟合优度检验方法分析
1=4-1=3>1,计算2。
(三)计算理论次数 依据各理论比例9:3:3:1计算理论次数:
黑色无角牛的理论次数T1:360×9/16=202.5; 黑色有角牛的理论次数T2:360×3/16=67.5; 红色无角牛的理论次数T3:360×3/16=67.5; 红色有角牛的理论次数T4:360×1/16=22.5。
【例】 在研究牛的毛色和角的有无两对 相对性状分离现象时 ,用黑色无角牛和红 色有角牛杂交 ,子二代出现黑色无角牛192 头,黑色有角牛78头,红色无角牛72头, 红色有角牛18头,共360头。试 问这两对性 状是否符合孟德尔遗传规律中9∶3∶3∶1的 遗传比例?
检验步骤:
(一)提出无效假设与备择假设 H0:实际观察次数之比符合9:3:3:1的理论比例。 HA:实际观察次数之比不符合9:3:3:1的理论比 例。 (二)选择计算公式 由于本例的属性类别分类数 k=4:自由 度df=k-
数据格式与计算公式
类别或组段 观察频数
理论频数
1
O1
E1
2
O2
E2



k
Ok
Ek
问题:试判断这份样本,是否来自该理论分布?
2 P
k i 1
(Oi
Ei )2 , Ei
a为参数的个数
k 1 a
df = k-1-a
注意:理论频数Ei不宜过小(如不
小于5),否则需要合并组段!
计算步骤
(1)
H
§ 7.1 拟合优度检验
回顾下2分布——p56
❖ 设有一平均数为μ、方差为 2的正态总 体。现从此总体中独立随机抽取n个随机 变量:x1、x2、…、 xn,并求出其样本方 差S2

拟合优度检验

拟合优度检验

计算上例的χ 值并做推断。先计算各理论数Ti。
2
给药方式 口服
(B )
有效( A )
O1=58 ( 98)(122 ) = 61.95 T1 = 193 O3=64 ( 95)(122 ) = 60.05 T3 = 193
无效( A )
总数
T2
( 98)( 71) = 36.5 =
193
O4=31 ( 95)( 71)
列联表中的数据可以用以下符号表示: a c a+c b d b+d a+b c+d N
在行总数和列总数及N都保持不变的情况下,a、b、c、d的各种组合 的概率可以由下式给出:
P=
( a + b )!( c + d )!( a + c )!( d + b )!
N !a !b !c !d !
零假设:不存在处理效应。若P > α 则接受零假设;反之则拒绝。 若a、b、c、d中的任何一个出现0时,则直接用该概率值作为判断标 准。若无,则应当将这个组合的概率以及从最接近于0的哪个观测值到 0的各种组合的概率都计入。这样才能构成一个尾区的概率。
将以上数据列成下表:
Y_R_ 实际观测数O 理论频率p 理论数T O-T (O-T) 2/ T 315 9/16 312.75 2.25 0.016
Y_rr 101 3/16 104.25 -3.25 0.101
yyR_ 108 3/16 104.25 3.75 0.135
yyrr 32 1/16 34.75 -2.75 0.218
2. 总体参数未知 例 调查到幼儿园接小孩的家长性别,以10人为一组,记录每组女性的人数,共得到
100组,列入下表的第2列中。问女性家长人数是否符合二项分布。 解:人群中男女比率各 占一半,但去接小孩的 家长中是否也是这个比 率就不一定。因此二项 分布的参数ϕ 是未知 的,需从样本数据估 计。

卡方-拟合优度检验

卡方-拟合优度检验

黑色无角牛的理论次数T1:360×9/16=202.5;
黑色有角牛的理论次数T2:360×3/16=67.5; 红色无角牛的理论次数T3:360×3/16=67.5;
红色有角牛的理论次数T4:360×1/16=22.5。
或 T4=360-202.5-67.5-67.5=22.5
(四)列表计算2
表 2计算表
~ 2 (n);

2
若用样本平均数

n
x 代替总体平均数μ,则随机变
2 i
x
2
(x x)
i 1

2

(n 1) S 2
2
服从自由度为n-1的2分布,记为
(n 1) S
2


2

2
( n 1)
显 然 ,2≥0 , 即 2 的 取 值 范 围 是[0,+∞;2 分布密度曲线是随自由度不同而改变的一组曲线。随 自由度的增大, 曲线由偏斜渐趋于对称;df≥30时, 接近正态分布。下面给出了几个不同自由度的2概率 分布密度曲线。
比例发生了实质性的变化?
要回答这个问题: ①首先需要确定一个统计量用以表示实际观察次数与 理论次数偏离的程度; ②然后判断这一偏离程度是否属于抽样误差,即进行 显著性检验。
为了度量实际观察次数与理论次数偏离程度:
A:最简单的办法是求出实际观察次数与理论次数的 差数。如上表:O1-T1 =-10,O2-T2=10,由于这两个 差数之和为0,显然此方法不可行; B:计算∑(O-T)2,其值越大,实际观察次数与理论次 数相差亦越大,反之则越小。但尚有不足。例如某一 组 实 际 观 察 次 数为505、理论次数为500,相差5; 而另一组实际观察次数为26、 理论次数为21,相差亦 为 5。

第7章 拟合优度检验

第7章 拟合优度检验
第七章 拟合优度检验
§7.1拟合优度检验的一般原理 拟合优度检验的一般原理
7.1.1 什么是拟合优度检验
拟合优度检验( 拟合优度检验(goodness of fit test) ) 是用来检验实际观测数与依照某种假设或模型 计算出来的理论数之间的一致性,以便判断该 计算出来的理论数之间的一致性, 假设或模型是否与观测数相配合。拟合优度检 假设或模型是否与观测数相配合。 验也会出现Ⅰ型错误(弃真) 验也会出现Ⅰ型错误(弃真)和Ⅱ型错误(取伪)。 型错误(取伪)
上一张 下一张 主 页 退 出
7.2.2 对二项分布的检验 1.总体参数 ϕ 已知 纯合的黄圆豌豆与绿皱豌豆杂交,F 例7.1 纯合的黄圆豌豆与绿皱豌豆杂交,F1 代自交,第二代分离数目如下: 代自交,第二代分离数目如下:
Y_R_ (黄圆) 黄圆) 315 Y_rr (黄皱) 黄皱) 101 yyR_ yyR_ (绿圆) 绿圆) 108 yyrr (绿皱) 绿皱) 32 556
χ2检验是对一个正态总体的标准差所作的检验。 检验是对一个正态总体的标准差所作的检验。
引例: 引例: 根据遗传学理论,动物的性别比例是1:1。 根据遗传学理论,动物的性别比例是1:1。 统计某羊场一年所产的876只羔羊中 只羔羊中, 统计某羊场一年所产的876只羔羊中,有 公羔428只 母羔448只 1:1的性别 公羔428只,母羔448只。按1:1的性别 比例计算, 母羔均应为438只 比例计算,公、母羔均应为438只。以A 表示实际观察次数, 论次数, 表示实际观察次数,T 表 示 理 论次数, 可将上述情况列成表7 可将上述情况列成表7-1。
从上述结果可以看出,矫正后的χ2比矫正前 从上述结果可以看出, 的低,若未加矫正,就已经接受H0,矫正后的χ2 的低,若未加矫正,就已经接受H 更低,不会影响结论,可以不加矫正。若未矫正 更低,不会影响结论,可以不加矫正。 时χ2> χ2α,一定要计算矫正的χ2。

生物医学统计复习

生物医学统计复习

试题类型
一.判断题 二.单项选择题 三.填空题 四.简答题 五.综合题
一、单项选择题
1.统计学中所说的样本是指____。 A.随意抽取的总体中任意部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分
2.最小组段无下限或最大组段无上限的频数表资料 ,可用____描述其集中趋势。
术后:X 127.20(mg / ml) S 101.27(mg / ml) CV S 100% 79.61% X
两组资料均数相差 悬殊,应采用变异 系数比较两组的变 异度。虽然术前变 异系数较大,但差 异并不明显,需做 进一步的统计分析 才能知道何者变异 为大。
4.有三种抗凝剂(A、B、C)对一标本作红细胞 沉降速度(1小时值)测定,每种抗凝剂各作5次, 结果如下,问三种抗凝剂对红细胞沉降速度的测定 有无差别?(13分)
变异来源 自由度 SS MS F P
总变异
14
40
组间
2
10 5.0 2 >0.05
组内
12
30 2.5
查F界值表,F0.05(2,12)=3.89,所以P>0.05,按=0.05 水准,不拒绝H0。即尚不能认为三种抗凝剂对红细 胞沉降速度的测定有差别。
6.为探讨父子身高间的线性相关程度,南方某 地在应届中学毕业生花名册中随机抽取10名男生, 分别测量他们和他们父亲的身高(cm),得资料如 下,试作回归分析。(12分)
答题要点: (1)该院总流感发病率为:
(108/900)×100%=12.00% 男性流感发病率为:
(79/760)×100%=10.39% 女性流感发病率为:
(29/140)×100%=20.71% (2)男性患者占总发病人数的百分比:

拟合优度检验

拟合优度检验

卡方分布下的检验水准及其临界值
7.2 拟合优度检验
一、理论分布已知的情况(不带未知参数) 1 二项分布的检验 例7.1 纯合的黄圆豌豆与绿皱豌豆杂交,F1代自 交,第二代分离数目如下,问是否符合自由组 合规律?
Y_R_ (黄圆) 315 Y_ r r (黄皱) 101 y y R_ (绿圆) 108 yyrr (绿皱) 32 总计
2列联表的精确检验若abcd中任何一个为0则可用p直接与比较若各格取值均不为0一般可取其中最接近于0的那一个求出它取值在0与当前值之间的所有概率p并把它们全加起来用其和与2626例76用两种饲料a和b饲养小白鼠一周后测其增重情况如下表问用不同的饲料饲养小白鼠的增重差异是否显著
问题引入:
前面所学的检验是在总体分布类型已 知的前提下,对有限个未知参数进行的 检验,那么如何来判断一组样本观察值 来自某种分布类型的总体呢?
1.分组不同,拟合的结果可能不同。 1.分组不同,拟合的结果可能不同。 分组不同 2.需要有足够的样本含量 需要有足够的样本含量。 2.需要有足够的样本含量。
对于连续型变量的优度拟合,卡方检验并不是理想的方法。 对于连续型变量的优度拟合,卡方检验并不是理想的方法。
统计学家推荐的拟合检验方法是: 统计学家推荐的拟合检验方法是: Shapiro-Wilk检验 检验 Kolmogorov-Smirnov检验 检验
【补例7.4】调查了某地200名男孩身高,得 分组数据见下表,男孩身高是否服从 正态分布?
其他类型变量分布的拟合优度检验 1. 几何分布 2. 正态分布 可仿照上述二项分布、Poisson分布 可仿照上述二项分布、 分布 的方法进行分布的拟合优度检验。 的方法进行分布的拟合优度检验。
拟合优度卡方检验的问题

精选拟合优度检验和假设检验

精选拟合优度检验和假设检验

2、关于拟合优度检验与方程显著性检验关系的讨论

可推出:


R2
R2
R2
R2
在中国居民人均收入-消费一元模型中,
在中国居民人均收入-消费二元模型中,
三、变量的显著性检验(t检验)
方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的
因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。 这一检验是由对变量的 t 检验完成的。
二、方程的显著性检验(F检验)
方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。
1、方程显著性的F检验
即检验模型 Yi=0+1X1i+2X2i+ +kXki+i i=1,2, ,n中的参数j是否显著不为0。
注意:一元线性是对相同的原假设H0:1=0 进行检验; 另一方面,两个统计量之间有如下关系:
在中国居民人均收入-消费支出二元模型例中,由应用软件计算出参数的t值:
给定显著性水平=0.05,查得相应临界值: t0.025(28) =2.048。
对于中国居民人均消费支出的例子: 一元模型:F=985.6616(P54) 二元模型:F=560.5650 (P72)
给定显著性水平 =0.05,查分布表,得到临界值: 一元例:F(1,30)=4.17 二元例: F(2,28)=3.34
显然有 F F(k,n-k-1) 即二个模型的线性关系在95%的水平下显著成立。
根据数理统计学中的知识,在原假设H0成立的条件下,统计量
服从自由度为(k , n-k-1)的F分布
给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过 F F(k,n-k-1) 或 FF(k,n-k-1)来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。

概率论与数理统计教程第七章答案

概率论与数理统计教程第七章答案

.第七章假设检验7.1设总体J〜N(4Q2),其中参数4, /为未知,试指出下面统计假设中哪些是简洁假设,哪些是复合假设:(1) W o: // = 0, σ = 1 ;(2) W o√∕ = O, σ>l5(3) ∕70:// <3, σ = 1 ;(4) % :0< 〃 <3 ;(5)W o :// = 0.解:(1)是简洁假设,其余位复合假设7.2设配么,…,25取自正态总体息(19),其中参数〃未知,无是子样均值,如对检验问题“0 :〃 = 〃o, M :4工从)取检验的拒绝域:c = {(x1,x2,∙∙∙,x25)r∣x-χ∕0∖≥c},试打算常数c ,使检验的显著性水平为0. 05_ Q解:由于J〜N(〃,9),故J~N(",二)在打。

成立的条件下,一/3 5cP o(∖ξ-^∖≥c) = P(∖ξ-μJ^∖≥-)=2 1-Φ(y) =0.05Φ(-) = 0.975,-= 1.96,所以c=L176°3 37. 3 设子样。

,乙,…,25取自正态总体,cr:已知,对假设检验%邛=μ0, H2> /J。

,取临界域c = {(X[,w,…,4):片>9)},(1)求此检验犯第一类错误概率为α时,犯其次类错误的概率夕,并争论它们之间的关系;(2)设〃o=0∙05, σ~=0. 004, a =0.05, n=9,求"=0.65 时不犯其次类错误的概率。

解:(1)在儿成立的条件下,F~N(∕o,军),此时a = P^ξ≥c^ = P0< σo σo )所以,包二为册=4_,,由此式解出c°=窄4f+为% ∖∣n在H∣成立的条件下,W ~ N",啊 ,此时nS = %<c°) = AI。

气L =①(^^~品)二①匹%=①(2δξ^历σoA∣-σ+A)-A-------------- y∕n)。

生物统计学课件--9拟合优度检验

生物统计学课件--9拟合优度检验
二、测验的目的:
通过实测值判断试验结果是否与某总体分布、某理论、模型或 假说等相吻合。
三、自由度的确定: df = k-1,其中 k 为属性性状的分组数,在例1中, 按花色将大豆分成两组,则 k = 2,df = 1。 四、应用实例:
例3:以紫花大豆和白花大豆品种杂交,在 F2 代共得到 289株,其中紫花208 株,白花81株,如果花色受一对等 位基因控制,则根据遗传学理论, F2 代紫花与白花植株 的分离比应为3:1,问现在的试验结果是否符合一对等 位基因的遗传规律? 分析:①属性性状:紫花、白花,
例4:黄圆豌豆与绿皱豌豆杂交,第二代分离数目如下:
Y-R黄圆 315 Y-rr 黄皱 101 yyR绿圆 108 yyrr 绿皱 32 总数 556
问试验结果是否符合自由组合律?
解:若性状间相互独立,根据孟德尔的自由组合律,则可以
有:
Y R : Y rr : yyR : yyrr 9 : 3 : 3 : 1
这一类数据的特点是都属于离散型数据,是通过数 数的办法获得的原始数据,它们不再符合基于正态 分布的 u分布、t分布和 F分布等,因此也就不能再 用基于正态分布的u检验、t检验、F检验等对数据进 行统计推断,而必须引入新的检验方法,这就是我 们即将给大家介绍的新内容:
拟和优度检验
第六章
一、什么是拟合优度检验 1、概念
208 216.75
216.75
2
81 72.25
72.25
2
1.4129
查表,df = k-1 = 2-1 =1 时, ∵

2 1, 0.05
3.841

2
2 1, 0.05
∴接受 H0:O =T,

拟合优度检验

拟合优度检验

0
223
1
142
2
48
3
15
4
4
根据我们对泊松分布产生的一般条件的理 解,可以用一个泊松随机变量来近似描述每 年爆发战争的次数。也就是说,我们可以假 设每年爆发战争次数分布 X 近似泊松分布。
现在的问题是:
上面的数据能否证实 X 具有泊松分布的 假设是正确的?
【引例2】某钟表厂对生产的 钟进行精确性检查,抽取100个 钟作试验,校准24小时后进行 检查,将每个钟的误差(快或 慢)按秒记录下来。
第七章 拟合优度检验
拟合优度检验的应用
总体分布未知,从样本数据中发 现规律(总体分布),再利用拟 合优度检验对假设的总体分布进 行验证。
【引例1】某地区在1500到1931 年的432年间,共爆发了299次战
争,具体数据如下(每年爆发战
争的次数可以看作一个随机变量
X):
战争次数 X 发生 X 次战争的年数
=(2-1)(2-1)
H0 : O T =0,1 0.05, df 2 12 1 1,

α
=0.05,
2 0.05
3.841,
2
12.39102.05
2 0.05
5. 给出结论: 接受H0,不同给药方式的治疗效果没有显著
不同。
注意:本例的 df =1应当矫正,矫正后的 χ2 值更 小,不会影响结论,可以不再矫正。
X):
战争次数 X 发生 X 次战争的年数
0
223
1
142
2
48
3
15
4
4
【例2】引例1,检验每年爆发战争次数分 布是否服从泊松分布。 解:H0:O-T=0 (X 服从参数为 λ 的泊松分布)

3.5 拟合优度检验

3.5  拟合优度检验
9 3 = 312.75 ≐ 313 ; 556* = 104.25 ≐ 104 16 16 3 1 556* = 104.25 ≐ 104 ; 556* = 34.75 ≐ 35 16 16 556*
样本容量 n=556 较大, 构造检验统计量
(Yi − Si ) 2 χ =∑ ~ χ 2 (k − r − 1) = χ 2 (4 − 0 − 1) = χ 2 (3) Yi i =1



n1i

Ai

ni1

nij
⋯nibniFra biblioteki⋮Aa
合计
na1 ni1
⋯ ⋯
naj ni j
⋯ ⋯
nab ni b
na i
n
样本容量 n,分 a × b 组 检验原假设
H 0 : A,B
H1 :
两指标无关联,相互独立
A,B 两指标有关联
若 H 0 为真,则 P( Ai , B j ) = P( Ai ) P( B j ) ,由于这些概率未知,现取实际频率作 为其估计值: P( Ai , B j ) =
解:首先应检验 H 0 : 各组总体具有齐一性,即表现型 与组别无关 依 yij = n 计算各组诸表现型的理论计数,结果如 表中括号内所示。由
df = (a − 1)(b − 1) = (5 − 1)(2 − 1) = 4
0.9 2 1.12 0.9 2 χ = + +⋯ = 10.8 > χ 2 0.05 (4) = 9.49 60.9 25.1 21.9
4 2
给定 α = 0.05 , H 0 : 表现型分布服从 Mendel 定律 H : 表现型分布不服从 Mendel 定律

生物统计第七章 拟合优度检验

生物统计第七章 拟合优度检验

(三)
χ 2统计量的计算 2 K.Pearson根据的 定义,根据 属性性状资料的分布,推导出用 2 于次数资料分析的 公式

2
O E
E
2
上式中O为观察次数,E为理论次 数,自由度为df.
• 卡方分布
( n 1) S 2

2

2
( n 1)
图7-1
几个自由度的概率分布密度曲线
表 7—9
结核菌数 x(1) 0 1 2 3 4 5 6 7 8 9 总计
结核菌数服从波松分布适合性检验计算表
理论概率(3) 0.0506 0.1511 0.2253 0.2240 0.1671 0.0997 0.0496 5.9708 17.8298 26.5854 26.4320 19.7178 5.8528 2.4898 0.9322 0.3068 117.8820 0.7288 9.5818 0.1297 0.2611 0.1578 0.1768 0.0129 0.0071 0.0834 理论格子数(T)(4)
1.016 1.704 3.720 6.920 12.060 18.120 23.180 27.700 28.400 24.960 20.480 14.040 8.980 4.880 2.288 1.552 200.00 8.7308 8.72 0.3393 0.6252 0.3519 1.4467 1.6476 0.1043 1.5338 0.3703 0.0132 0.2736 0.1069 6.44 1.9680
• 1、先将资料(原始数据略)整理成次数分布 表,组限、组中值、各组的次数列于表7-7的 (1)、(2)、(3)栏,再将各组上限列于 第(4)栏中。 • 2、计算各组组上限与均数( x =65.6kg)之差, 列于第(5)栏。 • 3、计算校正标准差Sc。由于由分组资料求得 的标准差较不分组时所得标准差为大,故需作 校正。

生物统计学第7章拟合优度检验

生物统计学第7章拟合优度检验
拟合优度检验的两种类型 (1)检验观测数与理论值之间的一致性 (2)检验观测数与理论数之间的一致性判断事件之 间的独立性
7.1.2 拟合优度检验的统计量
• 拟合优度检验一般方法是: (1)将观测值分为k种不同的类别。 (2)共获得n个独立观测值,第i类观测值的数目为
Oi, (3)求第i类的概率Pi (4)第i类的期望数即理论数为Ti,Ti=nPi (5)Oi与Ti进行比较,判断二者之间总的不符合程
例7.3 表7-3是不同给药方式与给药效果表。
解:因为零假设是给药方式与给药效果之间无
关联,则口服与有效同时出现的理论频率应为
口服的频率与有效的频率的乘积, P(BA)=P(B)P(A)=(98/193)(122/193)。其理 论数 由理T论i 频率乘以总数得出,
Ti
( 98 )(122 )193 193 193
7.2.2 对二项分布的检验
1.总体参数已知 【例7.1】纯合的黄圆豌豆与绿皱豌豆杂交,F1代自交,第
二代分离数目如下,问是否符合自由组合律?
1. 分组,根据孟德尔独立分配规律,YyRr×YyRr= Y_R_ :Y_rr :yyR_ :yyrr=9/16:3/16:3/16: 1/16,因此可分4组。
度是否由于机会所造成的。
2 k (Oi Ti )2
i 1
Ti
若理论数小于5 时应将相邻组 合并,直到大
于5为止。
当df=1时
2 k | oi Ti |2 0.5
i 1
Ti
Χ2的自由度:df=k-1-a
a为需要由样本估计的参数个数
7.2 拟合优度检验
7.2.1一般程序 (1)对数据进行分组(离散型数据组间距通常是1) (2)根据总体分布类型和样本含量n 计算理论数Ti。 (3)有时需用样本数据估计总体参数。记所估计的参数的个 数为a。 (4)分别合并两个尾区的理论数,使之不小于5,合并后的 组数计为k。 (5)相应于2的自由度为k-1, 相应于3的自由度为k-1-a。 (6)零假设:因为拟合优度检验不是针对总体参数做检验的, 因而零假设不需提出具体参数值,只需判断观测数是否符合理 论数或某一理论分布。它的零假设是观测数与理论数相符合, 可以形象化地记为H0:O-T=0。 (7)计算χ2值。

拟合优度检验

拟合优度检验

52 .479
df=(3-1)×(2-1)=2,查表得χ22,0.05=5.991, χ2> χ20.05,结论是拒绝H0:O-T=0,3种处理方式引 起的染色体畸变数是不同的。
作业
习题7.1,7.2
7.2.2 对二项分布的检验
1、总体参数已知
例1 纯合的黄圆豌豆与绿皱豌豆杂交,第二代律
解:当性状间相互独立时,根据孟德尔独立 分配定律,两对独立基因自由组合,表现型出现 的概率p=3/4,F2代各表现型出现的概率为 (3/4+1/4)2=9/16+3/16+3/16+1/16, 即黄圆,黄皱,绿圆,绿皱出现的概率分别 为9/16、3/16、3/16及1/16。
2
i 1
4
Oi Ti 2
Ti
1.391
df=(2-1)×(2-1)=1,查表得χ20.05=3.841, χ2< χ20.05 ,即口服给药与注射给药的效果没有显 著不同。因为已经接受H0,不必再矫正。
例题2 行数与列数大于2的r×c列连表χ2检验
各行列对应的理论数的计算方法:
5.相应于2的自由度为k-1,相应于3的自由度为 k-1-a; 6.零假设:因为拟合优度χ2 检验不是针对总体 参数做检验的,因而零假设不需提出具体参数 值,只需要判断观测数是否符合理论数或者某 一理论分布。它的零假设是观测数与理论数相 符合。可以记为H0:O-T=0; 7.按上述公式计算出χ2值,并与χ2临界值做比较, 当χ2>χ2α时拒绝H0;当χ2<χ2α时接受H0。
生物统计学
第七章 拟合优度检验
7.1 拟合优度检验的一般原理
7.1.1 拟合优度检验的概念 拟合优度检验是用来检验实际观测数与依照 某种假设或模型计算出来的理论数之间的一致 性,以便判断该假设或模型是否与观测数相配 合。 该检验包括两种类型:第一种类型是检验观 测数与理论数之间的一致性;第二种类型是通 过检验观测数与理论数之间的一致性来判断事 件之间的独立性。这两种类型的问题都使用χ2检 验,但这个χ2 检验与假设检验中所讲的χ2检验是 不同的,假设检验中的χ2检验是对一个正态总体 的方差差异显著性进行检验的方法。

总体分布的拟合优度检验

总体分布的拟合优度检验
)。也就
也就也就
也就
表明疾病不具有家族聚集性
表明疾病不具有家族聚集性表明疾病不具有家族聚集性
表明疾病不具有家族聚集性。
。。
。表
表表

7
77
7.
..
.2
22
2
二项分布的拟合优度
二项分布的拟合优度二项分布的拟合优度
二二
二、
、、
、Poisson分布的拟合优度检验
分布的拟合优度检验分布的拟合优度检验
分布的拟合优度检验一
一一
一、
、、
、二项分布的拟合优度检验
二项分布的拟合优度检验二项分布的拟合优度检验
二项分布的拟合优度检验【例7.4】某研究人员在某地随机抽查了150
户3口之家,结果全家无某疾病有112户,家
:
::
:样本与该理论分布有区别
样本与该理论分布有区别样本与该理论分布有区别
样本与该理论分布有区别
0.05α=
(2)
(2)(2)
(2)列出各组的实际频数与
列出各组的实际频数与列出各组的实际频数与
列出各组的实际频数与理论频数
二项分布的拟合优度χ
χχ
χ2
22
2检验计算表
检验计算表检验计算表
检验计算表
每户发
每户发每户发
每户发
病人数
病人数病人数
病人数
(1)
(1)(1)
(1)
观察
观察观察
观察
问题:
::
:试判断这份样本
试判断这份样本试判断这份样本

卡方独立性检验和拟合优度检验

卡方独立性检验和拟合优度检验

卡方独立性检验和拟合优度检验
一、卡方独立性检验
卡方独立性检验是检验两个变量是否独立的统计检验方法,它的假设是:
1. 样本来自于同一总体;
2. 样本的比例与总体的比例相同;
3. 样本容量足够大,足以推断总体分布;
卡方独立性检验的假设检验:
H_0:两个变量相互独立;H_1:两个变量不相互独立
卡方独立性检验的步骤:
1. 根据样本数据构造二项分布表;
2. 计算理论概率;
3. 计算卡方统计量;
4. 计算卡方检验的P值;
5. 根据P值确定检验结果;
二、拟合优度检验
拟合优度检验是检验数据是否符合某种分布的统计检验方法,它的假设是:
1. 样本来自于同一总体;
2. 样本量足够大,足以推断总体分布;
拟合优度检验的假设检验:
H_0:样本符合某种分布;H_1:样本不符合某种分布
拟合优度检验的步骤:
1. 根据样本数据构造统计量;
2. 计算理论概率;
3. 计算拟合优度统计量;
4. 计算拟合优度检验的P值;
5. 根据P值确定检验结果;。

第七章-拟合优度检验 (1)

第七章-拟合优度检验 (1)
第七章 拟合优度检验
教学目的要求

掌握:拟优合度检验的基本原理和步骤,不 同资料类型分布的拟合度检验,独立性测验 方法。 熟悉:拟合优度检验和独立性检验的应用。 了解:拟合优度检验在遗传学及其他生物学 科中上的应用。

讲授内容

一、拟合优度检验的一般原理 二、拟合优度检验 三、独立性检验
(O i Ti) Ti i 1
2 k
2
4、确定自由度: 2×2列联表的自由度df=(r-1)(c-1),r是 列联表的行数, c 是列联表的列数,若自由度 =1,则 应做连续性校正,校正后的统计量为:

2 df i 1
k
(O i Ti 0.5) Ti
2
1.061
每皿发芽种子数Xi 观察频数(Oi) OiXi
0 1 0 0 0 0
理论频率(P) 理论频数(Ti)
0.0001 0.0019
卡方值
2
3 4 5 6 7 8 9 10 总计
0
4 14 22 27 19 9 5 0 100
0
12 56 110 162 133 72 45 0 590
0.0125
0.0480 0.1209 0.2087 0.2503 0.2058 0.1111 0.0355 0.0051 1
6.25
0.81
12.09 20.87 25.03 20.58 15.71 100
0.302 0.061 0.155 0.121 0.09 1.539
题解

1、提出假设 H0:O-T=0;HA: O-T≠0 2、总体参数未知,需要由样本比例估计P=590/1000=0.59 3、计算理论值和卡方值,理论频率Pi按照二项分布公式计 算——n=10,0≤k ≤10,理论数Ti=NPi
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
理论概率 P( x)
x! e
0 103 1 143 7 1 586 fx 1.41889 n 413 413
2018/9/22 华中科技大学同济医学院 宇传华(yuchua@)制作
P(7)=0.000556
卡方分量
2
表 7.3
方格内 细胞数 (X) (1) 0 1 2 3 4 5 6 7 合计 实际 方格数 (Oi) (2) 103 143 98 42 18 6 2 1 413
解:H0:IQ 得分服从正态分布,H1:不服从正态,α =0.05, X 101.294
2018/9/22
S =15.585
华中科技大学同济医学院 宇传华(yuchua@)制作
表 7.3 正态分布拟合优度χ 2 检验的计算表
实际观 IQ 得分组限 (1) 测频数 Oi (2) 标准化 组限 Zi (3) (4) (5) 累计概率 概 率 理论频数 Ei (6)=150*(5)
Poisson 分布的拟合优度χ 检验计算表
理论概率 (Pi) (3) 0.24198 0.34335 0.24359 0.11521 0.04087 0.01160 0.00274 0.00067 理论 方格数 (Ei) (4) 099.939 141.802 100.601 047.580 016.878 004.790 001.133 6.201 000.278
O1 E1 E1
自由度
2
k 1 (计算理论分布时所用
参数的个数)
(Ok Ek ) 2 (O2 E2 ) 2 ... E2 Ek
(4) 确定概率 P 并作出统计推论。
2018/9/22
注意:理论频数不宜过小,否则需要合并 华中科技大学同济医学院 宇传华(yuchua@)制作
0.00149~ 0.00993~ 0.04579~ 0.14789~ 0.34316~ 0.59398~ 0.81042~ 0.93588~ 0.98472~ 0.99748~ 0.99972
0.00844 0.03586 0.10210 0.19527 0.25082 0.21644 0.12546 0.04884 0.01276 0.00224
1.2660 5.3790 15.3150 29.2905 37.6230 32.4660 18.8190 7.3260 1.9140 0.3360
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
本章介绍的拟合优度检验方法 1. 卡方检验
2. 正态性检验的W法(Shapiro-wilk法)、D法( Kolmogorov-Smirnov法)
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
Oi E i Ei
(7)
2

Oi E i Ei
(8)
2
55.0 ~ 65.0 ~ 75.0 ~ 85.0 ~ 95.0 ~ 105.0~ 115.0~ 125.0~ 135.0~ 145.0~155
1 5 15 31 39 36 15 4 3 1
-2.97048~ -2.32882 -1.68717 -1.04551 -0.40386 0.23780 0.87945 1.52111 2.16276 2.80441~ 3.44607
0
二、Poisson分布的拟合优度检验
【例7.3】将酵母细胞的稀释液置于某种计量 仪器上,数出每一小方格内的酵母细胞数, 共观察了413个小方格,结果见表7.3第1、2 列,试问该资料是否服从Poisson分布?
H0:方格内酵母细胞的个数服从 Poisson 分布; H1:…个数不服从 Poisson 分布 α =0.05 x
2
自由度=6-1-1=4。 0.05,4 9.49 ,本例 P 〉0.05,表示服从 Poisson 分布。
2
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
其他离散型变量分布的拟合优度检验
1. 2. 3. 4. 二项分布 Poisson分布 超几何分布 负二项分布
χ2分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
2
1
2

( / 21)
e
2 / 2
ß ×· Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84
× Ô Ó É ¶ቤተ መጻሕፍቲ ባይዱÈ £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
P=0.05的临界值
7.81 12.59
6
9 12 ¿ ¨· ½ Ö µ
15
18
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
卡方分布下的检验水准及其临界值
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
第二节 离散型随机变量分布的 拟合优度检验
第七章 总体分布的拟合优度检验
Goodness of Fit Test for Distribution of Population
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
为什么要知道总体分布?
1. 参数统计学推断方法(如t检验、F检验)均以 服从某一分布(如正态分布)为假定条件。 2. 实际工作中需要了解样本观察频数(Observed frequency,简记为O)是否与某一理论频数( Expected frequency,简记为E)相符。
2
理论概率 P( X 0) 3 0.140 0.863 0.63606 ,… 理论家庭数=150*理论概率 =3-1-1=1。 2 χ 0.05,1=3.84, ∴p<0.05,…具有家庭聚集性
2018/9/22 华中科技大学同济医学院 宇传华(yuchua@)制作
2 1.41889 P(2) e 0.24198 0.24359, P(7) 1 P( x 6) 0.00067 2! 2 理论细胞计数为 0 的方格数应等于 0.24198×413=99.939,…。 因细胞计数为 5、6、7 的三组,理论频数均小于 5,故将这三组数据合并
华中科技大学同济医学院 宇传华(yuchua@)制作
2. 计算步骤
(1) H 0 :样本的总体分布与该理论分布无区别 H 1 :样本与该理论分布有区别 0.05 (2)列出各组的实际频数与理论频数 (3) Pearson 2 统计量 2 k (实际频数-理论频数) 2 P 理论频数 i 1
一、二项分布的拟合优度检验
二、Poisson分布的拟合优度检验
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
一、二项分布的拟合优度检验
【例7.4】某研究人员在某地随机抽查了150 户3口之家,结果全家无某疾病有112户,家 庭中1人患病的有20户,2人患病的有11户, 3人全患病有7户,问该病在该地是否有家族 聚集性。
Oi Ei
(5) 3.061 1.198 2.601 5.580 1.122 2.799
Oi Ei
(6)
2
Oi Ei Ei
(7)
2
09.3697 01.4352 06.7652 31.1364 01.2589 07.8344
0.09375 0.01012 0.06723 0.65446 0.07462 1.26461 2.16478
第一节 卡方拟合优度检验 的原理与计算步骤
1. 原理
判断样本观察频数(Observed frequency)
与理论(期望)频数(Expected frequency )之差 是否由抽样误差所引起。
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
数据格式与计算公式
可仿照上述二项分布、Poisson分 布的方法进行分布的拟合优度检验。
2018/9/22
华中科技大学同济医学院 宇传华(yuchua@)制作
第三节 连续型随机变量分布的 拟合优度检验
一、采用卡方检验进行正态性检验 二、采用Shapiro-Wilk法进行正态性 检验 三、采用Kolmogorov-Smirnov法进行 正态性检验
2018/9/22 华中科技大学同济医学院 宇传华(yuchua@)制作
一、采用卡方检验进行正态性检验
例 7.5 下面是 150 名 10 岁儿童的 IQ 得分,请检验其是否服从正态分布
125.9 143.8 66.1 118.5 84.0 83.9 77.6 90.9 86.6 85.5 92.6 93.7 102.0 98.0 99.4 99.3 116.7 111.8 112.3 113.2 112.8 113.2 110.8 118.6 122.5 92.3 95.8 104.1 57.5 104.1 133.4 151.1 68.9 119.0 81.2 84.5 76.9 87.6 93.6 88.2 86.6 87.6 88.6 99.5 104.2 100.0 104.9 103.2 114.1 107.8 113.4 108.4 113.7 113.9 112.5 121.7 123.6 108.0 103.9 95.0 131.9 75.3 73.0 121.9 83.3 79.9 85. 88.6 89.1 93.6 94.6 93.3 86.9 98.6 104.3 98.2 95.0 99.8 111.4 108.5 108.6 105.9 109.3 113.2 113.1 115.9 124.7 109.6 99.1 101.4 137.1 78.6 74.1 123.7 83.9 78.9 89.6 93.6 87.6 90.1 87.3 89.6 103.2 95.8 96.8 97.4 97.7 103.2 109.5 115.7 120.1 115.7 108.2 113.1 114.1 99.8 101.4 104.1 99.0 102.3 135.9 76.3 73.4 127.8 82.7 84.8 92.6 93.8 89.9 93.4 89.2 94.6 95.2 101.8 97.0 105.9 114.9 109.1 109.3 113.2 109.8 105.5 106.8 119.7 95.9 107.7 109.2 98.9 103.0 103.5
相关文档
最新文档