第七章 拟合优度检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 1.拟合优度检验的一般原理(※)
• 2.拟合优度检验 • 3.独立性检验
难点
统计学家推荐的拟合检验方法是: Shapiro-Wilk检验 Kolmogorov-Smirnov检验
7.3 独立性检验
难点
一、列联表的独立性检验
原理:Pearson定理
用途:检验事物之间的独立性
1. 2×2列联表检验 2. r×c列联表检验
四格表资料的基本形式
处理组
甲 乙 合计
阳性事件发 阳性事件未发
生数
生数
a
b
c
d
a+c
b+d
合计
a+b c+d
n
四格表的前提条件:双边固定
1 . 2 2列联表(四格表 fourfold table)
处理 方式
口服
效 有效 a
果 无效 b
2 2列联表
注射 c
d
自由度 df = 1
四个表资料 检验的专用公式:
和前面的结果 一样
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
需要解决的问题:
1.用古典概型求2 2列联表出现某一组数值的概率 2.离散分布尾区建立的方法。
1. 2 2列联表概率的计算方法
a
b
a+bcdc+da +c b +d
N
2.离散分布尾区概率的计算方法:
从实际观测值开始,把对 成立不利的方向上 的概率全加起来,作为尾区概率。
3. 2 2列联表的精确检验
Goodness Of Fit Test
※7.1 拟合优度检验的一般原理 7.2 拟合优度检验 7.3 独立性检验(难点)
7.1 卡方拟合优度检验的一般原理
1.什么是拟合优度检验? 拟合优度检验是用来检验实际观测数与依照
某种假设或模型计算出来的理论观测数之间的一 致性。
2.类型 (1)检验观测值与理论值的一致性 (2)判断事物之间的独立性——独立性检验
正态分布?
分组数据见下表,男孩身高是否服从
其他类型变量分布的拟合优度检验
1. 几何分布 2. 正态分布
可仿照上述二项分布、Poisson分布 的方法进行分布的拟合优度检验。
拟合优度卡方检验的问题
1.分组不同,拟合的结果可能不同。 2.需要有足够的样本含量。
对于连续型变量的优度拟合,卡方检验并不是理想的方法。
2 (| ad bc | 0.5n)2 n
(a b)(c d)(a c)(b d)
2. r c列联表
自由度:
【例7.5】下表列出对某种药的试验结果,问给药方式对 药效果是否有影响?
补例:假定对股东的拟议合并意见按照股东的性别进行 分类,其结果如下表所示:
性别 男 女
意 赞成 45 55
若a,b,c,d中任何一个为0,则可用p直接与 或 比较,若各格取值均不为0,一般可取其 中最接近于0的那一个,求出它取值在0与当前值 之间的所有概率p,并把它们全加起来,用其和 与 或 比较,这样做的前提是该格的理论 值比观测值大。
Fisher’s 2×2 Exact Test用来检验零假设[即某个给 定的基因(基因1)在两个群体中没有差异调控]
Y_R_ (黄圆)
Y_ r r (黄皱)
y y R_
yyrr
(绿圆) (绿皱)
总计
315
101
108
32
556
【补例7.2】 (二项概率检验)根据遗传学规 律,某种杂交花卉子代黄绿花的比例为3:1, 现在某时间种下该花卉种子,开花时节观察结 果如下表实际频数行所列数据,试问开黄花和 开绿花的比例是否为3:1?
3. 原理:※ 判断样本观察频数(Observed frequency)
与理论(期望)频数(Expected frequency )之差 是否由抽样误差所引起。
补充:皮尔逊定理(pearson) 设 ( p1, p2, , pr )为总体的真实概率分布,统计量
2 r (ni npi )2
i 1
【例7.6】用两种饲料A和B饲养小白鼠,一周后测其增 重情况如下表,问用不同的饲料饲养小白鼠的增重差 异是否显著?
A饲料 B饲料 总数
未增(只) 增
4
1
0
6
4
7
总数 5 6 11
【例7.6】观测性别对药物的反应如下:问男女对 该药反应是否相同?
有反应 无反应 总数

4
1
5

3
6
9
总数
7
7
14
本章小结
问题引入:
前面所学的检验是在总体分布类型已 知的前提下,对有限个未知参数进行的 检验,那么如何来判断一组样本观察值 来自某种分布类型的总体呢?
解决办法:拟合优度检验
例1
Y_R_ (黄圆)
Y_ r r (黄皱)
y y R_
yyrr
(绿圆) (绿皱)
315
101
108
32
例2
总计 556
第七章 拟合优度检验
0.5
纵高
0.4 0.3 0.2 0.1 0.0
0
f
( 2)
1
2(
/ 2)
2
2
(
/ 21)
e2
/2
自由度=1 自由度=2 自由度=3 自由度=6
P=0.05的临界值
3 3.84 6 7.81 9
12.59
12 15
18
卡方值
4. 拟合优度检验的一般步骤: (1)建立假设检验,确定检验水准; (2)根据理论分布类型对数据进行分组,列出各 组的 ;
实际频数
黄花 84
绿花 16
合计 100
【补例7.3】( Poisson分布的拟合优度检验)将酵母细
胞的稀释液置于某种计量仪器上,数出每一小方格内的酵
母细胞数,共观察了413个小方格,结果见表7.3第1、2列,
试问该资料是否服从Poisson分布?
卡方分量
【补例7.4】调查了某地200名男孩身高,得
(3)根据理论分布的定义计算理论数 ; (4)计算 值; (5)计算自由度; (6)将计算的 值与 临界值作比较,并做出 统计推断。
卡方分布下的检验水准及其临界值
7.2 拟合优度检验
一、理论分布已知的情况(不带未知参数)
1 二项分布的检验
例7.1 纯合的黄圆豌豆与绿皱豌豆杂交,F1代自 交,第二代分离数目如下,问是否符合自由组 合规律?
npi
随n的增加渐近于自由度为r-1的 2 分布。
• Pearson定理满足三个条件: (1)理论值 ,如果有一个或者多个 则应与相邻组合并,直到大于等于5. (2)当df=1时
(3)理论分布带参数时,自由度为r-1-m, 其中m为参数的个数。
χ2分布(chi-square distribution)
项目
基因1
所 有 其 他 基 因 总和
群体A(如 归属基因1的序 该群体中非基因1的序
脑)
列数(g1A)
列数(NA-g1A)
NA
群体B(如 归属基因1的序 该群体中非基因1的序
肝)
列数(g1B)
列数(NB-g1B)
NB
总和
c = g1A + g1B
C = (NA-g1A) + (NB-g1B)
Fisher’s exact test 的p 值由下式给出:
反对 45 35
见 未定 10 10
要求:分析这些数据是否提供了充分的证据表明股东 对拟议合并的反应取决于股东的性别。
※二、2 2列联表的精确检验法(Fisher检验法) 前提条件:某一格的理论数小于5。 思 想:用古典概型的方法求出尾区的概率, 然后与给定的显著性水平 相比,大于 则接 受 ,反之拒绝。
相关文档
最新文档