w7计数资料的假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▲
6
如果假设检验成立,A与T不应该相差太大。
理论上可以证明 (A-T)2/T服从x2分布,计算
出x2值后,查表判断这么大的x2是否为小概率事
件,以判断建设检验是否成立。
7
x2分布规律
自由度一定时,P值越小, x2值越大,反比关系。 当P 值一定时,自由度越大, x2越大。 =1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, =1, x2 =3.84 =2, x2 =5.99
2
总体率的假设检验
当两个样本率不同时,有两种可能:
▲ P1 , P2所代表的总体率相同,由于抽样误差的存 在,造成了样本率不同,这种差别在统计上叫差别 无统计学意义。 ▲ P1 , P2所代表的总体率不同,即两个样本来不同 的总体,其差别有统计学意义。 用统计学方法进行判断属于那种情况。(反证法)
b Test Statistics
甲 培养 基 & 乙 培养 基 93 2.207 .137
a. Continuity Corrected
=0.05, x2 =3.84
b. McNemar Test
16
例:问两种培养基的效果是否不同
第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C 第二步:确定显著性水平 =0.05 第三步:计算统计量: b+c>40时,基本公式:x2 =(A-T)2/T, 专用公式: x2 =( b-c)2/ b+c b+c40时, 校正公式: x2 =(|A-T|-0.5)2/T x2 =( lb-cl-1)2/ b+c 自由度:=(2-1) x (2-1)=1 第四步:确定P值 第五步:判断结果
1.均数与标准差适合用于什么资料的描述? 2.标准差和标准误有何区别和联系? 3.可信区间和参考(正常)值范围有何不同? 4.假设检验的基本思想是什么?步骤是什么? 5.计量资料假设检验的类型有哪些? 6.方差分析适用于什么样的设计? 7.相关与回归的区别与联系是什么? 8.相对数用于什么资料的描述? 9.计数资料的主要检验方法是什么?
3、行x列表的x2检验
四格表是指只有2行2列,当行数或列数超过2时,统称
为行x列表。
行x列百度文库的x2检验是对多个样本率(或构成比)的检验。
基本公式:x2 =(A-T)2/T 专用公式:x2 =n x ( A2 /nR x nC -1) 自由度:=(R-1)x(C-1)
适用条件:表中不宜有1/5以上格子的理论频数小于5, 或有一个格子的理论频数小于1。
发病率(%) 14 25 20
14 30
86 90
5
x2检验的基本公式
x2 =(A-T)2/T
A:表示实际频数,即实际观察到的例数。 ▲ T:理论频数,即如果假设检验成立,应该观察 到的例数。 ▲ :求和符号,所有格子的值之和 ▲自由度:=(R-1)x(C-1) R行数, C列数 注意:是格子数,而不是例数。
适用条件: N>40且 T5 当不满足时用校正公式。
该公式从基本公式推导而来, x2 =(|A-T|-0.5)2/T 结果相同; 或 x2 =(|ad-bc|-n/2)2 xN 计算较为简单。
(a+b)(c+d)(a+c)(b+d)
SPSS计算程序
1.ANALYZE-DESCRIPTIVE STATISTICSCROSSTABS 2.data-weight cases-frequency variable-ok
Total
Chi-Square Tests Value 17.907a 18.755 14.315 84 df 2 2 1 Asymp. Sig. (2-sided) .000 .000 .000
Pearson Chi -Square Likel ihood Ratio Linear-by-Linear Associ ati on N of Valid Cases
14 30
86 90
四格表的一般形式
组 别 1 2 合计 阳 性 a c a+c 阴 性 b d b+d 合计 a+b c+d a+b+c+d
理论频数T计算公式为:TRC=NRxNC/N
NR:所在的行合计,NC:所在的列合计
10
四格表资料的专用公式
x2 =(ad-bc)2 xN/ (a+b)(c+d)(a+c)(b+d)
第七章 计数资料的假设检验
1
某医生想观察一种新药对流感的预防效果,进行了 如下的研究,问此药是否有效?
组 别 发 病 人 数 实 验 组 14 对 照 组 30 44 合计
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
两个率P1(14%) ,P2(25%)不同。
21
前半段课程
小 结
22
基本内容
统计描述
计量资料 频数分布 集中趋势 离散趋势
统计推断(1) 统计推断(2)
抽样误差 标准误 t u F检验 秩和检验 可信区间 直线相关与回归 偏相关 多元线性回归 因子分析
计数资料
相对数 (率、比)
率的标准误; Logistic回归 可信区间; 2检验
23
思考:
8
1、四格表资料的x2检验
什么是四格表资料?凡是两个率或构成比资料都 可以看做四格表资料。
某医生想观察一种新药对流感的预防效果,进行了如下 的研究,问此药是否有效?
组 别 发 病 人 数 实 验 组 14 对 照 组 30 44 合计 未 发 病人数 86 90 176 观察例数 100 120 220 发病率(%) 14 25 20
12
组 别 * 结 果 Cross tabulation Count 结果 + 组别 Total 实 验组 对 照组 14 30 44 _ 86 90 176 Total 100 120 220
Chi-Square Tests Value 4.125b 3.466 4.224 df 1 1 1 Asymp. Sig. (2-sided) .042 .063 .040 Exact Sig. (2-sided) Exact Sig. (1-sided)
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.24.
20
主要内容(计数资料的统计分析)
一、相对数 二、应用相对数的注意事项
三、率的标准误
四、率的可信区间 五、x2检验:四格表,配对资料,行×列表
Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
.044 4.106 220 1 .043
.030
24
分析计算
要求: 1. 选择合适的计算程序; 2. 在计算机上计算出结果; 3. 会看结果; 4. 完整的书写过程。
25
祝大家取得好成绩!
王晓莉
26
18
为了解花生黄曲霉素污染,随机观察了三个 地区,结果见下表。试问这三个地区花生的 黄曲霉素污染率是否不同?
三个地区花生的黄曲霉素污染情况 调查地区 甲 乙 丙 合计 受检样品 未污染 6 30 8 44 污染 23 14 3 40 合计 29 44 11 84 污染率 (%) 79.3 31.8 27.3 47.6
x2检验
是一种假设检验的方法 符合假设检验的规律 统计量(率或比)服从 x2分布
4
某医生想观察一种新药对流感的预防效果,进行 了如下的研究,问此药是否有效?
组 别 发 病 人 数 实 验 组 14 对 照 组 30 44 合计
A:观察例数 T:理论频数
未 发 病人数 86 90 176
观察例数 100 120 220
19
地 区 * 是 否 受 到 了 黄 曲 霉 毒 素 的 污 染 Crosstabul a tion Count 是 否 受到 了 黄 曲霉 毒 素 的 污染 未污染 污染了 6 23 30 14 8 3 44 40
Total 29 44 11 84
地区
1 2 3
=2, =0.05, x2 =5.99
1.data-weight cases 2.ANALYZE-nonparametric test-2 related samples-test pairs-Mcnemar-OK
甲 培 养 基 &乙 培 养 基 乙 培养 基 甲 培养 基 1 2 1 37 19 2 10 27
N Chi -Squarea Asymp. Sig.
a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 20. 00.
例 题
上例:问此药是否有效。 第一步:建立假设 H0 : 1=2 =20% H1 : 1 ‡ 2 第二步:确定显著性水平 =0.05 (x2 =3.84) 第三步:计算统计量: n =220>40,每格的T值大于5, x2 =4.125 第四步:确定P值 第五步:判断结果
14
2、配对(列联表)资料的2检验
有93份咽喉涂抹标本,每份标本分别接种在 甲乙两种培养基上,观察其生长情况,结果 如下表,两种培养基的效果是否不同?
甲乙两种培养基的生长情况
乙培养法
阳性 阴性 合计
甲培养法 阳性 37 19 56 阴性 10 27 37
合计
47 46 93
15
SPSS计算程序
6
如果假设检验成立,A与T不应该相差太大。
理论上可以证明 (A-T)2/T服从x2分布,计算
出x2值后,查表判断这么大的x2是否为小概率事
件,以判断建设检验是否成立。
7
x2分布规律
自由度一定时,P值越小, x2值越大,反比关系。 当P 值一定时,自由度越大, x2越大。 =1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, =1, x2 =3.84 =2, x2 =5.99
2
总体率的假设检验
当两个样本率不同时,有两种可能:
▲ P1 , P2所代表的总体率相同,由于抽样误差的存 在,造成了样本率不同,这种差别在统计上叫差别 无统计学意义。 ▲ P1 , P2所代表的总体率不同,即两个样本来不同 的总体,其差别有统计学意义。 用统计学方法进行判断属于那种情况。(反证法)
b Test Statistics
甲 培养 基 & 乙 培养 基 93 2.207 .137
a. Continuity Corrected
=0.05, x2 =3.84
b. McNemar Test
16
例:问两种培养基的效果是否不同
第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C 第二步:确定显著性水平 =0.05 第三步:计算统计量: b+c>40时,基本公式:x2 =(A-T)2/T, 专用公式: x2 =( b-c)2/ b+c b+c40时, 校正公式: x2 =(|A-T|-0.5)2/T x2 =( lb-cl-1)2/ b+c 自由度:=(2-1) x (2-1)=1 第四步:确定P值 第五步:判断结果
1.均数与标准差适合用于什么资料的描述? 2.标准差和标准误有何区别和联系? 3.可信区间和参考(正常)值范围有何不同? 4.假设检验的基本思想是什么?步骤是什么? 5.计量资料假设检验的类型有哪些? 6.方差分析适用于什么样的设计? 7.相关与回归的区别与联系是什么? 8.相对数用于什么资料的描述? 9.计数资料的主要检验方法是什么?
3、行x列表的x2检验
四格表是指只有2行2列,当行数或列数超过2时,统称
为行x列表。
行x列百度文库的x2检验是对多个样本率(或构成比)的检验。
基本公式:x2 =(A-T)2/T 专用公式:x2 =n x ( A2 /nR x nC -1) 自由度:=(R-1)x(C-1)
适用条件:表中不宜有1/5以上格子的理论频数小于5, 或有一个格子的理论频数小于1。
发病率(%) 14 25 20
14 30
86 90
5
x2检验的基本公式
x2 =(A-T)2/T
A:表示实际频数,即实际观察到的例数。 ▲ T:理论频数,即如果假设检验成立,应该观察 到的例数。 ▲ :求和符号,所有格子的值之和 ▲自由度:=(R-1)x(C-1) R行数, C列数 注意:是格子数,而不是例数。
适用条件: N>40且 T5 当不满足时用校正公式。
该公式从基本公式推导而来, x2 =(|A-T|-0.5)2/T 结果相同; 或 x2 =(|ad-bc|-n/2)2 xN 计算较为简单。
(a+b)(c+d)(a+c)(b+d)
SPSS计算程序
1.ANALYZE-DESCRIPTIVE STATISTICSCROSSTABS 2.data-weight cases-frequency variable-ok
Total
Chi-Square Tests Value 17.907a 18.755 14.315 84 df 2 2 1 Asymp. Sig. (2-sided) .000 .000 .000
Pearson Chi -Square Likel ihood Ratio Linear-by-Linear Associ ati on N of Valid Cases
14 30
86 90
四格表的一般形式
组 别 1 2 合计 阳 性 a c a+c 阴 性 b d b+d 合计 a+b c+d a+b+c+d
理论频数T计算公式为:TRC=NRxNC/N
NR:所在的行合计,NC:所在的列合计
10
四格表资料的专用公式
x2 =(ad-bc)2 xN/ (a+b)(c+d)(a+c)(b+d)
第七章 计数资料的假设检验
1
某医生想观察一种新药对流感的预防效果,进行了 如下的研究,问此药是否有效?
组 别 发 病 人 数 实 验 组 14 对 照 组 30 44 合计
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
两个率P1(14%) ,P2(25%)不同。
21
前半段课程
小 结
22
基本内容
统计描述
计量资料 频数分布 集中趋势 离散趋势
统计推断(1) 统计推断(2)
抽样误差 标准误 t u F检验 秩和检验 可信区间 直线相关与回归 偏相关 多元线性回归 因子分析
计数资料
相对数 (率、比)
率的标准误; Logistic回归 可信区间; 2检验
23
思考:
8
1、四格表资料的x2检验
什么是四格表资料?凡是两个率或构成比资料都 可以看做四格表资料。
某医生想观察一种新药对流感的预防效果,进行了如下 的研究,问此药是否有效?
组 别 发 病 人 数 实 验 组 14 对 照 组 30 44 合计 未 发 病人数 86 90 176 观察例数 100 120 220 发病率(%) 14 25 20
12
组 别 * 结 果 Cross tabulation Count 结果 + 组别 Total 实 验组 对 照组 14 30 44 _ 86 90 176 Total 100 120 220
Chi-Square Tests Value 4.125b 3.466 4.224 df 1 1 1 Asymp. Sig. (2-sided) .042 .063 .040 Exact Sig. (2-sided) Exact Sig. (1-sided)
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.24.
20
主要内容(计数资料的统计分析)
一、相对数 二、应用相对数的注意事项
三、率的标准误
四、率的可信区间 五、x2检验:四格表,配对资料,行×列表
Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases
.044 4.106 220 1 .043
.030
24
分析计算
要求: 1. 选择合适的计算程序; 2. 在计算机上计算出结果; 3. 会看结果; 4. 完整的书写过程。
25
祝大家取得好成绩!
王晓莉
26
18
为了解花生黄曲霉素污染,随机观察了三个 地区,结果见下表。试问这三个地区花生的 黄曲霉素污染率是否不同?
三个地区花生的黄曲霉素污染情况 调查地区 甲 乙 丙 合计 受检样品 未污染 6 30 8 44 污染 23 14 3 40 合计 29 44 11 84 污染率 (%) 79.3 31.8 27.3 47.6
x2检验
是一种假设检验的方法 符合假设检验的规律 统计量(率或比)服从 x2分布
4
某医生想观察一种新药对流感的预防效果,进行 了如下的研究,问此药是否有效?
组 别 发 病 人 数 实 验 组 14 对 照 组 30 44 合计
A:观察例数 T:理论频数
未 发 病人数 86 90 176
观察例数 100 120 220
19
地 区 * 是 否 受 到 了 黄 曲 霉 毒 素 的 污 染 Crosstabul a tion Count 是 否 受到 了 黄 曲霉 毒 素 的 污染 未污染 污染了 6 23 30 14 8 3 44 40
Total 29 44 11 84
地区
1 2 3
=2, =0.05, x2 =5.99
1.data-weight cases 2.ANALYZE-nonparametric test-2 related samples-test pairs-Mcnemar-OK
甲 培 养 基 &乙 培 养 基 乙 培养 基 甲 培养 基 1 2 1 37 19 2 10 27
N Chi -Squarea Asymp. Sig.
a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 20. 00.
例 题
上例:问此药是否有效。 第一步:建立假设 H0 : 1=2 =20% H1 : 1 ‡ 2 第二步:确定显著性水平 =0.05 (x2 =3.84) 第三步:计算统计量: n =220>40,每格的T值大于5, x2 =4.125 第四步:确定P值 第五步:判断结果
14
2、配对(列联表)资料的2检验
有93份咽喉涂抹标本,每份标本分别接种在 甲乙两种培养基上,观察其生长情况,结果 如下表,两种培养基的效果是否不同?
甲乙两种培养基的生长情况
乙培养法
阳性 阴性 合计
甲培养法 阳性 37 19 56 阴性 10 27 37
合计
47 46 93
15
SPSS计算程序