计数资料的统计推断(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、公式的适用条件n 、T 3、多组率经x2检验有显著性
时,只能说明不全相同,但不 能确定哪两个不同。需要进一 步证明时,用行x列表的x2分割 法。
19
20
练习
书上作业。67页
21
五、参数统计和非参数统计
参数:总体的统计指标称为参数( 、、) 统计量:样本的统计指标叫统计量(X、s、p)
x2 =(A-T)2/T A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察
到的例数。 :求和符号 自由度:=(R-1)x(C-1)
R行数, C列数 注意:是格子数,而不是例数。
10
基本原理
x2 =(A-T)2/T 如果假设检验成立,A与T不应该相差太大。
理论上可以证明 (A-T)2/T服从x2分布, 计算出x2值后,查表判断这么大的x2是否为 小概率事件,以判断建设检验是否成立。
二、总体率(或构成比)的估计
点估计:将样本率直接作为总体率的估计值. 区间估计(对照总体均数的区间估计)
公式: P±Uα .SP 条件: nP>5, n(1-P)>5 例题: 意义:
三、总体率(或构成比)的假设检验
当两个样本率不同时,有两种可能: 1. P1 , P2所代表的总体率相同,由于抽样误
1.率(或构成比)的 检验 2. x2检验
四、假设检验的注意事项 五、非参数检验
1.参数统计和非参数统计优缺点
2.秩和检验
一、率(或构成比)的抽样误差和标准误
均数的标准差和标准误(复习)。
抽样误差产生的原因、概念 标准误的计算公式 与样本量的关系:成反比。
例题:56页 某市为了解已婚育龄妇女子宫颈癌 的患病情况,进行了抽样调查,随机抽取2000人, 患者80例。试求此患病率的标准误。
11
(1)四格表资料的x2检验
什么是四格表资料?凡是两个率或构成比资料都
可以看做四格表资料。举例。
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
14 86 30 90
四格表的一般形式
组别
1 2 合计
例题
上例:问此药是否有效。 第一步:建立假设 H0 : 1=2 =20%
H1 : 1 ‡ 2 第二步:确定显著性水平 =0.05 第三步:计算统计量: n =200>40,每格的T值大于5,
可选用公式??(计算过程) 第四步:确定P值 第五步:判断结果
15
(2)配对计数资料的x2检验
四格表资料的专用公式:
13
四格表资料的专用公式
x2 =(ad-bc)2 xN/
(a+b)(c+d)(a+c)(b+d) 该公式从基本公式推 导而来,结果相同。 计算较为简单。
适用条件: N>40且 T5 当不满足时用校正公式。
x2 =(|A-T|-0.5)2/T 或
x2 =(|ad-bc|-n/2)2 xN (a+b)(c+d)(a+c)(b+d) 见62页。
8
x2分布规律
自由度一定时,P值越小, x2值越 大。
当P 值一定时,自由 度越大, x2 越大。
=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63
P=0.05时, =1, x2 =3.84 =2, x2 =5.99
当自由度取1时, u2= x2
9
x2检验的基本公式
7
2. x2检验
是一种假设检验的方法,当样本量不大, 或几个率进行比较时可用x2检验。
某医生想观察一种新药对流感的预防效果,进行了如下的 研究,问此药是否有效?
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
专用公式: x2 =( b-c)2/ b+c b+c40时,校正公式: x2 =(|A-T|-0.5)2/T
x2 =( lb-cl-1)2/ b+c
自由度:=(2-1) x (2-1)=1
第四步:确定P值 第五步:判断结果
(3)行x列表的x2检验
四格表是指只有2行2列,当行数或列数超过2时,
统称为行x列表。行x列表的x2检验是对多个样本
阳性
a c a+c
阴性
b d b+d
合计
a+b c+d a+b+c+d
理论频数与自由度的计算:A是实际频数,T是根据假设检验来确定的, 当H0成立时,计算出的格子中的数。每个格子中的理论频数计算公式为:
TRC=NRxNC/N, NR所在的行合计,NC所在的列合计,代入公式中求 x2值。
(求上例的4个T值)
什么是配对资料?P64
甲乙两种培养基的生长情况
乙种
甲种
合计
+
-ຫໍສະໝຸດ Baidu
+
11 ( a )
7 (b)
18
-
3 (c)
7 (d)
10
合计
14
14
28
16
例:问两种培养基的效果是否不同
第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C 第二步:确定显著性水平 =0.05 第三步:计算统计量: b+c>40时,基本公式:x2 =(A-T)2/T,
率(或构成比)的检验。 基本公式:x2 =(A-T)2/T 专用公式:x2 =n x ( A2 /nR x nC -1) 自由度:=(R-1)x(C-1) 适用条件:表中不宜有1/5以上格子的理论频数小 于5,或有一个格子的理论频数小于1。
18
四、注意事项
1、计量资料的注意事项同 样适用(见下张幻灯片)
差的存在,造成的不同,这种差别在统计上叫 差别无统计学意义。 2. P1 , P2所代表的总体率不同,即两个样本 来不同的总体,其差别有统计学意义。 现在就是要用统计学的方法进行判断到底 属于那种情况。
1.总体率(或构成比)的u检验
目的: 公式:
其中符号的含义
适用条件: 已知π0 nP>5, n(1-P)>5 例题P58
第八讲 计数资料的统计推断
统计推断
用样本信息推论总体特征的过程。
包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指
标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差别对
样本所代表的总体间是否存在着差别做出判断。
2
主要内容
一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区间估计 三、总体率(或构成比)的假设检验
时,只能说明不全相同,但不 能确定哪两个不同。需要进一 步证明时,用行x列表的x2分割 法。
19
20
练习
书上作业。67页
21
五、参数统计和非参数统计
参数:总体的统计指标称为参数( 、、) 统计量:样本的统计指标叫统计量(X、s、p)
x2 =(A-T)2/T A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察
到的例数。 :求和符号 自由度:=(R-1)x(C-1)
R行数, C列数 注意:是格子数,而不是例数。
10
基本原理
x2 =(A-T)2/T 如果假设检验成立,A与T不应该相差太大。
理论上可以证明 (A-T)2/T服从x2分布, 计算出x2值后,查表判断这么大的x2是否为 小概率事件,以判断建设检验是否成立。
二、总体率(或构成比)的估计
点估计:将样本率直接作为总体率的估计值. 区间估计(对照总体均数的区间估计)
公式: P±Uα .SP 条件: nP>5, n(1-P)>5 例题: 意义:
三、总体率(或构成比)的假设检验
当两个样本率不同时,有两种可能: 1. P1 , P2所代表的总体率相同,由于抽样误
1.率(或构成比)的 检验 2. x2检验
四、假设检验的注意事项 五、非参数检验
1.参数统计和非参数统计优缺点
2.秩和检验
一、率(或构成比)的抽样误差和标准误
均数的标准差和标准误(复习)。
抽样误差产生的原因、概念 标准误的计算公式 与样本量的关系:成反比。
例题:56页 某市为了解已婚育龄妇女子宫颈癌 的患病情况,进行了抽样调查,随机抽取2000人, 患者80例。试求此患病率的标准误。
11
(1)四格表资料的x2检验
什么是四格表资料?凡是两个率或构成比资料都
可以看做四格表资料。举例。
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
14 86 30 90
四格表的一般形式
组别
1 2 合计
例题
上例:问此药是否有效。 第一步:建立假设 H0 : 1=2 =20%
H1 : 1 ‡ 2 第二步:确定显著性水平 =0.05 第三步:计算统计量: n =200>40,每格的T值大于5,
可选用公式??(计算过程) 第四步:确定P值 第五步:判断结果
15
(2)配对计数资料的x2检验
四格表资料的专用公式:
13
四格表资料的专用公式
x2 =(ad-bc)2 xN/
(a+b)(c+d)(a+c)(b+d) 该公式从基本公式推 导而来,结果相同。 计算较为简单。
适用条件: N>40且 T5 当不满足时用校正公式。
x2 =(|A-T|-0.5)2/T 或
x2 =(|ad-bc|-n/2)2 xN (a+b)(c+d)(a+c)(b+d) 见62页。
8
x2分布规律
自由度一定时,P值越小, x2值越 大。
当P 值一定时,自由 度越大, x2 越大。
=1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63
P=0.05时, =1, x2 =3.84 =2, x2 =5.99
当自由度取1时, u2= x2
9
x2检验的基本公式
7
2. x2检验
是一种假设检验的方法,当样本量不大, 或几个率进行比较时可用x2检验。
某医生想观察一种新药对流感的预防效果,进行了如下的 研究,问此药是否有效?
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220
发病率(%) 14 25 20
专用公式: x2 =( b-c)2/ b+c b+c40时,校正公式: x2 =(|A-T|-0.5)2/T
x2 =( lb-cl-1)2/ b+c
自由度:=(2-1) x (2-1)=1
第四步:确定P值 第五步:判断结果
(3)行x列表的x2检验
四格表是指只有2行2列,当行数或列数超过2时,
统称为行x列表。行x列表的x2检验是对多个样本
阳性
a c a+c
阴性
b d b+d
合计
a+b c+d a+b+c+d
理论频数与自由度的计算:A是实际频数,T是根据假设检验来确定的, 当H0成立时,计算出的格子中的数。每个格子中的理论频数计算公式为:
TRC=NRxNC/N, NR所在的行合计,NC所在的列合计,代入公式中求 x2值。
(求上例的4个T值)
什么是配对资料?P64
甲乙两种培养基的生长情况
乙种
甲种
合计
+
-ຫໍສະໝຸດ Baidu
+
11 ( a )
7 (b)
18
-
3 (c)
7 (d)
10
合计
14
14
28
16
例:问两种培养基的效果是否不同
第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C 第二步:确定显著性水平 =0.05 第三步:计算统计量: b+c>40时,基本公式:x2 =(A-T)2/T,
率(或构成比)的检验。 基本公式:x2 =(A-T)2/T 专用公式:x2 =n x ( A2 /nR x nC -1) 自由度:=(R-1)x(C-1) 适用条件:表中不宜有1/5以上格子的理论频数小 于5,或有一个格子的理论频数小于1。
18
四、注意事项
1、计量资料的注意事项同 样适用(见下张幻灯片)
差的存在,造成的不同,这种差别在统计上叫 差别无统计学意义。 2. P1 , P2所代表的总体率不同,即两个样本 来不同的总体,其差别有统计学意义。 现在就是要用统计学的方法进行判断到底 属于那种情况。
1.总体率(或构成比)的u检验
目的: 公式:
其中符号的含义
适用条件: 已知π0 nP>5, n(1-P)>5 例题P58
第八讲 计数资料的统计推断
统计推断
用样本信息推论总体特征的过程。
包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指
标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差别对
样本所代表的总体间是否存在着差别做出判断。
2
主要内容
一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区间估计 三、总体率(或构成比)的假设检验