第11章 计数资料的统计推断-已经更换模板(李嗣生)
第11章 计数资料的统计推断-已经更换模板(李嗣生)
建立假设:H0: π1 =π2 H1: π1 ≠π2 α=0.05 计算各格子理论数(见表中): 计算x2值:本例有两个格子的理论数小于5,且n>40,故应用校正公式:
2
( 2 9 26 5 42/2)2 42 2814 7 35
3.62
确定P值: υ=(2-1)(2-1)=1 , x20.05,1= 3.84 3.62 <3.84, 故P>0.05 差异无显著性
• •
计算x2值:
确定P值: υ =(行数-1)(列数-1)=(2-1)(2-1)=1
x20.05,1= 3.84, x20.01,1=6.63
(18 13.21) 2 (190 194.79) 2 (2 6.79) 2 (105 100.21) 2 5.4627 13.21 194.79 6.79 100.21
0.0628 (1 0.0628 ) SP 0.52% 2196
19:46
率的标准误的应用
1、表示抽样误差的大小
率的标准误小,说明抽样误差小,表示样本率与总体率越接近, 用样本率推断总体率的可靠性越大。反之,率的标准误越大,表示 样本率离总体率较远,用样本率推断总体率的可靠性小。医学文献 上常用P±SP表示资料的可靠性。 例如,上例样本率的可靠性可表示为 6.28%±0.52%。
式中a、b、c、d分别代表四个格子的实际数, 现仍以例为例11.7 ,见表11-3-2 ,代入公式:
(18105- 190 2)2 315 5.4627 (18 190)(2 105)(18 2)(190 105)
2
计算结果与基本公式一致。
19:46
四格表校正公式
统计推断的内容概要
区间下限 = x - t (a/2, df)
s n
t (0.025,9) = 2.262 =
-
(
)=
New
区间上限 =
x + t (a/2, df)
s n
=
+
(
)=
范例--续
设备3所制造部件的平均值是否在目标范围之内?
5.397
高度 (英寸)
5.396 5.395
置信区间上限值 = 5.3955英寸
置信区间随样本容量的 增加而减小。
造部件的平均高度不在目标范围内
。
New
……使用不同的a值来计算置信区间
置信区间量化了数据的不定性。
样本大小对置信区间的影响
让我们取20个以上的样本(总数 n = 30),看一看对 95%的置信区间有何影响。
假设平均值和标准差保持不变:x = 5.3947 和 s = 0.00116 。
置信区间下限值 = x - t (a/2, df)
20
2.09
30
2.05
100
1.98
1000
1.96
用所给出的有关部件的数据代入以上公式…
New
置信区间
计算利用设备3所生产的传输设备平均高度的置信区间
使用a=0.05(95%的置信区间)
x = 5.3947
-s = 0.00116 n = 10
df = n - 1 = 9
t(a/2,df)取自t表格。
Calc > Random data > Normal
由1000个组成的样本保存在“数据 ”变量.
Calc > Random data > Sample from columns…
计数资料的统计推断
四格表专用公式
(ad bc) n (a b)(c d )( a c)(b d )
2 2
本例
2 ( 41 11 24 4 ) 80 2 6.565 45 35 65 15
校正公式
当n≥40时,如果有某个格子出现 1T<5
2
一、2分布
0.4
0.3
v=1
v=4 v=6
0.2
2 ,
0.1
v=9
0.0 0 3 6 9 12 15
各种自由度的2分布右侧尾部面积为α时的临界值 2 记为 (附表 8) ,
第二节 完全随机设计下 两组频数分布的2检验
一、二分类情形 ---- 2×2列联表
例7-2 某医师研究用兰芩口服液与银黄口服液治疗慢性 咽炎疗效有无差别,将病情相似的80名患者随机分成两 组,分别用两种药物治疗。
2
第六节 四格表的确切概率法
R.A.Fisher (1934年) 确切概率法(exact probability)
四格表资料,若有理论数小于1,或n < 40,或作 2检验后所得概率 P 接近检验水准 ,需用此法直 接计算概率,以作判断。
基本思想:四格表边缘合计固定不变的条件下,直接 计算表内四个格子数据各种组合的概率
例7-4 北京市1986年城市和农村20至40岁已婚妇女避 孕 方法情况如表所示,试分析北京城市和农村采用不同避 孕方法的总体分布是否有差别。
避孕方法 地区 城市 农村 合计 节育器 153 320 473 服避孕药 33 75 108 避孕套 165 43 208 节育器 153 320 473 其他 40 18 58 合计 431 518 949
计数资料的统计描述和推断PPT课件
详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。
讲稿统计推断
假设检验的结论二
若 P> α时 , 其概率大于我们事先 > 时 确定好的检验水平( 确定好的检验水平 ( 如 P> 0.05) , > ) 我们就不拒绝其无差别的假设H 我们就不拒绝其无差别的假设 0, 还不能认为各总体间有差别, 还不能认为各总体间有差别,样本 来自同一总体, 来自同一总体,即差别没有统计学 意义。 意义。
三、假设检验的基本步骤
1. 建立检验假设
建立检验假设有三个内容, 建立检验假设有三个内容 , 即无效假设 H0、备择假设 1和检验水准α 。 备择假设H 无效假设H 是根据反证法原理, 无效假设 0 。 是根据反证法原理 , 假设 研究者想得到结论的对立事件, 研究者想得到结论的对立事件 , 研究者 若想得到有差别的结论, 若想得到有差别的结论 , 首先应假设各 总体间无差别。 总体间无差别。 备择假设H 备择假设 1 , 是研究者想得到的有差别 的结论。 的结论。 确定检验水准α ,通常α取0.05。 。
统计中的假设检验也是从假设开始,即假设 统计中的假设检验也是从假设开始, 两个样本均数可能是来源于同一总体µ, 两个样本均数可能是来源于同一总体 , 然 后计算出在此假设下的某个统计量的大小。 后计算出在此假设下的某个统计量的大小。 若统计量在其分布中的概率较小时(如 P≤0.05)我们就拒绝其来源于同一总体的假 ) 而接受其对立假设, 设,而接受其对立假设,认为两样本分别来 自不同的总体µ 自不同的总体 1和µ2。 。 若统计量在其分布中的概率较大时( 若统计量在其分布中的概率较大时 ( 如P> > 0.05)我们就不能拒绝假设。 )我们就不能拒绝假设。 由此可见, 由此可见,假设检验方法的本质是一种概率 性的反证法。 性的反证法。
统计推断
E-mail: xybms@
统计学是搜集、整理、 统计学是搜集、整理、 总结、 总结、分析数据以及 依据数据进行推断的科学
定义
统计描述: 统计描述:包括搜集数 整理数据、 据、整理数据、总结数 据、分析数据以及将数 据呈现出来 统计推断: 统计推断:包括进行推 假设检验、 测、假设检验、确定关 系然后作出预测
肺癌病人 RD值 RD值 2.78 3.23 4.20 4.87 5.12 6.21 7.18 8.05 8.56 9.60 矽肺0期工人 矽肺0 RD值 RD值 3.23 3.50 4.04 4.15 4.28 4.34 4.47 4.64 4.75 4.82 4.95 5.10
1. Tests for Normality
研究阶段 随访 周数 体格检查 实验室检查 尿妊娠试验2 心电图 胸部X-ray3
模拟剂期 V1 –2周 X X X X X X X X X X
V2 第1天 X
药物治疗期 V3 V4 V5 2周末 4周末 X X 6周末 X
V6 8周末 X X X X
伴随用药情况 X 分发研究药物 回收研究药物 动态血压评价 不良事件评估
五、 分析思路
• • • • • 实验研究的目的是什么?研究变量是什么? 实验研究的目的是什么?研究变量是什么? 该资料属何种类型资料?属什么实验设计 属什么实验设计? 该资料属何种类型资料 属什么实验设计? 可以采用什么假设检验方法进行分析? 可以采用什么假设检验方法进行分析? 怎样建立检验假设? 怎样建立检验假设? 如果根据假设检验的统计量如何下结论? 如果根据假设检验的统计量如何下结论?
Equality of Variances
Variable
(医学课件)医学统计学-计量资料的统计推断
多元线性回归使用两个或更多自变量和一个因变量,通过最 小二乘法拟合出一个最佳拟合平面,表示多个变量之间的定 量关系。它通常用于分析多个因素对一个变量的影响程度和 方向。
线性回归的假设和检验
总结词
线性回归的假设和检验是用来验证模型的 可靠性和稳健性的,包括对模型的拟合程 度、误差项、自变量和因变量的关系等进 行检验。
关联性分析的假设和检验
假设
两个变量之间的相关性存在且稳定。
检验方法
t检验、F检验、卡方检验等。
结果解读
若p值小于预先设定的显著性水平(如0.05),则认 为两个变量之间存在显著的相关性。
07
回归分析在医学中的应用
诊断试验的评价与比较
01
受试者工作特征曲 线
评估诊断试验的性能,包括准确 性、假阳性率和假阴性率等。
03
参数估计
点估计
概念
特点
方法
点估计是在给定样本数据的基 础上,利用特定的统计方法, 对总体参数进行估计。
点估计只能提供一个估计值, 不能提供不确定性信息。
常见的点估计方法有矩法、最 大似然法和最小二乘法等。
区间估计
1 2 3
概念
区间估计是在给定样本数据的基础上,利用特 定的统计方法,对总体参数所在的范围进行估 计。
02
似然比
比较两个诊断试验的准确性,计 算阳性似然比和阴性似然比。
03
诊断准确性的校准
比较实际诊断结果与预测结果的 一致性,计算校准偏倚和校准系 数。
治疗效果的比较与评价
随机对照试验
通过将受试者随机分为试验组和对照组,评估干预措施对治疗效果的影响。
生存分析
研究事件发生的时间和影响因素,如患者的生存时间和中位生存时间等。
定性资料的统计推断101102---研究生
)
问题:
1. P=P(x≤1), 而不是 P=P(x≤2)
2. P=P(x≤1), 而不是 P=P(x=1)(面积 啊)和正态分布的P代表的意思相同
3. P=P(x≤1), 而不是 P=P(x ≥ 1) (注意两者的一一对应关系啊)
例4 用一种新药治疗某种寄生虫病,受试者 50人在服药后1人发生某种严重反应,这 种反应在此病患者中也曾有发生,但过 去普查结果约为每5000人中仅有1人出 现。问此新药是否提高了这种反应的发 生率?(看准字眼啊)
χ2检验的原理
理论 10 10 10 10 10 10 实际 12 13 6 5 15 9 差值 -2 -3 4 5 -5 1
χ2检验的原理
衡量理论数与实际数的差别
2
( Ai Ti )2 Ti
Karl Pearson 1857~1936
英国统计学家 1901年10月与Weldon、
查χ2界值表得0.05< P <0.10,按 =0.05水准,不拒绝H0,差别无统计学
意义,尚不能认为穿不同防护服的皮肤 炎患病率有差别。
6.3.4 四格表的确切概率 Fisher’s exact probability
例9 两种方法治疗黑色素瘤疗效比较
方法 缓解 未缓解 合计 缓解率(%)
A
13
=0.05 (2) 2=1.41
(3) P>0.05
(4) 按0.05水准,不拒绝H0,尚不能认
为两种方法的治疗效果不同。
四格表2检验的专用公式
a
b
cd
43 10 40 16
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
陈嗣成新编统计学原理
2.统计学的近代期
统计学的近代期始于18世纪末至19世纪末,在 这时期的统计学主要有数理统计学派和社会统 计学派。
(1)数理统计学派
阿道夫· 凯特勒(Adolphe Quetelet,1796 -1874),只看名字,人们容易把他和恶魔 阿道夫· 希特勒(Adolf Hitler)混淆,两人并 无关系。阿道夫· 凯特勒是比利时统计学家、 数学家、天文学家、物理学家,国际统计会议 之父、近代统计学之父、数理统计学派创始人, 其主要著作有:《论人类》、《概率论书简》、 《社会制度》和《社会物理学》等。
张国富博士副教授 教育经历: 2008/9-2011/6 东北财经大学数学与数量 经济学院 数量经济学专业博士 2003/9-2006/5 河北工业大学经济研究所 数量经济学专业硕士学历和学位
近三年代表性科研成果
1、“出口贸易技术外溢效应的地区差异与吸收能力的门限特征” 《数量经济技术经济研究》 2009.11 2、“中国资本配置效率行业差异影响因素的实证研究” 《中央财经大学学报》 2010.10 3、“中国资本配置效率的地区差异及影响因素” 《山西财经大学学报》 2010.11 4、“中国资本配置效率行业差异及影响因素分析” 第十届中国经济学年会入选论文并获邀宣读 2010.11 5、“电力价格改革的目标与路径” 国家发改委课题组成员 2009.11 6、“大连经济技术开发区经济发展分析与预测” 大连开发区课题组成员 2010.6 7、“资产定价的基本思想和理论演进” 辽宁省创新团队课题组成员 2010.12 8、“中国资本配置效率评价研究” 博士毕业论文 9、东北财经大学“光华”一等奖学金 2009.11 东北财经大学科研能力一等奖 2010.3 东北财经大学“实德”一等奖学金 2010.11
统计推断的基本概念和方法
统计推断的基本概念和方法统计推断是统计学中最重要的内容之一,它主要研究如何从样本数据推断出总体特征。
统计推断分为参数估计和假设检验两大类,其中参数估计是利用样本信息估计总体参数,假设检验是利用样本信息检验对总体的假设。
一、参数估计参数估计主要包括点估计和区间估计两种方法。
点估计是直接用一个具体的数值来估计总体参数,如用样本均值估计总体均值。
区间估计是在点估计的基础上,给出总体参数估计的一个区间范围,通常这个区间被称为置信区间。
1. 点估计点估计的方法主要包括最大似然估计和最小二乘估计。
最大似然估计是选择使得样本观测值出现概率最大的参数值作为估计值,最小二乘估计是选择使得样本观测值的残差平方和最小的参数值作为估计值。
2. 区间估计区间估计的方法主要包括正态分布的t分布和z分布。
t分布是在总体标准差未知的情况下,用样本标准差来估计总体标准差。
z分布是在总体标准差已知的情况下,直接用总体标准差来估计总体标准差。
二、假设检验假设检验主要包括单样本检验、双样本检验和方差分析三种方法。
1. 单样本检验单样本检验是针对一个总体参数的假设检验,主要包括单样本t检验和单样本卡方检验。
单样本t检验是用来检验一个总体均值μ与一个给定的某个值θ之间的差异是否显著。
单样本卡方检验是用来检验一个总体分布是否符合某个特定的分布。
2. 双样本检验双样本检验是针对两个总体参数的假设检验,主要包括独立样本t检验和配对样本t检验。
独立样本t检验是用来检验两个独立样本的均值是否显著不同。
配对样本t检验是用来检验两个配对样本的均值是否显著不同。
3. 方差分析方差分析是用来检验多个总体均值是否显著不同。
方差分析主要包括单因素方差分析和多因素方差分析。
三、统计推断的常用软件统计推断的常用软件有SPSS、SAS和R等。
这些软件可以方便地进行参数估计和假设检验,并能够输出详细的统计结果。
四、统计推断的应用统计推断在实际应用中非常广泛,可以用于医学、生物学、社会科学、经济学等各个领域。
计数资料的统计推断
14 30
86 90
四格表的一般形式
组 别 1 2 合计 阳 性 a c a+c 阴 性 b d b+d 合计 a+b c+d a+b+c+d
甲 种 7 (b) 7 (d) 14
合 计 18 10 28
20
配对计数资料的x2检验
甲 法 正常 减弱 异常 合计 乙法 正常 60 0 8 68 减弱 3 42 9 54 异常 2 9 17 28 合 计 65 51 34 150
21
四格表配对计数资料
甲乙两种培养基的生长情况
乙 种 + 合 计 + 11 ( a ) 3 (c) 14
10
基本原理
(A T) T
2 2
如果假设检验成立,A与T不应该相差太大。 理论上可以证明 (A-T)2/T服从x2分布, 计算出x2值后,查表判断这么大的x2是否为 小概率事件,以判断建设检验是否成立。
11
(1)四格表资料的x2检验
什么是四格表资料?凡是两个率或构成比资料都 可以看做四格表资料。举例。
组 别 发 病 人 数 未 发 病人数 86 实 验 组 14 90 对 照 组 30 44 176 合计 观察例数 100 120 220 发病率(%) 14 25 20
8
x2分布规律
自由度一定时,P值越小, x2值越 大。 当P 值一定时,自由 度越大, x2 越大。 =1时, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05时, =1, x2 =3.84 =2, x2 =5.99
计数资料的统计分析
操作方式与上述相同 (1)加权频数 (2)交叉表
公共卫生学院
2.1 多个样本率的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.1 多个样本率的卡方检验
③根据检验统计量的结果做出统计推断 三个地区60岁以上老年人高血压患病率分别 为25.2%,23.3%,21.2%,Pearson卡方 =6.293,P=0.043,按0.05的检验水准拒绝H0, 认为三个地区的60岁以上老年人高血压患病 率间的差异有统计学意义。
公共卫生学院
1.2 连续校正卡方检验
③根据检验统计量的结果做出统计推断
即冠心病初发后进行体育锻炼的人复发冠心 病的危险是不锻炼的0.169倍。
公共卫生学院
内容
2. R×C列无序列联表卡方检验
• 1.1 多个样本率的卡方检验 • 1.2 多个样本构成的卡方检验
公共卫生学院
应用条件
R×C列无序列联表卡方检验检
据题意,本题需分析两组的构成比例之间有无差异
①建立假设检验,确定检验水准
H0:三组的总体构成相同 H1:三组的总体构成不同或不全相同
α=0.05
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
2.2 多个样本构成的卡方检验
➢检验步骤 ②选择检验方法,计算统计量
公共卫生学院
内容
1. 四格表的卡方检验
• 1.1 一般四格表卡方检验 • 1.2 连续校正卡方检验
公共卫生学院
1.1 一般四格表卡方检验
➢卡方检验的零假设,假定比较样本来自 总体率(π)相等的总体,即H0:π1=π2.卡方 检验的统计量也称为Pearson’s卡方检验
3计量资料的统计推断仲来福7(修改)
t
P>0.05 0.98
0.05
2.145
0.01
2.977
P>0.05,按 0 . 05 检验水准,不拒绝H0, 无统计学意义。尚不能认为该法测得的均数 与真值不同。
二、配对设计的均数比较
常见的配对设计主要有以下情形:
①自身比较:同一受试对象处理前后。 ②同一受试对象分别接受两种不同的处理。 ③将条件近似的观察对象两两配成对子,对子 中的两个个体分别给予不同的处理。
次,CaCO3含量(mg/L)分别为:20.99,
20.41,20.62, 20.75,20.10,20.00,
20.80,20.91,22.60,22.30,20.99,
20.41,20.50, 23.00,22.60。问该法测
得的均数与真值有无差别?
(1)建立假设、确定检验水准 H0:µ µ = 0 即该法测得的均数与真值相等
3.250
( t 越大,概率 P 越小)
t 0 . 05 , 1.96
t 0 . 01 , 2.58
( u 0 . 01 2 . 58 )
( u 0 .05 1 . 96 )
当n≥50,为大样本( t 分布= u 分布), 可用 u 来代替 t ,
三、 总体均数的置信区间估计
布。
120人 120人
x1
N ( , x )
x
x2
2008级女 生(身高)
158 . 60 cm
x
120人
x3
x
…………
…………
t
x Sx
u
120人
N ( 0 ,1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n
式中σP 为率的标准误, 为总体率,n为样本例数, 当总体率不知时可用样本率作总体率的估计值,公式为:
SP P(1 P) n
式中Sp 为率的标准误,P为样本率,n为样本例数。
19:46
例如:某市血液中心对2196名无偿献血者进行 HbsAg检查,结果有138人检出HbsAg阳性,阳性率 6.28%,求标准误,代入公式:
19:46
卡方检验的四种计算方法
x2检验的基本公式:
( A T )2 T
2
四格表专用公式:
(ad bc)2 n (a b)(c d )(a c)(b d )
2
行×列表公式:
配对资料的x2检验:
n( A 1) n R .nC
2
2
(b c) 2 bc
19:4率(或构成比)的假设检验
当两个样本率不同时,有两种可能: (1)P1 , P2所代表的总体率相同,由于抽样误差 的存在,造成的不同,这种差别在统计上叫差别无 统计学意义。 (2) P1 , P2所代表的总体率不同,即两个样本来 不同的总体,其差别有统计学意义。 现在就是要用统计学的方法进行判断到底属于 那种情况。
计算u值:
PC
127 36 0.7309 148 75
u
0.8581 0.4800 0.7309 (1 0.7309 )(1 / 148 1 / 75)
6.015
确定P值:查u界值表,u0.001=3.29,现u>u0.001,差异有极显著性 判断结果:按α=0.05 ,拒绝H0,接受H1 ,可以认为两组有效率 的差别有统计学意义,治疗组治疗效果比对照组好。
19:46
第3节 卡方检验
19:46
x2检验是一种用途较广的假设检验方法,它主要用于计数资料的统计
处理,如用来检验两个率或多个率、两个或多个构成比之间的差别等。
例如:调查1990年某山区不同年龄组蛔虫感染情况,见下表,问两组 的蛔虫感染率有无差别?
某山区不同年龄组蛔虫感染率比较
组别
1~14 15岁以上
2、用以估计总体率的可信区间
当样本含量足够大,且样本率P和(1-P)均不太小,如nP与n(1-P) 均≥5时,样本率的分布近似正态分布,可用正态分布规律估计总体 率的可信区间。公式为: 总体率95%可信区间=P±1.96Sp 总体率99%可信区间=P±2.58Sp
19:46
如上例无偿献血者HBsAg阳性率为6.28 %,标准误为0.52%,则所有无偿献血 者HBsAg总体率的95%和99%可信区 间为: 总体率95%可信区间= 6.28%±1.96×0.52% = 5.26%~7.30% 总体率99%可信区间= 6.28%±2.58×0.52% = 4.94%~7.62% 3、用于率的假设检验:见计数资料 的假设检验(如率的u检验)。两率差 异的假设检验。
2
本例 3.84<5.46<6.63 ,故0.05<P<0.01 ,差异有极显著性
•
判断结果:按α=0.05 水准,拒绝H0 ,接受H1 ,可以认为两组抗HCV阳性率有差别,性乱者抗-HCV阳性率高于献血员。
19:46
四格表专用公式
公式为:
2 ( ad bc ) n 2 (a b)(c d )(a c)(b d )
2
( A T 0.5) T
2
( ad bc n ) 2 n 2 2 (a b)(c d )(a c)(b d )
19:46
例11.8 某地对甲、乙两零售点的猪肉进行抽查,检查其表层沙门氏菌带菌情况如下表。 试问甲、乙两零售点的猪肉表层沙门菌带菌率有无差别? 甲、乙两零售点猪肉表层沙门菌的带菌率 采样地点 阳性例数 阴性例数 合计 带菌率(%) 甲两零售点 2 26 28 7.14 甲两零售点 5 91 43 5.71 合 计 7 35 42 16.67
19:46
表11-3-2 两组抗-HCV阳性率比较 组别 + - 合计
性乱者
献血员 合计
18(13.21)
2( 6.79) 20
190(194.79)
105(100.21) 295
208
107 315
检验步骤: 建立假设:H0: π1 =π2
H1: π1 ≠π2
α=0.05
计算各格子理论数:
式中 P 为样本率,σP为总体率的标准误,π0为已知的 总体率,n为样本含量。
19:46
例11.5 某病的年发病率对全国人口来说为8.72%。现 在某县回顾一年,抽样调查了120人,有16人发该病。 问该县该病的发病率是否高于全国该病的发病率?
建立假设:H0:π =π0 , α=0.05 计算u值:u=
• •
计算x2值:
确定P值: υ =(行数-1)(列数-1)=(2-1)(2-1)=1
x20.05,1= 3.84, x20.01,1=6.63
(18 13.21) 2 (190 194.79) 2 (2 6.79) 2 (105 100.21) 2 5.4627 13.21 194.79 6.79 100.21
0.0628 (1 0.0628 ) SP 0.52% 2196
19:46
率的标准误的应用
1、表示抽样误差的大小
率的标准误小,说明抽样误差小,表示样本率与总体率越接近, 用样本率推断总体率的可靠性越大。反之,率的标准误越大,表示 样本率离总体率较远,用样本率推断总体率的可靠性小。医学文献 上常用P±SP表示资料的可靠性。 例如,上例样本率的可靠性可表示为 6.28%±0.52%。
TRC
n R nC n
TRC式中为行与列的格子内理论数,nR为相应行的合计数,nC为相应列 的合计数。 208 20 第1行第1列格子的T: T11 13.21 315
第1行第2列格子的T: T 12=208-13.21=194.79
19:46
第2行第1列格子的T: T 21=20-13.21=6.79 第2行第2列格子的T: T 22=107-6.79=100.21 因为表中每行每列的合计是固定的,只要求得其中一格理论数,其余三格 可利用同行或同列的合计数相减而求出。
2
19:46
卡方检验的基本公式
x2检验的基本公式: 2
( A T )2 T
检验的基本思想:公式中A为实际观察值,T为理论值, 它是根据检验假设来确定的,假设各样本率或比所属总体 的率或比相同(H0)。如果这一假设成立,则各样本率或比 就应该比较接近,实际数和理论数就不会相差太大,计算 的x2值就比较小;反之计算的x2值就大。因此, x2值反映 了实际数与理论数吻合的程度,但是x2值的大小,除决定 于A-T的差值外,还取决于格子数(严格说是自由度)的多 少,因为各格的(A -T)2/T 都是正值,故格子数越多, x2 值也越大。只有排除了这种影响, x2值才能正确反映A 和 T 的吻合程度,所以在查 x2 值表时必须考虑自由度的大小。
式中a、b、c、d分别代表四个格子的实际数, 现仍以例为例11.7 ,见表11-3-2 ,代入公式:
(18105- 190 2)2 315 5.4627 (18 190)(2 105)(18 2)(190 105)
2
计算结果与基本公式一致。
19:46
四格表校正公式
应用基本公式和四格表资料专用公式的条件是n≥40,且 T≥5。当n≥40,但1≤T<5时,应使用校正公式,否则会使卡 方值偏大而造成结论错误。 校正公式:
19:46
第11章
计数资料的统计推断
19:46
第11章 计数资料的统计 推断
学习目标 1.掌握率的抽样误差、率的标准误的概 念, 计数资料的U检验的方法及应用条件 2.熟悉率的标准误的计算和用途 3.了解率的u检验的方法和应用条件
19:46
主要内容
一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区 间估计 三、总体率(或构成比)的假设检验 1. 率(或构成比)的 检验 2. x2检验 四、假设检验的注意事项
建立假设:H0: π1 =π2 H1: π1 ≠π2 α=0.05 计算各格子理论数(见表中): 计算x2值:本例有两个格子的理论数小于5,且n>40,故应用校正公式:
2
( 2 9 26 5 42/2)2 42 2814 7 35
3.62
确定P值: υ=(2-1)(2-1)=1 , x20.05,1= 3.84 3.62 <3.84, 故P>0.05 差异无显著性
H1:π ≠π0
1.79
0.1333 0.0872 0.0872 (1 0.0872 ) / 120
确定P值:本例 1.79<1.96 , 故P>0.05 , 差异无显著 性。 判断结果:按α=0.05 水准,拒绝H0,接受H1,可 以认为某县该病的发病率与全国该病的发病率没有差 别。
19:46
两个样本率的比较
计算公式如下:
u
PC
p1 p2 S P1 P2
X1 X 2 n1 n2
p1 p2
pc (1 pc )(1 / n1 1 / n2 )
S P1 P2
式中P1 、P2为样本率,SP 1-P 2 为两样本率之差的标 准误 ,PC为合并样本率,n1和n2 分别为两样本含量, X1和X2分别为两样本的某类发生数。
2 ( b c ) 2 bc
当b+C<40时: