定性资料的统计推断101102---研究生

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8.00
10
10
10
2分布
0.5
0.4
0.3
0.2
Rejection Area
0.1
0.0
这是自由度为1的图形
四格表(fourfold table)
例7 109例患者治疗后有效率比较
组 别 有效 无效 合计 有效率(%)
p<0.05 拒绝H0,认为……
6.3 两样本率的比较
目的:推断两总体率是否相等
当n1,n2均较大,p1,p2,(1-p1),(1-p2)均不 太小,如n1p1,n2p2,n1(1-p1),n2(1-p2) 均大于5时,可用u检验
6.3.1两样本率的U检验
例6 蛙 王 露:n=53,有效率81.13% 复方阿胶:n=56,有效率71.43% 二者是否有差别?
定性资料的统计推断
主要内容
6.1 率的可信区间 6.2 样本率与总体率的比较 6.3 两率的比较 6.4 配对设计资料的两率的比较 6.5 多个率的比较 6.6 构成比的比较 6.7 两标准化率的比较 6.8 高维列联表的分析 6.9 趋势性检验
6.1 率的区间估计
阳性率的均数μp=π 标准差σp=
方法二:正态近似法 (n较大,np≥5)
u
p 0
0 1 0 n
例5 根据以往经验,一般胃溃疡病患者有 20%发生胃出血症状,现某医院观察65 岁以上溃疡病人304例,有31.6%发生 胃出血症状,问老年胃溃疡病患者是否较 容易出血?
H0: π=0.2 H1: π>0.2 α=0.05
即 0.1354~0.1646 至少0.1354×205000=27757 至多0.1646×205000=33743
2.查表法 n≤50
例2 有人调查29名非吸毒妇女,出狱时有 1名HIV(人免疫缺陷病毒)阳性,则阳性 率的95%可信区间为(0.1%,17.8%)
3.精确概率法
n较小,p接近于0或1
6.3.2 两样本率比较的卡方检验
卡方检验(chi-square test)的原理 一种对理论频数和实际频数吻合程度的考察。 • A investigation of the degree of agreement of theoretical frequency and actual frequency. 一个正常的骰子,抛出后得到六个面的概率 均为1/6。因此,要判定一个骰子是否合格, 可以通过抛骰子的方法来进行;

r

(n

r
r 1)
F / 2;2(nr1),2r
,
r
1
(n

r 1 r) / F / 2;2(r1),2(nr)

(其中r为阳性数)
特别地
在r=0时
0,
1
n
/
1 F
/ 2;2,2n

在r=n时

n

n F / 2;2,2n
,1
p1(1 p1) p2 (1 p2 )
n1
n2
6.2 样本率与总体率比较
比较的目的是推断该样本所代表的未知总 体率π与已知的总体率π0是否相等。
方法一:直接计算概率法
例3 据以往经验,新生儿染色体异常率一般为 1%,某医院观察了当地400名新生儿,只 有1例异常,问该地新生儿染色体异常率是 否低于一般?
H0:π1 = π2; H1:π1 ≠ π2; α=0.05
n1=53,n1p1=43, n2=56,n2p2=40 pc=(43+40)/(53+56)=0.7615
u
0.8113 71.43
1.188
0.7615
(1
0.7615)

Байду номын сангаас
1 53

1 56

查u界值表,p>0.05,不拒绝H0, 尚不能认为两药有效率不同
Galton一起创办Biometrika
理论 10 10 10 10 10 10
实际 12 13 6 5 15 9
差值 -2 -3 4 5 -5 1
2 12 102 13 102 6 102
10
10
10
5 102 15 102 9 102


1
n

(率的标准误)
sp
p(1 p) n
总体率的区间估计
1.正态近似法 np>5 n(1-p)>5
p±uasp
例1 在血吸虫病流行区中,某县根据随机原则 抽查4000人, 其血吸虫感染率为 15%,如 全县人口为205000人,试以99%的可信区 间估计该县血吸虫感染人数至少有多少?至多 有多少? 总体率的99%可信区间
p>0.05 不拒绝H0(注意为单侧检验啊
)
问题:
1. P=P(x≤1), 而不是 P=P(x≤2)
2. P=P(x≤1), 而不是 P=P(x=1)(面积 啊)和正态分布的P代表的意思相同
3. P=P(x≤1), 而不是 P=P(x ≥ 1) (注意两者的一一对应关系啊)
例4 用一种新药治疗某种寄生虫病,受试者 50人在服药后1人发生某种严重反应,这 种反应在此病患者中也曾有发生,但过 去普查结果约为每5000人中仅有1人出 现。问此新药是否提高了这种反应的发 生率?(看准字眼啊)
H0: π=0.01 H1: π<0.01
α=0.05
P=p(x≤1)=p(x=0)+p(x=1)
这里4的000P代00表1 的面0 4积00 啊 ,4100正 确0理1 解它0 3的99 含义啊
0.99400 400 0.01 0.99399 0.0905
χ2检验的原理
理论 10 10 10 10 10 10 实际 12 13 6 5 15 9 差值 -2 -3 4 5 -5 1
χ2检验的原理
衡量理论数与实际数的差别
2
( Ai Ti )2 Ti
Karl Pearson 1857~1936
英国统计学家 1901年10月与Weldon、
上例中,95%K可信区间为

1

(29

1
1
1)

39.482
,
1

1

11 (29 1)
/
3.024

即(0.0009,0.1776)
4.利用二项分布的概率公式迭代
两率差的可信区间
π1-π2的可信度为1-α的可信区间为
p1 p2 u s p1 p2
其中
s p1 p2
相关文档
最新文档