医学统计学试题:第4题【15分】__回归分析

合集下载

医学统计学:Logistic回归分析

医学统计学:Logistic回归分析

析包含某个或某几个变量的模型是否有统计学意义。
模型s的对数似然函数
模型s的对数似然函数 大样本
G = -2 ( ln Ls- ln LP ) ~ 2 ( p -s)
模型s嵌套 于模型p内
LS :包含s个回归系数的模型的似然函数对数值; LP:包含p个回归系数的模型的似然函数对数值,p > s ;
• G值的大小反映增加某个或某几个自变量的模型拟合优度提高的程度。 • s=0时,是对模型的整体检验;p=s+1时,是对某个自变量的检验。
包括:多元线性回归模型,logistic回归模型,Probit回归模型,
Poisson回归模型,负二项回归模型
2
当因变量是分类变量时,其自变量与因变量更多的是 非线性关系,严重违背了线性回归模型的假设条件。 故直接应用线性回归分析不合理;
不能直接分析 y 与 x 的关系 y=f(x) ,因y仅取有 限的几个值
23
2019/6/6
Logistic回归模型的统计推断 • Logistic回归方程(系数)的假设检验 • Logistic回归模型的拟合优度检验 • Logistic回归模型预测准确度的检验
22
(1) 似然比检验(likelihood ratio test)
通过比较两个相嵌套模型的对数似然函数统计量G (又称Deviance):来分
对数似然 ln L a(0 1) a ln[1 exp(0 1)] b ln[1 exp(0 1)] c0 c ln[1 exp(0)] d ln[1 exp(0 )]
求一非阶线偏性导迭,代并方令法一阶偏导数=0 ——Newton-Raphson迭代法
最大似然估计
ˆ0
ln
c d

医学统计学Logistic回归分析简介(四)

医学统计学Logistic回归分析简介(四)

1
1 exp(0 1 X1 p X p )
2019年7月7日星期日
重庆交通大学管理学院
21:05:13
模型简介-适用条件
反应变量为二分类变量或某事件的发生率; 自变量与logit(P)之间为线性关系; 残差合计为0,且服从二项分布; 各观测间相互独立。
logistic回归模型应该使用最大似然法来解决方程的 估计和检验问题,不应当使用以前的最小二乘法进行参数 估计。
-1.062
S.E. .317 .175 .318 .616
.184
Wal d 6.391
30.370 6.683 4.270
33.224
df 1 1 1 1
1
Sctep lwt
3
ptl
-.015
.007
5.584
1
.728
.327
4.961
1
ht
1.789
.694
6.639
1
Constant
.893
.038
race(2)
.329
.534
.380
1
.537
sm oke
.927
.399
5552
.345
2.562
1
.109
ht
1.763
.689
6.541
1
.011
ui
.649
.468
1.925
1
.165
ftv
.032
.171
.035
1
.851
Constant
1.143
1.087
2019年7月7日星期日
重庆交通大学管理学院

医学统计学-高级统计学课后部分习题答案第四版孙振球主编

医学统计学-高级统计学课后部分习题答案第四版孙振球主编

11-多因素实验资料的方差分析11-3(1)本题为4个处理组的2×2析因涉及,因分成3天进行,若将每天的实验结果设为一个区组,先进行随机区组的方差分析:方差分析表1变异来源df SS MS F Sig.总变异11 818.369区组间 2 3.762 1.881 .230 .801处理组间 3 765.529 255.176 31.196 .000误差 6 49.078 8.180从上表可以看出,各区组间差异无统计学意义,即各天的实验结果间无差异。

(3)依据完全随机设计析因试验方法进行方差分析方差齐性检验表F df1 df2 Sig.1.429 3 8 0.304P值大于0.05,尚不能认为方差不齐。

方差分析表2变异来源df SS MS F Sig.总变异11 818.37试样处理方式(A) 1 716.11 716.11 108.42 0.000试样重量(B) 1 36.40 36.40 5.51 0.047AB 1 13.02 13.02 1.97 0.198误差8 52.84 6.605结局:可以认为高锰酸盐处理及试样重量均会对甘蓝叶核黄素浓度测定产生影响,尚不能认为高猛酸盐及试样重量的交互作用会对甘蓝叶核黄素浓度测量有影响。

11-4假定不存在高阶交互作用,仅对A、B、C、D、E5个因素的主效应进行分析,采用正交设计的方差分析法:正交设计的方差分析变异来源df SS MS F Sig.总变异15 3495.366A 1 540.911 540.911 21.714 .001B 1 1743.689 1743.689 69.998 .000C 1 787.223 787.223 31.602 .000D 1 82.038 82.038 3.293 .100E 1 92.400 92.400 3.709 .083误差10 249.104 24.910从上表可以看出,A、B、C三个因素的主效应有统计学意义(P<0.05),即A、B、C三个参数对高频呼吸机的通气量有影响。

医学统计学试题及答案

医学统计学试题及答案

第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图 C线图 D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用( A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为( A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )(A)n1+ n2(B)n1+ n2–1 (C) n1+ n2 +1 (D) n1+ n2 -210、标准误反映( A )A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。

令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。

医学统计学复习练习及答案

医学统计学复习练习及答案

第1题:下列有关等级相关系数t s的描述中不正确的是A.不服从双变量正态分布的资料宜计算rSB.等级数据宜计算rsC. rs值-1~+1之间D.查rs界值表时,rs值越大,所对应的概率P值也越大E.当变量中相同秩次较多时,宜计算校正rs值,使rs值减小第2题:对某样本的相关系数r和0的差别进行检验,结果t1A.两变量的差别无统计意义B.两变量存在直线相关的可能性小于5%C.两变量肯定不存在相关关系D.两变量间存在相关关系E.就本资料尚不能认为两变量存在直线相关关系第3题:总体率95%可信区间的意义是。

%的正常值在此范围%的样本率在此范围%的总体率在此范围D.总体率在此范围内的可能性为95%E.样本率在此范围内的可能性为95%第4题:样本含量的确定下面哪种说法合理。

A.样本越大越好B.样本越小越好C.保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好第5题:直线相关与回归分析中,下列描述不正确的是。

值的范围在-1~+1之间B.已知r来自ρ≠0的总体,则r>0表示正相关,r<0表示负相关C.已知Y和X相关,则必可计算其直线回归方程D.回归描述两变量的依存关系,相关描述其相互关系无单位第6题:四格表χ2检验的自由度为1,是因为四格表的四个理论频数( )A.受一个独立条件限制B.受二个独立条件限制C.受三个独立条件限制D.受四个独立条件限制E.不受任何限制第7题:对同一双变量(X,Y)的样本进行样本相关系数的tr检验和样本回归系数的tb检验,有。

A. tb≠trB. tb=trC. tb>trD. tbE. 视具体情况而定第8题:为了由样本推断总体,样本应该是。

A.总体中任意的一部分B.总体中的典型部分C.总体中有意义的一部分D.总体中有价值的一部分E.总体中有代表性的一部分第9题:以下检验方法属非参数法的是。

检验检验检验检验E.以上都是第10题:作两次数比较,已知n1、n2均小于30,总体方差不齐且分布呈极度偏态,宜用。

医学统计学模拟考试题(1-4)及案例分析补充

医学统计学模拟考试题(1-4)及案例分析补充

《医学统计学》期末模拟考试题(一)学号_________ 姓名_______ 班级________ 成绩_________一、填空题(每空0.5分,共15分)1. 科研结果的好坏取决于___________的好坏,研究设计是统计工作的基础和关键,决定着整个统计工作的成败。

2. 概率是________________________________________________。

小概率事件是指__________的随机事件。

3. 实验设计四大原则为___________、_________、____________、______________。

4. 实验设计三要素是指_______________、______________、_____________。

5. 假设检验的基本思想是_________________和____________________。

6. 随机抽样是指_____________________________________________。

7. Ⅱ类错误的意思是________________________________________________。

8. 做两样本均数的比较时,如P>0.05,则应_________无效假设,结论为__________________。

9. 变异系数用于_______________,或_______________________________资料间变异程度的比较。

10. 均衡性原则是指_________________________________________________。

11. 正态分布N(μ,σ2)中有两个参数:____________和____________。

12. 标准化死亡比(SMR)是_______________________________________之比。

13. 计算标准化率时,一般选择“标准”的方法有二种:(1)______________________________________________________________;(2)______________________________________________________________。

医学统计学第18章 Logistic回归思考与练习参考答案

医学统计学第18章 Logistic回归思考与练习参考答案

第18章 Logistic 回归 思考与练习参考答案一、最佳选择题1. Logistic 回归与多重线性回归比较,( A )。

A .logistic 回归的因变量为二分类变量 B .多重线性回归的因变量为二分类变量C .logistic 回归和多重线性回归的因变量都可为二分类变量D .logistic 回归的自变量必须是二分类变量E .多重线性回归的自变量必须是二分类变量 2. Logistic 回归适用于因变量为( E )。

A .二分类变量B .多分类有序变量C .多分类无序变量D .连续型定量变量E .A 、B 、C 均可 3. Logistic 回归系数与优势比OR 的关系为( E )。

A .>β0等价于OR >1B .>β0等价于OR <1C .β=0等价于OR =1D .β<0等价于OR <1E .A 、C 、D 均正确 4. Logistic 回归可用于( E )。

A.影响因素分析 B .校正混杂因素 C .预测 D .仅有A 和C E .A 、B 、C 均可5. Logistic 回归中自变量如为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛选时可用( D )。

A .软件自动筛选的前进法B .软件自动筛选的后退法C .软件自动筛选的逐步法D .应将几个哑变量作为一个因素,整体进出回归方程E .A 、B 、C 均可二、思考题1. 为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中学校,各选择初一年级一个班的全部学生进行调查,并用logistic 回归方程筛选影响因素。

试问上述问题采用logistic 回归是否妥当?答:上述问题采用logistic回归不妥当,因为logistic回归中参数的极大似然估计要求样本结局事件相互独立,而研究的问题中低龄青少年吸烟行为不独立。

2. 分类变量赋值不同对logistic回归有何影响? 分析结果一致吗?答:(1)若因变量交换赋值,两个logistic回归方程的参数估计绝对值相等,符号相反;优势比互为倒数,含义有所区别,实质意义一样;模型拟合检验与回归系数的假设检验结果相同。

医学统计学试题及参考答案 1、2、3套

医学统计学试题及参考答案 1、2、3套

医学统计学试题及答案1、2、3套第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B)A条图B百分条图或圆图C线图D直方图2、均数和标准差可全面描述D资料的特征A所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A)A用该市五岁男孩的身高的95%或99%正常值范围来评价B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价D不能作评价4、比较身高与体重两组数据变异大小宜采用(A)A变异系数B方差C标准差D四分位间距5、产生均数有抽样误差的根本原因是(A)A.个体差异B.群体差异C.样本均数不同D.总体均数不同6.男性吸烟率是女性的10倍,该指标为(A)(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为(D)A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C.A和B均不是D.A和B均是8、两样本均数比较用t检验,其目的是检验(C)A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D)(A)n1+n2(B)n1+n2–1(C)n1+n2+1(D)n1+n2-210、标准误反映(A)A抽样误差的大小B总体参数的波动大小C重复实验准确度的高低D数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。

令对相关系数检验的t值为tr ,对回归系数检验的t值为tb,二者之间具有什么关系?(C)Atr >tbBtr<tbCtr=tbD二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D)A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为(A)A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。

医学统计学方法试题及答案

医学统计学方法试题及答案

医学统计学方法试题及答案一、单项选择题(每题2分,共20分)1. 以下哪一项不是描述性统计分析的内容?A. 均数B. 中位数C. 标准差D. 相关系数答案:D2. 以下哪种情况适合使用t检验?A. 比较两个独立样本的均值B. 比较两个相关样本的均值C. 比较三个及以上样本的均值D. 比较两个样本的率答案:A3. 以下哪种情况适合使用方差分析?A. 比较两个独立样本的均值B. 比较两个相关样本的均值C. 比较三个及以上样本的均值D. 比较两个样本的率答案:C4. 以下哪种情况适合使用非参数检验?A. 数据不符合正态分布B. 数据符合正态分布C. 样本量较小D. 资料为分类资料答案:A5. 以下哪种情况适合使用卡方检验?A. 比较两个独立样本的均值B. 比较两个相关样本的均值C. 比较三个及以上样本的均值D. 资料为分类资料答案:D6. 以下哪种情况适合使用二元Logistic回归分析?A. 研究一个自变量与一个因变量之间的关系B. 研究两个自变量与一个因变量之间的关系C. 研究一个自变量与多个因变量之间的关系D. 研究多个自变量与一个因变量之间的关系答案:D二、简答题(每题5分,共25分)7. 请简述描述性统计分析的主要内容。

答案:描述性统计分析主要包括以下内容:(1)均数:表示一组数据的平均水平;(2)中位数:将一组数据从小到大排列,位于中间位置的数值;(3)标准差:表示一组数据的离散程度;(4)方差:表示一组数据离均差的平方的平均数;(5)变异系数:表示数据的相对离散程度,等于标准差与均数的比值。

8. 请简述t检验的适用条件。

答案:t检验适用于以下条件:(1)样本来自正态分布的总体;(2)样本量较小,一般要求n<50;(3)两个独立样本,且样本数据满足正态分布。

9. 请简述方差分析的适用条件。

答案:方差分析适用于以下条件:(1)三个及以上独立样本;(2)各样本的观察值是可加性的,即各样本的总体均值等于各样本观察值之和除以样本量;(3)各样本之间是相互独立的;(4)各样本的总体方差相等,即满足方差齐性假设。

《医学统计学》考试试题及答案大全04

《医学统计学》考试试题及答案大全04

《医学统计学》考试试题及答案一.单选题(每题Label分)1.下列关于非参数检验的叙述错误的是()。

A.非参数检验不依赖于总体的分布类型B.非参数检验仅用于等级资料比较C.适合参数检验的资料采用非参数检验会降低检验效能D.非参数检验会损失部分样本信息E.秩和检验是一种非参数检验方法正确答案:B2.两种药物疗效(治愈、显效、好转、无效)比较,宜用()。

A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:C3.用大剂量Vit.E治疗产后缺乳,以安慰剂作对照,Vit.E 组中有效者24例,无效者6例,安慰剂组有效者4例,无效者12例。

欲分析Vit.E是否有效,应用()。

A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:A4.定量资料多组比较,满足参数检验条件,假设检验时宜采用()。

A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:B5.定量资料多组比较,当分布类型不清时,宜用()。

A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A6.对于多组独立有序多分类变量资料比较,假设检验时宜采用()。

A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A7.非参数统计的应用条件为()。

A.样本数据来自正态总体B.若两组比较,要求两样本方差相等C.总体分布类型未知D.要求样本例数很大E.总体属于某种已知的分布类型正确答案:C8.设配对设计资料的变量为X和X2,则配对设计的符号秩检验,如何编秩()。

A.把X1与X2的差数绝对值从小到大编秩,排好后秩次保持原差数的正负号B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号C.把X1和X2综合按绝对值从小到大编秩D.把X1与X2的差数从小到大编秩E.把X1和X2综合从小到大编秩正确答案:A9.用两种方法检查已确诊的乳腺癌患者120名。

甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致检出率为35%,试问两种方法何者为优,宜用()。

(完整版)医学统计学试题及答案

(完整版)医学统计学试题及答案

第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用(A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为(A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -210、标准误反映(A )A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的(C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。

令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。

医学统计学试题(卷)与答案解析

医学统计学试题(卷)与答案解析

第一套试卷及参考答案一、选择题(40分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B )A 条图B 百分条图或圆图 C线图 D直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用( A )A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是( A )A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6. 男性吸烟率是女性的10倍,该指标为( A )(A)相对比(B)构成比(C)定基比(D)率7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验( C )A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同 D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D )(A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D) n1+ n2 -210、标准误反映( A )A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的 (C)A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。

令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C)A t r>t bB t r<t bC t r= t b D二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D )A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为( A )A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。

《医学统计学》习题及答案

《医学统计学》习题及答案

一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。

医学统计学课件:回归分析

医学统计学课件:回归分析

回归分析在医学中的应用
05
疾病风险预测
利用回归分析,研究疾病发生的相关因素,如年龄、性别、遗传等,从而预测个体或群体在未来患某种疾病的风险。
预防措施制定
通过了解疾病影响因素,制定针对性强的预防措施,如控烟、控糖、加强锻炼等,以降低疾病发生概率。
疾病预测与预防
治疗效果评估与优化治疗方案
通过对比治疗前后的数据,利用回归分析研究治疗效果的影响因素,如治疗方式、病情严重程度等,为改进治疗方案提供依据。
时间序列回归分析
分位数回归分析是一种非参数回归方法,用于估计因变量的分位数与自变量之间的关系。
总结词
在分位数回归分析中,我们通常将因变量的值分成一系列的分位数,然后估计每个分位数与自变量之间的关系。这种方法可以更加灵活地描述因变量与自变量之间的关系,并且可以更好地适应各种不同的数据类型。
详细描述
分位数回归分析
总结词
多元回归分析
总结词
时间序列回归分析是一种特殊的回归方法,用于研究时间序列数据之间的依赖关系和预测未来趋势。
详细描述
在时间序列回归分析中,我们通常有两个或更多的时间序列数据,它们在时间上具有连续性。通过时间序列回归分析,我们可以估计各个时间序列对目标时间序列的影响程度,并对目标时间序列的未来趋势进行预测。
回归分析的基本步骤
线性回归分析
02
ቤተ መጻሕፍቲ ባይዱ
确定自变量和因变量
建立回归模型
模型假设检验
线性回归模型的建立
03
模型诊断
通过残差图、残差与预测值图等图形工具,对模型的假设和适应性进行诊断。
线性回归模型的评价与诊断
01
模型拟合度评估
应用R^2、校正R^2等指标,评估回归模型对数据的拟合程度。

医学统计学练习及参考答案

医学统计学练习及参考答案

医学统计学练习及参考答案《医学统计学》练习题及参考答案一、填空题:1、频数分布通常具有集中趋势、离散趋势两个基本特征。

P412、统计表一般需有标题、线条(横线)、标目、数字四个基本结构。

3、四格表应用基本公式进行卡方检验的条件是:n≥40 、T≥5 。

4、正态分布的两个决定参数是:位置参数μ、形状参数。

P535、正态分布中央95%的观察值的分布区间是(μ-1.96σ,μ+1.96 σ)。

P536、概率抽样三个基本原则是:随机化原则、同质性原则、 n足够大。

7、实验设计的三大原则是对照、随机化、重复。

P20二、单项选择题:1.下面的变量中,属于分类变量的是---B--.A.脉搏 B.血型 C.肺活量 D.血压2. 已知我国部分县1988年死因构成比资料如下:心脏疾病11.41%,损伤与中毒11.56%,恶性肿瘤15.04%,脑血管病16.07%,呼吸系统病25.70%,其他20.22%.为表达上述死因的构成的大小,根据此资料应绘制统计图为--D---.A.线图 B.直方图 C.直条图 D.百分条图 E.统计地图 3. 在一项研究的最初检查中,人们发现30~40岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同.这个结论是---C--. A.正确的B. 不正确的,因为没有可识别的队列人群 C.不正确的,因为没有区分发病率与患病率D.不正确的,因为用百分比代替率来支持该结论 E.不正确的,因为没有设立对照组 4. sx表示---C--.A.总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D.变量值x的离散程度 E.变量值x的可靠程度5.做两个总体均数比较t检验,计算t>t0.01,(n1+n2-2时,可以认为-B----.A.反复随机抽样时,出现这种大小的均数差异的可能性大于0.01B.样本均数差异是由随机抽样误差所致的可能性小于0.01,可认为两总体有差别。

医学统计学考题(按章节)第4题【15分】__回归分析

医学统计学考题(按章节)第4题【15分】__回归分析

四、回归分析 15分可能涉及范围:多元线性回归、logistic 回归。

要求: 1、提供某一资料,选择统计分析方法2、偏回归系数、标准偏回归系数、决定系数、校正决定系数、OR 等常用指标的意义与应用3、列回归方程例 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值如下表:(1)欲分析影响空腹血糖浓度的有关因素,宜采用什么统计分析方法?多元线性回归分析(2)已知甘油三酯(X2)、胰岛素(X3)和糖化血红蛋白(X4)是主要影响因素,现欲比较上述因素对血糖浓度的相对影响强度,应计算何种指标?标准偏回归系数可用来比较各自变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越大,对Y 的作用越大。

SPSS 输出的多元回归分析结果中给出的各变量的标准偏回归系数,比较三个标准偏回归系数:甘油三脂0.354: 胰岛素0.360: 糖化血红蛋白0.413≈1:1.02:1.17(倍) 糖化血红蛋白对血糖的影响强度大小依次为:糖化血红蛋白X4、胰岛素X3、甘油三脂X2(3)分析其回归模型的好坏宜选用何种指标?校正决定系数( R 2a )作为评价标准一般说决定系数(R 2)越大越优,但由于R 2是随自变量的增加而增大,因此,不能简单地以R 2作为评价标准,而是用校正决定系数( R 2a )作为评价标准。

R 2a 不会随无意义的自变量增加而增大。

(4)根据给出SPSS 结果,做出正确的结论。

空腹血糖浓度与总胆固醇无关,与甘油三脂、空腹胰岛素、糖化血红蛋白线性相关。

(5)列出回归方程。

最优回归方程为:432663.0287.0402.05.6ˆX X X y+-+= Model Summary(最终模型的拟合优度检验验表)相关分析【完全分析答案】jszb1、此资料包含有四个变量,属于多变量计量资料,为多因素设计。

要分析多因素对空腹血糖浓度的影响,宜采用 多元线性回归分析。

2、根据样本数据求得模型参数β0, β1, β2, β3,β4的估计值b0,b1,b2,b3,b4β0又称为截距,β1, β2, …,βm 称为偏回归系数(partial regressin coefficient )或简称为回归系数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

四、回归分析 15分可能涉及范围:多元线性回归、logistic 回归。

要求: 1、提供某一资料,选择统计分析方法2、偏回归系数、标准偏回归系数、决定系数、校正决定系数、OR 等常用指标的意义与应用3、列回归方程例 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值如下表:(1)欲分析影响空腹血糖浓度的有关因素,宜采用什么统计分析方法?多元线性回归分析(2)已知甘油三酯(X2)、胰岛素(X3)和糖化血红蛋白(X4)是主要影响因素,现欲比较上述因素对血糖浓度的相对影响强度,应计算何种指标?标准偏回归系数可用来比较各自变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越大,对Y 的作用越大。

SPSS 输出的多元回归分析结果中给出的各变量的标准偏回归系数,比较三个标准偏回归系数:甘油三脂0.354: 胰岛素0.360: 糖化血红蛋白0.413≈1:1.02:1.17(倍) 糖化血红蛋白对血糖的影响强度大小依次为:糖化血红蛋白X4、胰岛素X3、甘油三脂X2(3)分析其回归模型的好坏宜选用何种指标?校正决定系数( R 2a )作为评价标准一般说决定系数(R 2)越大越优,但由于R 2是随自变量的增加而增大,因此,不能简单地以R 2作为评价标准,而是用校正决定系数( R 2a )作为评价标准。

R 2a 不会随无意义的自变量增加而增大。

(4)根据给出SPSS 结果,做出正确的结论。

空腹血糖浓度与总胆固醇无关,与甘油三脂、空腹胰岛素、糖化血红蛋白线性相关。

(5)列出回归方程。

最优回归方程为:432663.0287.0402.05.6ˆX X X y+-+= Model Summary(最终模型的拟合优度检验验表)相关分析【完全分析答案】jszb1、此资料包含有四个变量,属于多变量计量资料,为多因素设计。

要分析多因素对空腹血糖浓度的影响,宜采用 多元线性回归分析。

2、根据样本数据求得模型参数β0, β1, β2, β3,β4的估计值b0,b1,b2,b3,b4β0又称为截距,β1, β2, …,βm 称为偏回归系数(partial regressin coefficient )或简称为回归系数。

求得回归方程为:4321638.0271.0351.0142.0943.5ˆX X X X y+-++= 3、对总的回归方程的假设检验和评价:检验所有自变量X1,X2,X3,X4作为整体与应变量Y 之间是否具有线性关系。

(1)方差分析法:H0:β1=β2=β3=β4=0 H1:β1, β2, β3,β4不全为0 检验水准:α=0.05查表F 界值表得F0.01(4,22) =4.31,F =8.278>4.31, P <0.01依据SPSS 结果,P =0.000<0.05根据α=0.05的检验水准,拒绝 H0,接受H1,认为所拟合的回归方程具有统计学意义。

(2)决定系数R 2:根据方差分析结果R 2=0.601,说明空腹血糖浓度变异的60%可由血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白的变化来解释。

回归模型的好坏以决定系数(R 2)越大越优,但由于R 2是随自变量的增加而增大,即使无显著性的变量进入方程,其值亦增加。

因此,在相近的情况下,以包含的自变量少者为优,也可用校正决定系数( R 2a )作为评价标准。

R 2a 不会随无意义的自变量增加而增大。

(3)复相关系数:R =0.775称为复相关系数,用来表示表示m 个自变量共同对应变量的相关密切程度。

4、各自变量的假设检验和评价:采用t 检验法对每一个自变量的作用进行检验和衡量它们对Y 作用的大小。

H0:βj =0,即Y 与Xj 无线性相关关系 H1:βj ≠0,即Y 与Xj 有线性相关关系 检验水准:α=0.05同一资料,不同自变量的t 值间可以相互比较,t 值的绝对值越大,说明该自变量对Y 的回归所起的作用越大。

标准偏回归系数可用来比较各自变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越大,对Y 的作用越大。

3、自变量的选择:通常每次只剔除关系最弱的一个因素。

由方程中剔除因素的标准(通常α = 0.10)根据多元回归方程1的偏回归系数检验结果,X1(总胆固醇)的P =0.701>0.05,Y 与X1无线性相关关系被剔除。

重新建立不包含剔除因素的回归方程2:432663.0287.0402.0500.6ˆX X X y+-+= 对新建立的回归方程进行检验:依据SPSS 结果,P =0.000<0.05根据α=0.05的检验水准,拒绝 H0,接受H1,认为所拟合的回归方程具有统计学意义。

对新方程的偏回归系数进行检验:检验结果有意义,因此回归方程保留因素X2、X3 、X4最后获得回归方程为:432663.0287.0402.0500.6ˆX X X y+-+=例: 50例急性淋巴细胞白血病病人,在入院时白细胞数X 1(×10/L ),淋巴结浸润度X 2(记为 0、1、2三级),缓解出院后巩固治疗X 3 (巩固治疗时赋值 1,无巩固治疗时赋值 0)。

随访1年取得每例病人是否死亡 Y (死亡赋值1,存活赋值0)的资料。

(1)欲筛选哪些因素是影响急性淋巴细胞白血病病人一年内死亡的的主要因素, 应选择何种统计分析方法? (2)经统计分析得淋巴结浸润度(X 2)和缓解出院后巩固治疗(X 3)是有意义的影响因素,现计算得b 0= 1.642,b 2=0.707,b 3= -2.784,请列出其回归方程?(3)请解析X3 对应的EXP (B )=0.062 的含义?(4)缓解出院后有巩固治疗患者一年内死亡的危险性是没有巩固治疗患者的多少?(5)假如此例是研究巩固治疗后生存时间受哪些因素影响,所调查的因素同上,现欲分析哪些因素是主要的影响胃癌患者术后生存时间的因素,宜选择何种统计分析方法?【答案】jszb1、该资料的应变量为二分类变量,应选择多因素Logistic 回归分析;2、经统计分析得淋巴结浸润度(X 2)和缓解出院后巩固治疗(X 3)是有意义的影响因素,现计算得b 0= 1.642,b 2=0.707,b 3= -2.784,那么其Logistic 回归方程是:3232784.2707.0642.1784.2707.0642.11x x x x e e P -+-++=(P 为一年内死亡的概率)3、X3 对应的EXP (B )的含义:EXP (B )表示的是在其它因素(自变量)固定的情况下,该变量与疾病关联的优势比,即因素x 与疾病的关联程度,常用OR 表示。

称作多变量调整后的优势比(adjusted odds ratio )。

优势比(OR )指某一影响因素X i 两个不同暴露水平(C 1,C 0)的P/Q 值之比(Q =1-P )。

当某影响因素Xi 仅为两个水平(1暴露,0非暴露),则:)ex p(i i b OR = 当b i =0时,OR i =1,说明因素X i 对疾病发生不起作用; 当b i >0时,OR i >1,说明因素X i 对疾病发生是危险因素; 当b i <0时,OR i <1,说明因素X i 对疾病发生是保护因素。

4、相对危险度RR 与概率预测:1)一名有巩固治疗的病人 ,其一年内死亡的概率为:将X = 1 代入上式得 P = 0.32 2)一名没有巩固治疗的病人,其一年内死亡的概率为:将X = 0 代入上式得 P = 0.88即,缓解出院后有巩固治疗患者一年内死亡的危险性是没有巩固治疗患者的0.32/0.88=4/11。

5、影响生存时间的因素分析,宜选择COX 比例风险回归模型。

【答案】jszbLogistic 回归分析按Logistic 回归的要求,设第i 例病人的应变量Y ,其赋值规则为: 一年内死亡,赋值 1; (发生— 1) 生存一年以上,赋值 0 (未发生— 0)回归模型或回归系数的假设检验 1、似然比检验)ln (ln 201L L G -= 2、Wald 检验j b j S b u /=X 1变量被剔除。

重建不包含X 1该变量回归方程3232784.2707.0642.1784.2707.0642.11X X X X ee P -+-++=若α=0.05, 则X 2被剔除。

重建不包含X 2新的回归方程Variables in the Equation-2.746.75013.4051.000.0641.992.61510.4801.0017.333X3Constant Step 1a B S.E.Wald dfSig.Exp(B)Variable(s) entered on step 1: X3.a.33746.2992.1746.2992.11X X e e P --+=概率预测1、一名没有巩固治疗的病人,其一年内死亡的概率为:将X = 0 代入上式得 P = 0.88,其生存概率为 1 – 0.88 = 0.12 2、一名有巩固治疗的病人,其一年内死亡的概率为:将X = 1 代入上式得 P = 0.32,其生存概率为 1 – 0.32 = 0.68回归方程的分类能力实际与理论一致率(%)= (22+17)×100/50=78% Classification Table a17385.082273.378.0Observed 01YOverall PercentageStep 11YPercentage CorrectPredicted The cut value is .500a.【相对危险度RR 】相对危险度(relative risk)简记为RR,人群总体中暴露于某因素者的发病率P 1与不暴露于某因素者的发病率P 0之比值称为该因素对于该疾病发病的相对危险度,即:1p P RR =【优势比OR 】回归系数(b i )表示自变量 X i 改变一个单位时LogitP 的改变量。

优势比(OR )指某一影响因素X i 两个不同暴露水平(C 1,C 0)的P/Q 值之比。

)1/()1/(0011P P P P OR i --=[])(exp )(logit logit )1/()1/(ln ln 010*******c c b OR c c b P P P P P P OR i i i i -=-=-=⎥⎦⎤⎢⎣⎡--=当P 很小时,【优势比OR 】可以作为【相对危险度RR 】的近似估计:。

相关文档
最新文档