卫生学 10.分类变量资料的统计推断
预防医学(二)第十七章 分类变量资料的统计 分析
第二节 分类变量资料的统计推断
• 一、率的抽样误差与标准误 • 由随机抽样造成的样本率和总体率的差异,以及各样本率 之间的差异称为率的抽样误差。 • 率的抽样误差可用率的标准误来表示 • 率的标准误的计算
• σp为率的标准率,π为总体率,n为样本含量
第二节 分类变量资料的统计推断
• 二、总体率的可信区间估计 • 方法:查表法、正态近似法 • 1.查表法 • 当样本含量较小(如n≤50),特别是p接近于0或1时,可根 据样本含量n和阳性数x,查相关统计学教材“百分率的可信区间” 表,求得总体率可信区间。
第三节 卡方检验(X2检验)
• 一、四格表资料的X2检验 • 2.假设检验步骤 • (1)建立检验假设,确定检验水准 • H0:π1=π2,即试验组与对照组的总体有效率相等。 • H1:π1≠π2,即试验组与对照组的总体有效率不等 • α=0.05(双侧检验) • (2)计算检验统计量
• A为实际频数 • T为理论频数
第三节 卡方检验(X2检验)
• 三、行✖列表资料的X2检验 • 例:某医院用3种方案治疗急性无黄疸型病毒性肝炎 254例, 观察结果见下表,问3种疗法的有效率是否不等。
• 检验假设具体步骤: • H0:3种治疗方案的有效率相等
第三节 卡方检验(X2检验)
• 三、行✖列表资料的X2检验 • 检验假设具体步骤: • H1:3种治疗方案的有效率不全等,α=0.05
第二节 分类变量资料的统计推断
• 四、率的u检验 • 2.计算检验统计量 • (2)两样本率比较的u检验
• 其中P1和P2为两样本率,Sp1-p2为两样本率之差的标准误, P含c量为两样本合并率,Pc=(X1+X2)/(n1+n2),n1和n2分别为两样本
第三节 分类变量资料的统计分析-统计推断
σp =
π (1 − π )
n
如果总体率π未知,用样本率 估计 如果总体率 未知,用样本率p估计 未知
sp =
p(1− p) n
19:46
率的标准误的计算
例 观察某医院产妇 106 人, 其中行剖腹产者 62 人, 剖腹产率为 58.5%,试估计剖腹产率的标准误。 ,试估计剖腹产率的标准误。 解: 已知 n=106,p=0.585,其标准误为: , ,其标准误为:
19:46
小 结
1.样本率也有抽样误差,率的抽样误差的大小用σp或Sp .样本率也有抽样误差,率的抽样误差的大小用 来衡量。 来衡量。 2.率的分布服从二项分布。当n足够大,π和1-π均不太小 .率的分布服从二项分布。 足够大, 和 均不太小 足够大 ,有nπ≥5和n(1-π)≥5时,近似正态分布。 和 ( ) 时 近似正态分布。 3. 总体率的可信区间是用样本率估计总体率的可能范围 . 分布近似正态分布时, 。当p分布近似正态分布时,可用正态近似法估计率的可信区 分布近似正态分布时 间。 4. 根据正态近似原理 , 可进行样本率与总体率以及两样 . 根据正态近似原理, 本率比较的u检验。 本率比较的 检验。 检验
19:46
T11= (a+b)×pc= (a+b)×[(a+c.)/ n]=R1C1/n =21.3 = × × T12 = (a+b)×(1-pc)= (a+b)×[(b+d.)/ n] =R1C2/n =182.7 × × T21 = (c+d)×pc= (c+d)×[(a+c)/ n] =R2C1/n =6.7 × × T22 = (c+d)×(1-pc)= (c+d)×[(b+d.)/ n] =R2C2/n =57.3 × × 行 row)合 ×列 column)合 ( 计 ( 计 nRnC T= = n 总 数 例
卫生统计学试题及答案
卫生统计学试题及答案【篇一:卫生统计学考试试题及答案(附解释)】xt>1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.a.普通线图b.半对数线图c.直方图d.直条图e.复式直条图【答案】c(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.a.直方图b.普通线图c.半对数线图d.直条图e.复式直条图(一个检测指标,两个分组变量)【答案】e? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.a.直方图b.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)c.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)d.直条图e.复式直条图【答案】e4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.a.该研究的样本是1000名易感儿童b.该研究的样本是228名阳性儿童c.该研究的总体是300名易感儿童d.该研究的总体是1000名易感儿童e.该研究的总体是228名阳性儿童【答案】d5.若要通过样本作统计推断,样本应是__________.a.总体中典型的一部分b.总体中任一部分c.总体中随机抽取的一部分d.总体中选取的有意义的一部分e.总体中信息明确的一部分【答案】c6.下面关于均数的正确的说法是______.a.当样本含量增大时,均数也增大b.均数总大于中位数c.均数总大于标准差d.均数是所有观察值的平均值e.均数是最大和最小值的平均值【答案】d7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.a.均数b.几何均数c.中位数d.方差e.四分位数间距【答案】b几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
医学统计学
医学统计学要求:章节出题量医学统计方法概述10数值变量资料的统计描述10数值变量资料的统计推断13分类变量资料的统计描述与推断13统计表与统计图 4合计50卫生统计1随机抽样的要点或实质是:A 每隔一定距离抽取一个个体B 对随机抽中的群体中的机会相同C 总体中每一个体被抽中的机会相同D 先把调查对象分类,再在各类对象中随机抽样E 以上都不是2、以舒张压>90mmHg为高血压,现调查1000人,其中10人为高血压,990人为非高血压,此资料为:A 数值变量资料B 二项分类资料C多项分类资料D有序分类变量资料E以上都不是3、根据研究分析的需要:A 数值变量资料可转化为分类变量资料B 分类变量资料可转化为数值变量资料C 有序分类变量资料可转化为数值变量资料D 三者都对E 以上都不对4 、实验设计的三个基本要素是:A受试对象、实验效应、观察指标B 随机化、重复、设置对照C齐同对比、均衡性、随机化D处理因素、受试对象、实验效应E 以上都不是5、实验设计的三大原则是:A受试对象、实验效应、观察指标B 对照原则、随机化原则、重复原则C齐同对比、均衡性、随机化D处理因素、受试对象、实验效应E 以上都不是6、完成良好的实验设计,不但能减少人力、物力,提高实验效率,还能有助于减少:A.系统误差B.随机误差C.抽样误差D.责任事故E 以上都不是7、用两种不同成分的培养基(分别为701批与702批)分别培养鼠疫杆菌,重复试验单元数为5个,将48小时内各试验单元上生长的活菌数记录如下:701批:48 84 90 123 171 702批:90 116 124 225 84那么该资料的类型为:A.二项分类变量资料B.数值变量资料C.多项分类变量资料D.有序分类变量资料E 以上都不是8、某医院用某种新疗法治疗某病患者41人,治疗结果见表2-3。
表2-3 某种新疗法治疗某病患者的疗效治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1 该资料的类型为:A. 二项分类变量资料B.数值变量资料C.多项分类变量资料D.有序分类变量资料E 以上都不是9、反映实验效应的指标应具备以下条件:A.关联性B.客观性C.灵敏性D.以上都是E 以上都不是10、随机误差的性质是:A.可以消除B.不可以消除C.不可以消除但可控制D以上都是E 以上都不是11、标准差常用于衡量:A 样本与总体的差异B 两总体间差异C 两样本间差异D 个体差异大小E、以上匀不是12、已知100名2岁儿童,身高X=80cm,S=4cm,现有一个两岁儿童身高86cm,依据范围判断该儿童为正常:A x±1.96SB x±2.58 S xC x±1.96 S xD x±1.64SE、以上均不是13、有8名传染病病人,其潜伏期分别为2,2,3,4,7,5,17,8天,则平均潜伏期为:A 5.5 天B 5 天C 4.5天D 6天E、以上均不是14、S大表示各变量值A 平均水平高B 抽样误差大C 变量间相差水平大D 各变量相接近E、以上均不是15、血清学滴度资料一般应计算:A. xB. MC. GD. P XE. 以上均不是16、中位数适用于下列资料:A 偏态分布的资料B 有极大或极小值的资料C 分布不明的资料D 以上都是E.以上均不是17、要比较两个单位不同资料的变异大小,可选用_____变异指标A 四分位数间距B 极差C标准差D变异系数E. 以上都不是18、几何均数可适用于:A 资料中有正有负的资料B 资料中有0的资料C 资料中全部为正或全部为负的资料D 任何资料E. 以上都不是19、变异系数的数值:A.一定大于1B.一定小于1C.一定比标准差小D.一定比标准差大E.以上全不对20、医学中确定参考值范围时应注意:A.正态分布资料不能用均数标准差法B.正态分布资料不能用百分位数法C.偏态分布资料不能用均数标准差法D.偏态分布资料不能用百分位数法E.随意选择21、来自同一总体的两个样本中小的那个样本均数估计总体均数更可靠:A SBxC S2D CVE.以上全不对22、可信区间说明:A 个体变量的分布范围B 总体均数所在的范围C 标准差的可信程度D 平均数的可信程度E.以上全不对23、在假设检验中,P值的含义是:A 因抽样误差造成数据间差异至少大于如此程度的概率B H0正确的概率C H1正确的概率D 两组数据存在差异的概率E. 以上全不对24、用t检验比较两均数的差异时,t 越大,P越小,愈说明:A 两均数差别大B 样本含量大C 有理由认为两总体均数不同D 有理由认为两样本均数不同E.以上全不对25、某医生治疗黑热病贫血病人17例,测量了每例治疗前后血红蛋白的含量,欲了解治疗前后有无差别应选用A 两样本的t检验B χ2检验C u检验D 配对t检验E.以上全不对26、在t检验中,若05=α,当t<t(0.05,v)时,可认为:< bdsfid="233" p=""></t(0.05,v)时,可认为:<>A 两样本均数不同B 两总体均数不同C 两样本均数相同D 两总体均数相同E.以上全不对27、两个t检验资料,一个t>t0.05一个t>t0.01,可认为A 后者两样本均数相差比前者大B 前者两样本均数相差比后者大C 后者更有理由认为两总体均数不同D 后者更有理由认为两总体均数相同E.以上全不对28、某医师给一批高血压病人服用某降压药,观察服药前后的降压效果,其假设检验的公式为:A sxxtμ-=Bxxstx2121--=Cs ddt=D 以上都是E.以上全不对29、用样本推断总体均数的95%可信区间时,其上下限为:A x±2.58s xB x±t(0.05,ν)s xC x±1.96sD x±t(0.05,ν)sE.以上全不对30、统计推断的内容:A 参数估计B 假设检验C t 检验D 以上都不是 E. A 和B 都是31、抽样误差存在的原因是: A 抽样B 总体中存在个体差异C 样本含量太小D .A 和B 都是 E. 以上都不是32、缩小抽样误差的方法有: A 扩大样本含量 B 保证同总体同质C 以上都是D 以上都不是 E. 减少样本含量 33、x 与s x 的关系为: A x 越大,s x 越小 B x 越大,s x 越大 Cs x 越大,x 代表性越大D s x越小,x 推断μ的可靠性越大E.以上都是34、四个样本作比较,201.02χχ>,则认为:A 各总体率不同或不全相同B 各总体率均不相同C 各样本率不同或不全相同D 各样本率均不相同 E.以上都是35、哪种情况的资料,必须采用四格表的直接计算概率法:A n >40 而且 1<t<5< bdsfid="302" p=""></t<5<>B . n >40 而且 T>5C . n<40 或 T<1 D. N>40 而且 T>1 E. 以上都不是36、四组人群每组均有A 、AB 、B 、O 型四种血型的人数各若干,要比较四组人群血型情况有无差别,则作: A . t 检验B.χ2检验C. u 检验 D .方差分析 E. 以上全对37、哪种情况,宜采用四格表的校正公式:A . n >40 而且 1<t40 而且 T>5</tC .n<40 或 T<1D .N>40 而且 T<1 E.以上全对38、计算麻疹疫苗接种后血清检查阳转率,分母为:A 麻疹易感人数 B 麻疹患儿人数 C 麻疹疫苗接种人数D 麻疹疫苗接种后的阳转人数 E.以上全不对39、已知男性的钩虫感染率高于女性,现欲比较甲乙两地的钩虫感染率,但甲乡的人口女多于男,乙乡的人口男多于女,适当的比较方法为:A 不具可比性,不能比较B 两个率比较的χ2检验 C 对性别标准化后再比较 D 以上都不对 E 以上都对40、四格表周边合计数不变时,实际频数如有改变,理论频数:A 增大B 减少C 不变D 不知道E 以上都对41、χ2检验中自由度的计算公式是: A 行数×列数 B n-1 C n-kD (行数-1)×(列数-1)E 以上都对42、四格表中,当a =30,b =60,c =40,d =50时,最小理论频数等于: A 18011070? B 1809090?C 1809070?D 18090110?E 以上都对43、配对四格表作2检验时的检验假设为: A B=C B A=C C B=D D A=B E 以上都对44、行×列表中,χ2检验其适用的条件为:A 允许1/5以下的格子理论频数小于5B 允许1/5以上格子的理论频数小于5C 允许1/5格子的理论频数大于1小于5D 以上都对E 以上都不对45、配对四格表χ2检验中应用校正公式的条件为:A b+c ≥40 B b+c<40 C n ≥40D n<40E 以上都对46、要了解某地区鲜血人员的血型分布情况,应选用______指标描述 A 率 B 相对比 C 构成比 D 中位数 E 以上都对47、比较甲、乙、丙、丁四个单位的发病率可选用:A 线图B 直方图C 圆图D 直条图E 以上都对48、比较工厂外伤患病率用,比较甲乙两地各年份的肝炎发病率用A 直方图B 构成条图C 线图D 直条图E 以上都对49、比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制:A 直方图B 直条图C 普通线图D 半对数线图E 以上都对50、在统计图中,图号与标题的位置:A.应在上方B.应在下方C.可在任意位置D.应在左侧E 以上都对答案:1C 2B 3D 4D 5B 6C 7B 8D 9D 10C 11D 12A 13C 14C 15C 16D 17D 18E 19E 20C 21B 22B 23A 24C 25D 26D 27C 28C 29B 30E 31D 32C 33D 34A 35C 36B 37A 38C 39C 40C 41D 42C 43A 44C 45B 46C 47D 48D C 49D 50B。
医学统计方法—分类变量资料的统计分析
常用类型: ➢率(rate) ➢构成比(constituent ratio) ➢相对比(relative ratio),等
概念:又称频率指标或强度指标,是指某一现象在一定条件 下实际发生的例数与可能发生该现象的总例数之比,用以说 明某现象发生的频率或强度。
2
91 1 4.90
bc
9 1
(3)确定P值:
查
x
2界
值表,来自得x 2 0.05,1
3.84
x2 0.01,1
6.63。
现 x2 =4.90,x2> x20.05, 故 P<0.05 (4) 做出推断结论:
按α=0.05水准,拒绝H0 ,接受H1,差异有统计学 意义,可以认为两种培养方法的效果不同, A培养基 效果优于B培养基。
计算相对数时应有足够的样本含量; 资料分析时不能以构成比代替率; 资料的对比应注意其可比性; 样本率(或构成比)的比较应考虑抽样误差。
表 某年某医院两种疗法治疗某传染病各型的治愈率(%)
病型
新疗法
传统疗法
治疗例数 治愈例数 治愈率 治疗例数 治愈例数 治愈率
普通型 350
重型
150
217
药物 甲药 乙药 合计
表1 两药物疗效的比较
有效
无效
合计
65 (57.4) 17(24.6)
82
40 (47.6) 28 (20.4)
68
105
45
150
表内蓝体数字为实际頻数,括号里数字为 理论頻数,是假设两药物疗效无差别算得
若假设H0:π1=π2成立,四个格子的实际频数 A 与理论 频数 T 相差不应该很大,即统计量x2值不应该很大。如 果x2值很大,则反过来推断A 与T 相差太大,超出了抽样 误差允许的范围,从而怀疑H0的正确性,继而拒绝H0, 接受其对立假设 H1,即π1≠π2 。
卫生统计学考研试题名词解释总结
卫生统计学考研试题名词解释总结1、typical survey:典型调查,典型调查就是在调查对象中有意识的选择若干具有典型意义或者代表的单位进行非全面调查。
2、箱式图(box plot):用于多组数据的直观比较分析。
一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。
3、二项分布(binorminal distribution):若一个随机变量X,它的可能取值是0,1,…,n,而且相应的取值概率为称此随机变量X服从n,π为参数的二项分布。
4、morbidity statistics:疾病统计,是居民健康统计的重要内容之一,它的任务是研究疾病在人群中发生、发展及其流行的规律,为病因学研究、疾病防治和评价疾病防治效果提供科学依据。
5、life expectancy:期望寿命,是指x岁尚存者预期平均尚能存活的年数,它是评价居民健康状况的主要指标。
6、life table:寿命表,又称为生命表,是根据特定人群的年龄组死亡率编制出来的一种统计表。
由于它是根据各年龄组死亡率计算出来的,因此,各项指标不受人口年龄构成的影响,不同人群的寿命表指杯具有良好的可比性。
7、预测(forecast):这是回归方程的重要应用方面。
所谓预测就是把预测因子(自变量X)代入回归方程,对预报量(应变量Y)进行估计,其波动范围可以按照个体Y值容许区间方法计算。
8、standard deviation:标准差,常用来描述数据离散趋势的统计指标,其能反映均数代表性的好坏,以及变量值与均数的平均离散程度。
9、cluster sampling:整群抽样,首先将总体按照某种与研究目的无关的分布特征(如地区范围、不同的团体、病历、格子等)划分为若干个“群”组,每个群包括若干观察单位;然后根据需要随机抽取其中部分“群”,并调查被抽中的各”群”中的全部观察单位。
这种抽样方法称为整群抽样。
10、precision:精密度,是指重复观察时,观察值与其均数的接近程度,其差值属于随机误差11、正交设计(orthogonal design):当实验涉及的因素在三个或三个以上,且因素间可能存在交互作用时,可用正交试验设计。
卫生统计学试题3含答案
《医学统计方法》试题三:1.两样本均数比较,经t检验,差异有显著性时,P越小,说明:CA.两样本均数差异越大B.两总体均数差异越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E•样本均数与总体均数不同2.某自然保护区狮子的平均密度为每平方公里100只,随机抽查其中一平方公里范围内狮子的数量,假设进行100次这样的抽查,其中的95次所得数据应在以下那个范围内。
(B 为加减,为什么?)BA •5-195B •-119.6C •90-110D •95-105E •-125.83.抽样研究中,S为定值,假设逐渐增大样本含量,则样本:AA .标准误减小B .标准误增大C.标准误不改变D.标准误的变化与样本含量无关E.以上都对4.以下关于统计表的要求,表达错误的选项是:EA.标题位于表的上方中央B.不宜有竖线及斜线C.备注不必列入表内D.线条要求三线式或四线式E.无数字时可以不填5.在统计学中,参数的含义是:DA •变量B.参与研究的数目C.研究样本的统计指标D•总体的统计指标E.与统计研究有关的变量6 .某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为:CA.所有成年男子B .该市所有成年男子C .该市所有健康成年男子D •120名该市成年男子E •120名该市健康成年男子7.医学统计的研究内容是EA.研究样本B.研究个体C.研究变量之间的相关关系D•研究总体E •研究资料或信息的收集.整理和分析8.总体应该由DA.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成9.在统计学中,参数的含义是DA .变量B.参与研究的数目C.研究样本的统计指标D•总体的统计指标E.与统计研究有关的变量10.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于AA .计数资料B .计量资料C .总体D .个体E・样本11.统计学中的小概率事件,下面说法正确的选项是:BA.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于的事件D.发生概率小于的事件E.发生概率小于的事件12、统计上所说的样本是指:DA、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体13、以舒张压为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属〔〕资料。
医学统计学分类变量资料的统计推断
率的标准误的意义
▪ 率的标准误小,说明抽样误差较小,表示 样本率与总体率越接近;
▪ 率的标准误大,说明抽样误差较大,表示 样本率与总体率相距较远。
▪ 有研究者在某地采用随机整群抽样法获得 642名青少年,调查其留守情况,得出留守 率为16.98%,求其留守率的标准误。
▪ 已知n=642,p=0.1698,则
单侧α= 0.05
本例,n=304,p=0.316,π0=0.2,则有
u=5.06>1.645,p<0.05,则拒绝H0,接受H1,老年 胃溃疡患者出血率高于一般胃溃疡患者。
案例
▪ 某地调查了50岁以上吸烟者200人中患慢 性支气管炎者41人,患病率为20.5%;不 吸烟者162人中患慢性支气管炎者15人, 患病率为9.3%。
案例
▪ 2003年,某学校欲了解大学生乙肝表面抗原 携带情况以评价防控措施,随机抽取1000名 大学生,做乙肝表面抗原检查,查得乙肝表 面抗原阳性者52人,乙肝表面抗原阳性率为 5.2%,欲用此率推断该校大学生乙肝表面抗 原总体阳性率。
例
▪ 某校大学生乙肝表面抗原总体阳性率的 95%的可信区间:
分类变量资料的 统计推断
二项分布
▪ 考虑一系列彼此独立的随机试验,每次试 验只有两个可能发生的结果,且每种结果 发生的可能性是一定的,即发生和不发生 的概率分别是:和1- ,那么这n次试验 中发生或者不发生的次数服从二项分布。 (没有“排列”的意义,而体现了“组合” 的意义)
只有两个可能发生的结果
▪ 问题
➢ 据以上资料能否下结论说吸烟者慢性支气管炎 患病率高于不吸烟者?
➢ 用什么方法对两个率进行比较?
吸烟组和不吸烟组慢性支气管炎患病率比较
医学统计学-分类变量资料的统计推断
分组
发病人数 未发病人数 合 计 发病率%
服药组
40(a) 190(b) 230(a+b) 17.39
对照组
50(c) 130(d) 180(c+d) 27.78
合计
90(a+c) 320(b+d) 410(n)
21.95
2
a
ad bc2 n bc d a cb
d
1
四格表资料的χ2检验(校正χ2值的计算)
分类变量资料的 统计推断
第一节 率的抽样误差和总体率的估计 第二节 率的u检验 第三节 χ2检验
统计推断:
用样本信息推论总体特征的过程。 包括:
参数估计:运用统计学原理,用从样本计算出来的统
计指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
=1时,P=0.05,x2 =3.84 P=0.01,x2 =6.63
P=0.05时,=1,x2 =3.84 =2,x2 =5.99
当自由度取1时,u2= x2
例1:某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松 (对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分 为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?
情况。
第二节 率的u检验
率的u检验的应用条件: 1. 已知π0 2. nP>5, n(1-P)>5
(当样本含量足够大、样本率p和1-p均不接近 于零的前提下,且np和n(1-p)均大于5时,样本 率的分布近似于正态分布,样本率和总体率、 两个样本率之间差异来源的判断可用u检验。)
一、样本率与总体率的比较
卫生学 10.分类变量资料的统计推断
40 6 2 16 64 / 2
42 22 56 8
2
64
4.79
自由度υ=(行数-1)(列数-1)
=(2-1)(2-1)=1
查X2界值表,得 P<0.05,按α=0.05水准, 拒绝H0,可认为两组有效率差别有统计学意 义。
三、配对设计分类变量资料的X2检验
H0:π= π0
H1:π≠ π0
α=0.05 P=0.26
u p 0 0.30 0.26 0.3(1 0.3) 385
0 (1 0 )
n
1.713
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
1 n2
)
0.0854 0.1486 1 1 0.1258(1 0.1258) 8207 14585
0.0046
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节
x2 检 验
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正 态分布 • 当nP和n(1-P)都大于5时,二项分布近 似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
表10-9 两种血清学方法对肝癌检测的结果比较
甲法 + 乙法 合计
+
合计
50(a)
卫生统计学重点笔记
医师资格考试蓝宝书预防医学之答禄夫天创作医学统计学方法第一节基本概念和基本步伐(非常重要)一、统计工作的基本步伐设计(最关键、决定成败)、搜集资料、整理资料、分析资料.总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单元某一变量值的集合.总体的指标为参数.实际工作中,经常是从总体中随机抽取一定命量的个体,作为样本,用样本信息来推断总体特征.样本的指标为统计量.由于总体中存在个体变异,抽样研究中所抽取的样本,只包括总体中一部份个体,这种由抽样引起的不同称为抽样误差.抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低.某事件发生的可能性年夜小称为概率,用P暗示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件.二、变量的分类变量:观察单元的特征,分数值变量和分类变量.第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布.2.几何均数适用于等比资料,尤其是对数正态分布的计量资料.对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX取代X)服从正态分布,观察值不能为0,同时有正和负.3.中位数一组按年夜小顺序排列的观察值中位次居中的数值.可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定命据资料的中心位置.不能求均数和几何均数,但可求中位数.百分位数是个界值,将全部观察值分为两部份,有X%比小,剩下的比年夜,可用于计算正常值范围.二、描述计量资料的离散趋势的指标1.全距和四分位数间距.2.方差和标准差最为经常使用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单元酿成了平方,所以开方为标准差.均为数值越小,观察值的变异度越小.3.变异系数多组间单元分歧或均数相差较年夜的情况.变异系数计算公式为:CV=s/×100%,公式中s为样本标准差,为样本均数.三、标准差的应用暗示观察值的变异水平(或离散水平).在两组(或几组)资料均数相近、怀抱单元相同的条件下,标准差年夜,暗示观察值的变异度年夜,即各观察值离均数较远,均数的代表性较差;反之,暗示各观察值多集中在均数周围,均数的代表性较好.(常考!)四、医学参考值的计算方法,单双侧问题,医学为95%医学参考值是指正凡人体或植物体的各种生理常数,由于存在变异,各种数据不单因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其摆荡的范围,即正常值范围.医学参考值的计算公式:①正态分布资料95%医学参考值:±1.96s(双侧);+1.645s或 1.645s(单侧),s为标准差.②百分位数法P2.5和P97.5(双侧);P5或P95(单侧).第三节数值变量数据的统计推断(重要考点)一、标准误,标准误与标准差和样本含量的关系标准差和标准误的区别.样本标准误即是样本标准差除以根号下样本含量.标准误与标准差成正比;与样本含量的平方根成反比.因此.为减少抽样误差,应尽可能保证足够年夜的样本含量.样本标准差与样本标准误是既有联系又有区另外两个统计量,二者的联系是公式:二者的区别在于:样本标准差是反映样本中各观测值X1,X2,……,Xn变异水平年夜小的一个指标,它的年夜小说明了对该样本代表性的强弱.样本标准误是样本平均数1,2,……的标准差,它是抽样误差的估计值,其年夜小说明了样本间变异水平的年夜小及精确性的高低.(掌握!)二、t分布和标准正态u分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶端较u分布低,两端翘.(v逐渐增年夜,t分布逐渐迫近u分布).正态分布的特点:①以均数为中心左右两侧完全对称分布;②两个参数,均数u(位置参数)和s(变异参数);③对称均数的两正面积相等.三、总体均数的估计样本统计量推算总体均数有两个重要方面:区间估计和假设检验.样本均数估计总体均数称点估计.总体均数区间估计(可信区间)的概念:按一定的可信度估计未知总体均数所在范围.其统计上习惯用95%(或99%)可信区间暗示总体均数μ有95%(或99%)的可能在某一范围.可信区间的两个要素,一为准确度,反映在可信度1α的年夜小,即区间包括总体均数的概率年夜小,固然愈接近1愈好;二是精度,反映在区间的长度,固然长度愈小愈好.在样本例数确定的情况下,二者是矛盾的,需要兼顾.总体均数可信区间的计算方法:1.当n小按t分布的原理用式计算可信区间为:±tα/2,vS2.当n足够年夜因n足够年夜时,t分布迫近μ分布,按正态分布原理.用式估计可信区间为:±μα/2S可信区间与医学参考值范围的区别:二者的意义和算法分歧.四、假设检验的步伐1.建立假设:H0(无效,两样本代表的总体均数相同),H1(备择,两样原本自分歧总体),当拒绝H0就接受H1,不拒绝就不接受H1.2.确定显著性水平:区分年夜概率和小概率事件的标准,通常取α=0.05.3.计算统计量:根据资料类型和分析目的选择适当的公式计算.4.确定概率P值:将计算获得的t值或u值查界值表获得P 值和α值比力.5.做出推断结论.|t|值、P值与统计结论五、两均数的假设检验(常考!)1.样本均数与总体均数比力 u检验和t检验用于样本均数与总体均数的比力.理论上要求样原本自正态分布总体实际中,只要样本例数n较年夜,或n小但总体标准差σ已知,就选用u检验.n较小且σ未知时,用于t检验.两样本均数比力时还要求两总体方差等.以算得的统计量t,按表所示关系作判断.2.配对资料的比力在医学研究中,经常使用配对设计.配对设计主要有四种情况:①同一受试对象处置前后的数据;②同一受试对象两个部位的数据;③同一样品用两种方法(仪器等)检验的结果;④配对的两个受试对象分别接受两种处置后的数据.情况①的目的是推断其处置有无作用;情况②、③、④的目的是推断两种处置(方法等)的结果有无分歧.v=对子数1;如处置前后或两法无分歧,则其差数d的总体均数应为0,可看作样本均数和总体均数0的比力.为差数的均数;为差数均数的标准误,Sd为差数的标准差;n为对子数.因计算的统计量是t,按表所示关系作判断.3.完全随机设计的两样本均数的比力亦称成组比力.目的是推断两样本各自代表的总体均数μ1与μ2是否相等.根据样本含量n的年夜小,分u检验与t检验.t检验用于两样本含量n1、n2较小时,且要求两总体方差相等,即方差齐.若被检验的两样本方差相差显著则需用t′检验.u检验:两样本量足够年夜,n>50.=v=(n11)+(n21)=n1+n22式中,为两样本均数之差的标准误,Sc2为合并估计方差(combined estimate variance).算得的统计量为t,按表所示关系做出判断.4.Ⅰ型毛病和Ⅱ型毛病弃真,拒绝正确的H0为Ⅰ型毛病α暗示,若显著性水平α定为0.05,则犯Ⅰ型毛病的概率0.05;接受毛病的H0为Ⅱ型毛病,概率用β暗示,β值的年夜小很难确切估计.当样本含量一按时,两者反比,增年夜n,当α一按时,可减少β.1β称为检验效能或掌控度,其统计意义是若两总体确有分歧,按α水准能检出其差另外能力.客观实际拒绝H0 不拒绝H0H0成立Ⅰ型毛病(α)推断正确1αH0不成立推断正确(1β)Ⅱ型毛病(β)5.假设检验注意事项保证组间可比性;根据研究目的、资料类型和设计类型选用适当的检验方法,熟悉各种检验方法的应用条件;“显著与否”是统计学术语,为“有无统计学意义”,不能理解为“分歧是不是年夜”;结论不能绝对化.第四节分类变量资料的统计描述(一般考点)相对数是两个有关联事物数据之比.经常使用的相对数指标有构成比、率、相比较等.一、构成比暗示事物内部各个组成部份所占的比重,通常以100为例基数,故又称为百分比.其公式如下:构成比=×100%该式可用符号表达如下:构成比=×100%构成比有两个特点:(1)各构成部份的相对数之和为100%.(2)某一部份所占比重增年夜,其他部份会相应地减少.二、率用以说明某种现象发生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数(K)均可,原则上以结果至少保管一位整数为宜,其计算公式为:率和构成比分歧之处:率的年夜小仅取决于某种现象的发生数和可能发生该现象的总数,不受其他指标的影响,而且各率之和一般不为1.率=×K该式亦可用符号表达如下阳性率=×K(若算阴性率则分子为A())式中A(+)为阳性人数,A()为阴性人数.三、相比较暗示有关事物指标之比较,常以百分数和倍数暗示,其公式为:相比较:甲指标/乙指标(或×100%)或用符号暗示为:A/B×K四、注意事项①构成比和率的分歧,不能以比代率;②计算相对数时,观察例数不宜过小;③率的比力注意可比性,特别是混杂因素的问题,有的话,可用标准化法和分层分析消除;④观察单元分歧的几个率的平均率不即是几个率的算术均数;⑤样本率或构成比的比力应做假设检验.第五节分类变量资料的统计推断(非常重要)一、率的抽样误差用抽样方法进行研究时,肯定存在抽样误差.率的抽样误差年夜小可用率的标准误来暗示,计算公式如下:σp=式中:σp为率的标准误,π为总体阳性率,n为样本含量.因为实际工作中很难知道总体阳性率π,故一般采纳样本率P来取代,而上式就酿成Sp=二、总体率的可信区间由于样本率与总体率之间存在着抽样误差,所以也需根据样本率来推算总体率所在的范围,根据样本含量n和样本率P的年夜小分歧,分别采纳下列两种方法:(一)正态近似法(常考!)当样本含量n足够年夜,且样本率P和(1P)均不太小,如nP 或n(1P)均≥5时,样本率的分布近似正态分布.则总体率的可信区间可由下列公式估计:总体率(π)的95%可信区间:p±1.96sp总体率(π)的99%可信区间:p±2.58sp(二)查表法当样本含量n较小,如n≤50,特别是P接近0或1时,则按二项分布原理确定总体率的可信区间,其计算较繁,读者可根据样本含量n和阳性数x参照专用统计学介绍的二项分布中95%可信限表.三、u检验(非常重要!)当样本含量n足够年夜,且样本率P和(1P)均不太小,如nP 或n(1P)均≥5时,样本率的分布近似正态分布.样本率和总体率之间、两个样本率之间差另外判断可用u检验.1.样本率和总体率的比力公式 u=|Pπ|/σP=|Pπ|/;2.两样本率比力公式u=|P1P2|/Sp1P2=|P1P2|/也可用χ2检验,两者相等.四、χ2检验(非常重要!)可用于两个及两个以上率或构成比的比力;两分类变量相关关系分析.其数据构成,一定是相互对峙的两组数据,四格表资料自由度v永远=1.四格表χ2检验各种公式适用条件,n>40且每个格子T>5,可用基本公式或专用公式,不用校正.基本公式:χ2=∑(AT)2/T专用公式:χ2=∑(adbc)2n/(a+b)(c+d)(a+c)(b+d)只要有一个格子T在1~5之间,需校正.校正公式:基本公式:χ2=∑(|AT|0.5)2/T专用公式:χ2=∑(|adbc|n/2)2n/(a+b)(c+d)(a+c)(b+d)n<40或T<1,用确切概率法.五、行×列表χ2检验当行数或列数超越2时,称为行×列表.行×列表χ2检验是对多个样本率(或构成比)的检验.适用条件:一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数.1.当理论数太小可采用下列方法处置①增加样本含量以增年夜理论数;②删去上述理论数太小的行和列;③将太小理论数所在组与性质相近的组合并,使重新计算的理论数增年夜.由于后两法可能会损失信息,损害样本的随机性,分歧的合并方式有可能影响推断结论,故不宜作惯例方法.另外,不能把分歧性质的实际数合并,如研究血型时,不能把分歧的血型资料合并.2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有分歧,但不能说明它们彼此之间都有分歧,或某两者间有分歧.3.关于单向有序行列表的统计处置在比力各处置组的效应有无分歧时,宜用秩和检验法,如作χ2检验只说明各处置组的效应在构成比上有无不同.六、配对计数资料的χ2检验同一样品用两种方法处置,观察阳性和阴性个数.判断两种处置方法是否相同.当b+c>40时,χ2=(bc)2/b+c;b+c<40时,校正公式:χ2=(|bc|1)2/b+c第六节直线相关和回归(一般考点)一、直线相关分析的用途、相关系数及其意义相关分析是研究事物或现象之间有无关系、关系的方向和密切水平.相关系数:是定量暗示两个变量(X,Y)之间线性关系的方向和密切水平的指标,用r暗示,r=lxy/,其值在1至+1间,r 没有单元.r呈正值,两变量间呈正相关,即两者的变动趋势是同向的,r=1时为完全正相关;如r呈负值,两变量呈负相关,即两者的变动趋势是反向的,r=1时为完全负相关.r的绝对值越接近1,两变量间线性相关越密切;越接近于0,相关越不密切.当r=0时,说明X和Y两个变量之间无直线关系.二、直线回归分析的作用、回归系数及其意义直线回归分析的任务在于找出两个变量有依存关系的直线方程,以确定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小.这个方程称为直线回归方程,据此方程描绘的直线就是回归直线.直线同归方程式的一般表达式Y=a+bX式中a为回归直线在Y轴上的截距,即a>0暗示直线与Y轴的交点在原点上方,<0在原点下方,a=0过原点.b为样本回归系数,即回归直线的斜率,暗示当X变动一个单元时,Y平均变动b个单元.b>0:暗示Y随X增年夜而增年夜b<0:暗示Y随X增年夜而减少b=0:暗示Y不随X变动而变动第七节统计表和统计图(重要考点)一、统计表原则:结构简单、条理分明、内容安插合理、重点突出、数据准确.1.题目简练表达表的中心内容,位置在表的上方.2.标目有横标和纵标目,横标目通常位于表内左侧;纵标目列在表内上方,其表达结果与主辞呼应.3.线条力求简洁,一般为三线表.4.用阿拉伯数暗示,如无数据或暂缺资料,也可用“”或“…”来暗示.5.备注一般不列入表内,解释在表下.内容排列:一般按事物发生频率年夜小顺序来排列,比较鲜明,重点突出.二、统计图1.线图(line diagram)(常考!)资料性质:适用于连续变量资料.分析目的:用线段的升降表达某事物的静态(差值)变动.2.半对数线图(semilogarithmic line graph)资料性质:适用于连续变量资料.分析目的:用线段的升降表达事物的发展速度变动趋势.3.直方图(histogram)资料性质:适用于数值变量,连续性资料的频数表资料.分析目的:直方图是以直方面积表达各组段的频数或频率.4.直条图(bar chart)资料性质:适用于彼此自力的资料.分析目的:直条图是用等宽直条的和长短来暗示各统计量的年夜小,进行比力.5.百分条图(percentchart)资料性质:构成比.分析目的:用长条各段的长度(面积)表达内部构成比.6.圆形图(circulargraph)(常考!)资料性质:构成比.分析目的:用圆的扇形面积表达内部构成比.7.散点图(scatterdiagram)资料性质:双变量资料.分析目的:用点的密集度和趋势表达两变量间的相关关系.8.统计舆图(statistical map)资料性质:地区性资料.分析目的:用分歧纹线或颜色代表指标高低,说明地区分布.。
卫生统计学知识点总结
卫生统计学统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。
★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验.a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。
b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别.变量资料可分为定性变量、定量变量。
不同类型的变量可以进行转化,通常是由高级向低级转化。
资料按性质可分为计量资料、计数资料和等级资料。
定量资料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法.离散型定量变量的频率分布图可用直条图表达。
2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值. ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数.算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
卫生统计学试题及答案
卫生统计学试题及答案【篇一:卫生统计学考试试题及答案(附解释)】xt>1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______.a.普通线图b.半对数线图c.直方图d.直条图e.复式直条图【答案】c(6——16岁为连续变量,得到的是连续变量的频数分布)直方图(适用于数值变量,连续性资料的频数表变量)直条图(适用于彼此独立的资料)2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______.a.直方图b.普通线图c.半对数线图d.直条图e.复式直条图(一个检测指标,两个分组变量)【答案】e? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______.a.直方图b.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势)c.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度)d.直条图e.复式直条图【答案】e4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。
若要研究该疫苗在该地儿童中的接种效果,则______.a.该研究的样本是1000名易感儿童b.该研究的样本是228名阳性儿童c.该研究的总体是300名易感儿童d.该研究的总体是1000名易感儿童e.该研究的总体是228名阳性儿童【答案】d5.若要通过样本作统计推断,样本应是__________.a.总体中典型的一部分b.总体中任一部分c.总体中随机抽取的一部分d.总体中选取的有意义的一部分e.总体中信息明确的一部分【答案】c6.下面关于均数的正确的说法是______.a.当样本含量增大时,均数也增大b.均数总大于中位数c.均数总大于标准差d.均数是所有观察值的平均值e.均数是最大和最小值的平均值【答案】d7.某地易感儿童注射乙肝疫苗后,从中随机抽取100名儿童测量其乙肝表面抗体滴度水平,欲描述其平均水平,宜采用______.a.均数b.几何均数c.中位数d.方差e.四分位数间距【答案】b几何均数(geometric mean)是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常适用于免疫学的指标。
卫生统计学题库
卫生统计学题库最佳选择题1.收集资料的方法是:EA.收集各种报表B.收集各种工作记录C.进行专题调查D.进行科学实验E.以上都对2.统计工作的基本步骤是:DA.调查资料、审核资料、整理资料B.收集资料、审核资料、分析资料C.调查资料、整理资料、分析资料D.收集资料、整理资料、分析资料E.以上都对3.在抽样研究中样本是:DA.总体中的一部分B.总体中任意一部分C.总体中典型部分D.总体中有代表性的一部分E.总体中有意义的一部分4.计量资料、计数资料和等级资料的关系是:CA.计量资料兼有计数资料和等级资料的一些性质B.计数资料兼有计量资料和等级资料的一些性质C.等级资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.以上都不是5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D:A.普通线图B.直方图C.构成比直条图D.半对数线图E.直条图6.直方图可用于:A.某现象的内部构成B.各现象的比较C.某现象的比较D.某现象的频数分布E.某现象的发展速度7.统计图表的要求是:A.简单明了B.层次清楚C.说明问题明确D.避免臃肿复杂E.以上都对8.在列频数表时,分组数目一般为:A.5-10B.8-15C.10-30D.15-20E.>20 9.平均数作为一种统计指标是用来分析:A.计数资料B.计量资料C.等级分组资料D.调查资料E.以上都不对10.表示变量值变异情况的常用指标是:A.全距B.标准差C.方差D.变异系数E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是:A.从未患过病的人B.健康达到了要求的人C.排除影响被研究指标的疾病和因素的人D.只患过小病但不影响研究指标的人E.排除了患过某病或接触过某因素的人 12.标准误:A.与标准差呈反比B.与标准差呈正比C.与标准差的平方呈反比D.与标准差平方呈正比E.以上都不对13.是指:A.所有观察值对总体均数的离散程度B.某一个样本均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度E.所有含量相同的样本均数对总体均数的离散程度14.表示:A.95%的正常值范围B.95%的可信区间C.99%的正常值范围D.99%的可信区间E.以上都不对 15.构成比通常以下列哪项指标为比例基数:A.100%B.1000‰C.10000/万D.100000/10万E.视具体情况而定 16.一事物各构成比部分相对数之和应为:A.大于1B.小于1C.等于1D.不一定E.以上都不对17.正态曲线下,横轴上从–∞到的面积为( )xσ 2.58XX S ± 1.96μσ+A 、95%B 、45%C 、97.5%D 、47.5%E 、不能确定 18. 进行统计分析的资料必须是( )A 、完整、准确、及时的B 、随机取得的C 、满足条件齐同的D 、数量足够的E 、以上都对 19.指出下列变量中哪一个指标为统计量A.B. C.μ D.π E.β20.计算样本率的抽样误差适用公式为:E.以上都不对21.R ×C 表的检验的自由度为:A. B. C. D. E.22.实验设计的基本原则为A.齐同原则B.随机原则C.对照原则D.重复原则E.以上都是 23.在相关分析中:A.越接近1,散点图越集中 B.越接近0,散点图越集中C.,散点图越集中D.,散点图越集中E.以上全不对24.已知,则一定有:A. B. C. D. E.25.相关分析的主要内容包括:A.确定变量间的数量关系B.确定变量之间有无关系C.确定变量之间有无因果关系D.确定变量之间关系的密切程度E.以上都不是26.在配对法秩和检验中,共有8对数据,且差值中没出现0,,则:p σ(1)p p n-(1)(1)p p n --(1)nππ-(1)(1)n ππ--2χ1R -1C -1RC -(1)(1)R C --2R C ⨯-rr0r <0r >1r =1b =1a =,0Y X S =,Y X YS S =,Y X XS S =27T -=T +=A. -3B.9C.-9D.-27E.3027.配对比较的秩和检验的基本思想是:如果假设检验成立,则对样本来说:A.正秩和的绝对值大于负秩和的绝对值B.正秩和的绝对值小于负秩和的绝对值C.正秩和的绝对值与负秩和的绝对值不会相差很大D.正秩和的绝对值与负秩和的绝对值相等E.正秩和的绝对值与负秩和的绝对值相差很大28.在成组设计两样本比较的秩和检验中,甲组中最小数据有2个(0.2,0.2),乙组中最小数据也有2个(0.2,0.2),则数据0.2 的秩次为:A.2B.3C.4.5D.2.5E.3.529.当第二类错误β由0.2变到0.3时,则第一类错误α是:A.增大B.减小C.不确定D.不变化E.以上都不对30.下列指标除了哪项均为疾病统计指标:A.治愈率B.某病病死率C.某病死亡专率D.感染率E.发病率31.计算某抗体滴度的平均水平,一般宜选择()A、算术均数B、几何均数C、中位数D、百分位数E、极差32.统计推断的内容()A、是用样本指标估计相应的总体指标B、是检验统计上的“假设”C、估计正常值范围D、A、B均不是E、A、B均是33.比较身高与体重的变异程度宜用的指标是()A、标准差B、标准误C、四分位间距D、变异系数E、全距34.观察值 2、 5、 10、 7、 9、 8、 20、 100的平均数是()A、20.14B、6.15C、8.5D、 20E、1035.当n一定时,第二类错误β由0.2变到0.3时,第一类错误()A 、增大B 、减小C 、不确定D 、不变化E 、以上都不对 36.两小样本计量资料比较的假设检验,应首先考虑( )A 、用检验B 、用检验C 、用秩和检验D 、资料符合检验还是秩和检验的条件E 、任选一种检验方法37.抽样误差指的是( )A 、个体值与总体值之差B 、样本统计量之间及样本统计量与总体参数值之差C 、个体值与统计量值之差D 、总体参数值与总体参数值之差E 、以上都不对 38.同一双变量资料进行直线相关与回归分析,有( ) A 、 B 、 C 、 D 、E 、与的符号无关39.用均数和标准差可全面描述下列哪项资料的特征( ) A 、正偏态分布 B 、负偏态分布 C 、正态分布 D 、非对称分布40.四个样本率作比较,,可认为( )各总体率不等或不全相等 B 、各总体率均不相等 C 、各样本率均不相等 D 、各样本率不等或不全相等 E 、各总体率相等 二、填空题1、统计工作的基本步骤是( )、( )、( )。
卫生统计学试题(含答案)
医学统计方法选择题一:医学统计方法概述l.统计中所说的总体是指:AA根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体2.概率P=0,则表示BA某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 DA分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样4.测量身高、体重等指标的原始资料叫:BA计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 1该资料的类型是:DA计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的CA有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:CA统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 CA收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BA抽样误差B系统误差C随机误差D责任事故E以上都不对10.以下何者不是实验设计应遵循的原则DA对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 BA算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择CA XB GC MD SE CV13.各观察值均加(或减)同一数后:BA均数不变,标准差改变B均数改变,标准差不变C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),问该食物中毒的平均潜伏期为多少小时?CA 5B 5.5C 6D lOE 1215.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:DA全距B标准差C方差D变异系数E极差16.下列哪个公式可用于估计医学95%正常值范围 AA X±1.96SB X±1.96SXC μ±1.96SXD μ±t0.05,υSXE X±2.58S 17.标准差越大的意义,下列认识中错误的是BA观察个体之间变异越大B观察个体之间变异越小C样本的抽样误差可能越大D样本对总体的代表性可能越差E以上均不对18.正态分布是以 EA t值为中心的频数分布B 参数为中心的频数分布C 变量为中心的频数分布D 观察例数为中心的频数分布E均数为中心的频数分布19.确定正常人的某项指标的正常范围时,调查对象是BA从未患过病的人B排除影响研究指标的疾病和因素的人C只患过轻微疾病,但不影响被研究指标的人D排除了患过某病或接触过某因素的人E以上都不是20.均数与标准差之间的关系是EA标准差越大,均数代表性越大B标准差越小,均数代表性越小C均数越大,标准差越小D均数越大,标准差越大E标准差越小,均数代表性越大第九章数值变量资料的统计推断21.从一个总体中抽取样本,产生抽样误差的原因是AA总体中个体之间存在变异B抽样未遵循随机化原则C被抽取的个体不同质D组成样本的个体较少E分组不合理22.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
统计实习指导-(1)
数值变量资料的统计描述一、 目 的 要 求1. 掌握数值变量数据描述性指标的计算与其适用条件.2. 熟悉95%医学参考值X 围的计算,牢记正态曲线下面积的分布规律.二、 内 容1. 选择题 〔1〕-x 是表示变量值的指标.A.平均水平B.变化X 围C.频数分布D.相互间差别大小 〔2〕利用频数分布表与公式)2(∑-+=L f nf i L M 计算中位数时. A.要求组距相等 B.不要求组距相等C.要求数据分布对称D.要求数据呈对数正态分布 〔3〕-x 与s 中. A.-x 可能是负数,s 不可能 B.s 可能是负数,-x 不可能 C.两者都不可能 D.两者都可能 〔4〕变异系数的数值.A.一定大于1B.一定小于1C.可大于1,也可小于1D.一定比s 小 〔5〕若一组数据呈正态分布,其中小于-x +1.96s 的变量值有.A.5%B.95%C.97.5%D.92.5% 〔6〕正态分布曲线下〔σμ645.1±〕区间的面积占总面积的.A.95%B.90%C.97.5%D.99% 2.计算题〔1〕某大学校医1995年随机调查了该校101名一年级男大学生的身高〔cm 〕,结果如下: 170.7 174.1 166.7 179.7 171.0 168.0 177.3 174.5 174.1 173.3 169.0 173.5 173.1 177.5 180.0 173.2 173.1 172.4 173.6 175.3 181.5 170.8 176.4 171.0 171.8 180.7 170.7 173.8 164.9 170.0 177.7 171.4 163.5 178.8 174.9 178.3 174.1 174.3 171.4 173.2 173.7 173.4 174.2 172.9 176.9 168.3 175.1 172.1 166.8 172.8 168.8 172.5 172.8 175.2 170.9 168.6 167.6 169.1 168.8 172.0 168.2 172.8 169.1 173.6 169.6 172.8 175.7 178.8 170.1 175.5 171.7 168.6 171.2 170.1 170.7 173.6 167.2 170.8 174.8 171.8 174.9 168.5 178.7 177.3 165.9 174.2 170.2 169.5 172.1 178.1 171.2 176.0 169.8 177.9 171.6 179.4 183.8 168.3 175.6 175.9 182.2A . 编制频数表,简述其分布特征.B . 计算其描述性指标.C . 计算其95%医学参考值X 围. 〔2〕某地10人接种某疫苗后,其抗体滴度如下,1׃2 1׃2 1׃4 1׃4 1׃4 1׃8 1׃8 1׃8 1׃161׃32,请计算其描述性指标.〔3〕今有94名电光性眼炎患者,其发病距接触电焊时间〔潜伏期,小时〕如下,请计算其描述性指标.潜伏期〔小时〕0~ 2~ 4~ 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 发 病 数 8 10 21 19 22 6 4 0 1 0 0 1 2分类变量资料的统计描述一、 目的要求1. 明确医学上常用的几种相对指标的意义和应用X 围2.懂得运用率的标准化法可消除两组资料内部结构不同的影响,以利客观分析.二、内容〔一〕复习思考题选择题1.发病率和患病率中.〔1〕两者都不会超过100% 〔2〕两者都会超过100%〔3〕发病率不会超过100% ,患病率会〔4〕患病率不会超过100%,发病率会2.两个县的结核病死亡率作比较时作率的标化可以 .〔1〕消除两组总人数不同的影响〔2〕消除各年龄组死亡率不同的影响〔3〕消除两组人口年龄构成不同的影响〔4〕消除两组比较时的抽样误差3.两地某病发病率比较时.〔1〕要考虑性别构成的影响,不必考虑年龄构成影响〔2〕要考虑年龄构成的影响,不必考虑性别构成影响〔3〕不必考虑性别、年龄构成影响〔4〕要同时考虑性别、年龄构成影响4.某日门诊各科疾病分类统计资料,可作为.〔1〕计算死亡率的的基础〔2〕计算发病率的基础〔3〕计算构成比的基础〔4〕计算病死率的基础5.标准化后的总死亡率〔1〕仅仅作为比较的基础,它反映了一种相对水平〔2〕它反映了实际水平〔3〕它不随标准的选择变化而变化〔4〕它反映了事物实际发生的强度是非题:1.比较两地胃癌死亡率,如果两地粗的胃癌死亡率一样,就不必标化.〔〕2.同一地方30年来肺癌死亡率比较,要研究是否肺癌致病因子在增强,应该用同一标准人口对30年来的肺癌死亡率分别作标化.〔〕3.某地1956年婴儿死亡人数中死于肺炎者占总数的16%,1976年则占18%,故可认为20年来该地对婴儿肺炎防治效果不明显.〔〕4.小学生交通事故发生次数为中学生的两倍,这是小学生不遵守交通规则所致.〔〕5.若两地人口的性别、年龄构成差别大,即使某病发病率与性别、年龄无关,比较两地该病总发病率时,也应考虑标准化问题.〔〕6.计算率的平均值的方法是:将各率直接相加求平均值.〔〕7.某年龄组占全部死亡比例,1980年为11.2%,1983年为16.8%,故此年龄组的死亡危险增加.〔〕8.比较两地同性别婴儿死亡率时〔诊断指标一致〕,不需要标准化,可直接比较.〔〕〔二〕习题1.某地某年肿瘤普查资料整理如下表,据表资料〔1〕填充〔2〕分析讨论哪个年龄组患肿瘤率最高?哪个年龄组病人最多?某地某年肿瘤普查资料年龄〔岁〕人口数肿瘤患者数构成比〔%〕患病率0~ 633000 19 〔〕〔〕30~ 570000 171 〔〕〔〕40~ 374000 486 〔〕〔〕50~ 143000 574 〔〕〔〕60~ 30250 242 〔〕〔〕合计175**** **** 〔〕〔〕2.今有两个煤矿的工人尘肺患病率资料如下,试用直接法计算标化率后作比较.工龄〔年〕甲矿乙矿检查人数尘肺人数患病率〔%〕检查人数尘肺人数患病率〔%〕6以下14029 120 0.86 992 2 0.206~9 4285 168 3.92 1905 8 0.4210与以上2542 316 12.43 1014 117 11.54合计20856 604 2.90 3911 127 3.25如果仅知下述资料,有该如何作标化.工龄〔年〕标准尘肺患病率〔%〕甲矿人数乙矿人数6以下0.81 14029 9926~9 2.84 4285 1905 10与以上12.18 2542 1014 合计 2.95 20856 3911甲矿尘肺总人数604,乙矿尘肺总人数127〔三〕讨论题1.据下述资料,"锑剂短程疗法血吸虫病病例的临床分析〞一文认为"其中11~20岁死亡率最高,其次为21~30岁组〞,对否?锑剂治疗后死亡者年龄分布性别≤10岁11~20 21~30 31~40 41~50 51~60 合计男 3 11 4 5 1 5 29女 3 7 6 3 2 1 22合计 6 18 10 8 3 6 512.某地某年肿瘤死亡资料如下表,就表中资料而言,各年龄组间比较,下述说法中,哪些是对的?〔1〕40、50岁的人最容易死于肿瘤.〔2〕40、50岁的人最容易死于肿瘤,60岁次之.〔3〕40、50岁的人最容易死于肿瘤,20岁~40岁之间次之.〔4〕因肿瘤而死亡者40、50岁的最多.年龄人口数死亡总数其中肿瘤死亡数肿瘤死亡〔%〕总死亡0 82920 138 4 2.920 46639 63 12 19.040 28161 172 42 24.460 9370 342 32 9.4合计167090 715 90 12.6 3.现有两年疟疾发病情况资料如下:病种1955年1956年发病人数% 发病人数% 恶性疟68 70 21 42 间日疟12 12 12 24 三日疟17 18 17 34合计97 100 50 100 据上述数据能否说:〔1〕1956年和1955年相比,恶性疟发病少了,间日疟、三日疟发病多了. 〔2〕1956年和1955年相比,恶性疟发病少了,其余不变.统计研究的基本步骤与图表制备一、目的要求1. 正确理解统计研究的三个基本步骤——搜集资料、整理资料、分析资料——和她们之间的关系.2. 学会拟制调查表,整理表和统计表的基本原则和方法.3. 重点学会如何对原始资料进行整理,并正确绘制图表.二、内容、步骤1. 按下题要求自制调查卡一份 某医师想观察胎盘娩出方式与人工流产史的关系,须要统计项目是人工流产史〔流产胎次〕和胎盘娩出方式〔包括自娩、人工剥离和子宫切除〕,请你帮他拟制调查卡片,以便调查登记. 2. 对以下资料绘制适当统计图. 〔1〕某年某地儿童近视情况:年龄 8 9 10 11 12 13 14 15 人数 100 150 120 110 120 130 100 120 近视人数 20 32 28 25 30 38 40 58 〔2〕某年某地某病按月发病人数月份 1 2 3 4 5 6 7 8 9 10 11 12 发病人数 981426 3243454540181210〔3〕两种气管炎病人疗效比较分组 临床治愈 显效 好转 无效 单纯型 60 98 51 12 喘息型238365111995年某地几种传染病的病死率4. 根据下面资料绘成的图是否恰当,如不当,请改制.某年某地3~4岁儿童急性传染病构成5. 将下表资料中两种传染病死亡率的历年变动分别绘制普通线图与半对数线图,并说明两种图示法的不同意义.1949~1957年某市15岁以下儿童结核病和白喉的死亡率〔1/10万〕 年份 结核病死亡率 白喉死亡率 1949 150.2 20.1 1950 148.0 16.6 1951 141.0 14.0 1952130.011.8白喉 10.9 流行性乙型脑炎 18.0 流行性脑脊髓膜炎 11.0 伤寒与副伤寒 2.7 痢疾 1.2 病类 病例数 %猩红热 2920 36.5麻疹 2640 33.0 百日咳 1450 18.0 白喉 530 6.6 痢疾 470 5.9 合计 8010100.01953 110.4 10.7 1954 98.2 6.5 1955 72.6 3.9 1956 68.0 2.4 1957 54.8 1.3数值变量资料的统计推断一、目的要求1. 通过习题练习掌握假设检验的基本步骤 2. 掌握t 检验和u 检验的计算与应用条件 3. 熟悉标准差与标准误在应用上的不同.二、内容1. 选择题(1) 对于正态分布资料,可用_____估计95%的正常值X 围. A. s x 96.1± B. s x 58.2± C. x v s t x )(05.0± D. s t x v )(05.0±〔2〕总体均数的95%可信限可用______表示.A .σμ96.1± B. x σμ96.1± C. x v s t x )(05.0± D. s x 96.1±〔3〕在同一正态总体中以固定n 随机抽样时,理论上有99%的样本均数在____X 围内. A. X s x 58.2± B. X s x 96.1± C. x σμ96.1± D. X σμ58.2± 〔4〕X σ表示_____.A 总体均数标准误B 总体均数离散程度C 变量值X 的可靠程度D 样本均数标准差〔5〕两组数据作均数差别的t 检验时,不仅要求数据来自正态分布总体,而且要求_____. A 两组数据均数相近,方差齐 B 两组数据方差齐C 两组数据均数相近D 两组数据的σ已知 〔6〕进行两样本均数差别的u 检验时,要求______.A 两样本含量要足够大B 两样本必须来自正态分布总体C 两样本所属总体的方差必须相等D 两组数据均数相近 2. 计算题(1) 随机抽样调查##市区男婴出生体重如下:X :2.0~ 2.2~ 2.4~ 2.6~ 2.8~ 3.0~ 3.2~ 3.4~ 3.6~ 3.8~ 4.0~ 4.2~ 4.4~ 4.6 f : 1 2 5 10 12 24 23 22 17 7 3 2 1 问:A.理论上99%的男婴出生体重在什么X 围?B.估计全市男婴出生体重均数在什么X 围?C.某男婴出生体重为4.51kg,如何评价?D.在郊区抽查100例男婴的出生体重,其均数为3.23<kg>,标准差为0.47<kg>,问市区和郊区男婴出生体重均数是否不同?E.以往##市区男婴平均出生体重为3kg,现在出生的男婴是否比以往的更重些?F.若在这些男婴中随机抽样,根据正态分布原理,抽到出生体重为)(15.2kg ≤的男婴的可能性是多少?G.在这些男婴中随机抽查10人,抽到出生体重均数为)(2.3kg ≤的样本的可能性是多少? 〔2〕 将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后〔治后1个月〕的血沉〔mm/h 〕如下表,试问甲、乙两药是否均有效?甲乙两药的疗效有无差别?甲、乙两药治疗前后的血沉〔mm/h 〕甲药 病人号1234567 8 9 10 治疗前 10 13 6 11 10 78 8 5 9 治疗后 6 9 3 10 10 42 53 3 乙药 病人号1 2 3 4 5 6 7 8 9 10 治疗前9 10 9 138 6 10 11 10 10治疗后6353358274〔3〕 某医生测得20例慢性支气管炎患者〔1X 〕与18例健康人〔2X 〕的尿17酮类固醇排出量〔mg/dl 〕如下,试比较两组的均数有无不同?1X :3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.165.555.94 4.40 5.35 3.80 4.12 4.10 4.202X :4.12 7.89 3.40 6.36 3.48 6.74 4.67 7.38 4.95 4.20 5.34 4.276.544.625.92 5.18 5.30 5.40分类变量资料的统计推断一、目的要求1. 掌握率的标准误与可信区间估计方法.2. 掌握u 检验、2χ检验各种公式的用途和适用条件.二、内容(一) 选择题1. 四格表中四个格子基本数字是___C__.A. 两个样本率的分子和分母B. 两个构成比的分子和分母C. 两对实测阳性绝对数和阴性绝对数D. 两对实测数和理论数2. 四个百分比率作比较,有1个理论数小于5,大于1,其它都大于5__A__. A. 只能作校正2χ检验 B. 不能作校正2χ检验 C. 作2χ检验不必校正 D. 必须先作合理的合并 3. 四格表如有一个实际数为0,___A__.A. 就不能作2χ检验 B. 就必须用校正2χ检验 C. 还不能决定是否可作2χ检验 D. 肯定可作2χ检验4. 两个样本的构成比〔实际的数字分别为25/80和60/75〕作差别的假设检验〔有可比性〕__A___.A. 可作2χ检验 B. 不可作2χ检验C. 看不出能否作2χ检验D. 只能作2χ检验5. 某医师用A 药治疗9例病人,治愈7人;用B 药治疗10例病人,治愈1人,比较两药疗效时,可选用的最恰当方法是__D__.A. 2χ检验 B. u 检验 C. 校正2χ检验 D. 直接计算概率法 6. 正态近似法估计率的95%可信区间用___B__.A. s p 96.1±B. σ96.1±pC. p p σ58.2±D. p s p 96.1± 〔二〕是非题1. 三个医院的门诊疾病构成作比较不可作2χ检验. 〔 × 〕2. 用甲乙两药治疗某病,甲组400人,乙组4人,治愈数分别为40人和0人,要研究两药疗效差别,不可作2χ检验. 〔 √ 〕3.四格表资料作2χ检验,四个格子里都不可以是百分率. 〔 × 〕 4. 有理论数小于1时,三行四列的表也不能直接作2χ检验. 〔 √ 〕5. 五个百分率的差别作假设检验,2)(05.02v χχ>,可认为总体率各不相同.〔 × 〕 6. 欲比较两种疗法对某病的疗效,共观察了300名患者,疗效分为痊愈、好转、未愈、死亡四级.要判断两种治疗方法的优劣,可用2χ检验.〔 × 〕7. 2χ值的取值X 围是02≥χ. 〔 × 〕 8. 2χ值和t 值一样,随着ν增加而增加. 〔 √ 〕 9. 在2χ值表中,当ν一定时,2χ值越大,P 值越小. 〔 √ 〕10. C R ⨯表的2χ检验中,P<0.05,说明被比较的n 个〔n>3〕样本率之间,至少某两个样本率间差别有显著性. 〔 √ 〕 〔三〕计算题药物 治疗人数 有效人数 槟榔煎剂 27 22 阿的平 18 12 合计4534药物 例数 阴转例数 阴转率〔%〕复方敌百虫片 37 28 75.7 纯敌百虫片381847.4灭虫片 34 10 29.43.为研究两种方法细菌培养效果是否相同,分别用两种方法对110份乳品作细菌培养,结果如下,请作统计分析.乳胶凝聚常规培养合计+-- + 27 1 28 -- 8 74 82 合计3575110 4.用两种不同剂量的电离辐射照射小白鼠,第一种剂量照射25只,在照射后14天内死亡14只;第二种剂量照射18只,同时期内死亡5只.问这两种剂量对小白鼠的致死作用是否相同?5.某医师欲研究重点高中近视发生率,调查了400名中学生,近视人数为98人,试估计重点高中学生近视发生率的可信区间;若大量调查普通高中近视发生率为18%,问重点高中与普通高中近视发生率有无不同.6.某研究者研究文化活动与老年人生活满意率的关系,调查了经常参加文化活动的老年人306人,对生活满意者有219人,不经常参加文化活动者246人,对生活满意者有159人,问经常参加文化活动与否的生活满意率有无不同.相关回归分析一、 目 的 要 求1. 掌握直线相关与回归分析的意义与用途.2. 熟悉直线相关与回归的统计分析方法与对结论的评价.二、 复习思考题[是非题] 1. 回归系数越大,两变量关系越密切.〔 〕 2. 样本回归系数b<0,且有显著意义,可认为两变量呈负相关. 〔 〕 3. 同一样本的b 和r 的假设检验结果相同. 〔 〕 4. R=0.8,就可以认为两变量相关非常密切.〔 〕 5. 建立回归方程Y=a+bX,且b 有显著意义,就可认为X 和Y 间存在因果关系. 〔 〕 6. 相关系数的假设检验P 值愈小,则说明两变量X 与Y 间的关系愈密切. 〔 〕 7. 当相关系数为0.78,而P>0.05时,表示两变量X 与Y 相关密切. 〔 〕 8. 有一资料作相关分析,t 检验结果为t r =4.24,若作回归分析,t b ≥4.24.〔 〕 9. 根据样本算得一相关系数r,经t 检验,P<0.01,说明r 来自高度相关的相关总体. 〔 〕 10.S y, x 为各观察值Y 距回归直线的标准差.如果变量X 与Y 的相关系数r=1,则必定S y, x =0. 〔 〕[选择题]1.两组资料中,回归系数b 较大的一组.A.则r 也较大B. 则r 也较小C.两变量关系较密切D. r 可能大也可能小2.同一资料,如将X 作自变量,Y 作因变量,得回归系数b ;将Y 作自变量,X 作因变量,得回归系数b ’,则相关系数r 为. A.'bb B.2'b b + C.'b b + D.'bb 3.若r 1>r 0.01<n 1’>, r 2>r 0.05<n 2’>则可认为.A.第一组资料中两变量相关较密切B.第二组资料中两变量相关较密切C.很难说那一组资料中两变量相关较密切D.至少可以说两组资料中两变量相关密切程度不一样 4.下列哪一式可出现负值A.()∑-2ˆX X B.()n Y Y /22∑∑-C. ()∑-2ˆY Y D.()()∑--Y Y X X ˆˆ 5.X Y27ˆ+=是1~7岁儿童以年龄〔岁〕估计体重〔kg 〕的回归方程,若体重以市斤为单位,则此方程:A.截距改变B.回归系数改变C.两者都改变D.两者都不改变三、习 题某监测站拟用极谱法替代碘量法来测定水中溶解氧含量.今对13个水样同时用两种方法测定,结果如下,求相关系数与回归方程式.极谱法〔A μ值〕碘量法〔溶解氧〕5.3 5.84 5.3 5.85 5.2 5.80 2.1 0.33 3.0 1.96 3.3 2.27 2.8 1.58 3.4 2.32 2.3 0.766.87.79 6.3 7.56 6.5 7.98 4.85.00非参数统计一、 目 的 要 求熟悉常用的秩和检验和Ridit 分析的计算与应用条件.二、 内 容1. 对9个水样分别用重量法与硬度联合测定的EDTA 法,测得硫酸盐含量如下表,试比较两种方法测定结果的有无差别.两种方法测定水中硫酸盐的含量〔10-3g/L 〕比较水样号 EDTA 法 重量法 1 115.3 115.3 2 355.3 354.0 3 336.2 337.5 4 215.2 222.3 5159.5 156.46 57.6 56.67 59.6 58.78 653.2 658.69 1786.7 1792.62.使用二巯基丙磺酸钠与二巯基丁二酸钠作驱汞效果比较,今分别测定两药驱汞与自然排汞的比值结果见下表,试问两药的驱汞效果何者为优.两种药物的驱汞效果比较丙磺酸钠丁二酸钠0.93 0.933.34 1.194.82 2.465.22 2.606.11 2.626.11 2.756.34 3.506.80 3.837.28 3.848.54 8.5012.5914.193.某毒物中毒后68天大白鼠肾组织游离CN-1含量见下表,试问四组大白鼠肾组织游离CN-1含量有无差别.四组大白鼠肾组织游离CN-1含量〔10-8g/g〕对照组小剂量中剂量大剂量34.1 24.6 44.4 31.731.7 24.6 28.1 66.711.5 21.1 22.7 26.726.1 22.4 14.8 23.84.对某病一般用常规疗法进行治疗,有效率达80%,今用某新疗法治疗同样情况的病人,有效率为70%,从下表数字看,新疗法治愈率高于前者,但总有效率低于前者,问两疗法的疗效有无差别.常规疗法与新疗法疗效疗效等级常规疗法新疗法治愈80 17显效280 25好转320 25无效170 28合计850 95医学统计学实习指导同济大学医学院预防医学教研室。
人群健康研究的统计学方法(四)考试答案和讲义
人群健康研究的统计学方法(四)1、率表示()A、某现象发生的频率或强度B、事物内部各组成部分所占的比重或分布情况C、两个有联系指标之比D、某事物内部各组成部分出现的频率2、以下关于率的抽样误差代表意义描述错误的是()A、率的抽样误差越小,说明率的标准误越小B、率的抽样误差越小,用样本推论总体时,可信程度越低C、率的抽样误差越小,用样本推论总体时,可信程度越高D、率的抽样误差越大,说明率的标准误越大3、相对比=A/B,说明()A、A为B的若干倍或百分之几B、A、B两个指标只可以为绝对数C、性质肯定相同D、肯定是定性资料4、以下关于应用相对数时的描述正确的是()A、分析时可以以构成比代替率B、观察单位数不等的几个率的平均率,不能将这几个率直接相加求其均值C、所比较资料的内部构成不一定相同D、样本率或构成比的比较不必进行假设检验5、()在表的左侧,表明被研究事物的主要特征,相当于句子的主语A、备注B、标题C、纵标目D、横标目人群健康研究的统计学方法(四)北京大学公共卫生学院刘爱萍一、分类变量资料的统计分析(一)分类变量资料的统计描述1 .相对数常用的指标及其意义相对数主要涵盖:率、构成比和相对比。
率是表示某现象发生的频率或强度,常用百分率、千分率、万分率或十万分率等表示。
它的计算公式是:(实际发生某现象的观察单位数 / 可能发生该现象的观察单位总数)×比例基数。
构成比是说明事物内部各组成部分所占的比重或分布情况,用百分数表示。
构成比 = (事物内部某一组成部分的观察单位数 / 同一事物各组成部分的观察单位总数)× 100% 。
构成比的特点有 : 它的值在 0 和 1 之间变动。
当某一部分构成比发生变化时,其他部分的构成比也相应地发生变化。
相对比是指两个有联系指标之比( A/B ),常以百分数或者倍数表示。
它说明 A 是 B 的若干倍或百分之几,指标可以是绝对数,也可以是相对数,性质可以相同,也可以不同,可以是定性资料,也可以是定量资料。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
查表法
p1.96sp
总体率99%的可信区间为:
正态近似法
p2.58sp
p1.96sp
例 试估计例10-6中结核菌素试验阳性 率的95%和99%的置信区间。 已知阳性率0. 3847,标准误为0.0116
( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) , ( 0 .3 8 4 7 1 .9 6 0 .0 1 1 6 ) 0 .3 6 2 0 ~ 0 .4 0 7 4
pc(1
pc)(n11
1 n2
)
0.08540.1486
0.0046
0.1258(10.1258)82107 145185
查t界值表中υ为∝对应的界值得, P< 0.01,按α=0.05水准,拒绝H0,接受H1, 可认为该人群HBV感染率有性别差异。
第三节 x2 检 验
卡方检验(Chi-square test )主要用于分 类资料的统计分析,研究的变量是分类变量, 而观察值以频数表示。
P (X) n!
X(1)(nX)
X !(nX)!
• 例10-5 已知①π=0.3,n=5; ②π=0.3, n=10; ③π=0.3,n=15; ④ π=0.5,n=10 。求阳性事件的概率并作概率分布图。
P (0 ) 5 ! 0 .3 0(1 0 .3 )(5 0 ) 0 .1 6 8 1 0 !(5 0 )!
卫生学 10.分 类变量资料的
统计推断
内容
• 率的抽样分布 • 率的抽样误差与标准误 • 总体率的置信区间估计 • 两个率比较的U检验 • X2检验
要求
掌握: •U检验适用条件 •x2检验的用途、四格表资料(配对资料)的x2检验应 用条件 •行×列表资料的x2检验及其注意事项; 熟悉: •U检验计算方法 •x2检验计算方法 了解: •率的抽样分布、x2分布
P (1 ) 5 ! 0 .3 1(1 0 .3 )(5 1 )0 .3 6 0 2 1 !(5 1 )!
P(2)=0.3087 P(3)=0.1323 P(4)=0.0283 P(5)=0.0024
• 二项分布的形状取决于π和n的大小,高 峰在m=np处。当p接近0.5时,图形是对 称的;p离0.5愈远,对称性愈差,但随着 n的增大,分布趋于对称。当n→∞时, 只要p不太靠近0或1,特别是当nP和n(1 -P)都大于5时,二项分布近似于正态分 布。
该方法可用于推断两个及多个总体率(或构 成比)之间有无差别、分类资料的关联度分 析以及频数分布的拟合优度检验等。
一 、x2 检验的基本思想 (chi-square test for fourfold data)
四格表x2检验的基本结构
发生数
未发生数
合计
A组
a
b
a+b
B组
c
d
c+d
合计
a+c
b+d
n
问该院直肠癌患者围术期并发症发生率与一般情况 有无差异。
H0:π= π0 H1:π≠ π0 α=0.05
P=0.26
u p0
0.300.26
1.713
0(10) 0.3(10.3)
n
385
查t界值表中υ为∝对应的界值,得P> 0.05,按α=0.05水准,不拒绝H0,尚不 能认为该院认为该院直肠癌患者围术期 并发症发生率与一般情况不同
率的抽样分布特征:
1、为离散型分布 2、π为0.5时,呈对称分布 3、当n不断增大时,二项分布逐渐逼近正
态分布 • 当nP和n(1-P)都大于5时,二项分布近
似于正态分布。
二、率的抽样误差和总体率的估计
一、率的抽样误差和标准误(sampling error and standard error of rate)
无差H异0:。π1= π2 H1:π1≠ π2 α=0.05
本例:n1=8207,X1=701,P1=0.0854 n2=14585,X2=2167,P2=0.1486
p cX n 1 1 n X 228 7 2 0 0 1 7 1 2 4 1 5 6 8 7 50 .1 2 5 8
u
p1 p2
X2检验的基本思想
例10-9 某医生欲比较甲、乙两种药物对动脉 粥样硬化的疗效,甲药治疗71例,有 效52例,乙药治疗42例,有效39例。 问两种药物的有效率是否有差别?
一、率的抽样分布
• 在医学领域中,有一些随机事件是只具有两种 互斥结果的离散型随机事件,称为二项分类变 量(dichotomous variable),如对病人治疗结 果的有效与无效,某种化验结果的阳性与阴性 ,接触某传染源的感染与未感染等。二项分布 (binomial distribution)就是对这类只具有两 种互斥结果的离散型随机事件的规律性进行描 述的一种概率分布。
二、两样本率的比较
1、正态近似法
n足够大,p或1-p均不太小(np和n(1-p)均 大于5)。
up1p2
p1p2
Sp1p2
pc(1pc)(n11n12)
pc
X1 n1
X2 n2
例10-8
为了解某地小学生蛔虫感染率的城乡差异,抽样调查 了该地小学生,其中城镇小学生8207人,粪检蛔虫卵 阳性数701人,蛔虫感染率为8.54%,乡村小学生 14585人,粪检蛔虫卵阳性数2167人,蛔虫感染率为 14.86%,试比较该地小学生蛔虫感染率城乡之间有
( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) , ( 0 .3 8 4 7 2 .5 8 0 .0 1 1 6 ) 0 .3 5 4 8 ~ 0 .4 1 4 6
四、两率比较的u检验
一、样本率与总体率的比较
u p0 p0
p
0(10)
n
例10-7 一般情况下,直肠癌围术期并发症发生率 为30%,现某医院手术治疗了385例直肠癌患者, 围术期出现并发症有100例,并发症发生率为26%,
p
(1)
n
sp
p(1 p) n
例
结核菌素试验阳性率,检测1773人结核菌 属阳性者682人,阳性率为38.47%,试计算标准 误。
p (1 p ) 0 .3 8 4 7 (1 0 .3 8 4 7 )
sp
n
0 .0 1 1 6 1 7 7 3
适用于小样本资料
三、总体率的估ran和计t足( 分 间en)(够(n布 表1≤-大pe参5)s,0均pt数)i或,大mπ1于查a置-pt5均i二信)o不n项区太of小(np