第四章定性数据的统计描述
医学统计学第七版课后答案及解析知识分享
医学统计学第七版课后答案及解析医学统计学第七版课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12 [参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
定性数据的统计描述、正态分布以及应用(normaldistribution)
-2.58 -1.96 -1
0
1 1.96 2.58
标准正态分布
-1~1 -1.96~1.96 -2.58~2.58
面积或概率 68.27% 95.00% 99.00%
曲线下面积分布规律
68.27%
68.27%
95.00%
95.00%
-2.58 -1.96 -1
99.00%
0
1 1.96 2.58μ-2.58σ μ-1.96σ μ-σ
标准正态分布
标准正态分布 (standard normal distribution) 的两个参数为:μ=0,σ=1 记为 N(0,1)
一般正态分布为一个分布族:N(m,2) ;标准
正态分布只有一个 N(0,1) ;这样简化了应 用
u曲线下面积
0.5
f(X)
1 u X2
0.4
-∞
u0.3
(u)
五. 正态分布的应用
1.许多医学指标服从正态分布或近似 正态分布,如同性别、同年龄儿童的身 高,同性别健康成人的红细胞数、血红 蛋白量等,及实验中的误差。
2. 估计医学参考值范围 医学正常值范围
定义:又称参考值范围,是指特定健康人群的 解剖、生理、生化等各种数据的波动范围。习 惯上是确定包括95%的人的界值。
e 2dX
2
0.2
附表(标准正态分布
0.1
左侧曲线下面积)就
0.0
是根据此公式和图形
-4 -3 -2 -1 0 1 X
2
3
4
制定的
曲线下面积分布规律
查附表
68.27%
( 1 .9 6 ) P (u 1 .9 6 ) ?
95.00%
《医学统计学》第6版单项选择题
《医学统计学》单项选择题摘自:李康,贺佳主编.医学统计学.第6版.北京:人民卫生出版社,2013第一章绪论1. 医学统计学研究的对象是()A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 有变异的医学事物E.疾病的预防与治疗2. 用样本推论总体,具有代表性的样本通常指的是()A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是()A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是()A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由操作失误引起的误差5. 系统误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是()A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差8. 统计学中所谓的总体通常指的是()A. 自然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9. 医学统计学中所谓的样本通常指的是A. 可测量的生物样品B. 统计量C. 某一变量的测量值D. 数据中有代表性的一部分E.总体中有代表性的部分观察单位10. 医学研究中抽样误差的主要来源是()A. 测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. 生物个体的变异E.样本量不够答案:1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第二章定量数据的统计描述1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是()A. 中位数B. 几何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相比,其特点是()A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3. 将一组计量资料整理成频数表的主要目的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A. 均数B. 几何均数C. 中位数D. 百分位数E. 倒数的均数5. 变异系数主要用于()A. 比较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的大小6. 对于正态或近似正态分布的资料,描述其变异程度应选用的指标是()A. 变异系数B. 离均差平方和C. 极差D. 四分位数间距E. 标准差7.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用()A.全距B.标准差C.变异系数D.方差E.四分位数间距8. 一组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较小B. 数值离散度较大C. 数值分布偏向较大一侧D. 数值分布偏向较小一侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是()A. 均数与中位数相同B. 均数大于中位数C. 均数小于中位数D. 两者有一定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与方差相比,其主要特点是()A. 标准差小于方差B. 标准差大于方差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的面积为()A.50% B.95% C. 97.5% D.99% E.不能确定(与标准差的大小有关)2. 标准正态分布的形态参数和位置参数分别为()A.0,1 B. 1,0 C. µ,σ D. σ,µ E. S,X3. 正态分布的均数、中位数和几何均数之间的关系为()A. 均数与几何均数相等B. 均数与中位数相等C. 中位数与几何均数相等D. 均数、中位数、几何均数均不相等E. 均数、中位数、几何均数均相等4.正常成年男子的红细胞计数近似服从正态分布,已知X =4.78×1012/L ,S=0.38×1012/L ,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为( )A .高于4.78×1012/L 的成年男子占97.98%B .低于4.78×1012/L 的成年男子占97.98%C .高于4.00×1012/L 的成年男子占97.98%D .低于4.00×1012/L 的成年男子占97.98%E .在4.00×1012/L 至4.78×1012/L 的成年男子占97.98%5. 某项指标95%医学参考值范围表示的是( )A. 在此范围 “异常”的概率大于或等于95%B. 在此范围 “正常”的概率大于或等于95%C. 在“异常”总体中有95%的人在此范围之外D. 在“正常”总体中有95%的人在此范围E. 在人群中检测指标有5%的可能超出此范围6. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人7. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人8. 要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是( )A. 用均数来评价B. 用中位数来评价C. 用几何均数来评价D. 用变异系数来评价E. 用参考值范围来评价9.应用百分位数法估计参考值范围的条件是( )A .数据服从正态分布B .数据服从偏态分布C .有大样本数据D .数据服从对称分布E .数据变异不能太大10.某市1974年238名居民的发汞含量(µmol/kg )如下,则该地居民发汞值的95%医学参考值范围是( )发汞值(µmol/kg )15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 人数 20 66 60 48 18 16 6 1 0 3A .<P 95B .>P 5C .(P 2.5,P 97.5)D .S X 96.1±E .S X 96.1±答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A第四章定性数据的统计描述1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是()A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成比增加2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为()A. 乙肝易感人数B. 平均人口数C. 乙肝疫苗接种人数D. 乙肝患者人数E. 乙肝疫苗接种后的阳转人数3. 计算标准化死亡率的目的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较D. 消除各地区内部构成不同的影响E. 便于进行不同时间死亡率的比较4. 已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡女性居民多,而乙乡男性居多,适当的比较方法是()A. 两个率直接比较B. 两个率间接比较C. 直接对感染人数进行比较D. 计算标准化率比较E. 不具备可比性5. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其原因最有可能是()A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的人口健康水平高D. 甲县的老年人口在总人口中所占比例更小E. 甲县的老年人口在总人口中所占比例更大6. 相对危险度RR的计算方法是()A. 两个标准化率之比B. 两种不同疾病的发病人数之比C. 两种不同疾病患病率之比D. 两种不同疾病的发病率之比E. 两种不同条件下某疾病发生的概率之比7. 比数比OR值表示的是()A. 两个标准化率的差别大小B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发生的危险性程度8. 计算患病率时的平均人口数的计算方法是()A. 年初人口数和年末人口数的平均值B. 全年年初的人口数C. 全年年末人口数D. 生活满一年的总人口数E. 生活至少在半年以上的总人口数9. 死因构成比反映的是()A. 各种疾病发生的严重程度B. 疾病发生的主要原因C. 疾病在人群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险大小10. 患病率与发病率的区别是()A. 患病率高于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作用是()A. 便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论文篇幅D. 容易进行统计描述和推断E. 代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是()A.线图B.直条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数线图B.线图C.直条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是()A. 复式条图B. 复式线图C. 散点图D. 直方图E. 箱式图5. 研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A. 直方图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适用于表示构成比关系的是()A. 直方图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7. 有些资料构成统计表时,下列哪一项可以省略()A. 标题B. 标目C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A. 圆图B. 百分条图C. 线图D. 半对数线图E. 直方图9.描述某现象频数分布情况可选择()A. 圆图B. 百分条图C. 箱式图D. 误差条图E. 直方图10.对比某种清热解毒药物和对照药物的疗效,其单项指标为口渴、身痛、头痛、咳嗽、流涕、鼻塞、咽痛和发热的有效率,应选用的统计图是()A. 圆图B. 百分条图C. 箱式图D. 复式条图E. 直方图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1. 样本均数的标准误越小说明()A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 要减少抽样误差,通常的做法是()A. 减少系统误差B. 将个体变异控制在一定范围内C. 减小标准差D. 控制偏倚E. 适当增加样本含量4. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为()A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%6. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是( )A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年人血清胆固醇均数的95%可信区间是( )A. 3.64±1.96×1.20B. 3.64±1.20C. 200/20.196.164.3×±D. 200/20.158.264.3×±E. 3.64±2.58×1.208. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为小概率9. 假设检验差别有统计学意义时,P 值越小,说明( )A. 样本均数差别越大B. 总体均数差别越大C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法( )A. 检验水准必须设为0.05B. 必须采用双侧检验C. 必须根据样本大小选择检验水准D. 必须建立无效假设E. 要说明无效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C 5. B 6. E 7. C 8. D 9. D 10. D第七章 t 检验1. 两样本均数之差的标准误反映的是( )A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度2. 两样本均数比较,检验结果05.0>P 说明( )A. 两总体均数的差别较小B. 两总体均数的差别较大C. 支持两总体无差别的结论D. 不支持两总体有差别的结论E. 可以确认两总体无差别3. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指( )A. 两样本均数的差别具有实际意义B. 两总体均数的差别具有实际意义C. 两样本和两总体均数的差别都具有实际意义D. 有理由认为两样本均数有差别E. 有理由认为两总体均数有差别4. 两样本均数比较,差别具有统计学意义时,P 值越小说明( )A. 两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是( )A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的无效假设错误E. 可能出现的备择假设错误6. 减少假设检验的Ⅱ类错误,应该使用的方法是( )A. 减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提高检验界值E. 增加样本含量7. 以下不能用配对检验方法的是( )A. 比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B. 比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C. 比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D. 比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E. 比较15名受试者针刺檀中穴前后的痛阈值8. 两独立样本均数 t 检验,其前提条件是( )A. 两总体均数相等B. 两总体均数不等C. 两总体方差相等D. 两总体方差不等E. 两总体均数和两总体方差都相等9. 若将配对设计的数据进行两独立样本均数 t 检验,容易出现的问题是( )A. 增加出现I 类错误的概率B. 增加出现II 类错误的概率C. 检验结果的P 值不准D. 方差齐性检验的结果不准E. 不满足t 检验的应用条件10.两组定量资料比较,当方差不齐时,应该使用的检验方法是( )A. 配对 t 检验B. Satterthwaite t ′ 检验C. 两独立样本均数t 检验D. 方差齐性检验E. z 检验答案 1. E 2. D 3. E 4. D 5. C 6. E 7. C 8. C 9. B 10. B第八章 方差分析1. 方差分析的基本思想是( )A .组间均方大于组内均方B .组内均方大于组间均方C .不同来源的方差必须相等D .两方差之比服从F 分布E .总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是方差齐性,它是指( )A. 各比较组相应的样本方差相等B. 各比较组相应的总体方差相等C. 组内方差=组间方差D. 总方差=各组方差之和E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是( )A. 随机测量误差大小B. 某因素效应大小C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t 检验的关系是( )A. t 检验结果更准确B. 方差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5.多组均数比较的方差分析,如果0.05P <,则应该进一步做的是( )A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK-q 检验E .确定单独效应6.完全随机设计的多个样本均数比较,经方差分析,如果0.05P <,则结论为( )A .各样本均数全相等B .各样本均数全不相等C .至少有两个样本均数不等D .至少有两个总体均数不等E .各总体均数全相等7.完全随机设计资料的多个样本均数的比较,若处理无作用,则方差分析的F 值在理论上应接近于( )A .()21,F νναB .误差处理SS SS / C. 0 D. 1 E. 任意值8.对于多个方差的齐性检验,若P < α,可认为( )A .多个样本方差全不相等B .多个总体方差全不相等C .多个样本方差不全相等D .多个总体方差不全相等E .多个总体方差相等9.析因设计的方差分析中,两因素X 与Y 具有交互作用指的是( )A .X 和Y 的主效应相互影响B .X 与Y 对观察指标的影响相差较大C .X 与Y 有叠加作用D .X 对观察指标的作用受Y 水平的影响E .X 与Y 的联合作用较大10.多组均数比较的方差分析,如果0.05P <,则应该进一步做的是( )A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK-q 检验E .确定单独效应答案: 1. E 2. B 3. C 4. E 5. D 6. D 7. D 8. D 9. D 10. C第八章 χ2 检验1. 两样本率比较,差别有统计学意义时,P 值越小说明( )A. 两样本率差别越大B. 两总体率差别越大C. 越有理由认为两样本率不同D. 越有理由认为两总体率不同E. 越有理由认为两样本率相同2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用的假设检验方法是( )A. 四格表χ2检验B. 校正四格表χ2检验C. Fisher 确切概率法D. 配对χ2检验E. 校正配对χ2检验3.进行四组样本率比较的χ2检验,如220.01,3χχ>,可认为( ) A. 四组样本率均不相同 B. 四组总体率均不相同C. 四组样本率相差较大D. 至少有两组样本率不相同E. 至少有两组总体率不相同4. 从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文220.01,1χχ>,乙文220.05,1χχ>,可认为( ) A. 两文结果有矛盾 B. 两文结果完全相同C. 甲文结果更为可信D. 乙文结果更为可信E. 甲文说明总体的差异较大5. 两组有效率比较的检验功效相关因素是()A. 检验水准和样本率B. 总体率差别和样本含量C. 样本含量和样本率D. 总体率差别和理论频数E. 容许误差和检验水准6. 通常分析四格表需用连续性校正χ2检验的情况是()A. T< 5B. T < 1或n < 40C. T< 5且n < 40D. 1≤T< 5且n > 40E. T< 5或n < 407. 当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是()A. 增大B. 减小C. 不变D. 不确定E. 随该格实际频数的增加而增减8. 对四种药物进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较,用Bonferroni方法校正后的检验水准应该是()A. 0.017B. 0.008C. 0.025D. 0.005E. 0.0139. 对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较(多个实验组与对照组比较),用Bonferroni方法校正后的检验水准应该是()A. 0.050B. 0.010C. 0.025D. 0.005E. 0.01710. 利用χ2检验公式不适合解决的实际问题是()A. 比较两种药物的有效率B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效D. 药物三种不同剂量显效率有无差别E. 两组病情“轻、中、重”的构成比例答案: 1. D 2. C 3. E 4. C 5. B 6. D 7. C 8. B 9. E 10. C第九章非参数检验1.对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是()A. 适用范围广B. 检验效能高C.检验结果更准确 D. 充分利用资料信息E. 不易出现假阴性错误2. 对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是()A. 增加Ⅰ类错误B. 增加Ⅱ类错误C. 减少Ⅰ类错误D. 减少Ⅱ类错误E. 两类错误都增加3. 两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A. 两总体的差别越大B. 两总体的差别越小C. 两样本的差别可能越大D. 越有理由说明两总体有差别E. 越有理由说明两总体无差别4. 多个计量资料的比较,当分布类型未知时,应选择的统计方法是()A. 方差分析B.Wilcoxon T检验C. Kruskal-Wallis H检验D. u检验E. 列联表χ2检验5. 两组数据的秩和检验和t检验相比,其优点是()A. 计算简便B. 检验假设合理C. 检验效能高D. 抽样误差更小E. 对数据分布不做限制6. 两样本比较的秩和检验,其检验统计量T是()A. 例数较小的秩和B. 例数较大的秩和C. 较小的秩和D. 较大的秩和E. 任意一组数据的秩和7. 两样本比较的秩和检验,其无效假设是()A. 两样本有相同的秩和B. 两总体有相同的秩和C. 两样本分布相同D. 两总体分布相同E. 两总体分布的位置相同8. 两样本比较的Wilcoxon秩和检验结果为P值小于0.05,判断孰优孰劣的根据是()A. 比较两样本的秩和大小B. P值大小C. 检验统计量T值大小D. 两样本秩和的差别大小E. 比较两样本平均秩(Mean Rank)的大小9.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是×列联表χ2检验A. Wilcoxon秩和检验B. 24C. 四格表χ2检验D. Fisher确切概率法E. 计算标准化率10. 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次是( )A. 0.2B. 1.0C. 5.0D. 2.5E. 3.0答案 1. A 2. B 3. D 4. C 5. E 6. A 7. E 8. E 9. A 10. E第十章 线性相关与回归1. 两数值变量相关关系越强,对应的是( )A. 相关系数越大B. 相关系数的绝对值越大B. 回归系数越大C. 回归系数的绝对值越大E. 相关系数检验统计量的t 值越大2. 回归分析的决定系数2R 越接近于1,说明( )A. 相关系数越大B. 回归方程的显著程度越高C. 应变量的变异越大D. 应变量的变异越小E. 自变量对应变量的影响越大3. 对两变量X 和Y 作简单线性相关分析,要求的条件是( )A. X 和Y 服从双变量正态分布B. X 服从正态分布C. Y 服从正态分布D. X 和Y 有回归关系E. X 和Y 至少有一个服从正态分布4. 两组资料作回归分析,直线回归系数b 较大的一组,表示( )A .相关系数r 也较大较大B .假设检验的P 值较小C .决定系数R 2较大D .决定系数R 2较小E .Y 随X 变化其数量关系有更大的变化 5. 1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为ˆ144YX =+,若将体重换成国际单位kg ,则此方程( )A .常数项改变B .回归系数改变C .常数项和回归系数都改变D .常数项和回归系数都不改变E .决定系数改变6. 对同一资料进行线性回归与相关分析时,下列正确的情形是( )A .ρ=0时,r=0B .ρ>0时,r>0C .r>0时,b<0D .r<0时,b<0E .ρ<0时,r>07. 下列双变量中,适用于进行线性相关分析的是( )A .年龄与体重B .民族与血型C .体重与体表面积D .母亲文化水平与子女智商E .工龄与患病率8. 对同一资料进行线性回归与相关分析时,下列正确的情形是( )A .有密切的关系B .有一定的因果关系C .相关关系密切D .存在数量依存关系E .有较强的回归关系9. 作线性相关分析时,当n=12,r=0.767,查r 界值表823.010,2/001.0=r ,795.010,2/002.0=r ,750.010,2/005.0=r ,则P 值范围为( )A .0.001<P<0.002B .P<0.001C .P<0.002D .P>0.005E .0.002<P<0.00510. 通过线性回归分析(n =48),得决定系数R 2=0.49,则下列说法中错误的是( )A .两个变量具有回归关系B .一定有相关系数r=0.70或r= - 0.70C .假设检验的自由度ν=46D .回归平方和大于剩余平方和E .Y 的总变异有49%可以由X 的变化解释答案 1. B 2. E 3. A 4. E 5. C 6. D 7. C 8. D 9. E 10. D第十一章 多元线性回归1. 在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是( )A .节省样本B .提高分析效率C .克服共线影响D .减少异常值的影响E .减少混杂的影响2. 多元线性回归分析中,反映回归平方和在应变量Y 的总离均差平方和中所占比重的统计量是( )A. 简单相关系数 B .复相关系数C. 偏回归系数D. 回归均方E. 决定系数R 23. 对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是( )A .决定系数 B. 相关系数C. 偏回归平方和D. 校正决定系数E. 复相关系数4. 多元线性回归分析中,反映自变量对应变量作用大小的是( )A .决定系数 B. 标准化偏回归系数C. 偏回归平方和D. 校正决定系数E. 复相关系数。
医学统计学(第二版)思考与练习答案
【习题解析】
一、思考题
1.抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。
105.85
8.60
121.04
合计
5508(N)
5.11
264( )
4.86
286( )
男性HBsAg标准化阳性率:
女性HBsAg标准化阳性率:
可见,经标准化后女性HBsAg阳性率高于男性。
输出结果
注:将SPSS输出的sp1的和除以sp的和,得男性HBsAg标准化阳性率;sp2的和除以sp的和,得女性HBsAg标准化阳性率。
2.同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小,表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。
逐年
定基比
环比
定基比
环比
1998~
a0
160.5
—
—
—
—
—
—
1999~
a1
144.2
-16.3
-16.3
0.90
0.90
-0.10
-0.10
2000~
a2
130.0
-30.5
-14.2
0.81
医学统计学第二版高等教育出版社课后习题答案
医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明人口和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2021年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2021年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差一般是指测量值与实际值之间的差值,一般分为随机误差和非随机误差。
随机误差是指重复观测得到的实际观测值经常在某一值附近无方向波动的误差;最常见的非随机误差是系统误差,也称为偏差。
正是这种误差使实际观测值偏离了实际值。
3.举例说明参数和统计量的概念。
一项研究通常希望了解人口的一些数字特征,这些特征被称为参数,例如整个城市的高血压患病率。
根据样本计算的一些数字特征称为统计学,例如根据数百人的抽样调查数据计算的样本人群中的高血压。
统计是研究人员可以知道的,参数是他们想知道的。
一般来说,这些参数很难测量,只能通过样本进行估计。
显然,只有当样本代表总体时,根据样本统计估计的总体参数才是合理的。
4.简述小概率事件原理。
当一个事件的概率小于或等于0.05时,它被用来在统计学中称该事件为低概率事件,这意味着该事件的概率非常小,因此认为不可能在一次采样中发生是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查的主要特点是:① 研究对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为地给出干预措施;② 随机分组不能用来平衡混杂因素对调查结果的影响。
医学统计学:定性数据统计描述、统计图表
表1 某社区不同性别人群肺癌情况
性别
检查人 有病人 死亡人 死亡率 发病率
数
数
数
(%) (%)
男
1050
6
3
50.0
0.6
女
950
3
2
66.7
0.3
合计
2000
9
5
58.4 0.45
▪ 请讨论: ▪ 1)该医生所选择的统计指标正确吗? ▪ 2)该医生对指标的计算方法恰当吗? ▪ 3)应该如何作适当的统计分析?
25.73
(1.35)
172
42
(24.42)
(149.14) (6.11)
(342)
32
(9.36)
(341.48) (36.50)
715
90
12.59
(53.86)
(4.28)
▪ 根据最后三栏结果作简要分析。
▪ 由第⑸栏:40~岁组恶性肿瘤死亡占总死亡比重最高,近1/4; 20~岁组次之,占19.05%;60~岁组恶性肿瘤死亡人数虽多, 但仅占总死亡的9.36%;0~岁组恶性肿瘤死亡占总死亡比重 最低,仅占2.90%。
3.常用统计图的适用资料及实施方法
图 形 适用资料
实施方法
直条图 组间数量对比 用直条高度表示数量大小
直方图
百分条 图
饼图
线图
散点图
箱式图
定量资料的分 布 构成比
构成比
定量资料演变 水平 双变量间的关 联 定量资料取值 范围
用直条的面积表示各组段的频数或频率
用直条分段的长度表示全体中各部分的构 成比 用圆饼的扇形面积表示全体中各部分的构 成比 线条位于横、纵坐标均为算术尺度的坐标 系 点的密集程度和形成的趋势,表示两现象 间的相关关系 用箱体、线条标志四分位数间距及中位数、 全距的位置
2023年专升本考试大纲 《预防医学》考试要求
《预防医学》考试要求I、考试性质为挑选专科生中优秀的学生进入普通高等学校专升本学生,特举办此考试。
该考试所包含的内容将大致稳定,试题形式多种,具有对学生把握课程的较强识别、区分能力。
II、考试内容及要求第一篇流行病学第一章绪论掌握流行病学定义及流行病学定义的诠释,流行病学的应用。
熟悉流行病学的原理。
了解流行病学发展史,流行病学的特点,流行病学与其他学科的关系,流行病学的展望。
第二章疾病的分布掌握疾病分布的概念。
熟悉疾病频率测量指标,描述疾病流行强度的常用术语。
了解疾病人群分布、地区分布和时间分布的特征与变化规律。
第三章描述性研究掌握描述性研究的概念、种类、用途;现况研究的概念及特点;普查、抽样调查的概念、用途。
熟悉生态学研究、个案调查、病例报告、病例分析的概念、用途;现况调查实施步骤、数据分析、常见偏倚及控制方法。
了解调查表的编制;生态学研究的方法和局限性。
第四章队列研究掌握队列研究的定义、基本原理和方法,队列研究的设计与资料整理分析,包括累计发病率、发病密度、相对危险度、归因危险度及人群归因危险度等指标的计算方法及其流行病学意义。
熟悉队列研究的特点、研究类型;队列研究的偏倚及其控制方法;队列研究的优缺点。
了解队列研究的实施步骤、样本大小的估计、随访方法、人年的计算、率的显著性检验。
第五章病例对照研究掌握病例对照研究的基本原理;匹配的原理和方法;病例与对照的来源与选择;资料整理和数据分析的基本方法;OR的含义及其在病例对照研究中的意义;。
熟悉病例对照研究的一般步骤;分层分析的概念及应用,病例对照研究中常见的偏倚及其控制方法;病例对照研究的优点及局限性。
了解实施病例对照研究应注意的问题。
第六章实验流行病学掌握实验流行病学的定义、基本特点、流行病学实验的类型:临床试验、现场试验、社区试验。
熟悉实验流行病学研究与队列研究优缺点的比较。
了解实验流行病学研究优缺点和应注意的问题。
第七章筛检掌握筛检的定义、评价筛检试验真实性的指标的计算及意义。
医学统计学第二版高等教育出版社课后习题答案
医学统计学第二版高等教育出版社课后习题答案第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
《医学统计学》第6版单项选择题(附答案)
《医学统计学》第6版单项选择题(附答案)差计学》单项选择题的部分个体 D .⽤⽅法抽取 B .在总体中随部分个体个体《医学统摘⾃:李康,贺佳主编.医学统计学.第6版.北京:⼈民卫⽣出版社,20131. 医学统计学研究的对象是()第⼀章绪论A. 医学中的⼩概率事件B. 各种类型的数据C. 动物和⼈的本质D. 有变异的医学事物E .疾病的预防与治疗2. ⽤样本推论总体,具有代表性的样本通常指的是() A .总体中最容易获得的 C .挑选总体中的有代表性 E .依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是()A .收缩压测量值B .脉搏数C .住院天数D .病情程度E .四种⾎型4. 随机误差指的是()A. 由某些固定因素引起的 C. 选择样本不当引起的误 E. 由操作失误引起的误差意抽取任意的部分个体因素引起的误差的误5. 系统误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是()A. 由某些固定因素引起C. 选择样本不当引起的误E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是() A. 随机误差 B. 系统误差 C. 过失误差D. 记录误差E .仪器故障误差起的误差总体参数间的误差误差 B. 由不可预知的偶然差 D. 选择总体不当引起的误差 B. 由操作失误引 D. 样本统计量与差8.统计学中所谓的总体通常指的是()A.⾃然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9.医学统计学中所谓的样本通常指的是A.可测量的⽣物样品B. 统计量C. 某⼀变量的测量值D. 数据中有代表性的⼀部分E.总体中有代表性的部分观察单位10.医学研究中抽样误差的主要来源是()A.测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. ⽣物个体的变异E.样本量不够答案: 1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第⼆章定量数据的统计描述1.某医学资料数据⼤的⼀端没有确定数值,描述其集中趋势适⽤的统计指标是()A.中位数B. ⼏何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相⽐,其特点是()A.不易受极端值的影响B.能充分利⽤数据的信息C.抽样误差较⼤D.更适⽤于偏态分布资料E.更适⽤于分布不明确资料3.将⼀组计量资料整理成频数表的主要⽬的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4.6⼈接种流感疫苗⼀个⽉后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选⽤的指标是A.均数B. ⼏何均数C. 中位数D. 百分位数E. 倒数的均数5.变异系数主要⽤于()A.⽐较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的⼤⼩6. 对于正态或近似正态分布的资料,描述其变异程度应选⽤的指标是()A. 变异系数B. 离均差平⽅和C. 极差D. 四分位数间距E. 标准差7. 已知动脉硬化患者载脂蛋⽩B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使⽤()A .全距B .标准差C .变异系数D .⽅差E .四分位数间距8. ⼀组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较⼩B. 数值离散度较⼤C. 数值分布偏向较⼤⼀侧D. 数值分布偏向较⼩⼀侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是()A. 均数与中位数相同B. 均数⼤于中位数C. 均数⼩于中位数D. 两者有⼀定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与⽅差相⽐,其主要特点是()A. 标准差⼩于⽅差B. 标准差⼤于⽅差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的⾯积为()A .50% B.95% C. 97.5% D.99% E.不能确定(与标准差的⼤⼩有关)2. 标准正态分布的形态参数和位置参数分别为()A .0,1B. 1,0C.S ,X3. 正态分布的均数、中位数和⼏何均数之间的关系为() A. 均数与⼏何均数相等 B. 均数与中位数相等 C. 中位数与⼏何均数相等D. 均数、中位数、⼏何均数均不相等E. 均数、中位数、⼏何均数均相等D. ο,µµ,ο E.4.正常成年男⼦的红细胞计数近似服从正态分布,已知X =4.78?1012/L,S=0.38?1012/L,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为()A.⾼于4.78?1012/L的成年男⼦占97.98%B.低于4.78?1012/L的成年男⼦占97.98%C.⾼于4.00?1012/L的成年男⼦占97.98%D.低于4.00?1012/L的成年男⼦占97.98%E.在4.00?1012/L ⾄4.78?1012/L的成年男⼦占97.98%5.某项指标95%医学参考值范围表⽰的是()A.在此范围“异常”的概率⼤于或等于95%B.在此范围“正常”的概率⼤于或等于95%C.在“异常”总体中有95%的⼈在此范围之外D.在“正常”总体中有95%的⼈在此范围E.在⼈群中检测指标有5%的可能超出此范围6.确定某项指标的医学参考值范围时,“正常⼈”指的是()A.从未患过疾病的⼈B. 患过疾病但不影响研究指标的⼈C.排除了患过某种疾病的⼈E. 健康状况良好的⼈D.排除了影响研究指标的疾7.确定某项指标的医学参考值范围时,“正常⼈”指的是()A.从未患过疾病的⼈B. 患过疾病但不影响研究指标的⼈C. 排除了患过某种疾病的⼈D. 排除了影响研究指标的疾病或因素的⼈E. 健康状况良好的⼈8.要评价某地区⼀名5岁男孩的⾝⾼是否偏⾼,其统计学⽅法是()A.⽤均数来评价B. ⽤中位数来评价C. ⽤⼏何均数来评价D. ⽤变异系数来评价E. ⽤参考值范围来评价9.应⽤百分位数法估计参考值范围的条件是()A.数据服从正态分布B.数据服从偏态分布C.有⼤样本数据D.数据服从对称分布E.数据变异不能太⼤10.某市1974年238名居民的发汞含量(µmol/kg)如下,则该地居民发汞值的95%医学参考值范围是()发汞值(µmol/kg)15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 ⼈数20 66 60 48 18 16 6 1 0 3A.P5C.(P2.5,P97.5) D.X ± 1.96S 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A E.X ± 1.96S 病或因素的⼈B. D. 计算标较是()第四章定性数据的统计描述1. 如果⼀种新的治疗⽅法能够使不能治愈的疾病得到缓解并延长⽣命,则应发⽣的情况是()A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成⽐增加2. 计算⼄肝疫苗接种后⾎清学检查的阳转率,分母为()A. ⼄肝易感⼈数B. 平均⼈⼝数C. ⼄肝疫苗接种⼈数D. ⼄肝患者⼈数E. ⼄肝疫苗接种后的阳转⼈数3. 计算标准化死亡率的⽬的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进⾏不同地区死亡率的⽐较D. 消除各地区内部构成不同的影响E. 便于进⾏不同时间死亡率的⽐较4. 已知男性的钩⾍感染率⾼于⼥性,今欲⽐较甲⼄两乡居民的钩⾍感染率,但甲乡⼥性居民多,⽽⼄乡男性居多,适当的⽐较⽅法是()A. 两个率直接⽐较C. 直接对感染⼈数进⾏⽐ E. 不具备可⽐性两个率间接⽐较准化率⽐较5. 甲县恶性肿瘤粗死亡率⽐⼄县⾼,经标准化后甲县恶性肿瘤标化死亡率⽐⼄县低,其原因最有可能是()A. 甲县的诊断⽔平⾼B. 甲县的肿瘤防治⼯作⽐⼄县好C. 甲县的⼈⼝健康⽔平⾼D. 甲县的⽼年⼈⼝在总⼈⼝中所占⽐例更⼩E. 甲县的⽼年⼈⼝在总⼈6. 相对危险度RR 的计算⽅法 A. 两个标准化率之⽐B. 两种不同疾病的发病⼈数之⽐C. 两种不同疾病患病率之⽐D. 两种不同疾病的发病率之⽐E. 两种不同条件下某疾病发⽣的概率之⽐7. ⽐数⽐OR 值表⽰的是()A. 两个标准化率的差别⼤⼩B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发⽣的危险性程度⼝中所占⽐例更⼤8.计算患病率时的平均⼈⼝数的计算⽅法是()A.年初⼈⼝数和年末⼈⼝数的平均值B. 全年年初的⼈⼝数C. 全年年末⼈⼝数D. ⽣活满⼀年的总⼈⼝数E. ⽣活⾄少在半年以上的总⼈⼝数9.死因构成⽐反映的是()A.各种疾病发⽣的严重程度B. 疾病发⽣的主要原因C. 疾病在⼈群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险⼤⼩10.患病率与发病率的区别是()A.患病率⾼于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作⽤是()A.便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论⽂篇幅D. 容易进⾏统计描述和推断E. 代替冗长的⽂字叙述和便于分析对⽐2.描述某疾病患者年龄(岁)的分布,应采⽤的统计图是()A.线图B.直条图C.百分条图D.直⽅图E.箱式图3.⾼⾎压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周⾎压的动态变化和改善情况,为了直观显⽰出两组⾎压平均变动情况,宜选⽤的统计图是()A.半对数线图B.线图C.直条图D.直⽅图E.百分条图4.研究三种不同⿇醉剂在⿇醉后的镇痛效果,采⽤计量评分法,分数呈偏态分布,⽐较终点时分数的平均⽔平及个体的变异程度,应使⽤的图形是()A.复式条图B. 复式线图C. 散点图D. 直⽅图E. 箱式图5.研究⾎清低密度脂蛋⽩LDL与载脂蛋⽩B-100的数量依存关系,应绘制的图形是()A.直⽅图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适⽤于表⽰构成⽐关系的是()A.直⽅图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7.有些资料构成统计表时,下列哪⼀项可以省略()A.标题B. 标⽬C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A.圆图B. 百分条图C. 线图D. 半对数线图E. 直⽅图9.描述某现象频数分布情况可选择()A.圆图B. 百分条图C. 箱式图D. 误差条图E. 直⽅图10.对⽐某种清热解毒药物和对照药物的疗效,其单项指标为⼝渴、⾝痛、头痛、咳嗽、流涕、⿐塞、咽痛和发热的有效率,应选⽤的统计图是()A.圆图B. 百分条图C. 箱式图D. 复式条图E. 直⽅图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1.样本均数的标准误越⼩说明()A.观察个体的变异越⼩B. 观察个体的变异越⼤C. 抽样误差越⼤D. 由样本均数估计总体均数的可靠性越⼩E. 由样本均数估计总体均数的可靠性越⼤2. 抽样误差产⽣的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3.要减少抽样误差,通常的做法是()A.减少系统误差B. 将个体变异控制在⼀定范围内C. 减⼩标准差D. 控制偏倚E. 适当增加样本含量4.对于正偏态分布的的总体, 当样本含量⾜够⼤时, 样本均数的分布近似为()A.正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5.根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%6. 根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是()A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年⼈200名,测得其⾎清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年⼈⾎清胆固醇均数的95%可信区间是()A. 3.64±1.96?1.20 C. 3.64 ± 1.96 ?0 / E. 3.64±2.58?1.208. 假设检验的⽬的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为⼩概率9. 假设检验差别有统计学意义时,P 值越⼩,说明()A. 样本均数差别越⼤B. 总体均数差别越⼤C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法()A. 检验⽔准必须设为0.05B. 必须采⽤双侧检验C. 必须根据样本⼤⼩选择检验⽔准D. 必须建⽴⽆效假设E. 要说明⽆效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C D第七章 t 检验1. 两样本均数之差的标准误反映的是()A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度B. 3.64±1.202005 . B6. E7. C8. D9. D 10.2.两样本均数⽐较,检验结果P 0.05 说明()A.两总体均数的差别较⼩B. 两总体均数的差别较⼤C. ⽀持两总体⽆差别的结论D. 不⽀持两总体有差别的结论E. 可以确认两总体⽆差别3.由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指()A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别4.两样本均数⽐较,差别具有统计学意义时,P值越⼩说明()A.两样本均数差别越⼤B. 两总体均数差别越⼤C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是()A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的⽆效假设错误E. 可能出现的备择假设错误6.减少假设检验的Ⅱ类错误,应该使⽤的⽅法是()A.减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提⾼检验界值E. 增加样本含量7.以下不能⽤配对检验⽅法的是()A.⽐较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B.⽐较两种检测⽅法测量15名肝癌患者组织中Sirt1基因的表达量C.⽐较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D.⽐较糖尿病患者经某种药物治疗前后糖化⾎红蛋⽩的变化E.⽐较15名受试者针刺檀中⽳前后的痛阈值8.两独⽴样本均数t 检验,其前提条件是()A.两总体均数相等B. 两总体均数不等C. 两总体⽅差相等D. 两总体⽅差不等E. 两总体均数和两总体⽅差都相等9.若将配对设计的数据进⾏两独⽴样本均数t 检验,容易出现的问题是()A.增加出现I类错误的概率B. 增加出现II类错误的概率C. 检验结果的P值不准D. ⽅差齐性检验的结果不准E. 不满⾜t 检验的应⽤条件1 210. 两组定量资料⽐较,当⽅差不齐时,应该使⽤的检验⽅法是()A. 配对 t 检验B. Satterthwaite t′检验C. 两独⽴样本均数t 检验D. ⽅差齐性检验E. z 检验答案 1. E 2. D 3. E 4. D第⼋章⽅差分析1. ⽅差分析的基本思想是()A .组间均⽅⼤于组内均⽅B .组内均⽅⼤于组间均⽅C .不同来源的⽅差必须相等D .两⽅差之⽐服从F 分布E .总变异及其⾃由度可按不同来源分解2. ⽅差分析的应⽤条件之⼀是 A. 各⽐较组相应的样本⽅ C. 组内⽅差=组间⽅差 D. 总⽅差=各组⽅差之和 E. 总⽅差=组内⽅差+ 组间⽅差3. 完全随机设计⽅差分析中的组间均⽅反映的是()A. 随机测量误差⼤⼩B. 某因素效应⼤⼩C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组⽅差的平均⽔平4. 对于两组资料的⽐较,⽅差分析与t 检验的关系是()A. t 检验结果更准确B. ⽅差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5. 多组均数⽐较的⽅差分析,如果 P < 0.05 ,则应该进⼀步做的是()A .两均数的t 检验B .区组⽅差分析C .⽅差齐性检验D .SNK- q 检验E .确定单独效应6. A .各样本均数全相等 B .各样本均数全不相等 C .⾄少有两个样本均数不等 D .⾄少有两个总体均数不等 E .各总体均数全相等7. 完全随机设计资料的多个样本均数的⽐较,若处理⽆作⽤,则⽅差分析的F 值在理论上应接近于()A . F α (? ,? ) B. SS 处理 / SS 误差C. 0D. 1E. 任意值C 9. B 10. B5. C6. E7. C8.⽅差齐性,它是指()组相应的总体⽅差相差相等 B. 各⽐较等。
医学统计学定性资料定量资料习题
第四章定量资料的统计描述1. 编制频数表时错误的做法是().A. 用最大值减去最小值求全距B。
组距常取等组距,一般分为10~15组C。
第一个组段须包括最小值 D. 最后一个组段须包括最大值E. 写组段,如“1.5~3,3~5,5~6。
5,…”2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是()。
A. 中位数B. 几何均数C. 调和均数D. 算术均数E。
众数3。
比较5年级小学生瞳距和他们坐高的变异程度,宜采用()。
A. 变异系数B。
全距 C. 标准差D。
四分位数间距 E. 百分位数P2.5与P97.5的间距4. 均数和标准差S的关系是( )。
A。
S越小,对样本中其他个体的代表性越好B。
S越大,对样本中其他个体的代表性越好C。
越小,S越大D。
越大,S越小E。
S必小于5。
在正态分布条件下表示变量值变异情况的指标最常用的是()。
A。
标准差B。
标准误 C. 变异系数D。
全距E。
百分位数6. 变异系数越大说明( ).A. 标准差越大B。
平均数越大C。
标准差、平均数都大D。
平均数小 E. 以均数为准变异程度大7. 在服从正态分布条件下,样本标准差S的值( )。
A。
与集中位置有关 B. 与观察例数n无关C。
与平均数有关D。
与平均数无关E。
与个体的变异程度有关8。
计算几何均数G时,用常用对数lgX和用自然对数lnX所得计算结果( ).A. 一样B。
不一样C。
有时一样,有时不一样D。
有时相差较大,只能用lgX9. 算术均数与中位数相比,()。
A. 抽样误差更大B。
不易受极端值的影响C。
更充分利用数据信息 D. 更适用于分布不明及偏态分布资料10. 比较连续分布数据的离散度,( )。
A. 单位相同时根本不能用CV B。
单位相同均数相差较大时根本不能用SC. S表示绝对离散度,CV表示相对离散度. D。
只要单位相同,用S和用CV都是一样的11. 以中位数表示几种趋势,( )资料。
A。
不能用于正态分布的B。
不能用于严重偏态的连续分布C. 可用于任何分布的定量资料D. 可用于任何一种定性资料12。
04-医学统计学定性数据的统计描述
人年发病率(/10万) 278.36 12.34 24.23
RR=278.36/12.34=22.56,说明EB病毒抗体阳性鼻咽癌发病率是抗体 阴性发病率的22.56倍。
相对比 比数比(odds ratio,OR),用于流行病学中病例对 照研究资料。
病例组的暴露比数 a / b ad OR 对照组的暴露比数 c / d bc
概 述
标准化率(standardization rate),是为了在比较两 个不同人群的患病率、发病率、死亡率等资料时,消 除内部构成(如年龄、性别、工龄、病程长短等)不 同而不能直接比较所产生的影响。 标准化率仅用于相互比较,不代表实际水平;当标 准构成不同时,标准化率一般也不相同。
标准化直接法的计算步骤 a、标准化直接法的计算方法
治愈率(cure rate),表示接受治疗的病人中治愈的频 率。
治愈病人数 治愈率 100% 接受治疗病人数
相对数的使用注意
a、区别构成比和频率 ★频率,强度相对数;构成比,结构相对数。 b、使用相对数时分母不宜过小 ★如分母太小,用绝对数表示,如“3例中死亡1例”。 c、注意相对数的可比性 ★研究对象要同质,方法要相同,观察时期要一致等。 d、考虑存在抽样误差 ★对总体进行推断应作统计学检验。
率的标准化
构成比 构成比(constituent ratio),表示某事物内部各组成 部分在整体中所占的比重。
构成比 某一组成部分的观察单位 数 100% 同一事物各组成部分的 观察单位总数
【例】
某医院某月各科室住院病人数及死亡人数 因病死亡人 死亡构成 科室 病人数 病死率(‰) 数 (%) 内科 350 25 31.25 71.43 外科 650 30 37.50 46.15 肿瘤科 120 20 25.00 166.67 妇产科 300 5 6.25 16.67 合计 1420 80 100.00 56.34
医学统计人卫6版 第四章 定性数据的统计描述
.
一、定性数据的统计描述
➢定性数据的特点:将观察结果先按 分析要求,分类汇总观察单位数, 再用统计表列出。
➢常用相对比、构成比、率来描述计 数资料,这些指标统称为相对数。
.
二、常用相对数:
1.率(rate): 表示某现象发生的频率和强度, 常以百分率(%)、千分率(‰)、万分率 (/万)、十万分率(/10万)等表示。
合计 16709 715 0
90 12.59
53.86 4.28
.
五、应用相对数时应注意的问题
1.根据要说明的问题,选择合适的相对数,不能 以构成比代替率;
2.计算时分母不宜过小,分母过小时相对数不稳 定。在观察例数较少时,应直接用绝对数表示, 以免引起误解。
3.对观察单位数不等的几个率,பைடு நூலகம்能直接相加求 其平均率即合计率(总率)不等于各分率(组 率)之和。
➢ 基本思想:采用统一的标准(人口构成、年龄 构成等)以消除混杂因素的影响。
例题1.2
.
标准化率的计算:直接法
已知某一影响因素标准构成的每层例数Ni或 已知标准构成的构成比时,选用该法。 标准构成可选:
另选一有代表性、较稳定、数量较大的 构成为标准;
取各层合计为标准; 在各组中任选一组作为标准构成。 P30例4-5;例4-6
4.资料的对比应注意可比性: 1)“同质”事物比较相对数才有意义; 2)其它影响因素在各组的内部构成是否相同,
若不同,应先进行标准化后再作比较。 5.率或比的比较,亦应考虑存在抽样误差,对于
样本之间的差异应作显著性检验。
.
.
小结
发病率、死亡率、病死率 率的标准化
.
计算公式为: 比 A B
定性数据的统计描述
* 间接法计算标准化率
P’ = P r / ni Pi
P’为标准化率 r 为实际死亡率人数 ni Pi 根据标准死亡 率Pi推算的预期死亡率
选择某地更大样本的各年龄组患病率(Pi)作为标准
甲、乙两校35岁以上知识分子的高血压患病率
年龄
( 岁) 检查人数
甲校
病人数 患病率(%) 检查人数
1)对比指标:两个有关同类指标之比,如两地 肿瘤死亡比 2)关系指标:两个有关非同类指标之比,如每 千人病床数
4. 动态数列及其分析指标
* 动态数列(Dynamic series):
一系列按时间顺序排列起来的统计指标(包 括绝对数、相对数、平均数),用以说明事物在 时间上的变化和发展趋势。
* 分析指标:
55~ 65~
0.2850
0.2339 0.2113
7.20
9.90 14.68
2.0520
2.3156 3.1019
7.39
10.21 15.29
2.1062
2.3881 3.2308
合 计
1.0000
10.02
9.2987
8.73
9.5867
甲校高血压患病标化率P’= (Ni / N) Pi = 9.298% 乙校高血压患病标化率P’= (Ni / N) Pi = 9.587%
55~
65~ 合计
15.16
24.79 16.32
384
402 1397
58
100 209
235
157 1249
36
39 144
甲校的标化患病比=r/∑niPi=140/209=0.6699
乙校的标化患病比=r/∑niPi=109/144=0.7569 甲校标化患病率(%)=P×r/∑niPi=16.32×0.6699=10.93%
医学统计学4. 定性数据的统计描述
已知健康男童体重近似服从正态分布,某年某地 150名12岁健康男童体重的均数为35kg,标准差为 6kg,试估计
1)该地12岁健康男童体重在50kg以上者占该地12岁健康男 童总数的百分比;
2)该地12岁健康男童体重30-40公斤占该地12岁健康男童的 百分比;
3)该地80%的12岁健康男童集中在哪个范围;
应用相对数的注意事项
例如,某医师对口腔门诊不同年龄龋齿患病情况 (表5-3)进行了分析,得出40~49岁组患病率高, 0~9岁组和70岁及以上组患病率低的错误结论。
年龄组(岁)
0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计
表 5-3 口腔门诊龋齿患者年龄构成
患者人数
患者构成比(%)
一、统计学指标
绝对数:反应实际水平 相对数----两个数值的比,包括: 率 构成比 相对比
(一)率
率:
说明某现象或某事物在它可能发生的范围内实际发 生的频率或强度,又称频率指标或强度指标。
常以百分率(%)、千分率(‰)、万分率(1/ 万)、十万分率(1/10万)等表示,计算公式为:
率
某时期内实际发生某现象的观察单位数 同时期可能发生某现象的观察单位总数
比例基数
需要注意的是,分母中所规定的平均人口是指可 能会发生该病的人群。
2.患病率: 也称现患率,表示某一时点某人群人口 中患某病的频率,通常用来表示病程较长的慢性
病的发生或流行情况,其计算公式为
某病患病率
某地某时点某病患病例数 该地同期内平均人口数
比例基数
以上比例基数可为100%、1000‰、10000/万、 100000/10万,实际中患病率的分母通常为调查 的总人数,分子为患病的人数。
上海交通大学网络《医学统计学》习题册答案
上海交通⼤学⽹络《医学统计学》习题册答案上海交通⼤学⽹络教育学院医学院分院医学统计学课程练习册第⼀章绪论⼀、单选题1. ⼩概率事件是指P ( B )A.P>0.05 B.P<0.05 C. P >0.01 D. P <0.12. 从⼀个数值变量资料的总体中抽样,产⽣抽样误差的原因是( A )A总体中个体值存在差别B样本中个体值存在差别C样本只含总体的⼀部分D总体均数不等于03. 调查中国放射科医⽣接触射线情况,全国放射科医⽣的全部组成为( A )A.研究总体B.⽬标总体C.研究样本D.⽬标样本4. 若以舒张压90mmHg、收缩压130 mmHg为⾼⾎压阳性临界点,调查3000⼈中有300名⾎压超过临界值,这份资料属于:( B )A. 定量资料B. 分类资料C. 等级资料D. 离散型变量5. 下列属于统计量的指标是( C )A 总体均数B 总体标准差C 样本标准差D 总体率6. 调查某地区⾼⾎压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是:( C )A 分类资料B等级资料 C 定量资料D分析后才知7. 下列属于参数的指标是( D )A 样本均数B 样本率C 样本标准差D总体标准差8. ⽤样本做统计推断,样本应是( B )A. 总体中典型⼀部分B. 总体中有代表性⼀部分C. 总体中任意⼀部分D. 总体中信息明确⼀部分9. 统计推断的内容为( D )A. ⽤样本指标估计相应的总体指标B. 检验统计上的“检验假设”C. A和B均不是D. A和B均是10. 随机调查社区2000⼈,得到平均体重为60公⽄,则该资料属于( A )A. 计量资料B. 总体资料C. 计数资料D. 等级资料⼆、名词解释1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的⼀部分观察单位,因⽽样本指标不⼀定恰好等于相应的总体指标。
样本指标与总体指标的差异称为抽样误差。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
事物内部某一部分的观察单位数 构成比= 100% 事物内部各部分的观察单位数总和
常用百分数表示,故又称百分比。
7
构成比的两个特点:
①各部分构成比之和为100%。
②此消彼长。
8
例 2001年对某地中小学学生进行 HbsAg检查,结果见 下表,试计算各级学生HbsAg检出率及阳性者构成比
甲指标 相对比= (或 100%) 乙指标
两个指标可以是绝对数、相对数、平均数,可以是 性质相同或性质不同,但两个指标互不包含。
10
• 1.两类个体例数之比
• 如 我 国 1982 年 人 口 普 查 的 男 性 人 口 数 为 519433369 ,女性人口数为 488741919 人,求 人口数的男女比例。 R = 519433369/488741919 = 1.063 人口数的男女比为1.063:1。
学生 检查人数 阳性人数 检出率(%) 阳性构成比 (%)
小学生
初中生
660
1115
6
49
0.91
4.39
5.41
44.14
高中生 合 计
1563 3338
56 111
3.58 3.33
50.45 100.00
率和构成比不是同一指标,在应用时应注意加以区分。 9
相对比
相对比:指两个有关指标之比,说明两个指标的比 例关系。
18
如:用某药治疗某病患者,5例中有3例治愈,计算治愈 率为 3/5×100%=60.0% ,如果有 4 例治愈,则其治愈率 为80%。显然,这个结果是不稳定的。
在分母例数很少的情况下,个别的偶然因素会导致结果
的变化,只有分母例数较大时,计算的相对数才比较稳
定。在例数较少时,通常直接用绝对数表示。如果要用
烟的死亡率的2.139倍。这种指标在流行
病学研究中称为相对危险度(relative
risk简写为RR )。
• 3.两个相对比之比
• 临床医生欲探索某病的病因,在以医院病例为基础作
病例对照研究时,一般不能计算出RR,但可以计算出
疾病组暴露比数与对照组暴露比数之比,称之为 比数
比或优势比(odds ratio简写为OR)
实际发生某现象的观察 单位数 率 K 可能发生该现象的观察 单位总数
K 为比例基数,如 100% 、 1000‰ 等。比例基数的选择主要依
习惯而定或使计算结果能保留1~2位整数。
6
构成比(constituent ratio)
构成比: 是指事物内部某一部分的观察单位数与事
物内部各组成部分的观察单位数总和之比,用以说
11
• 2.两个率之比
• 某地某年龄组男性吸烟和非吸烟的冠心病 死亡资料下表所示,试分析其相对危害度。
分组
吸烟组 非吸烟组
死亡数 104 12
观察人年数 43248 10673
死亡率(1/10万人年) 240.5 .4 = 2.139
说明男性吸烟的冠心病死亡率是不吸
3.治愈率 =
接受治疗病人数
某期内因某病死亡人数 同期患该病的病人数
×100%
4.病死率 =
×100%
17
二、应用相对数的注意事项
• 计算相对数时分母不宜过小
• 正确区分构成比和率,不能以构成比代替率
• 正确计算平均率
• 对率和构成比进行比较时,应注意资料的可 比性 • 率的标准化
• 样本率或构成比进行比较时要作假设检验 。
例如, 分析比较两医院病死率的时,应注意两个医
母亲年龄(岁) 畸形儿例数 % 21 1 23 2 24 14 25 19 26 24 27 18 28 19 29 13 30 3 31 1 32 1 33 1 合计 116
0.86 1.7 12.1 16.4 20.7 15.5 16.4 11.2 2.6 0.86 0.86 0.86 100
20
相对数表示,则需列出其总体率的置信区间。
19
某产院拟分析当地畸形儿与母亲分娩年龄的关系,检 查了新生儿4470例,得以下资料,据此得出结论:“母亲 年龄在24—29岁时,畸形儿最多,占总数的92.2%,表明 该年龄段易发生畸形儿,符合一般规律”。试分析该结 论是否合理?
某地畸形儿与母亲分娩年龄的关系
医学统计学
第四章 定性数据的 统计描述
• 什么是分类变量资料?
• 用什么指标进行描述?
例:甲、乙两地发生麻疹流行,甲地患儿100人, 乙地患儿50人,何地较为严重? 若甲地易感儿童667人,而乙地易感儿童250人。 •甲地麻疹发病率为 •乙地麻疹发病率为 100/667×100%=15% 50/250×100%=20%
• 服用反应停与肢体缺陷关系病例对照研究 服用反应停 使 用 未使用 合 计 畸型儿组 34(a) 16 (c) 50 对 照 组 2(b) 88(d) 90 合计 36 104 140
14
本例
15
医学中常用的相对数指标
死亡统计指标
1.死亡率 = 某年某地死亡人口总数 同年该地年平均人口数 某年某地某年龄组死亡人数 同年该地同年龄别平均人口数 某年某地某病死亡人数 ×比例基数
2001年某地中小学学生HBsAg检出率及构成比
学生 小学生 初中生 高中生 检查人数 660 1115 1563 阳性人数 检出率(%) 6 49 56 0.91 4.39 3.58
阳性构成比 (%)
5.41 44.14 50.45
合 计
3338
111
3.33
100.00
21
在进行率或构成比比较时,除了要比较 的因素外,其他影响的因素应基本一致。
用相对数能较好地反映分类变量资料的特征。
3
一、常用相对数
二、应用相对数时的注意事项
三、率的标准化法
4
一、相对数
• 相对数:是两个有关联的数值或指标之比。 • 常用的相对数有:
–率 –构成比 –相对比
5
率(rate)
率:是指在一定观察时间内,某现象实际发生数与
可能发生该现象的总数之比,用以说明某现象发生 的频率或强度。
2.年龄别死亡率 =
×比例基数
3.死因别死亡率
=
同年该地年平均人口数
因某种死因死亡的人数 总死亡人数
×比例基数
4.死因构成 =
×100%
16
医学中常用的相对数指标
疾病统计指标
1.患病率 = 某地某时点(期间)某病患病人数(新旧病例) ×比例基数 同期间内平均人口数
2.发病率 = 某时期某病新病例数 该地同期平均人口数 治愈病人数 ×比例基数