医学统计学6
《医学统计学》第6版单项选择题(附答案)
差计学》单项选择题 的部分个体 D .用方法抽取 B .在总体中随 部分个体 个体《医学统摘自:李康,贺佳主编.医学统计学.第6版.北京:人民卫生出版社,20131. 医学统计学研究的对象是( )第一章 绪论A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 有变异的医学事物E .疾病的预防与治疗2. 用样本推论总体,具有代表性的样本通常指的是( ) A .总体中最容易获得的 C .挑选总体中的有代表性 E .依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是( )A .收缩压测量值B .脉搏数C .住院天数D .病情程度E .四种血型4. 随机误差指的是( )A. 由某些固定因素引起的 C. 选择样本不当引起的误 E. 由操作失误引起的误差意抽取任意的部分个体因素引起的误差 的误5. 系统误差指的是( )A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是( )A. 由某些固定因素引起C. 选择样本不当引起的误E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是( ) A. 随机误差 B. 系统误差 C. 过失误差D. 记录误差E .仪器故障误差起的误差 总体参数间的误差误差 B. 由不可预知的 偶然 差 D. 选择总体不 当引起的误差 B. 由操作失误引 D. 样本统计量与差8.统计学中所谓的总体通常指的是()A.自然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9.医学统计学中所谓的样本通常指的是A.可测量的生物样品B. 统计量C. 某一变量的测量值D. 数据中有代表性的一部分E.总体中有代表性的部分观察单位10.医学研究中抽样误差的主要来源是()A.测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. 生物个体的变异E.样本量不够答案: 1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第二章定量数据的统计描述1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是()A.中位数B. 几何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相比,其特点是()A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3.将一组计量资料整理成频数表的主要目的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4.6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A.均数B. 几何均数C. 中位数D. 百分位数E. 倒数的均数5.变异系数主要用于()A.比较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的大小6. 对于正态或近似正态分布的资料,描述其变异程度应选用的指标是( )A. 变异系数B. 离均差平方和C. 极差D. 四分位数间距E. 标准差7. 已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用( )A .全距B .标准差C .变异系数D .方差E .四分位数间距8. 一组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较小B. 数值离散度较大C. 数值分布偏向较大一侧D. 数值分布偏向较小一侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是( )A. 均数与中位数相同B. 均数大于中位数C. 均数小于中位数D. 两者有一定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与方差相比,其主要特点是( )A. 标准差小于方差B. 标准差大于方差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答 案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的面积为( )A .50% B.95% C. 97.5% D.99% E.不能确定(与标准差的大小有关)2. 标准正态分布的形态参数和位置参数分别为( )A .0,1B. 1,0C.S ,X3. 正态分布的均数、中位数和几何均数之间的关系为( ) A. 均数与几何均数相等 B. 均数与中位数相等 C. 中位数与几何均数相等D. 均数、中位数、几何均数均不相等E. 均数、中位数、几何均数均相等D. ο,μμ,ο E.4.正常成年男子的红细胞计数近似服从正态分布,已知X =4.78⨯1012/L,S=0.38⨯1012/L,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为()A.高于4.78⨯1012/L的成年男子占97.98%B.低于4.78⨯1012/L的成年男子占97.98%C.高于4.00⨯1012/L的成年男子占97.98%D.低于4.00⨯1012/L的成年男子占97.98%E.在4.00⨯1012/L 至4.78⨯1012/L的成年男子占97.98%5.某项指标95%医学参考值范围表示的是()A.在此范围“异常”的概率大于或等于95%B.在此范围“正常”的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围E.在人群中检测指标有5%的可能超出此范围6.确定某项指标的医学参考值范围时,“正常人”指的是()A.从未患过疾病的人B. 患过疾病但不影响研究指标的人C.排除了患过某种疾病的人E. 健康状况良好的人D.排除了影响研究指标的疾7.确定某项指标的医学参考值范围时,“正常人”指的是()A.从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人8.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是()A.用均数来评价B. 用中位数来评价C. 用几何均数来评价D. 用变异系数来评价E. 用参考值范围来评价9.应用百分位数法估计参考值范围的条件是()A.数据服从正态分布B.数据服从偏态分布C.有大样本数据D.数据服从对称分布E.数据变异不能太大10.某市1974年238名居民的发汞含量(μmol/kg)如下,则该地居民发汞值的95%医学参考值范围是()发汞值(μmol/kg)15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 人数20 66 60 48 18 16 6 1 0 3A.<P95B.>P5C.(P2.5,P97.5) D.X ± 1.96S 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A E.X ± 1.96S 病或因素的人B. D. 计算标 较 是( ) 第四章定性数据的统计描述1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况 是( )A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成比增加2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为( )A. 乙肝易感人数B. 平均人口数C. 乙肝疫苗接种人数D. 乙肝患者人数E. 乙肝疫苗接种后的阳转人数3. 计算标准化死亡率的目的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较D. 消除各地区内部构成不同的影响E. 便于进行不同时间死亡率的比较4. 已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡女 性居民多,而乙乡男性居多,适当的比较方法是( )A. 两个率直接比较C. 直接对感染人数进行比 E. 不具备可比性 两个率间接比较 准化率比较5. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其 原因最有可能是( )A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的人口健康水平高D. 甲县的老年人口在总人口中所占比例更小E. 甲县的老年人口在总人6. 相对危险度RR 的计算方法 A. 两个标准化率之比B. 两种不同疾病的发病人数之比C. 两种不同疾病患病率之比D. 两种不同疾病的发病率之比E. 两种不同条件下某疾病发生的概率之比7. 比数比OR 值表示的是( )A. 两个标准化率的差别大小B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发生的危险性程度口中所占比例更大8.计算患病率时的平均人口数的计算方法是()A.年初人口数和年末人口数的平均值B. 全年年初的人口数C. 全年年末人口数D. 生活满一年的总人口数E. 生活至少在半年以上的总人口数9.死因构成比反映的是()A.各种疾病发生的严重程度B. 疾病发生的主要原因C. 疾病在人群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险大小10.患病率与发病率的区别是()A.患病率高于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作用是()A.便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论文篇幅D. 容易进行统计描述和推断E. 代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是()A.线图B.直条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数线图B.线图C.直条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是()A.复式条图B. 复式线图C. 散点图D. 直方图E. 箱式图5.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适用于表示构成比关系的是()A.直方图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7.有些资料构成统计表时,下列哪一项可以省略()A.标题B. 标目C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A.圆图B. 百分条图C. 线图D. 半对数线图E. 直方图9.描述某现象频数分布情况可选择()A.圆图B. 百分条图C. 箱式图D. 误差条图E. 直方图10.对比某种清热解毒药物和对照药物的疗效,其单项指标为口渴、身痛、头痛、咳嗽、流涕、鼻塞、咽痛和发热的有效率,应选用的统计图是()A.圆图B. 百分条图C. 箱式图D. 复式条图E. 直方图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1.样本均数的标准误越小说明()A.观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3.要减少抽样误差,通常的做法是()A.减少系统误差B. 将个体变异控制在一定范围内C. 减小标准差D. 控制偏倚E. 适当增加样本含量4.对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为()A.正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%6. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其 含义是( )A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年人血清胆固醇均数的95%可信区间是( )A. 3.64±1.96⨯1.20 C. 3.64 ± 1.96 ⨯0 / E. 3.64±2.58⨯1.208. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为小概率9. 假设检验差别有统计学意义时,P 值越小,说明( )A. 样本均数差别越大B. 总体均数差别越大C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法( )A. 检验水准必须设为0.05B. 必须采用双侧检验C. 必须根据样本大小选择检验水准D. 必须建立无效假设E. 要说明无效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C D第七章 t 检验1. 两样本均数之差的标准误反映的是( )A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度B. 3.64±1.202005 . B6. E7. C8. D9. D 10.2.两样本均数比较,检验结果P 0.05 说明()A.两总体均数的差别较小B. 两总体均数的差别较大C. 支持两总体无差别的结论D. 不支持两总体有差别的结论E. 可以确认两总体无差别3.由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指()A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别4.两样本均数比较,差别具有统计学意义时,P值越小说明()A.两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是()A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的无效假设错误E. 可能出现的备择假设错误6.减少假设检验的Ⅱ类错误,应该使用的方法是()A.减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提高检验界值E. 增加样本含量7.以下不能用配对检验方法的是()A.比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E.比较15名受试者针刺檀中穴前后的痛阈值8.两独立样本均数t 检验,其前提条件是()A.两总体均数相等B. 两总体均数不等C. 两总体方差相等D. 两总体方差不等E. 两总体均数和两总体方差都相等9.若将配对设计的数据进行两独立样本均数t 检验,容易出现的问题是()A.增加出现I类错误的概率B. 增加出现II类错误的概率C. 检验结果的P值不准D. 方差齐性检验的结果不准E. 不满足t 检验的应用条件1 210. 两组定量资料比较,当方差不齐时,应该使用的检验方法是( )A. 配对 t 检验B. Satterthwaite t′ 检验C. 两独立样本均数t 检验D. 方差齐性检验E. z 检验答 案 1. E 2. D 3. E 4. D第八章方差分析1. 方差分析的基本思想是( )A .组间均方大于组内均方B .组内均方大于组间均方C .不同来源的方差必须相等D .两方差之比服从F 分布E .总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是 A. 各比较组相应的样本方 C. 组内方差=组间方差 D. 总方差=各组方差之和 E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是( )A. 随机测量误差大小B. 某因素效应大小C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t 检验的关系是()A. t 检验结果更准确B. 方差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5. 多组均数比较的方差分析,如果 P < 0.05 ,则应该进一步做的是()A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK- q 检验E .确定单独效应6. A .各样本均数全相等 B .各样本均数全不相等 C .至少有两个样本均数不等 D .至少有两个总体均数不等 E .各总体均数全相等7. 完全随机设计资料的多个样本均数的比较,若处理无作用,则方差分析的F 值在理 论上应接近于( )A . F α (ϖ ,ϖ ) B. SS 处理 / SS 误差C. 0D. 1E. 任意值C 9. B 10. B5. C6. E7. C8.方差齐性,它是指( ) 组相应的总体方差相差相等 B. 各比较等0.01,30.01,1 ζ > ζ 8. 对于多个方差的齐性检验,若P < α,可认为( )A .多个样本方差全不相等B .多个总体方差全不相等C .多个样本方差不全相等D .多个总体方差不全相等E .多个总体方差相等9. 析因设计的方差分析中,两因素X 与Y 具有交互作用指的是( )A .X 和Y 的主效应相互影响B .X 与Y 对观察指标的影响相差较大C .X 与Y 有叠加作用D .X 对观察指标的作用受Y 水平的影响E .X 与Y 的联合作用较大10. 多组均数比较的方差分析,如果 P < 0.05 ,则应该进一步做的是()A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK- q 检验E .确定单独效应答案: 1. E 2. B 3. C 4. E 5. D 6. D 7. D 8. D 9. D 10. C第八章ζ2 检验1. 两样本率比较,差别有统计学意义时,P 值越小说明( ) A. 两样本率差别越大 B. 两总体率差别越大 C. 越有理由认为两样本率不同 D. 越有理由认为两总体率不同E. 越有理由认为两样本率相同2. 欲比较两组阳性反应率, 在样本量非常小的情况下(如n 1 < 10, n 2 < 10 ), 应采用的假 设检验方法是( )A. 四格表χ2检验B. 校正四格表χ2检验C. Fisher 确切概率法D. 配对χ2检验E. 校正配对χ2检验3. 进行四组样本率比较的χ2检验,如 ζ 2> ζ2,可认为( )A. 四组样本率均不相同B. 四组总体率均不相同C. 四组样本率相差较大D. 至少有两组样本率不相同E. 至少有两组总体率不相同4. 从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文 ζ 2> ζ 2,乙文2 20.05,1 ,可认为()A. 两文结果有矛盾B. 两文结果完全相同C. 甲文结果更为可信D. 乙文结果更为可信E. 甲文说明总体的差异较大5.两组有效率比较的检验功效相关因素是()A.检验水准和样本率B. 总体率差别和样本含量C. 样本含量和样本率D. 总体率差别和理论频数E. 容许误差和检验水准6.通常分析四格表需用连续性校正χ2检验的情况是()A. T< 5B. T < 1 或n < 40C. T< 5且n < 40D. 1≤T< 5且n > 40E. T< 5或n < 407.当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是()A.增大B. 减小C. 不变D. 不确定E. 随该格实际频数的增加而增减8.对四种药物进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较,用Bonferroni方法校正后的检验水准应该是()A. 0.017B. 0.008C. 0.025D. 0.005E. 0.0139.对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较(多个实验组与对照组比较),用Bonferroni方法校正后的检验水准应该是()A. 0.050B. 0.010C. 0.025D. 0.005E. 0.01710.利用χ2检验公式不适合解决的实际问题是()A.比较两种药物的有效率B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效D. 药物三种不同剂量显效率有无差别E. 两组病情“轻、中、重”的构成比例答案: 1. D 2. C 3. E 4. C 5. B 6. D 7. C 8. B 9. E 10. C第九章非参数检验1.对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是()A.适用范围广B. 检验效能高C.检验结果更准确 D. 充分利用资料信息E. 不易出现假阴性错误2.对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是()A.增加Ⅰ类错误B. 增加Ⅱ类错误C. 减少Ⅰ类错误D. 减少Ⅱ类错误E. 两类错误都增加3.两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A.两总体的差别越大B. 两总体的差别越小C. 两样本的差别可能越大D. 越有理由说明两总体有差别E. 越有理由说明两总体无差别4.多个计量资料的比较,当分布类型未知时,应选择的统计方法是()A.方差分析B. Wilcoxon T检验C. Kruskal-Wallis H检验D. u检验E. 列联表χ2检验5.两组数据的秩和检验和t检验相比,其优点是()A.计算简便B. 检验假设合理C. 检验效能高D. 抽样误差更小E. 对数据分布不做限制6.两样本比较的秩和检验,其A.例数较小的秩和C. 较小的秩和D. 较大的秩和E. 任意一组数据的秩和7.两样本比较的秩和检验,其无效假设是()A.两样本有相同的秩和B. 两总体有相同的秩和C. 两样本分布相同D. 两总体分布相同E. 两总体分布的位置相同8.两样本比较的Wilcoxon秩和检验结果为P值小于0.05,判断孰优孰劣的根据是()A.比较两样本的秩和大小B. P值大小C. 检验统计量T值大小D. 两样本秩和的差别大小E. 比较两样本平均秩(Mean Rank)的大小9.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是A. Wilcoxon秩和检验B. 2⨯ 4 列联表χ2检验C. 四格表χ2检验E. 计算标准化率D. Fisher确切概率法)检验统计量T是(B. 例数较大的秩和10.两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2 对应的秩次是()A. 0.2B. 1.0C. 5.0D. 2.5E. 3.0答案 1. A 2. B 3. D 4. C 5. E 6. A 7. E 8. E 9. A 10. E第十章线性相关与回归1.两数值变量相关关系越强,对应的是()A.相关系数越大B. 相关系数的绝对值越大B.回归系数越大C. 回归系数的绝对值越大E. 相关系数检验统计量的t值越大2.回归分析的决定系数R2 越接近于1,说明()A.相关系数越大B. 回归方程的显著程度越高C. 应变量的变异越大D. 应变量的变异越小E. 自变量对应变量的影响越大3.对两变量X和Y作简单线性相关分析,要求的条件是()A. X和Y服从双变量正态分布B. X服从正态分布C. Y服从正态分布D. X和Y有回归关系E. X和Y至少有一个服从正态分布4.两组资料作回归分析,直线回归系数b较大的一组,表示()A.相关系数r也较大较大B.假设检验的P值较小C.决定系数R2较大D.决定系数R2较小E.Y随X变化其数量关系有更大的变化5.1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为Yˆ=14 + 4X ,若将体重换成国际单位kg,则此方程()A.常数项改变B.回归系数改变C.常数项和回归系数都改变D.常数项和回归系数都不改变E.决定系数改变6.对同一资料进行线性回归与相关分析时,下列正确的情形是()A.ρ=0时,r=0 B.ρ>0时,r>0C.r>0时,b<0 D.r<0时,b<0E.ρ<0时,r>07.下列双变量中,适用于进行线性相关分析的是()A.年龄与体重B.民族与血型C.体重与体表面积D.母亲文化水平与子女智商E.工龄与患病率8.对同一资料进行线性回归与相关分析时,下列正确的情形是()A.有密切的关系B.有一定的因果关系C.相关关系密切D.存在数量依存关系E.有较强的回归关系9. 作线性相关分析时,当n=12,r=0.767,查r界值表r0.001 / 2,10 = 0.823 ,r0.002 / 2,10 = 0.795 ,= 0.750 ,则P值范围为()r0.005 / 2,10A.0.001<P<0.002 B.P<0.001C.P<0.002 D.P>0.005E.0.002<P<0.00510.通过线性回归分析(n=48),得决定系数R2=0.49,则下列说法中错误的是()A.两个变量具有回归关系B.一定有相关系数r=0.70或r= - 0.70C.假设检验的自由度ν=46 D.回归平方和大于剩余平方和E.Y的总变异有49%可以由X的变化解释答案 1. B 2. E 3. A 4. E 5. C 6. D 7. C 8. D 9. E 10. D第十一章多元线性回归1.在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是()A.节省样本B.提高分析效率C.克服共线影响D.减少异常值的影响E.减少混杂的影响2.多元线性回归分析中,反映回归平方和在应变量Y 的总离均差平方和中所占比重的统计量是()A.简单相关系数 B .复相关系数C. 偏回归系数D. 回归均方E. 决定系数R23.对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是()A.决定系数 B. 相关系数C. 偏回归平方和D. 校正决定系数E. 复相关系数4.多元线性回归分析中,反映自变量对应变量作用大小的是()A.决定系数 B. 标准化偏回归系数C. 偏回归平方和D. 校正决定系数E. 复相关系数。
医学统计学6卡方检验
卡方检验的卡方值
卡方值是卡方检验的统计量,用于衡量实际观测值和期望值之间的差异。 卡方值越大,就表示观测值与期望值之间的差异越大,这意味着结论更可信。
如何进行卡方检验
第一步
确定研究的问题和相关变量, 并给出所需的假设。
第二步
收集数据并整理成交叉列联 表。
第三步
计算卡方值和自由度。
第四步
查阅卡方分布表,确定相应置信度水准下的临 界值。
2
应用
概率常用于医学研究中,以测量一种治疗对患者的疗效。
3
公式
概率=事件发生的次数/总次数。
统计学中的假设
在统计学中,我们需要制定一个或多个假设进而做出相应的决策。常见的假设有零假设和备择假设。
零假设
零假设是指不存在两个群体之间的差异。
备择假设
备择假设是指存在两个群体之间的差异。
什么是卡方检验
卡方检验是一种用于比较两个或多个群体在某些因素上的分布情况的方法。
卡方检验与其他假设检验的区 别
卡方检验主要用于回答多个分类变量间是否有关联的问题,而 T 检验和 Z 检 验主要用于回答单变量的问题。
卡方检验对于数据的类型并无太多的要求,而 T 检验和 Z 检验只适用于概率 分布为正态分布的数据。
卡方检验的计算公式
卡方检验的计算公式如下: χ² = ∑(O-E)²/E
为什么需要统计学
准确
统计学可以让我们从收集到的数据中得出真正 准确可靠的结论。
决策
统计学有助于做出决策并帮助我们更好地理解 数据背后的信息。
推断
统计学允许我们通过对大量数据的推断得到新 的信息。
掌握
掌握医学统计学对于实现优质医保研究至关重 要。
概率
医学统计学课后习题答案
医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。
医学统计学考题(按章节)第6题【05分】__随访资料的生存分析
五、其它30分(3~5道题目,每题6~10分)随访资料的生存分析:【06真题】九、某医生从 2002年 1月 1日起对某医院收治的 6名急性心肌梗塞病人进行跟踪观察,2002年 3月 25日结束观察,共 12周。
记录的资料如下:(5分)1、上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2、判断上述随访时间哪些属截尾值?写出观察对象编号。
【05真题、04真题、03真题】四、16例某癌症病人在不同时期经随机化分配到A、B两治疗组,并继续进行随访至1974年5月 31日结束。
资料如下表:(8分)16例某种癌症病人随访资料病人号治疗组分组日期终止日期是否该病死亡截尾值1 A 68.05.12 68.05.30 Y2 B 70.10.18 71.04.16 Y3 B 69.02.12 70.11.06 Y4 A 72.01.30 74.05.31 仍存活5 A 73.11.11 74.01.02 Y6 B 68.03.12 73.03.30 车祸死亡7 A 69.01.06 69.01.04 Y8 A 69.02.08 70.02.08 迁出9 B 71.05.02 71.11.13 Y10 B 68.03.08 68.05.23 Y11 B 73.12.12 74.02.20 Y12 A 74.05.01 74.05.09 Y13 B 72.07.02 72.07.15 Y14 B 68.12.18 74.04.31 失访15 A 69.01.01 74.05.31 仍存活16 B 73.09.02 73.09.20 Y1.上述资料随访时间单位以(日)、(月)、(年)哪个较合适?为什么?2.判断上述随访时间哪些属截尾值,写出观察对象编号。
3.要比较A、B疗法对该种癌症病人的疗效,宜选用何种统计检验方法?4.A、B治疗组随访资料生存时间的特征量(代表值)一般用何指标表示?【答案】jszb0、本资料中,第7号观察对象数据,终止日期竟然早于分组日期,是典型的错误数据,应该排除。
医学统计学:第06讲t检验和Z检验6
表 可能发生的两类错误
客观实际
假设检验的结果
H0成立 H0不成立
拒绝H0
Ⅰ型错误(α )
推断正确(1-β)
不拒绝H0
推断正确(1- α )
Ⅱ型错误(β)
七、假设检验的注意事项
1. 资料要来自严密的抽样研究设计 2. 选用假设检验的方法应符合其应用条件 3. 假设检验的结论不能绝对化
在报告结论时,一般列出检验统计量的值,然后给出 确切的P值或者给出P>0.05,P<0.05,P<0.01 或 P<0.001这四种结果之一。 4. 要根据资料的性质事先确定采用单侧或双侧检验。
表 手术前后舒张压变化情况
患者编号 (1) 1 2 3 4 5 6 7 8 9 10
合计
手术前(kPa) (2)
16.0 12.0 14.6 13.3 12.0 12.0 14.6 14.6 12.0 12.3
手术后(kPa) (3)
12.0 13.3 10.6 12.0 12.0 10.6 10.6 14.6 12.7 13.3
差值d (4)=(2)-(3)
4.0 -1.3
4.0 1.3 0.0 1.4 4.0 0.0 -0.7 0.0 ∑d=12.7
差值d2 (5)=(4)×(4)
16.00 1.69
16.00 1.69 0.00 1.96
16.00 0.00 0.49 0.00
∑(d2)=53.83
返回
【例】某克山病区抽样调查测得11例急性克山病患者 和13名健康人的血磷值(mmol/L)如下,问该地急性 克山病患者与健康人的血磷值是否不同?
六、Ⅰ型错误和Ⅱ型错误
假设检验中作出的推断结论可能发生两种错误: ①. “拒绝”了实际上成立的H0,这叫Ⅰ型错误,也
医学统计学 统计题及参考答案(六部分)
第一部分计量资料的统计描述一、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A、全距B、标准差C、变异系数D、四分位数间距E、方差2.用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位数间距5.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差6.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数B.标准差C.几何均数D.中位数E.变异系数7.()分布的资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8.对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距E.几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.标准差二、简答题1、对于一组近似正态分布的资料,除样本含量n 外,还可计算,S 和,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年女子血清联系和区别。
甘油三酯(mmol/L)测量结果3、说明频数分布表的用途。
4、变异系数的用途是什么?组段频数5、试述正态分布的面积分布规律。
0.6~ 10.7~ 3三、计算分析题0.8~ 91、根据1999年某地某单位的体检资料,116名正常0.9~ 13成年女子的血清甘油三酯(mmol/L)测量结果如右表, 1.0~ 19请据此资料: 1.1~ 25(1)描述集中趋势应选择何指标?并计算之。
医学统计学知识点
第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
2、研究对象:具有不确定性结果的事物。
3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。
4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。
5、医学统计学根本内容:统计设计、数据整理、统计描述、统计推断。
6、医学统计学中的根本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。
变异,指总体内的个体间存在的、绝对的差异。
统计学通过对变异的研究来探索事物。
(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。
变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。
〔如身高、体重、血压、温度等〕定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。
包括二分类、无序多分类。
〔进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、A B等〕有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。
统计方法的选用与数据类型有密切的关系。
〔3〕总体与样本总体,指根据研究目确实定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。
样本,是从研究总体中随机抽取局部有代表性的观察单位,对变量进行观测得到的数据。
抽样,是从研究总体中随机抽取局部有代表性的观察单位。
参数,指描述总体特征的指标。
统计量,指描述样本特征的指标。
〔4〕误差误差,指观测值与真实值、统计量与参数之间的差异。
可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。
随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。
抽样误差,是抽样引起的统计量与参数间的差异。
抽样误差主要来源于个体的变异。
《医学统计学》第6版单项选择题(附答案)
《医学统计学》第6版单项选择题(附答案)差计学》单项选择题的部分个体 D .⽤⽅法抽取 B .在总体中随部分个体个体《医学统摘⾃:李康,贺佳主编.医学统计学.第6版.北京:⼈民卫⽣出版社,20131. 医学统计学研究的对象是()第⼀章绪论A. 医学中的⼩概率事件B. 各种类型的数据C. 动物和⼈的本质D. 有变异的医学事物E .疾病的预防与治疗2. ⽤样本推论总体,具有代表性的样本通常指的是() A .总体中最容易获得的 C .挑选总体中的有代表性 E .依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是()A .收缩压测量值B .脉搏数C .住院天数D .病情程度E .四种⾎型4. 随机误差指的是()A. 由某些固定因素引起的 C. 选择样本不当引起的误 E. 由操作失误引起的误差意抽取任意的部分个体因素引起的误差的误5. 系统误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是()A. 由某些固定因素引起C. 选择样本不当引起的误E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是() A. 随机误差 B. 系统误差 C. 过失误差D. 记录误差E .仪器故障误差起的误差总体参数间的误差误差 B. 由不可预知的偶然差 D. 选择总体不当引起的误差 B. 由操作失误引 D. 样本统计量与差8.统计学中所谓的总体通常指的是()A.⾃然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9.医学统计学中所谓的样本通常指的是A.可测量的⽣物样品B. 统计量C. 某⼀变量的测量值D. 数据中有代表性的⼀部分E.总体中有代表性的部分观察单位10.医学研究中抽样误差的主要来源是()A.测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. ⽣物个体的变异E.样本量不够答案: 1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第⼆章定量数据的统计描述1.某医学资料数据⼤的⼀端没有确定数值,描述其集中趋势适⽤的统计指标是()A.中位数B. ⼏何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相⽐,其特点是()A.不易受极端值的影响B.能充分利⽤数据的信息C.抽样误差较⼤D.更适⽤于偏态分布资料E.更适⽤于分布不明确资料3.将⼀组计量资料整理成频数表的主要⽬的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4.6⼈接种流感疫苗⼀个⽉后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选⽤的指标是A.均数B. ⼏何均数C. 中位数D. 百分位数E. 倒数的均数5.变异系数主要⽤于()A.⽐较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的⼤⼩6. 对于正态或近似正态分布的资料,描述其变异程度应选⽤的指标是()A. 变异系数B. 离均差平⽅和C. 极差D. 四分位数间距E. 标准差7. 已知动脉硬化患者载脂蛋⽩B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使⽤()A .全距B .标准差C .变异系数D .⽅差E .四分位数间距8. ⼀组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较⼩B. 数值离散度较⼤C. 数值分布偏向较⼤⼀侧D. 数值分布偏向较⼩⼀侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是()A. 均数与中位数相同B. 均数⼤于中位数C. 均数⼩于中位数D. 两者有⼀定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与⽅差相⽐,其主要特点是()A. 标准差⼩于⽅差B. 标准差⼤于⽅差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的⾯积为()A .50% B.95% C. 97.5% D.99% E.不能确定(与标准差的⼤⼩有关)2. 标准正态分布的形态参数和位置参数分别为()A .0,1B. 1,0C.S ,X3. 正态分布的均数、中位数和⼏何均数之间的关系为() A. 均数与⼏何均数相等 B. 均数与中位数相等 C. 中位数与⼏何均数相等D. 均数、中位数、⼏何均数均不相等E. 均数、中位数、⼏何均数均相等D. ο,µµ,ο E.4.正常成年男⼦的红细胞计数近似服从正态分布,已知X =4.78?1012/L,S=0.38?1012/L,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为()A.⾼于4.78?1012/L的成年男⼦占97.98%B.低于4.78?1012/L的成年男⼦占97.98%C.⾼于4.00?1012/L的成年男⼦占97.98%D.低于4.00?1012/L的成年男⼦占97.98%E.在4.00?1012/L ⾄4.78?1012/L的成年男⼦占97.98%5.某项指标95%医学参考值范围表⽰的是()A.在此范围“异常”的概率⼤于或等于95%B.在此范围“正常”的概率⼤于或等于95%C.在“异常”总体中有95%的⼈在此范围之外D.在“正常”总体中有95%的⼈在此范围E.在⼈群中检测指标有5%的可能超出此范围6.确定某项指标的医学参考值范围时,“正常⼈”指的是()A.从未患过疾病的⼈B. 患过疾病但不影响研究指标的⼈C.排除了患过某种疾病的⼈E. 健康状况良好的⼈D.排除了影响研究指标的疾7.确定某项指标的医学参考值范围时,“正常⼈”指的是()A.从未患过疾病的⼈B. 患过疾病但不影响研究指标的⼈C. 排除了患过某种疾病的⼈D. 排除了影响研究指标的疾病或因素的⼈E. 健康状况良好的⼈8.要评价某地区⼀名5岁男孩的⾝⾼是否偏⾼,其统计学⽅法是()A.⽤均数来评价B. ⽤中位数来评价C. ⽤⼏何均数来评价D. ⽤变异系数来评价E. ⽤参考值范围来评价9.应⽤百分位数法估计参考值范围的条件是()A.数据服从正态分布B.数据服从偏态分布C.有⼤样本数据D.数据服从对称分布E.数据变异不能太⼤10.某市1974年238名居民的发汞含量(µmol/kg)如下,则该地居民发汞值的95%医学参考值范围是()发汞值(µmol/kg)15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 ⼈数20 66 60 48 18 16 6 1 0 3A.P5C.(P2.5,P97.5) D.X ± 1.96S 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A E.X ± 1.96S 病或因素的⼈B. D. 计算标较是()第四章定性数据的统计描述1. 如果⼀种新的治疗⽅法能够使不能治愈的疾病得到缓解并延长⽣命,则应发⽣的情况是()A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成⽐增加2. 计算⼄肝疫苗接种后⾎清学检查的阳转率,分母为()A. ⼄肝易感⼈数B. 平均⼈⼝数C. ⼄肝疫苗接种⼈数D. ⼄肝患者⼈数E. ⼄肝疫苗接种后的阳转⼈数3. 计算标准化死亡率的⽬的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进⾏不同地区死亡率的⽐较D. 消除各地区内部构成不同的影响E. 便于进⾏不同时间死亡率的⽐较4. 已知男性的钩⾍感染率⾼于⼥性,今欲⽐较甲⼄两乡居民的钩⾍感染率,但甲乡⼥性居民多,⽽⼄乡男性居多,适当的⽐较⽅法是()A. 两个率直接⽐较C. 直接对感染⼈数进⾏⽐ E. 不具备可⽐性两个率间接⽐较准化率⽐较5. 甲县恶性肿瘤粗死亡率⽐⼄县⾼,经标准化后甲县恶性肿瘤标化死亡率⽐⼄县低,其原因最有可能是()A. 甲县的诊断⽔平⾼B. 甲县的肿瘤防治⼯作⽐⼄县好C. 甲县的⼈⼝健康⽔平⾼D. 甲县的⽼年⼈⼝在总⼈⼝中所占⽐例更⼩E. 甲县的⽼年⼈⼝在总⼈6. 相对危险度RR 的计算⽅法 A. 两个标准化率之⽐B. 两种不同疾病的发病⼈数之⽐C. 两种不同疾病患病率之⽐D. 两种不同疾病的发病率之⽐E. 两种不同条件下某疾病发⽣的概率之⽐7. ⽐数⽐OR 值表⽰的是()A. 两个标准化率的差别⼤⼩B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发⽣的危险性程度⼝中所占⽐例更⼤8.计算患病率时的平均⼈⼝数的计算⽅法是()A.年初⼈⼝数和年末⼈⼝数的平均值B. 全年年初的⼈⼝数C. 全年年末⼈⼝数D. ⽣活满⼀年的总⼈⼝数E. ⽣活⾄少在半年以上的总⼈⼝数9.死因构成⽐反映的是()A.各种疾病发⽣的严重程度B. 疾病发⽣的主要原因C. 疾病在⼈群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险⼤⼩10.患病率与发病率的区别是()A.患病率⾼于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作⽤是()A.便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论⽂篇幅D. 容易进⾏统计描述和推断E. 代替冗长的⽂字叙述和便于分析对⽐2.描述某疾病患者年龄(岁)的分布,应采⽤的统计图是()A.线图B.直条图C.百分条图D.直⽅图E.箱式图3.⾼⾎压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周⾎压的动态变化和改善情况,为了直观显⽰出两组⾎压平均变动情况,宜选⽤的统计图是()A.半对数线图B.线图C.直条图D.直⽅图E.百分条图4.研究三种不同⿇醉剂在⿇醉后的镇痛效果,采⽤计量评分法,分数呈偏态分布,⽐较终点时分数的平均⽔平及个体的变异程度,应使⽤的图形是()A.复式条图B. 复式线图C. 散点图D. 直⽅图E. 箱式图5.研究⾎清低密度脂蛋⽩LDL与载脂蛋⽩B-100的数量依存关系,应绘制的图形是()A.直⽅图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适⽤于表⽰构成⽐关系的是()A.直⽅图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7.有些资料构成统计表时,下列哪⼀项可以省略()A.标题B. 标⽬C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A.圆图B. 百分条图C. 线图D. 半对数线图E. 直⽅图9.描述某现象频数分布情况可选择()A.圆图B. 百分条图C. 箱式图D. 误差条图E. 直⽅图10.对⽐某种清热解毒药物和对照药物的疗效,其单项指标为⼝渴、⾝痛、头痛、咳嗽、流涕、⿐塞、咽痛和发热的有效率,应选⽤的统计图是()A.圆图B. 百分条图C. 箱式图D. 复式条图E. 直⽅图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1.样本均数的标准误越⼩说明()A.观察个体的变异越⼩B. 观察个体的变异越⼤C. 抽样误差越⼤D. 由样本均数估计总体均数的可靠性越⼩E. 由样本均数估计总体均数的可靠性越⼤2. 抽样误差产⽣的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3.要减少抽样误差,通常的做法是()A.减少系统误差B. 将个体变异控制在⼀定范围内C. 减⼩标准差D. 控制偏倚E. 适当增加样本含量4.对于正偏态分布的的总体, 当样本含量⾜够⼤时, 样本均数的分布近似为()A.正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5.根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%6. 根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是()A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年⼈200名,测得其⾎清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年⼈⾎清胆固醇均数的95%可信区间是()A. 3.64±1.96?1.20 C. 3.64 ± 1.96 ?0 / E. 3.64±2.58?1.208. 假设检验的⽬的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为⼩概率9. 假设检验差别有统计学意义时,P 值越⼩,说明()A. 样本均数差别越⼤B. 总体均数差别越⼤C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法()A. 检验⽔准必须设为0.05B. 必须采⽤双侧检验C. 必须根据样本⼤⼩选择检验⽔准D. 必须建⽴⽆效假设E. 要说明⽆效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C D第七章 t 检验1. 两样本均数之差的标准误反映的是()A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度B. 3.64±1.202005 . B6. E7. C8. D9. D 10.2.两样本均数⽐较,检验结果P 0.05 说明()A.两总体均数的差别较⼩B. 两总体均数的差别较⼤C. ⽀持两总体⽆差别的结论D. 不⽀持两总体有差别的结论E. 可以确认两总体⽆差别3.由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指()A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别4.两样本均数⽐较,差别具有统计学意义时,P值越⼩说明()A.两样本均数差别越⼤B. 两总体均数差别越⼤C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是()A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的⽆效假设错误E. 可能出现的备择假设错误6.减少假设检验的Ⅱ类错误,应该使⽤的⽅法是()A.减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提⾼检验界值E. 增加样本含量7.以下不能⽤配对检验⽅法的是()A.⽐较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B.⽐较两种检测⽅法测量15名肝癌患者组织中Sirt1基因的表达量C.⽐较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D.⽐较糖尿病患者经某种药物治疗前后糖化⾎红蛋⽩的变化E.⽐较15名受试者针刺檀中⽳前后的痛阈值8.两独⽴样本均数t 检验,其前提条件是()A.两总体均数相等B. 两总体均数不等C. 两总体⽅差相等D. 两总体⽅差不等E. 两总体均数和两总体⽅差都相等9.若将配对设计的数据进⾏两独⽴样本均数t 检验,容易出现的问题是()A.增加出现I类错误的概率B. 增加出现II类错误的概率C. 检验结果的P值不准D. ⽅差齐性检验的结果不准E. 不满⾜t 检验的应⽤条件1 210. 两组定量资料⽐较,当⽅差不齐时,应该使⽤的检验⽅法是()A. 配对 t 检验B. Satterthwaite t′检验C. 两独⽴样本均数t 检验D. ⽅差齐性检验E. z 检验答案 1. E 2. D 3. E 4. D第⼋章⽅差分析1. ⽅差分析的基本思想是()A .组间均⽅⼤于组内均⽅B .组内均⽅⼤于组间均⽅C .不同来源的⽅差必须相等D .两⽅差之⽐服从F 分布E .总变异及其⾃由度可按不同来源分解2. ⽅差分析的应⽤条件之⼀是 A. 各⽐较组相应的样本⽅ C. 组内⽅差=组间⽅差 D. 总⽅差=各组⽅差之和 E. 总⽅差=组内⽅差+ 组间⽅差3. 完全随机设计⽅差分析中的组间均⽅反映的是()A. 随机测量误差⼤⼩B. 某因素效应⼤⼩C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组⽅差的平均⽔平4. 对于两组资料的⽐较,⽅差分析与t 检验的关系是()A. t 检验结果更准确B. ⽅差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5. 多组均数⽐较的⽅差分析,如果 P < 0.05 ,则应该进⼀步做的是()A .两均数的t 检验B .区组⽅差分析C .⽅差齐性检验D .SNK- q 检验E .确定单独效应6. A .各样本均数全相等 B .各样本均数全不相等 C .⾄少有两个样本均数不等 D .⾄少有两个总体均数不等 E .各总体均数全相等7. 完全随机设计资料的多个样本均数的⽐较,若处理⽆作⽤,则⽅差分析的F 值在理论上应接近于()A . F α (? ,? ) B. SS 处理 / SS 误差C. 0D. 1E. 任意值C 9. B 10. B5. C6. E7. C8.⽅差齐性,它是指()组相应的总体⽅差相差相等 B. 各⽐较等。
医学统计学第6章二项分布与泊松分布(108页)
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第1页
结束
MEDICAL STATISTICS
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第2页
结束
《医学统计学》目录
第1章 绪论 第2章 定量资料的统计描述 第3章 总体均数的区间估计和假设检验 第4章 方差分析 第5章 定性资料的统计描述 第6章 总体率的区间估计和假设检验 第7章 二项分布与Poisson分布 第8章 秩和检验 第9章 直线相关与回归 第10章 实验设计 第11章 调查设计 第12章 统计表与统计图
3.二项分布名称: 也称为贝努里分布(Bernoulli distribution)或贝努里模型,是由法国数学家 J.Bernoulli于1713年首先阐述的概率分布。
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第7页
结束
贝努里模型应具备下列三个基本条件。
1. 试验结果只出现对立事件A或AA,两者只能出
x
Pn ( X x) P( X ) X 0
X=0,1,2,…,x (7.4)
至少有x例阳性的概率为:
n
Pn ( X x) P( X ) X x
X=x,x+1,…,n (7.5)
公式(7.4)为下侧累计概率,公式(7.5)为上侧累计概率。
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
8. 了解:常用的拟合优度检验方法。
简历
返回总目录 返回章目录 第7章 二项分布与泊松分布
第5页
结束
第一节 二项分布及其应用
一、二项分布的概念及应用条件
1.二项分布(binominal distribution) 是一种重要的离散型分布,在医学上常遇到属 于两分类的资料,每一观察单位只具有相互独 立的一种结果,如检查结果的阳性或阴性,动 物试验的生存或死亡,对病人治疗的有效或无 效等。
医学统计学第六版(马斌荣)课后习题答案教学教材
医学统计学第六版(马斌荣)课后习题答案第一章绪论部分一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
医学统计学课后习题答案
医学统计学课后习题答案医学统计学课后习题答案在医学领域中,统计学是一门非常重要的学科。
通过统计学的方法,我们可以对医学数据进行分析和解释,从而得出科学的结论和推断。
在医学统计学的学习过程中,课后习题是非常重要的一环。
通过解答习题,我们可以巩固所学的知识,并且更好地理解统计学的应用。
下面是一些医学统计学课后习题的答案,希望对大家的学习有所帮助。
1. 什么是样本均值和总体均值?它们之间有什么区别?样本均值是指从总体中抽取的一组样本数据的平均值。
总体均值是指整个总体中所有个体的平均值。
样本均值是对总体均值的估计。
区别:样本均值是通过抽样得到的估计值,而总体均值是真实的未知参数。
样本均值可以通过多次抽样得到不同的值,而总体均值是固定的。
2. 什么是标准差和方差?它们之间有什么关系?标准差是指一组数据的离散程度或者分散程度。
方差是标准差的平方。
关系:标准差是方差的平方根。
3. 什么是假设检验?在医学研究中有什么应用?假设检验是一种统计学方法,用于对两个或多个样本数据进行比较,从而判断它们之间是否存在显著差异。
在医学研究中,假设检验可以用于判断某种治疗方法是否有效,或者某种药物是否有副作用等。
4. 什么是P值?如何解释P值?P值是指在假设检验中,根据观察到的样本数据计算得到的一个概率值。
P值可以用来判断观察到的差异是否由随机因素引起。
解释P值:如果P值小于设定的显著性水平(通常为0.05),则可以拒绝原假设,认为观察到的差异是显著的。
如果P值大于显著性水平,则不能拒绝原假设,认为观察到的差异可能是由随机因素引起的。
5. 什么是置信区间?如何解释置信区间?置信区间是指对总体参数的一个估计范围。
置信区间由一个下限和一个上限组成。
解释置信区间:例如,对于一个置信水平为95%的置信区间,意味着在多次抽样中,有95%的置信区间会包含真实的总体参数值。
置信区间越窄,对总体参数的估计越准确。
6. 什么是卡方检验?在医学研究中有什么应用?卡方检验是一种用于比较两个或多个分类变量之间是否存在关联的统计方法。
医学统计学课后案例分析答案:第6章 两样本定量资料的比较
第6章两样本定量资料的比较案例辨析及参考答案案例6-1 为研究直肠癌患者手术前后血清CEA含量有无差异,作者收集了以下资料:术前(24例):31.5 30.0 28.6 39.7 45.2 20.3 37.3 24.0 36.2 20.5 23.1 29.033.1 35.2 28.9 26.4 25.9 23.8 30.4 31.6 27.9 33.0 34.0 32.7 术后(12例):2.0 3.2 2.3 3.1 1.9 2.2 1.5 1.8 3.2 3.0 2.8 2.1 (1)有人采用了两独立样本的t检验,结果t=15.92,ν=34,P<0.05。
从而得出结论:手术前后血清CEA含量有差异,术前CEA含量高于术后。
(2)也有人觉得上述分析方法不对,应该采用两独立样本的秩和检验,结果为:=,P<0.05。
Z-4.83(3)还有人认为应该采用校正t检验,结果:t'=22.51,P<0.05。
(4)有人将上述三种方法作一比较,认为既然三者结论是一致的,所以采用哪种分析方法都无所谓。
对此你有何看法?案例辨析(1)属于盲目套用两独立样本的t检验,因为未检查定量资料是否满足参数检验的前提条件。
(2)若定量资料满足参数检验的前提条件,直接用秩和检验会降低检验功效。
(3)若定量资料不满足正态性要求,直接用校正的t检验也是不妥当的。
(4)应当采用哪种统计分析方法不应仅看结论是否一致,而应根据分析目的、设计类型、资料是否满足参数检验的前提条件等方面综合考虑,事先选定统计分析方法,不能等到计算结果出来了,再确定统计分析方法。
正确做法此案例涉及完全随机设计两小样本资料的假设检验,统计方法的选择一定要结合数据特征。
通过对两组数据进行正态性检验,发现两样本均来自正态总体,但方差齐性检验结果表明,两总体方差不齐,所以最好的办法就是t'检验,此种情况一般不主张采用秩和检验,因为检验功效会大大降低。
《医学统计学》第6版单项选择题(附答案)
差计学》单项选择题 的部分个体 D .用方法抽取 B .在总体中随 部分个体 个体《医学统摘自:李康,贺佳主编.医学统计学.第6版.北京:人民卫生出版社,20131. 医学统计学研究的对象是( )第一章 绪论A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 有变异的医学事物E .疾病的预防与治疗2. 用样本推论总体,具有代表性的样本通常指的是( ) A .总体中最容易获得的 C .挑选总体中的有代表性 E .依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是( )A .收缩压测量值B .脉搏数C .住院天数D .病情程度E .四种血型4. 随机误差指的是( )A. 由某些固定因素引起的 C. 选择样本不当引起的误 E. 由操作失误引起的误差意抽取任意的部分个体因素引起的误差 的误5. 系统误差指的是( )A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是( )A. 由某些固定因素引起C. 选择样本不当引起的误E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是( ) A. 随机误差 B. 系统误差 C. 过失误差D. 记录误差E .仪器故障误差起的误差 总体参数间的误差误差 B. 由不可预知的 偶然 差 D. 选择总体不 当引起的误差 B. 由操作失误引 D. 样本统计量与差8.统计学中所谓的总体通常指的是()A.自然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9.医学统计学中所谓的样本通常指的是A.可测量的生物样品B. 统计量C. 某一变量的测量值D. 数据中有代表性的一部分E.总体中有代表性的部分观察单位10.医学研究中抽样误差的主要来源是()A.测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. 生物个体的变异E.样本量不够答案: 1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第二章定量数据的统计描述1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是()A.中位数B. 几何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相比,其特点是()A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3.将一组计量资料整理成频数表的主要目的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4.6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A.均数B. 几何均数C. 中位数D. 百分位数E. 倒数的均数5.变异系数主要用于()A.比较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的大小6. 对于正态或近似正态分布的资料,描述其变异程度应选用的指标是( )A. 变异系数B. 离均差平方和C. 极差D. 四分位数间距E. 标准差7. 已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用( )A .全距B .标准差C .变异系数D .方差E .四分位数间距8. 一组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较小B. 数值离散度较大C. 数值分布偏向较大一侧D. 数值分布偏向较小一侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是( )A. 均数与中位数相同B. 均数大于中位数C. 均数小于中位数D. 两者有一定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与方差相比,其主要特点是( )A. 标准差小于方差B. 标准差大于方差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答 案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的面积为( )A .50% B.95% C. 97.5% D.99% E.不能确定(与标准差的大小有关)2. 标准正态分布的形态参数和位置参数分别为( )A .0,1B. 1,0C.S ,X3. 正态分布的均数、中位数和几何均数之间的关系为( ) A. 均数与几何均数相等 B. 均数与中位数相等 C. 中位数与几何均数相等D. 均数、中位数、几何均数均不相等E. 均数、中位数、几何均数均相等D. ο,μμ,ο E.4.正常成年男子的红细胞计数近似服从正态分布,已知X =4.78⨯1012/L,S=0.38⨯1012/L,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为()A.高于4.78⨯1012/L的成年男子占97.98%B.低于4.78⨯1012/L的成年男子占97.98%C.高于4.00⨯1012/L的成年男子占97.98%D.低于4.00⨯1012/L的成年男子占97.98%E.在4.00⨯1012/L 至4.78⨯1012/L的成年男子占97.98%5.某项指标95%医学参考值范围表示的是()A.在此范围“异常”的概率大于或等于95%B.在此范围“正常”的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围E.在人群中检测指标有5%的可能超出此范围6.确定某项指标的医学参考值范围时,“正常人”指的是()A.从未患过疾病的人B. 患过疾病但不影响研究指标的人C.排除了患过某种疾病的人E. 健康状况良好的人D.排除了影响研究指标的疾7.确定某项指标的医学参考值范围时,“正常人”指的是()A.从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人8.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是()A.用均数来评价B. 用中位数来评价C. 用几何均数来评价D. 用变异系数来评价E. 用参考值范围来评价9.应用百分位数法估计参考值范围的条件是()A.数据服从正态分布B.数据服从偏态分布C.有大样本数据D.数据服从对称分布E.数据变异不能太大10.某市1974年238名居民的发汞含量(μmol/kg)如下,则该地居民发汞值的95%医学参考值范围是()发汞值(μmol/kg)15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 人数20 66 60 48 18 16 6 1 0 3A.<P95B.>P5C.(P2.5,P97.5) D.X ± 1.96S 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A E.X ± 1.96S 病或因素的人B. D. 计算标 较 是( ) 第四章定性数据的统计描述1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况 是( )A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成比增加2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为( )A. 乙肝易感人数B. 平均人口数C. 乙肝疫苗接种人数D. 乙肝患者人数E. 乙肝疫苗接种后的阳转人数3. 计算标准化死亡率的目的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较D. 消除各地区内部构成不同的影响E. 便于进行不同时间死亡率的比较4. 已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡女 性居民多,而乙乡男性居多,适当的比较方法是( )A. 两个率直接比较C. 直接对感染人数进行比 E. 不具备可比性 两个率间接比较 准化率比较5. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其 原因最有可能是( )A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的人口健康水平高D. 甲县的老年人口在总人口中所占比例更小E. 甲县的老年人口在总人6. 相对危险度RR 的计算方法 A. 两个标准化率之比B. 两种不同疾病的发病人数之比C. 两种不同疾病患病率之比D. 两种不同疾病的发病率之比E. 两种不同条件下某疾病发生的概率之比7. 比数比OR 值表示的是( )A. 两个标准化率的差别大小B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发生的危险性程度口中所占比例更大8.计算患病率时的平均人口数的计算方法是()A.年初人口数和年末人口数的平均值B. 全年年初的人口数C. 全年年末人口数D. 生活满一年的总人口数E. 生活至少在半年以上的总人口数9.死因构成比反映的是()A.各种疾病发生的严重程度B. 疾病发生的主要原因C. 疾病在人群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险大小10.患病率与发病率的区别是()A.患病率高于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作用是()A.便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论文篇幅D. 容易进行统计描述和推断E. 代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是()A.线图B.直条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数线图B.线图C.直条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是()A.复式条图B. 复式线图C. 散点图D. 直方图E. 箱式图5.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适用于表示构成比关系的是()A.直方图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7.有些资料构成统计表时,下列哪一项可以省略()A.标题B. 标目C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A.圆图B. 百分条图C. 线图D. 半对数线图E. 直方图9.描述某现象频数分布情况可选择()A.圆图B. 百分条图C. 箱式图D. 误差条图E. 直方图10.对比某种清热解毒药物和对照药物的疗效,其单项指标为口渴、身痛、头痛、咳嗽、流涕、鼻塞、咽痛和发热的有效率,应选用的统计图是()A.圆图B. 百分条图C. 箱式图D. 复式条图E. 直方图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1.样本均数的标准误越小说明()A.观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3.要减少抽样误差,通常的做法是()A.减少系统误差B. 将个体变异控制在一定范围内C. 减小标准差D. 控制偏倚E. 适当增加样本含量4.对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为()A.正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%6. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其 含义是( )A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年人血清胆固醇均数的95%可信区间是( )A. 3.64±1.96⨯1.20 C. 3.64 ± 1.96 ⨯0 / E. 3.64±2.58⨯1.208. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为小概率9. 假设检验差别有统计学意义时,P 值越小,说明( )A. 样本均数差别越大B. 总体均数差别越大C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法( )A. 检验水准必须设为0.05B. 必须采用双侧检验C. 必须根据样本大小选择检验水准D. 必须建立无效假设E. 要说明无效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C D第七章 t 检验1. 两样本均数之差的标准误反映的是( )A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度B. 3.64±1.202005 . B6. E7. C8. D9. D 10.2.两样本均数比较,检验结果P 0.05 说明()A.两总体均数的差别较小B. 两总体均数的差别较大C. 支持两总体无差别的结论D. 不支持两总体有差别的结论E. 可以确认两总体无差别3.由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指()A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别4.两样本均数比较,差别具有统计学意义时,P值越小说明()A.两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是()A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的无效假设错误E. 可能出现的备择假设错误6.减少假设检验的Ⅱ类错误,应该使用的方法是()A.减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提高检验界值E. 增加样本含量7.以下不能用配对检验方法的是()A.比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E.比较15名受试者针刺檀中穴前后的痛阈值8.两独立样本均数t 检验,其前提条件是()A.两总体均数相等B. 两总体均数不等C. 两总体方差相等D. 两总体方差不等E. 两总体均数和两总体方差都相等9.若将配对设计的数据进行两独立样本均数t 检验,容易出现的问题是()A.增加出现I类错误的概率B. 增加出现II类错误的概率C. 检验结果的P值不准D. 方差齐性检验的结果不准E. 不满足t 检验的应用条件1 210. 两组定量资料比较,当方差不齐时,应该使用的检验方法是( )A. 配对 t 检验B. Satterthwaite t′ 检验C. 两独立样本均数t 检验D. 方差齐性检验E. z 检验答 案 1. E 2. D 3. E 4. D第八章方差分析1. 方差分析的基本思想是( )A .组间均方大于组内均方B .组内均方大于组间均方C .不同来源的方差必须相等D .两方差之比服从F 分布E .总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是 A. 各比较组相应的样本方 C. 组内方差=组间方差 D. 总方差=各组方差之和 E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是( )A. 随机测量误差大小B. 某因素效应大小C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t 检验的关系是()A. t 检验结果更准确B. 方差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5. 多组均数比较的方差分析,如果 P < 0.05 ,则应该进一步做的是()A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK- q 检验E .确定单独效应6. A .各样本均数全相等 B .各样本均数全不相等 C .至少有两个样本均数不等 D .至少有两个总体均数不等 E .各总体均数全相等7. 完全随机设计资料的多个样本均数的比较,若处理无作用,则方差分析的F 值在理 论上应接近于( )A . F α (ϖ ,ϖ ) B. SS 处理 / SS 误差C. 0D. 1E. 任意值C 9. B 10. B5. C6. E7. C8.方差齐性,它是指( ) 组相应的总体方差相差相等 B. 各比较等0.01,30.01,1 ζ > ζ 8. 对于多个方差的齐性检验,若P < α,可认为( )A .多个样本方差全不相等B .多个总体方差全不相等C .多个样本方差不全相等D .多个总体方差不全相等E .多个总体方差相等9. 析因设计的方差分析中,两因素X 与Y 具有交互作用指的是( )A .X 和Y 的主效应相互影响B .X 与Y 对观察指标的影响相差较大C .X 与Y 有叠加作用D .X 对观察指标的作用受Y 水平的影响E .X 与Y 的联合作用较大10. 多组均数比较的方差分析,如果 P < 0.05 ,则应该进一步做的是()A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK- q 检验E .确定单独效应答案: 1. E 2. B 3. C 4. E 5. D 6. D 7. D 8. D 9. D 10. C第八章ζ2 检验1. 两样本率比较,差别有统计学意义时,P 值越小说明( ) A. 两样本率差别越大 B. 两总体率差别越大 C. 越有理由认为两样本率不同 D. 越有理由认为两总体率不同E. 越有理由认为两样本率相同2. 欲比较两组阳性反应率, 在样本量非常小的情况下(如n 1 < 10, n 2 < 10 ), 应采用的假 设检验方法是( )A. 四格表χ2检验B. 校正四格表χ2检验C. Fisher 确切概率法D. 配对χ2检验E. 校正配对χ2检验3. 进行四组样本率比较的χ2检验,如 ζ 2> ζ2,可认为( )A. 四组样本率均不相同B. 四组总体率均不相同C. 四组样本率相差较大D. 至少有两组样本率不相同E. 至少有两组总体率不相同4. 从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文 ζ 2> ζ 2,乙文2 20.05,1 ,可认为()A. 两文结果有矛盾B. 两文结果完全相同C. 甲文结果更为可信D. 乙文结果更为可信E. 甲文说明总体的差异较大5.两组有效率比较的检验功效相关因素是()A.检验水准和样本率B. 总体率差别和样本含量C. 样本含量和样本率D. 总体率差别和理论频数E. 容许误差和检验水准6.通常分析四格表需用连续性校正χ2检验的情况是()A. T< 5B. T < 1 或n < 40C. T< 5且n < 40D. 1≤T< 5且n > 40E. T< 5或n < 407.当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是()A.增大B. 减小C. 不变D. 不确定E. 随该格实际频数的增加而增减8.对四种药物进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较,用Bonferroni方法校正后的检验水准应该是()A. 0.017B. 0.008C. 0.025D. 0.005E. 0.0139.对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较(多个实验组与对照组比较),用Bonferroni方法校正后的检验水准应该是()A. 0.050B. 0.010C. 0.025D. 0.005E. 0.01710.利用χ2检验公式不适合解决的实际问题是()A.比较两种药物的有效率B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效D. 药物三种不同剂量显效率有无差别E. 两组病情“轻、中、重”的构成比例答案: 1. D 2. C 3. E 4. C 5. B 6. D 7. C 8. B 9. E 10. C第九章非参数检验1.对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是()A.适用范围广B. 检验效能高C.检验结果更准确 D. 充分利用资料信息E. 不易出现假阴性错误2.对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是()A.增加Ⅰ类错误B. 增加Ⅱ类错误C. 减少Ⅰ类错误D. 减少Ⅱ类错误E. 两类错误都增加3.两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A.两总体的差别越大B. 两总体的差别越小C. 两样本的差别可能越大D. 越有理由说明两总体有差别E. 越有理由说明两总体无差别4.多个计量资料的比较,当分布类型未知时,应选择的统计方法是()A.方差分析B. Wilcoxon T检验C. Kruskal-Wallis H检验D. u检验E. 列联表χ2检验5.两组数据的秩和检验和t检验相比,其优点是()A.计算简便B. 检验假设合理C. 检验效能高D. 抽样误差更小E. 对数据分布不做限制6.两样本比较的秩和检验,其A.例数较小的秩和C. 较小的秩和D. 较大的秩和E. 任意一组数据的秩和7.两样本比较的秩和检验,其无效假设是()A.两样本有相同的秩和B. 两总体有相同的秩和C. 两样本分布相同D. 两总体分布相同E. 两总体分布的位置相同8.两样本比较的Wilcoxon秩和检验结果为P值小于0.05,判断孰优孰劣的根据是()A.比较两样本的秩和大小B. P值大小C. 检验统计量T值大小D. 两样本秩和的差别大小E. 比较两样本平均秩(Mean Rank)的大小9.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是A. Wilcoxon秩和检验B. 2⨯ 4 列联表χ2检验C. 四格表χ2检验E. 计算标准化率D. Fisher确切概率法)检验统计量T是(B. 例数较大的秩和10.两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2 对应的秩次是()A. 0.2B. 1.0C. 5.0D. 2.5E. 3.0答案 1. A 2. B 3. D 4. C 5. E 6. A 7. E 8. E 9. A 10. E第十章线性相关与回归1.两数值变量相关关系越强,对应的是()A.相关系数越大B. 相关系数的绝对值越大B.回归系数越大C. 回归系数的绝对值越大E. 相关系数检验统计量的t值越大2.回归分析的决定系数R2 越接近于1,说明()A.相关系数越大B. 回归方程的显著程度越高C. 应变量的变异越大D. 应变量的变异越小E. 自变量对应变量的影响越大3.对两变量X和Y作简单线性相关分析,要求的条件是()A. X和Y服从双变量正态分布B. X服从正态分布C. Y服从正态分布D. X和Y有回归关系E. X和Y至少有一个服从正态分布4.两组资料作回归分析,直线回归系数b较大的一组,表示()A.相关系数r也较大较大B.假设检验的P值较小C.决定系数R2较大D.决定系数R2较小E.Y随X变化其数量关系有更大的变化5.1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为Yˆ=14 + 4X ,若将体重换成国际单位kg,则此方程()A.常数项改变B.回归系数改变C.常数项和回归系数都改变D.常数项和回归系数都不改变E.决定系数改变6.对同一资料进行线性回归与相关分析时,下列正确的情形是()A.ρ=0时,r=0 B.ρ>0时,r>0C.r>0时,b<0 D.r<0时,b<0E.ρ<0时,r>07.下列双变量中,适用于进行线性相关分析的是()A.年龄与体重B.民族与血型C.体重与体表面积D.母亲文化水平与子女智商E.工龄与患病率8.对同一资料进行线性回归与相关分析时,下列正确的情形是()A.有密切的关系B.有一定的因果关系C.相关关系密切D.存在数量依存关系E.有较强的回归关系9. 作线性相关分析时,当n=12,r=0.767,查r界值表r0.001 / 2,10 = 0.823 ,r0.002 / 2,10 = 0.795 ,= 0.750 ,则P值范围为()r0.005 / 2,10A.0.001<P<0.002 B.P<0.001C.P<0.002 D.P>0.005E.0.002<P<0.00510.通过线性回归分析(n=48),得决定系数R2=0.49,则下列说法中错误的是()A.两个变量具有回归关系B.一定有相关系数r=0.70或r= - 0.70C.假设检验的自由度ν=46 D.回归平方和大于剩余平方和E.Y的总变异有49%可以由X的变化解释答案 1. B 2. E 3. A 4. E 5. C 6. D 7. C 8. D 9. E 10. D第十一章多元线性回归1.在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是()A.节省样本B.提高分析效率C.克服共线影响D.减少异常值的影响E.减少混杂的影响2.多元线性回归分析中,反映回归平方和在应变量Y 的总离均差平方和中所占比重的统计量是()A.简单相关系数 B .复相关系数C. 偏回归系数D. 回归均方E. 决定系数R23.对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是()A.决定系数 B. 相关系数C. 偏回归平方和D. 校正决定系数E. 复相关系数4.多元线性回归分析中,反映自变量对应变量作用大小的是()A.决定系数 B. 标准化偏回归系数C. 偏回归平方和D. 校正决定系数E. 复相关系数。
第六版医学统计学答案
第六版医学统计学答案【篇一:医学统计学第二版高等教育出版社课后习题答案】例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
【医学】《医学统计学》6 Chisquare test
它通过比较两个分类变量之间的 关系,推断它们之间是否存在关 联性。
卡方检验的重要性
01
在医学研究中,卡方检验常用于分析病例对照研究、队列研究等类型 的数据,以评估不同特征或因素之间的关联性。
02
卡方检验能够提供定量的证据,帮助研究者判断变量之间的关系是否 具有统计学显著性,从而为进一步的研究提供依据。
实施步骤
根据研究目的和数据特征,选择适当的 卡方检验方法,如四格表卡方检验、配 对卡方检验等。
VS
结果解读
根据卡方检验的结果,判断不同因素与疾 病发生之间的关系是否具有统计学显著性 。同时,结合实际情境和专业知识,对结 果进行合理的解释和推断。
07
结论与展望
卡方检验在医学统计学中的地位
重要统计工具
数据收集
首先,收集所有需要的数据,确保数据的准确性和完 整性。
数据筛选
检查数据中是否存在异常值或缺失值,这些值可能影 响检验结果。
数据分类
将连续变量转换为适当的分类变量,以便进行卡方检 验。
构建期望频数
理论频数计算
根据每个类别的预期频率计算期望频 数。
期望频数的调整
根据实际频数的大小对期望频数进行 调整,以避免极端值的影响。
卡方分布的应用
利用卡方分布表来确定显著性水平,判断实际频数与期望频数的差异是否具有 统计学上的意义。
确定显著性水平
选择显著性水平
选择合适的显著性水平(如0.05或 0.01),用于判断实际频数与期望频 数的差异是否具有统计学上的显著性 。
结果解释
根据卡方检验的结果,解释实际频数 与期望频数的差异是否具有统计学上 的显著性,并据此得出相应的结论。
卡方检验的应用场景
医学统计课件人卫6版第一章绪论
变量与数据类型
变量
描述研究对象特征的量度或度量,具 有可变性。
数据类型
根据变量的性质和测量尺度,将数据 分为不同的类型,如定量数据、定性 数据和等级数据等。
参数与统计量
参数
描述总体特性的度量,通常用希腊字母表示,如均值μ、方差 σ²等。
统计量
描述样本特性的度量,通常用英文字母表示,如样本均值x、 样本方差s²等。
。
03
药物研发和临床试验
在药物研发和临床试验中ຫໍສະໝຸດ 医学统计学对试验设计、数据收集、分析和
解释起到至关重要的作用。它确保试验结果的可靠性和准确性,为新药
审批和上市提供科学依据。
02
CATALOGUE
医学统计学的基本概念
总体与样本
总体
研究对象的全体集合,具有同质 性。
样本
从总体中随机抽取的一部分研究 对象,用于推断总体的性质。
02
它通过对数据的研究,揭示现象 的内在规律,为医学研究和医疗 实践提供科学依据。
医学统计学在科学研究中的作用
实验设计和数据分析
医学统计学在实验设计中起到关键作用,通过合理的设计和样本量的计算,确保实验结果 的可靠性和准确性。同时,在数据分析阶段,医学统计学提供了一系列统计分析方法,帮 助研究者从数据中提取有意义的信息。
多元统计分析
开始发展多元统计分析方法,以处 理更复杂的数据结构。
现代的医学统计学
数据挖掘与机器学习
利用大数据和机器学习技术进行数据分析和预测。
生物信息学
结合生物信息学方法,对基因组、蛋白质组等大规模数据进行统 计分析。
可视化技术
发展出丰富的可视化技术,帮助更好地理解和解释数据。
05
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
置信半径=1.96×0.32=0.63
置信下限x -u S =23.54- 0.63 = 22.91(cm) 0.05/2 X
置信上限 x+u S =23.54+0.63 = 24.17(cm) 0.05/2 X
所以,该渔群小黄鱼总体平均体长的95%置信区间为22.91,24.17。
医学统计学
99%置信区间: 置信半径u S 0.01/2 x =2.58×0.32=0.84 置信下限x -u S 0.01/2 x =23.54- 0.84 = 22.70(cm) 置信上限 x+u S 0.01/2 x =23.54+0.84 = 24.38(cm)
表6-1 两组患者的退热天数
分组 试验组
n
x
S
32
2.9
1.9
对照组
40
5.2
2.7
解:
x1 x 2
12
n1
2 2
n2
S12 n1 S22 n2
1.92 32 2.72 40 0.5
(x1 x2 ) u /2 x1x2 (2.9 5.2) 1.96 0.5 3.3 (x1 x2 ) u /2 x1x2 (2.9 5.2) 1.96 0.5 1.3
所以,该渔群小黄鱼总体平均体长的99%置信区间为22.70,24.38。
医学统计学
置信区间定义理解
1、置信区间估计的优劣:优劣比较要从准确度和精密度 两方面来衡量。置信度(1-α)越大、区间的宽度越窄 越好。当样本容量确定后,估计范围与可靠性,即精密 度与准确度是矛盾的,要使两者皆取得改进,必须减小 试验误差或增大样本含量。
注意:若n1和n2都为大样本,则两总体均数的差数μ1-
μ2的区间估计为(
x1 x2
未知,用 S x1 x2
代替):
P (x1 x2) u /2 x1x2 1 2 (x1 x2) u /2 x1x2 1
例6.4 比较某药治疗流行性乙型脑炎的疗效,将72名流 行性乙型脑炎患者随机分为试验组和对照组,得两组的 退热天数的均数和标准差,见下表。试估计该药退热效 果的95%的置信区间。
2. 未2 知时总体均值的区间估计
医学统计学
2 已知时总体均值的区间估计
❖
x ~ N(, 2 )
,则
x
~
N(, 2 ) X
,
u检验中统计量u的
计算公式为:
u x x
x
n
P(u /2
x
u / 2 )
1
n
P(x u / 2
n
x u /2
) 1
n
2 已知时总体均值的区间估计
总体平均数 置信度为1-α的置信区间:
u0.01 2.58
x 2.58 5.58 2.58 0.1 5.58 0.129 则总体均值的9n9%置信区间为(4 5.451,5.709)
医学统计学
2 未知时总体均值的区间估计
当总体方差未知时,可用总体方差 2的无偏估 计量 S 2来代替,则:
x
x
x
S x
上式服从自由度为df的t分布。
2、置信区间的解释:置信区间是随机的而总体参数是固 定的,所以,置信区间包含总体参数的可能性为1-α。 而不能理解为置信区间是固定的,总体参数是随机的, 总体参数落在置信区间范围内的可能性为1-α。
二、正态总体方差的区间估计
设一样本x1,x2,…,xn,其服从正态分布N(μ,σ2), 现根据样本方差S2对总体方差σ2进行区间估计。
根据
得出
2
(n 1)S 2
2
~
2 (n 1)
P{(n
1)S 2
2
2
(n 1)S
2 1
2
}
1
2
2
三、两个总体平均数差数μ1-μ2的区间估计
,通常 是未知的,用 x1
x 2~N(1
2,
2)
x1 x2
x1 x2
S x1 x2
估计,所以两总体均数的差数μ1-μ2的区间估计为:
P (x1 x2) t /2Sx1x2 1 2 (x1 x2) t /2Sx1x2 1
医学统计学
第六章
参数估计
参数估计
医学统计学
❖ 点估计:直接以样本统计量作总体参数的估 计值;
❖ 区间估计:在一定概率保证下指出总体参数 的可能范围,该范围称为置信区间,给出的 概率保证称置信度或置信概率,置信区间的 下限和上限称为置信限。
一、正态总体平均数 的区间估计
1. 已2 知时总体均值的区间估计
P(x
u /2Sx
x
u
/
2
S x
)
1
医学统计学
例6.3 在某渔场小黄鱼群一次捕获中任意抽取120尾 测得体长平均数 x =23.54cm,标准差S=3.52cm, 试估计该鱼群小黄鱼总体平均体长的95%,99% 置信 区间。
解:x
=23.54,S=3.52,Sx 3.52
0.32 120
查t值表得
解:
已知 x 0.5, S 0.,08,又n 因251-α=0.90,则α=0.10, df=24,查t分布表得,t0.1/2(24)=1.711,
x t Sx
0.5 1.711
0.08 25
0.5 0.027
该药片平均片重的90%置信区间为(0.473,0.527)
❖ 注意:当样本含量n特大,即n>30,t分布趋 近于标准正态分布,所以总体方差未知的大 样本,可采用u分布进行总体平均数μ的区间 估计
故该药退热效果的95%的置信区间为[-3.3,-1.3]。
四、配对数据总体差数μd的区间估计 由 d 估计总体μd的1-α的置信区间:
P(x u / 2
n
x u / 2
) 1
n
❖ 置信半径:u /2 x ❖ 置信下限:x u / 2 x ❖ 置信上限:x u /2 x
医学统计学
95%置信区间:
x 1.96 x 1.96
n
n
99%置信区间
x 2.58 x 2.58
n
n
医学统计学
例6.1 设正态总体 N(容,0.量12 )为4的样本均值为 5.58,试求总体均值 的99%置信区间。 解: 已知 x 5.58, ,0.1,又n 因4 1-α=0.99,则α=0.01,
医学统计学
总体平均数 在置信度为1- α的置信区间:
p(t / 2 t t / 2 ) 1
p(t / 2
x
S
t / 2 )
1
x
p(x t / 2Sx x t / 2Sx ) 1
医学统计学
例6.2 在一批中药片中,随机抽取25片检查,称得平 均片重0.5g,标准差0.08g。如果已知药片的重量近 似服从正态分布,试求该药片平均片重的90%置信区 间。