医学统计学6 参数估计与假设检验

合集下载

医学统计学复习重点

医学统计学复习重点

整理分析和2.计描述4.(集合)。

1.抽样随机2.分组随机3.实验顺序随机。

称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。

系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。

参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。

②方差齐性:两样本均数比较时,要求两总体方差相等。

U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。

8、★.描述分类变量常用的指标有率、构成比、相对数。

9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。

10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。

本科《医学统计学》第6版单选题

本科《医学统计学》第6版单选题

《医学统计学》单项选择题摘自:李康,贺佳主编.医学统计学.第6版.北京:人民卫生出版社,2013第一章绪论1. 医学统计学研究的对象是()A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 有变异的医学事物E.疾病的预防与治疗2. 用样本推论总体,具有代表性的样本通常指的是()A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是()A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是()A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由操作失误引起的误差5. 系统误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是()A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差8. 统计学中所谓的总体通常指的是()A. 自然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9. 医学统计学中所谓的样本通常指的是A. 可测量的生物样品B. 统计量C. 某一变量的测量值D. 数据中有代表性的一部分E.总体中有代表性的部分观察单位10. 医学研究中抽样误差的主要来源是()A. 测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. 生物个体的变异E.样本量不够答案:1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第二章定量数据的统计描述1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是()A. 中位数B. 几何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相比,其特点是()A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3. 将一组计量资料整理成频数表的主要目的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A. 均数B. 几何均数C. 中位数D. 百分位数E. 倒数的均数5. 变异系数主要用于()A. 比较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的大小6. 对于正态或近似正态分布的资料,描述其变异程度应选用的指标是()A. 变异系数B. 离均差平方和C. 极差D. 四分位数间距E. 标准差7.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用()A.全距B.标准差C.变异系数D.方差E.四分位数间距8. 一组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较小B. 数值离散度较大C. 数值分布偏向较大一侧D. 数值分布偏向较小一侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是()A. 均数与中位数相同B. 均数大于中位数C. 均数小于中位数D. 两者有一定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与方差相比,其主要特点是()A. 标准差小于方差B. 标准差大于方差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的面积为()A.50% B.95% C. 97.5% D.99% E.不能确定(与标准差的大小有关)2. 标准正态分布的形态参数和位置参数分别为()A.0,1 B. 1,0 C. µ,σ D. σ,µ E. S,X3. 正态分布的均数、中位数和几何均数之间的关系为()A. 均数与几何均数相等B. 均数与中位数相等C. 中位数与几何均数相等D. 均数、中位数、几何均数均不相等E. 均数、中位数、几何均数均相等4.正常成年男子的红细胞计数近似服从正态分布,已知X =4.78×1012/L ,S=0.38×1012/L ,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为( )A .高于4.78×1012/L 的成年男子占97.98%B .低于4.78×1012/L 的成年男子占97.98%C .高于4.00×1012/L 的成年男子占97.98%D .低于4.00×1012/L 的成年男子占97.98%E .在4.00×1012/L 至4.78×1012/L 的成年男子占97.98%5. 某项指标95%医学参考值范围表示的是( )A. 在此范围 “异常”的概率大于或等于95%B. 在此范围 “正常”的概率大于或等于95%C. 在“异常”总体中有95%的人在此范围之外D. 在“正常”总体中有95%的人在此范围E. 在人群中检测指标有5%的可能超出此范围6. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人7. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人8. 要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是( )A. 用均数来评价B. 用中位数来评价C. 用几何均数来评价D. 用变异系数来评价E. 用参考值范围来评价9.应用百分位数法估计参考值范围的条件是( )A .数据服从正态分布B .数据服从偏态分布C .有大样本数据D .数据服从对称分布E .数据变异不能太大10.某市1974年238名居民的发汞含量(µmol/kg )如下,则该地居民发汞值的95%医学参考值范围是( )发汞值(µmol/kg )15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 人数 20 66 60 48 18 16 6 1 0 3A .<P 95B .>P 5C .(P 2.5,P 97.5)D .S X 96.1±E .S X 96.1±答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A第四章定性数据的统计描述1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是()A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成比增加2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为()A. 乙肝易感人数B. 平均人口数C. 乙肝疫苗接种人数D. 乙肝患者人数E. 乙肝疫苗接种后的阳转人数3. 计算标准化死亡率的目的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较D. 消除各地区内部构成不同的影响E. 便于进行不同时间死亡率的比较4. 已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡女性居民多,而乙乡男性居多,适当的比较方法是()A. 两个率直接比较B. 两个率间接比较C. 直接对感染人数进行比较D. 计算标准化率比较E. 不具备可比性5. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其原因最有可能是()A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的人口健康水平高D. 甲县的老年人口在总人口中所占比例更小E. 甲县的老年人口在总人口中所占比例更大6. 相对危险度RR的计算方法是()A. 两个标准化率之比B. 两种不同疾病的发病人数之比C. 两种不同疾病患病率之比D. 两种不同疾病的发病率之比E. 两种不同条件下某疾病发生的概率之比7. 比数比OR值表示的是()A. 两个标准化率的差别大小B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发生的危险性程度8. 计算患病率时的平均人口数的计算方法是()A. 年初人口数和年末人口数的平均值B. 全年年初的人口数C. 全年年末人口数D. 生活满一年的总人口数E. 生活至少在半年以上的总人口数9. 死因构成比反映的是()A. 各种疾病发生的严重程度B. 疾病发生的主要原因C. 疾病在人群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险大小10. 患病率与发病率的区别是()A. 患病率高于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作用是()A. 便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论文篇幅D. 容易进行统计描述和推断E. 代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是()A.线图B.直条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数线图B.线图C.直条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是()A. 复式条图B. 复式线图C. 散点图D. 直方图E. 箱式图5. 研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A. 直方图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适用于表示构成比关系的是()A. 直方图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7. 有些资料构成统计表时,下列哪一项可以省略()A. 标题B. 标目C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A. 圆图B. 百分条图C. 线图D. 半对数线图E. 直方图9.描述某现象频数分布情况可选择()A. 圆图B. 百分条图C. 箱式图D. 误差条图E. 直方图10.对比某种清热解毒药物和对照药物的疗效,其单项指标为口渴、身痛、头痛、咳嗽、流涕、鼻塞、咽痛和发热的有效率,应选用的统计图是()A. 圆图B. 百分条图C. 箱式图D. 复式条图E. 直方图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1. 样本均数的标准误越小说明()A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 要减少抽样误差,通常的做法是()A. 减少系统误差B. 将个体变异控制在一定范围内C. 减小标准差D. 控制偏倚E. 适当增加样本含量4. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为()A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5. 用某种中成药治疗高血压患者100名,总有效率为80.2%,标准误为0.038,则总有效率的95%可信区间估计为()A. 0.082±1.64×0.083B. 0.082±1.96×0.083C. 0.082±2.58×0.083D. > (0.082-1.64×0.083)E. <(0.082+1.64×0.083)6. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是( )A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年人血清胆固醇均数的95%可信区间是( )A. 3.64±1.96×1.20B. 3.64±1.20C. 200/20.196.164.3×±D. 200/20.158.264.3×±E. 3.64±2.58×1.208. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为小概率9. 假设检验差别有统计学意义时,P 值越小,说明( )A. 样本均数差别越大B. 总体均数差别越大C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法( )A. 检验水准必须设为0.05B. 必须采用双侧检验C. 必须根据样本大小选择检验水准D. 必须建立无效假设E. 要说明无效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C 5. B 6. E 7. C 8. D 9. D 10. D第七章 t 检验1. 两样本均数之差的标准误反映的是( )A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度2. 两样本均数比较,检验结果05.0>P 说明( )A. 两总体均数的差别较小B. 两总体均数的差别较大C. 支持两总体无差别的结论D. 不支持两总体有差别的结论E. 可以确认两总体无差别3. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指( )A. 两样本均数的差别具有实际意义B. 两总体均数的差别具有实际意义C. 两样本和两总体均数的差别都具有实际意义D. 有理由认为两样本均数有差别E. 有理由认为两总体均数有差别4. 两样本均数比较,差别具有统计学意义时,P 值越小说明( )A. 两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是( )A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的无效假设错误E. 可能出现的备择假设错误6. 减少假设检验的Ⅱ类错误,应该使用的方法是( )A. 减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提高检验界值E. 增加样本含量7. 以下不能用配对检验方法的是( )A. 比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B. 比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C. 比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D. 比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E. 比较15名受试者针刺檀中穴前后的痛阈值8. 两独立样本均数 t 检验,其前提条件是( )A. 两总体均数相等B. 两总体均数不等C. 两总体方差相等D. 两总体方差不等E. 两总体均数和两总体方差都相等9. 若将配对设计的数据进行两独立样本均数 t 检验,容易出现的问题是( )A. 增加出现I 类错误的概率B. 增加出现II 类错误的概率C. 检验结果的P 值不准D. 方差齐性检验的结果不准E. 不满足t 检验的应用条件10.两组定量资料比较,当方差不齐时,应该使用的检验方法是( )A. 配对 t 检验B. Satterthwaite t ′ 检验C. 两独立样本均数t 检验D. 方差齐性检验E. z 检验答案 1. E 2. D 3. E 4. D 5. C 6. E 7. C 8. C 9. B 10. B第八章 方差分析1. 方差分析的基本思想是( )A .组间均方大于组内均方B .组内均方大于组间均方C .不同来源的方差必须相等D .两方差之比服从F 分布E .总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是方差齐性,它是指( )A. 各比较组相应的样本方差相等B. 各比较组相应的总体方差相等C. 组内方差=组间方差D. 总方差=各组方差之和E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是( )A. 随机测量误差大小B. 某因素效应大小C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t 检验的关系是( )A. t 检验结果更准确B. 方差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5.多组均数比较的方差分析,如果0.05P <,则应该进一步做的是( )A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK-q 检验E .确定单独效应6.完全随机设计的多个样本均数比较,经方差分析,如果0.05P <,则结论为( )A .各样本均数全相等B .各样本均数全不相等C .至少有两个样本均数不等D .至少有两个总体均数不等E .各总体均数全相等7.完全随机设计资料的多个样本均数的比较,若处理无作用,则方差分析的F 值在理论上应接近于( )A .()21,F νναB .误差处理SS SS / C. 0 D. 1 E. 任意值8.对于多个方差的齐性检验,若P < α,可认为( )A .多个样本方差全不相等B .多个总体方差全不相等C .多个样本方差不全相等D .多个总体方差不全相等E .多个总体方差相等9.析因设计的方差分析中,两因素X 与Y 具有交互作用指的是( )A .X 和Y 的主效应相互影响B .X 与Y 对观察指标的影响相差较大C .X 与Y 有叠加作用D .X 对观察指标的作用受Y 水平的影响E .X 与Y 的联合作用较大10.某职业病防治院测定了年龄相近的45名男性用力肺活量,其中石棉肺患者、石棉肺可疑患者和正常人各15名,其中用力肺活量分别为(1.79±0.74)L 、(2.31±0.87)L 和(3.08±0.65)L ,拟推断石棉肺患者、石棉肺可疑患者和正常人的用力肺活量是否不同,宜采用的假设检验方法是( )A .两组均数比较的 t 检验B .方差齐性检验C .完全随机设计方差分析D .随机区组设计方差分析E .析因设计方差分析答案: 1. E 2. B 3. C 4. E 5. D 6. D 7. D 8. D 9. D 10. C第九章 χ2 检验1. 两样本率比较,差别有统计学意义时,P 值越小说明( )A. 两样本率差别越大B. 两总体率差别越大C. 越有理由认为两样本率不同D. 越有理由认为两总体率不同E. 越有理由认为两样本率相同2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用的假设检验方法是( )A. 四格表χ2检验B. 校正四格表χ2检验C. Fisher 确切概率法D. 配对χ2检验E. 校正配对χ2检验3.进行四组样本率比较的χ2检验,如220.01,3χχ>,可认为( )A. 四组样本率均不相同B. 四组总体率均不相同C. 四组样本率相差较大D. 至少有两组样本率不相同E. 至少有两组总体率不相同4. 从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文220.01,1χχ>,乙文220.05,1χχ>,可认为( ) A. 两文结果有矛盾 B. 两文结果完全相同C. 甲文结果更为可信D. 乙文结果更为可信E. 甲文说明总体的差异较大5. 两组有效率比较的检验功效相关因素是( )A. 检验水准和样本率B. 总体率差别和样本含量C. 样本含量和样本率D. 总体率差别和理论频数E. 容许误差和检验水准6. 通常分析四格表需用连续性校正χ2检验的情况是( )A. T < 5B. T < 1或 n < 40C. T < 5且n < 40D. 1≤T< 5且n > 40E. T < 5或n < 407. 当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是( )A. 增大B. 减小C. 不变D. 不确定E. 随该格实际频数的增加而增减8. 对四种药物进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较,用Bonferroni 方法校正后的检验水准(进行了6次多重比较,校正后的检验水准为0.05/6)应该是( )A. 0.017B. 0.008C. 0.025D. 0.005E. 0.0139. 对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较(多个实验组与对照组比较),用Bonferroni 方法校正后的检验水准(进行了3次多重比较,校正后的检验水准为0.05/3)应该是( )A. 0.050B. 0.010C. 0.025D. 0.005E. 0.01710. 利用χ2检验公式不适合解决的实际问题是( )A. 比较两种药物的有效率B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效D. 药物三种不同剂量显效率有无差别E. 两组病情“轻、中、重”的构成比例答案: 1. D 2. C 3. E 4. C 5. B 6. D 7. C 8. B 9. E 10. C第十章非参数检验1.对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是()A. 适用范围广B. 检验效能高C.检验结果更准确 D. 充分利用资料信息E. 不易出现假阴性错误2. 对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是()A. 增加Ⅰ类错误B. 增加Ⅱ类错误C. 减少Ⅰ类错误D. 减少Ⅱ类错误E. 两类错误都增加3. 两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A. 两总体的差别越大B. 两总体的差别越小C. 两样本的差别可能越大D. 越有理由说明两总体有差别E. 越有理由说明两总体无差别4. 多个计量资料的比较,当分布类型未知时,应选择的统计方法是()A. 方差分析B.Wilcoxon T检验C. Kruskal-Wallis H检验D. u检验E. 列联表χ2检验5. 两组数据的秩和检验和t检验相比,其优点是()A. 计算简便B. 检验假设合理C. 检验效能高D. 抽样误差更小E. 对数据分布不做限制6. 两样本比较的秩和检验,其检验统计量T是()A. 例数较小的秩和B. 例数较大的秩和C. 较小的秩和D. 较大的秩和E. 任意一组数据的秩和7. 两样本比较的秩和检验,其无效假设是()A. 两样本有相同的秩和B. 两总体有相同的秩和C. 两样本分布相同D. 两总体分布相同E. 两总体分布的位置相同8. 两样本比较的Wilcoxon秩和检验结果为P值小于0.05,判断孰优孰劣的根据是()A. 比较两样本的秩和大小B. P值大小C. 检验统计量T值大小D. 两样本秩和的差别大小E. 比较两样本平均秩(Mean Rank)的大小9.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是A. Wilcoxon 秩和检验B. 24×列联表χ2检验C. 四格表χ2检验D. Fisher 确切概率法E. 计算标准化率10. 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次是( )A. 0.2B. 1.0C. 5.0D. 2.5E. 3.0答案 1. A 2. B 3. D 4. C 5. E 6. A 7. E 8. E 9. A 10. E第十一章 线性相关与回归1. 两数值变量相关关系越强,对应的是( )A. 相关系数越大B. 相关系数的绝对值越大B. 回归系数越大C. 回归系数的绝对值越大E. 相关系数检验统计量的t 值越大2. 回归分析的决定系数2R 越接近于1,说明( )A. 相关系数越大B. 回归方程的显著程度越高C. 应变量的变异越大D. 应变量的变异越小E. 自变量对应变量的影响越大3. 对两变量X 和Y 作简单线性相关分析,要求的条件是( )A. X 和Y 服从双变量正态分布B. X 服从正态分布C. Y 服从正态分布D. X 和Y 有回归关系E. X 和Y 至少有一个服从正态分布4. 两组资料作回归分析,直线回归系数b 较大的一组,表示( )A .相关系数r 也较大较大B .假设检验的P 值较小C .决定系数R 2较大D .决定系数R 2较小E .Y 随X 变化其数量关系有更大的变化5. 1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为ˆ144YX =+,若将体重换成国际单位kg ,则此方程( )A .常数项改变B .回归系数改变C .常数项和回归系数都改变D .常数项和回归系数都不改变E .决定系数改变6. 对同一资料进行线性回归与相关分析时,下列正确的情形是( )A .ρ=0时,r=0B .ρ>0时,r>0C .r>0时,b<0D .r<0时,b<0E .ρ<0时,r>07. 下列双变量中,适用于进行线性相关分析的是( )A .年龄与体重B .民族与血型C .体重与体表面积D .母亲文化水平与子女智商E .工龄与患病率8. 若直线回归系数的假设检验结果P<0.05,则可认为两变量间( )A .有密切的关系B .有一定的因果关系C .相关关系密切D .存在数量依存关系E .有较强的回归关系9. 作线性相关分析时,当n=12,r=0.767,查r 界值表823.010,2/001.0=r ,795.010,2/002.0=r ,750.010,2/005.0=r ,则P 值范围为( )A .0.001<P<0.002B .P<0.001C .P<0.002D .P>0.005E .0.002<P<0.00510. 通过线性回归分析(n =48),得决定系数R 2=0.49,则下列说法中错误的是( )A .两个变量具有回归关系B .一定有相关系数r=0.70或r= - 0.70C .假设检验的自由度ν=46D .回归平方和大于剩余平方和E .Y 的总变异有49%可以由X 的变化解释答案 1. B 2. E 3. A 4. E 5. C 6. D 7. C 8. D 9. E 10. D第十二章 多元线性回归1. 在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是( )A .节省样本B .提高分析效率C .克服共线影响D .减少异常值的影响E .减少混杂的影响2. 多元线性回归分析中,反映回归平方和在应变量Y 的总离均差平方和中所占比重的统计量是( )A. 简单相关系数 B .复相关系数C. 偏回归系数D. 回归均方E. 决定系数R 23. 对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是( )A .决定系数 B. 相关系数C. 偏回归平方和D. 校正决定系数E. 复相关系数。

参数的假设检验

参数的假设检验
参数的假设检验
目录
• 参数假设检验的基本概念 • 参数假设检验的类型 • 参数假设检验的实例 • 参数假设检验的注意事项 • 参数假设检验的应用领域 • 参数假设检验的发展趋势与展望
01
参数假设检验的基本概 念
参数假设检验的定义
参数假设检验是在统计推断中,根据 样本数据对总体参数是否符合某种假 设进行检验的方法。
总结词
正态性检验是检验数据是否符合正态分 布的统计方法。
VS
详细描述
正态分布的参数检验包括峰度系数、偏度 系数、直方图和P-P图等,通过这些方法 可以判断数据是否符合正态分布,从而为 后续统计分析提供依据。
方差分析的参数检验
总结词
方差分析是检验不同组别之间是否存在显著差异的统计方法 。
详细描述
方差分析通过比较不同组别之间的方差,判断它们是否具有 统计学上的显著差异。这种方法广泛应用于实验设计和数据 分析中,用于比较不同处理或不同条件下的结果差异。
做出推断
根据检验统计量的值和临界值,做出关于 假设的推断。
选择检验统计量
根据假设和数据特征,选择合适的统计量 进行检验。
计算检验统计量的值
根据样本数据和选择的统计量,计算检验 统计量的值。
确定临界值
根据统计量的性质和误差概率,确定临界 值。
02
参数假设检验的类型
单侧假设检验
总结词
只考虑参数大于或小于某个值的情况。
详细描述
在单侧假设检验中,我们只考虑参数大于或小于某个值的情况,而不需要同时考虑两个方向。例如, 在检验某药物是否有效时,我们只关心该药物是否比对照组效果好,而不关心它是否比对照组差。
双侧假设检验
总结词
同时考虑参数大于和小于某个值的情况。

参数估计和假设检验

参数估计和假设检验

参数估计和假设检验1.参数估计参数估计是指通过样本数据来推断总体参数的过程。

总体参数是指总体的其中一种性质,比如总体均值、总体方差等。

样本数据是从总体中随机抽取的一部分数据,用来代表总体。

参数估计的目标是使用样本数据来估计总体参数的值。

常见的参数估计方法有点估计和区间估计。

(1)点估计点估计是通过一个统计量来估计总体参数的值。

常见的点估计方法有样本均值、样本方差等。

点估计的特点是简单、直观,但是估计值通常是不准确的。

这是因为样本的随机性导致样本统计量有一定的误差。

因此,点估计通常会伴随着误差界限,即估计值的置信区间。

(2)区间估计区间估计是通过一个统计量构建总体参数的估计区间。

常见的区间估计方法有置信区间和可信区间。

置信区间是指当重复抽样时,包含真实总体参数的概率。

置信区间的计算方法是在样本统计量的基础上,加减一个合适的误差界限,得到一个估计区间。

可信区间是指在一次抽样中,包含真实总体参数的概率。

可信区间的计算方法同样是在样本统计量的基础上,加减一个合适的误差界限,得到一个估计区间。

参数估计的应用非常广泛,可以用于各个领域的数据分析和决策。

例如,经济学家可以通过样本数据估计失业率,政治学家可以通过样本数据估计选举结果,医学研究者可以通过样本数据估计药物的疗效等。

2.假设检验假设检验是指通过样本数据来判断总体参数的其中一种假设是否成立。

在假设检验中,我们先提出一个原假设(H0),然后使用样本数据来检验该假设的合理性。

在假设检验中,我们需要确定一个统计量,该统计量在原假设成立时,其分布是已知的。

然后,我们计算该统计量在样本数据下的取值,并通过比较该取值与已知分布的临界值,来判断原假设是否成立。

假设检验包含两种错误,即第一类错误和第二类错误。

第一类错误是指在原假设成立的情况下,拒绝原假设的错误概率。

第二类错误是指在原假设不成立的情况下,接受原假设的错误概率。

常见的假设检验方法有单样本假设检验、双样本假设检验、方差分析等。

医学统计学知识点梳理

医学统计学知识点梳理

医学统计学知识点梳理医学统计学:?是用统计学原理和方法研究生物医学问题的一门学科。

他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。

统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。

统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征:? ①参数估计:用样本的指标去推断总体相应的指标? ②假设检验:由样本的差异推断总体之间是否可能存在的差异同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。

总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

变异:在自然状态下,个体间测量结果的差异称为变异(variation)。

变异是生物医学研究领域普遍存在的现象。

严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。

(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。

计数资料亦称定性资料或分类资料。

医学统计学-假设检验

医学统计学-假设检验
差别有统计学意义,可以认为病毒性肝炎患者的转 铁蛋白含量较低。
3.4 两组资料比较的u检验
➢当随机抽样的样本例数足够大时,t检验统计 量的自由度逐渐增大,t分布逐渐逼近于标准 正态分布,可以利用近似正态分布的原理进 行u检验。
u XA XB sX A X B
XA XB sA2 nA sB2 nB
1 假设检验的基本思想
➢提出一个假设 ➢如果假设成立,得到现有样本的可能性
➢可能性很小(小概率事件),在一次试验中本不 该得到,居然得到了,说明我们的假设有问题, 拒绝之。
➢有可能得到手头的结果,故根据现有的样本无法 拒绝事先的假设(没理由)
例1
样本:随机抽查25名男炊事员的血清总胆固 醇 , 求 得 其 均 数 为 5.1mmol/L , 标 准 差为0.88mmol/L。
假设检验的基本思想:女士和奶
➢ 女士说她可以辨认出加奶和水的顺序 ➢ 事先假设:她在耍我们,每次她都在瞎猜 ➢ 现在给她对十杯牛奶做出判断 ➢ 如果她是瞎猜的,却全部正确,几率为0.510≈0.001 ➢ 0.001是小概率,认为不会发生(即10次全猜对是
不可能的) ➢ 现在试验的结果是十杯全部说对了 ➢ 故断定假设不成立

F
s12 (大) s22 (小)
~ F( ,1 , 2 )
方差齐性检验
男性组
12=?
➢除抽样误差外,该单位食堂炊事员与健康男性存 在本质上的差异:偷东西吃?。(必然的、大于 随机误差)
➢两种情况只有一个是正确的,且二者必居其 一,需要我们作出推断。
假设检验的一般步骤
➢步骤1:建立假设 ➢在假设的前提下有规律可寻
➢零假设(null hypothesis),记为H0,表示目前的 差异是由于抽样误差引起的。

《医学统计学》第6版单项选择题(附答案)

《医学统计学》第6版单项选择题(附答案)

《医学统计学》第6版单项选择题(附答案)差计学》单项选择题的部分个体 D .⽤⽅法抽取 B .在总体中随部分个体个体《医学统摘⾃:李康,贺佳主编.医学统计学.第6版.北京:⼈民卫⽣出版社,20131. 医学统计学研究的对象是()第⼀章绪论A. 医学中的⼩概率事件B. 各种类型的数据C. 动物和⼈的本质D. 有变异的医学事物E .疾病的预防与治疗2. ⽤样本推论总体,具有代表性的样本通常指的是() A .总体中最容易获得的 C .挑选总体中的有代表性 E .依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是()A .收缩压测量值B .脉搏数C .住院天数D .病情程度E .四种⾎型4. 随机误差指的是()A. 由某些固定因素引起的 C. 选择样本不当引起的误 E. 由操作失误引起的误差意抽取任意的部分个体因素引起的误差的误5. 系统误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是()A. 由某些固定因素引起C. 选择样本不当引起的误E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是() A. 随机误差 B. 系统误差 C. 过失误差D. 记录误差E .仪器故障误差起的误差总体参数间的误差误差 B. 由不可预知的偶然差 D. 选择总体不当引起的误差 B. 由操作失误引 D. 样本统计量与差8.统计学中所谓的总体通常指的是()A.⾃然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9.医学统计学中所谓的样本通常指的是A.可测量的⽣物样品B. 统计量C. 某⼀变量的测量值D. 数据中有代表性的⼀部分E.总体中有代表性的部分观察单位10.医学研究中抽样误差的主要来源是()A.测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. ⽣物个体的变异E.样本量不够答案: 1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第⼆章定量数据的统计描述1.某医学资料数据⼤的⼀端没有确定数值,描述其集中趋势适⽤的统计指标是()A.中位数B. ⼏何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相⽐,其特点是()A.不易受极端值的影响B.能充分利⽤数据的信息C.抽样误差较⼤D.更适⽤于偏态分布资料E.更适⽤于分布不明确资料3.将⼀组计量资料整理成频数表的主要⽬的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4.6⼈接种流感疫苗⼀个⽉后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选⽤的指标是A.均数B. ⼏何均数C. 中位数D. 百分位数E. 倒数的均数5.变异系数主要⽤于()A.⽐较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的⼤⼩6. 对于正态或近似正态分布的资料,描述其变异程度应选⽤的指标是()A. 变异系数B. 离均差平⽅和C. 极差D. 四分位数间距E. 标准差7. 已知动脉硬化患者载脂蛋⽩B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使⽤()A .全距B .标准差C .变异系数D .⽅差E .四分位数间距8. ⼀组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较⼩B. 数值离散度较⼤C. 数值分布偏向较⼤⼀侧D. 数值分布偏向较⼩⼀侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是()A. 均数与中位数相同B. 均数⼤于中位数C. 均数⼩于中位数D. 两者有⼀定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与⽅差相⽐,其主要特点是()A. 标准差⼩于⽅差B. 标准差⼤于⽅差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的⾯积为()A .50% B.95% C. 97.5% D.99% E.不能确定(与标准差的⼤⼩有关)2. 标准正态分布的形态参数和位置参数分别为()A .0,1B. 1,0C.S ,X3. 正态分布的均数、中位数和⼏何均数之间的关系为() A. 均数与⼏何均数相等 B. 均数与中位数相等 C. 中位数与⼏何均数相等D. 均数、中位数、⼏何均数均不相等E. 均数、中位数、⼏何均数均相等D. ο,µµ,ο E.4.正常成年男⼦的红细胞计数近似服从正态分布,已知X =4.78?1012/L,S=0.38?1012/L,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为()A.⾼于4.78?1012/L的成年男⼦占97.98%B.低于4.78?1012/L的成年男⼦占97.98%C.⾼于4.00?1012/L的成年男⼦占97.98%D.低于4.00?1012/L的成年男⼦占97.98%E.在4.00?1012/L ⾄4.78?1012/L的成年男⼦占97.98%5.某项指标95%医学参考值范围表⽰的是()A.在此范围“异常”的概率⼤于或等于95%B.在此范围“正常”的概率⼤于或等于95%C.在“异常”总体中有95%的⼈在此范围之外D.在“正常”总体中有95%的⼈在此范围E.在⼈群中检测指标有5%的可能超出此范围6.确定某项指标的医学参考值范围时,“正常⼈”指的是()A.从未患过疾病的⼈B. 患过疾病但不影响研究指标的⼈C.排除了患过某种疾病的⼈E. 健康状况良好的⼈D.排除了影响研究指标的疾7.确定某项指标的医学参考值范围时,“正常⼈”指的是()A.从未患过疾病的⼈B. 患过疾病但不影响研究指标的⼈C. 排除了患过某种疾病的⼈D. 排除了影响研究指标的疾病或因素的⼈E. 健康状况良好的⼈8.要评价某地区⼀名5岁男孩的⾝⾼是否偏⾼,其统计学⽅法是()A.⽤均数来评价B. ⽤中位数来评价C. ⽤⼏何均数来评价D. ⽤变异系数来评价E. ⽤参考值范围来评价9.应⽤百分位数法估计参考值范围的条件是()A.数据服从正态分布B.数据服从偏态分布C.有⼤样本数据D.数据服从对称分布E.数据变异不能太⼤10.某市1974年238名居民的发汞含量(µmol/kg)如下,则该地居民发汞值的95%医学参考值范围是()发汞值(µmol/kg)15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 ⼈数20 66 60 48 18 16 6 1 0 3A.P5C.(P2.5,P97.5) D.X ± 1.96S 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A E.X ± 1.96S 病或因素的⼈B. D. 计算标较是()第四章定性数据的统计描述1. 如果⼀种新的治疗⽅法能够使不能治愈的疾病得到缓解并延长⽣命,则应发⽣的情况是()A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成⽐增加2. 计算⼄肝疫苗接种后⾎清学检查的阳转率,分母为()A. ⼄肝易感⼈数B. 平均⼈⼝数C. ⼄肝疫苗接种⼈数D. ⼄肝患者⼈数E. ⼄肝疫苗接种后的阳转⼈数3. 计算标准化死亡率的⽬的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进⾏不同地区死亡率的⽐较D. 消除各地区内部构成不同的影响E. 便于进⾏不同时间死亡率的⽐较4. 已知男性的钩⾍感染率⾼于⼥性,今欲⽐较甲⼄两乡居民的钩⾍感染率,但甲乡⼥性居民多,⽽⼄乡男性居多,适当的⽐较⽅法是()A. 两个率直接⽐较C. 直接对感染⼈数进⾏⽐ E. 不具备可⽐性两个率间接⽐较准化率⽐较5. 甲县恶性肿瘤粗死亡率⽐⼄县⾼,经标准化后甲县恶性肿瘤标化死亡率⽐⼄县低,其原因最有可能是()A. 甲县的诊断⽔平⾼B. 甲县的肿瘤防治⼯作⽐⼄县好C. 甲县的⼈⼝健康⽔平⾼D. 甲县的⽼年⼈⼝在总⼈⼝中所占⽐例更⼩E. 甲县的⽼年⼈⼝在总⼈6. 相对危险度RR 的计算⽅法 A. 两个标准化率之⽐B. 两种不同疾病的发病⼈数之⽐C. 两种不同疾病患病率之⽐D. 两种不同疾病的发病率之⽐E. 两种不同条件下某疾病发⽣的概率之⽐7. ⽐数⽐OR 值表⽰的是()A. 两个标准化率的差别⼤⼩B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发⽣的危险性程度⼝中所占⽐例更⼤8.计算患病率时的平均⼈⼝数的计算⽅法是()A.年初⼈⼝数和年末⼈⼝数的平均值B. 全年年初的⼈⼝数C. 全年年末⼈⼝数D. ⽣活满⼀年的总⼈⼝数E. ⽣活⾄少在半年以上的总⼈⼝数9.死因构成⽐反映的是()A.各种疾病发⽣的严重程度B. 疾病发⽣的主要原因C. 疾病在⼈群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险⼤⼩10.患病率与发病率的区别是()A.患病率⾼于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作⽤是()A.便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论⽂篇幅D. 容易进⾏统计描述和推断E. 代替冗长的⽂字叙述和便于分析对⽐2.描述某疾病患者年龄(岁)的分布,应采⽤的统计图是()A.线图B.直条图C.百分条图D.直⽅图E.箱式图3.⾼⾎压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周⾎压的动态变化和改善情况,为了直观显⽰出两组⾎压平均变动情况,宜选⽤的统计图是()A.半对数线图B.线图C.直条图D.直⽅图E.百分条图4.研究三种不同⿇醉剂在⿇醉后的镇痛效果,采⽤计量评分法,分数呈偏态分布,⽐较终点时分数的平均⽔平及个体的变异程度,应使⽤的图形是()A.复式条图B. 复式线图C. 散点图D. 直⽅图E. 箱式图5.研究⾎清低密度脂蛋⽩LDL与载脂蛋⽩B-100的数量依存关系,应绘制的图形是()A.直⽅图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适⽤于表⽰构成⽐关系的是()A.直⽅图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7.有些资料构成统计表时,下列哪⼀项可以省略()A.标题B. 标⽬C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A.圆图B. 百分条图C. 线图D. 半对数线图E. 直⽅图9.描述某现象频数分布情况可选择()A.圆图B. 百分条图C. 箱式图D. 误差条图E. 直⽅图10.对⽐某种清热解毒药物和对照药物的疗效,其单项指标为⼝渴、⾝痛、头痛、咳嗽、流涕、⿐塞、咽痛和发热的有效率,应选⽤的统计图是()A.圆图B. 百分条图C. 箱式图D. 复式条图E. 直⽅图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1.样本均数的标准误越⼩说明()A.观察个体的变异越⼩B. 观察个体的变异越⼤C. 抽样误差越⼤D. 由样本均数估计总体均数的可靠性越⼩E. 由样本均数估计总体均数的可靠性越⼤2. 抽样误差产⽣的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3.要减少抽样误差,通常的做法是()A.减少系统误差B. 将个体变异控制在⼀定范围内C. 减⼩标准差D. 控制偏倚E. 适当增加样本含量4.对于正偏态分布的的总体, 当样本含量⾜够⼤时, 样本均数的分布近似为()A.正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5.根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L~9.1×109/L,其含义是()A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C.样本中有95%的观察值在此范围内D.该区间包含样本均数的可能性为95%E.该区间包含总体均数的可能性为95%6. 根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是()A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年⼈200名,测得其⾎清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年⼈⾎清胆固醇均数的95%可信区间是()A. 3.64±1.96?1.20 C. 3.64 ± 1.96 ?0 / E. 3.64±2.58?1.208. 假设检验的⽬的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为⼩概率9. 假设检验差别有统计学意义时,P 值越⼩,说明()A. 样本均数差别越⼤B. 总体均数差别越⼤C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法()A. 检验⽔准必须设为0.05B. 必须采⽤双侧检验C. 必须根据样本⼤⼩选择检验⽔准D. 必须建⽴⽆效假设E. 要说明⽆效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C D第七章 t 检验1. 两样本均数之差的标准误反映的是()A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度B. 3.64±1.202005 . B6. E7. C8. D9. D 10.2.两样本均数⽐较,检验结果P 0.05 说明()A.两总体均数的差别较⼩B. 两总体均数的差别较⼤C. ⽀持两总体⽆差别的结论D. 不⽀持两总体有差别的结论E. 可以确认两总体⽆差别3.由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指()A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别4.两样本均数⽐较,差别具有统计学意义时,P值越⼩说明()A.两样本均数差别越⼤B. 两总体均数差别越⼤C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是()A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的⽆效假设错误E. 可能出现的备择假设错误6.减少假设检验的Ⅱ类错误,应该使⽤的⽅法是()A.减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提⾼检验界值E. 增加样本含量7.以下不能⽤配对检验⽅法的是()A.⽐较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B.⽐较两种检测⽅法测量15名肝癌患者组织中Sirt1基因的表达量C.⽐较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D.⽐较糖尿病患者经某种药物治疗前后糖化⾎红蛋⽩的变化E.⽐较15名受试者针刺檀中⽳前后的痛阈值8.两独⽴样本均数t 检验,其前提条件是()A.两总体均数相等B. 两总体均数不等C. 两总体⽅差相等D. 两总体⽅差不等E. 两总体均数和两总体⽅差都相等9.若将配对设计的数据进⾏两独⽴样本均数t 检验,容易出现的问题是()A.增加出现I类错误的概率B. 增加出现II类错误的概率C. 检验结果的P值不准D. ⽅差齐性检验的结果不准E. 不满⾜t 检验的应⽤条件1 210. 两组定量资料⽐较,当⽅差不齐时,应该使⽤的检验⽅法是()A. 配对 t 检验B. Satterthwaite t′检验C. 两独⽴样本均数t 检验D. ⽅差齐性检验E. z 检验答案 1. E 2. D 3. E 4. D第⼋章⽅差分析1. ⽅差分析的基本思想是()A .组间均⽅⼤于组内均⽅B .组内均⽅⼤于组间均⽅C .不同来源的⽅差必须相等D .两⽅差之⽐服从F 分布E .总变异及其⾃由度可按不同来源分解2. ⽅差分析的应⽤条件之⼀是 A. 各⽐较组相应的样本⽅ C. 组内⽅差=组间⽅差 D. 总⽅差=各组⽅差之和 E. 总⽅差=组内⽅差+ 组间⽅差3. 完全随机设计⽅差分析中的组间均⽅反映的是()A. 随机测量误差⼤⼩B. 某因素效应⼤⼩C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组⽅差的平均⽔平4. 对于两组资料的⽐较,⽅差分析与t 检验的关系是()A. t 检验结果更准确B. ⽅差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5. 多组均数⽐较的⽅差分析,如果 P < 0.05 ,则应该进⼀步做的是()A .两均数的t 检验B .区组⽅差分析C .⽅差齐性检验D .SNK- q 检验E .确定单独效应6. A .各样本均数全相等 B .各样本均数全不相等 C .⾄少有两个样本均数不等 D .⾄少有两个总体均数不等 E .各总体均数全相等7. 完全随机设计资料的多个样本均数的⽐较,若处理⽆作⽤,则⽅差分析的F 值在理论上应接近于()A . F α (? ,? ) B. SS 处理 / SS 误差C. 0D. 1E. 任意值C 9. B 10. B5. C6. E7. C8.⽅差齐性,它是指()组相应的总体⽅差相差相等 B. 各⽐较等。

医学统计学第六版(马斌荣)课后习题答案教学教材

医学统计学第六版(马斌荣)课后习题答案教学教材

医学统计学第六版(马斌荣)课后习题答案第一章绪论部分一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。

2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。

统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。

统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。

4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。

5答系统误差、随机测量误差、抽样误差。

系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。

6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。

第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E二、计算与分析2第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A二、计算与分析12[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。

人卫第七版医学统计学课后答案及解析-李康、贺佳主编

人卫第七版医学统计学课后答案及解析-李康、贺佳主编

人卫第七版医学统计学课后答案李康、贺佳主编第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D11、E 12、C 13、E 14、A 15、C二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。

2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。

统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。

统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。

4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。

5答系统误差、随机测量误差、抽样误差。

系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。

第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 11、D 12、E 13、E 14、C 15、E二、计算与分析第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A11、E 12、C 13、C 14、B 15、A二、计算与分析2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。

2024 医学统计学形考作业1-4(含答案)

2024 医学统计学形考作业1-4(含答案)

医学统计学专题测验一1.名词解释总体:是指根据研究目的确定的研究对象的全体。

误差:测量值与事实真相之间的差值。

抽样研究:是指以样本特征推论总体特征的研究。

极差:又称全距,是所有观察值中最大值和最小值之差。

变异系数:是标准差与均数的比值。

2.下面有关抽样误差的叙述,正确的是( D )。

A.严格设计和严格实施的研究可以避免抽样误差B.样本量越大,抽样误差越大C.抽样误差是由于测量人员测量技术不合格导致的误差D.抽样误差与研究特征的个体差异有关3.“是否吸烟”的变量类型是( D )。

A.数值型变量资料B.多分类变量资料C.等级资料D.二分类变量资料4.下面关于样本量的陈述,正确的是( D )。

A.样本量与总体规模有关B.抽样误差与样本量无关C.样本量与应答率水平无关D.样本量需要专门的公式估计5.下面关于研究对象的陈述,错误的是( C )。

A.研究对象与研究目的有关B.研究对象可以是人,也可以是动物C.研究对象不需要来自研究总体D.研究对象是研究设计的内容6.下面有关总体的叙述,正确的是( A )。

A.总体是由根据研究目的所确定的全部研究对象B.总体与研究目的无关C.总体由样本量决定D.总体由统计分析方法决定7.下列选项中,属于数值变量的是( B )。

A.民族B.体重C.血型D.性别8.数据录入时,部分数据录入有误,误差的类型属于( B )。

A.样本与总体之差B.系统误差C.随机测量误差D.抽样误差9.统计量是( C )。

A.统计总体数据得到的量B.反映总体特征的的量C.使用样本数据计算出来的统计指标D.使用参数估计出来的10.某病房记录了50名病人的护理等级,其中特级护理1名,一级护理3名,二级护理12名,三级护理34名,此资料属于( C )。

A.分类变量资料B.二分类资料C.有序分类变量资料D.数值变量资料11.下面有关误差的叙述,错误的是(D )。

A.随机误差不可以避免B.系统误差一定要避免发生C.抽样误差包含个体差异D.因为样本含量越大,抽样误差越小,所样本含量越大越好12.某药物临床试验数据的两端均没有确定数值,描述其中心位置适用的最佳指标是( A )。

医学统计学总体均数的估计和假设检验

医学统计学总体均数的估计和假设检验

3.106
3.055
3.012 2.977 2.947 2.921 2.898 2.878 2.861 2.845 2.750 2.704 2.678 2.626
2.58
3.497
3.428
3.372 3.326 3.286 3.252 3.222 3.197 3.174 3.153 3.030 2.971 2.937 2.871 2.8070
t x
sX
统计量是t的分布就是t分布。
t分布的特征: ① 以0为中心,左右对称呈单峰分布; ② t分布是一簇曲线,分布参数为自由度υ。 ③ t分布的形状与样本例数n有关,高峰比正态分
布略低,两侧尾部翘得比正态分布略高。越大, 曲线越近正态分布,当ν=∞时,t分布即为z分布。 由于t分布是一簇曲线,为了便于应用,统计学 家编制了表4-4-1 t界值表。
3)与例数的关系不同:当样本含量足够大时,标准 差趋向稳定。而标准误随例数的增大而减小,甚至趋 向于0。若样本含量趋向于总例数,则标准误接近于0。
联系;二者均为变异指标,如果把总体中各样本均 数看成一个变量,则标准误可称为样本均数的标准差。 当样本含量不变时,均数的标准误与标准差成正比。 两者均可与均数结合运用,但描述的内容各不相同。
活量的95%的可信区间。
本例n=5, =4,t0.05,4=2.776
x t0.05sx =2.44±2.776×0.33/ 5 =2.03~2.85(L)
该地17岁女中学生肺活量均数的95%可信区间为2.03L~2.85L。
例4-4-3 由例4-2-1 101名30~49岁健康男子血清总 胆固醇 X 4.735mmol·L-1,S=0.88 mmol·L-1,求该 地健康男子血清总胆固醇值均数的95%可信区间。

统计学中的参数估计与假设检验

统计学中的参数估计与假设检验

统计学中的参数估计与假设检验统计学是一门研究如何收集、整理、分析和解释数据的学科。

参数估计和假设检验是统计学中两个重要的概念和方法,用于推断总体参数和判断假设是否成立。

本文将详细介绍参数估计与假设检验的基本原理和应用。

一、参数估计参数估计是通过样本数据推断总体的未知参数。

在统计学中,总体是指研究对象的全体,而样本是从总体中抽取的一部分。

参数是总体的特征指标,例如均值、方差、比例等。

参数估计旨在通过样本数据对总体参数进行估计,并给出估计的精度。

参数估计分为点估计和区间估计两种方法。

点估计是通过样本数据计算得到的单个数字,用来估计总体参数的具体数值。

常见的点估计方法有最大似然估计、矩估计和贝叶斯估计等。

区间估计是通过样本数据计算得到的一个范围,该范围包含总体参数真值的概率较高。

置信区间是区间估计的一种形式,它可以用来描述估计值的不确定性。

二、假设检验假设检验是用于检验研究问题的特定假设是否成立的一种统计推断方法。

在假设检验中,我们提出一个原假设和一个备择假设,并根据样本数据对两个假设进行比较,进而判断原假设是否应该被拒绝。

原假设通常表示一种无关,即不发生预期效应或差异。

备择假设则表示研究者所期望的效应或差异。

在进行假设检验时,我们首先选择一个适当的统计检验方法,例如t检验、F检验或卡方检验等。

然后,计算出样本数据的检验统计量,并根据相关的分布理论和显著性水平进行推论。

最后,比较检验统计量与临界值,以决定是否拒绝原假设。

三、参数估计与假设检验的应用参数估计和假设检验在实际问题中有广泛的应用。

以医学研究为例,研究人员可能希望通过抽样来估计某种药物的有效剂量,并对药效进行假设检验。

在市场调研中,我们可以使用参数估计和假设检验来推断总体的需求曲线和做出市场预测。

在质量控制中,我们可以利用参数估计和假设检验来判断产品是否符合标准。

四、总结参数估计和假设检验是统计学中重要的方法,可以通过样本数据来推断总体参数和判断假设是否成立。

06参数估计与假设检验(医学统计学)

06参数估计与假设检验(医学统计学)

三、总体均数的区间估计
(一) 已知
95%可信区间:
一般情况
其中 为标准正态分布的双侧界值。
(二) 未知
Confidence interval
通常未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是服从
著名的t 分布。
William Gosset
图6-1 不同自由度的 t 分布图
t分布
四、两总体均数差的区间估计
实际中,有时需要计算两个总体均数差值的可信 区间,例如通过计算两种降压药物平均降压的差 值比较两种药物的差别,其双侧 100(1 )%可信 区间的计算公式为 ( X1 X 2 ) t /2, SX1X2 其中, n1 n2 2 为自由度,SX1X2 为两样本均数之 差的标准误。
样本率来代替总体率,其估计值为:
p(1 p)
Sp
n
二、参数估计
点估计: 是使用单一的数值直接作为总体参数的估 计值,如用估计相应的,用估计相应的。该法表 达简单,但未考虑抽样误差的影响,无法评价参 数估计的准确程度。
区间估计(interval estimation)是指按预先给定的概 率,计算出一个区间,使它能够包含未知的总体 均数。事先给定的概率称为可信度,计算得到的 区间称为可信区间(confidence interval,CI)。
n
250
六、两总体率差值的区间估计
在大样本情况下,可采用正态近似法对两总体率 差值进行可信区间估计,其计算公式为:
( p1 p2 ) z S /2 )( n1
1 n2
),pc =
X1 n1
X2 n2
X1和X2分别表示两组中某事件发生的例数。
例6-7 某医院口腔科医生用极固宁治疗牙本质过 敏症,以双氟涂料作对照,进行了1年的追踪观察 ,结果见表6-1所示,试估计两组有效率差别95% 的可信区间。

6-假设检验基础

6-假设检验基础

提出假设
(例题分析)
【例】使用黑加仑油软胶囊治疗高脂血症,30 名高脂血症患者治疗前后血清甘油三酯检测 结果的差值为1.38±0.76 (g/L),问治疗后血 清甘油三酯是否有所改善?
解:研究者想收集证据予以证明的假设应该是“黑加仑 油软胶囊”治疗有效,因为如果研究者事先认为黑加仑 油软胶囊”治疗有效,他就没必要去进行检验了
1、假设检验采用的逻辑推理方法是反证法 为了检某假设是否成立,先假定它正确,然后根据样 本信息,观察由此假设而导致的结果是否合理,从而判断 是否接受原假设;
2、判断结果合理与否,是基于“小概率事件不易发 生”这一原理的
即在一次抽样中,小概率事件不可能发生。如果在原 假设下发生了小概率事件,则认为原假设是不合理的;反 之,小概率事件没有发生,则认为原假设是合理的。
第Ⅱ类错误的概率记为 (Beta)
(其值未知)
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小
你不能同时减 少两类错误!
注意:
1、犯第一类错误与犯第二类错误的概率存在此消彼长的关系;
2、若要同时减少 与 ,须增大样本容量n。 3、通常的作法是,取显著性水平较小,即控制犯第一 类错误的概率在较小的范围内;
显著性水平
(significant level)
1. 显著性水平是一个概率值,是人们事先 指定的犯第I类错误的概率的最大允许值
2. 无效假设为真时,拒绝无效假设的概率
3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
1、显著性的意义:是指这样的样本结果不是偶然得 到的,或者说,不是靠机遇能够得到的。同样,如果 检验的结果不是显著的,则表明这样的样本结果是偶 然得到的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
思考题
请列举描述定量资料的统计图,并举例 说明各类统计图的应用(例:男孩的身 高分布:直方图)
请列举描述定性资料的统计图,并举例 说明各类统计图的应用
纠错题
请指出下表存在的问题,并绘制正确的统计表
某病信息表
年份
1964 1965 1966 1967 1968 合计
病 例 存 活 住院期 急 性 住院期 急性期
10
样本均数的抽样分布具有如下特点:
① X ,各样本均数 X 未必等于总体均数;
② 各样本均数间存在差异; ③ 样本均数的分布为中间多,两边少,左右基本 对称。 ④ 样本均数的变异范围较之原变量的变异范围大 大缩小。 可算得这100个样本均数的均数为167.69cm、标准 差为1.69cm。
11
双侧概双率侧或概率双或尾双概尾概率率::用用t /2, 表表示示。。 双侧概率或双尾概率:用 t /2, 表示。
自由度
单侧 双侧
1
2 3 4 5
6 7 8 9 10
21 22 23 24 25
0.25 0.50
1.000 0.816 0.765 0.741 0.727
0.718 0.711 0.706 0.703 0.700
总体
随机抽取部分观察单位 样本
μ?
X
推断inference
μ≠ X
抽样误差(sampling error)
由于个体存在差异,因此通过样本推论总体时会 存在一定的误差,样本均数往往不等于总体均数
样本统计量与总体参数的差异。
抽样误差
若 某 市 2009 年 18 岁 男 生 身 高 服 从 均 数 μ
400 350
n 10; S X
0.1580
300
250
200
150
100
50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
n 30; S X 0.0920
案例 例6-1 在某地随机抽查成年男子140人,得红细
2016年某市男生大学生吸烟率抽样示意图
各抽样之 间的差别
率的标准误
样本率的标准差也称为率的标准误(standard error of rate),可用来描述样本率抽样误差的大 小。率的标准误越小,则率的抽样误差越小,率 的标准误越大,则率的抽样误差越大。公式为:
p
(1 )
n
率的标准误
在一般情况下,总体率往往是未知的,此时可用 样本率来代替总体率,其估计值为:
X u X 或 X u SX
32
总体均数的区间估计 (二) 未知
通常 未知,这时可以用其估计量S 代替,但
已不再服从标准正态分布,而是
服从著名的t 分布。
William Gosset
图6-1 不同自由度的 t 分布图
二、t 分布的图形与特征
t 分布只有一个参数,即自由度
t 分布是一簇曲线。当自由度ν 不同时,曲线 的形状不同。当ν 时,t 分布趋近于标准正 态分布,但当自由度ν 较小时,与标准正态分布差 异较大。其图形如下:
均数的抽样误差与标准误 统计学中为了区别个体观察值之间变异的标准差与 反映样本均数之间变异的标准差,将后者称为均数 的标准误(standard error of the mean)
衡量抽样误差的大小
标准误(standard error, SE)
表示样本统计量抽样误差大小的统计 指标。
均数标准误:说明均数抽样误差的
当n确定时,上述两者互相矛盾。 提高准确度(可信度),则精确度降低(可信区
间会变宽),势必降低可信区间的实际应用价值, 故不能笼统认为99%可信区间比95%可信区间 要好。 相反,在实际应用中,95%可信区间更为常用。
当可信度确定的情况下,增加样本含量可减小区 间宽度,提高精确度。
总体均数可信区间的计算 需考虑:
p(1 p)
Sp
n
案例
为调查某县成年人乙型肝炎表面抗原(HBsAg)的 携带情况,随机抽查了100名成年人,发现HBsAg阳性 者12人,试估计此次HBsAg阳性率调查的抽样误差大 小。
样本阳性率p=12/100=0.12
=0.0325=3.25%
此次HBsAg阳性率调查的抽样误差为3.25%
总体
6.965 4.541 3.747 3.365
1.943 1.895 1.860 1.833 1.812
2.447 2.365 2.306 2.262 2.228
3.143 2.998 2.896 2.821 2.764
1.721 1.717 1.714 1.711 1.708
2.080 2.074 2.069 2.064 2.060
区间,我们就认为该区间包含了总体均数。
可信区间的两个要素
(1)可信度:用可信度(1)表示:即区间包 含总体均数的理论概率大小 。
当然它愈接近1愈好,如99%的可信区间比95%的可 信区间要好 。
(2)精确度:即区间的宽度 区间愈窄愈好,如95%的可信区间比99%的可信区
间要好 。
28
可信区间的两个要素
(1)总体标准差是否已知, (2)样本含量n的大小
30
总体均数的区间估计 (一) 已知
95%可信区间: 其中 为标准正态分布的双侧界值。
总体均数的区间估计 总体均数双侧1 可信区间可简写为
X u 2 X 或 X u 2SX
同理,总体均数的单侧1 可信区间则为
X u X 或 X u SX
2.52.83.13.43.7 4 4.34.64.95.25.55.86.16.46.7 7 7.37.67.9
若用样本标准差S 来估计 ,
SX
S n
降低抽样误差的途径有:
①通过增加样本含量n;
②通过设计减少S。
3个抽样实验结果图示
频数 频数
频数 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
450
400
350 300
n 5; SX 0.2212
250
200
150
100
50
0 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
450 400 350 300 250 200 150 100
50 0
均数
450
0.686 0.686 0.685 0.685 0.684
0.20 0.40
1.376 1.061 0.978 0.941 0.920
0.906 0.896 0.889 0.883 0.879
0.859 0.858 0.858 0.857 0.856
0.10 0.20
3.078 1.886 1.638 1.533 1.476
f(t)
ν─>∞(标准正态曲线)
ν =5
ν =1
X
S/ n
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
图3-3 不同自由度下的t 分布图
35
t分布特征:
① 单峰分布,以 0 为中心,左右对称; ② 自由度 越小,则 t 值越分散,t 分布的峰部
越矮而尾部翘得越高; ③当 逼近, SX 逼近 X , t 分布逼近 u 分布,故标
应用
描述正态分布(近似正态 分布)资料的频数分布; 医学参考值范围的估计
样本均数的变异程度,表 总体均数区间估计;两个 示抽样误差的大小。标准 或多个总体均数间比较
误越大表示抽样误差越大, 样本均数的可靠性越小;标 准误越小表示抽样误差越小, 样本均数的可靠性越大
=167.7cm =5.3cm X1,X2,X3,Xi,
胞均数 X 4.77,标准差 S 0.38 ,试计算其标 准误。 按公式计算得:
S S 0.38 0.032(1012 / L) X n 140
标准差和标准误的区别
指标
标准差
(s)
标准误
( S X)
意义
衡量变量值离散趋势(变 异程度),s越大表示变 量值变异程度越大,s越 小表示变量值变异程度越 小
nj=10
168.20, 5.36 ┆
165.69, 5.09
100 个
2009年某市18岁男生身高N(167.7, 5.32)的抽样示意图
将此100个样本均数看成新变量值,则这100个样本 均数构成一新分布,绘制直方图。
图3-2 从正态分布总体N(167.7, 5.32)随机抽样所得样本均数分布


死亡总 期 死 总病死 病死率

亡数 率 ( % )(%)
17 9
8
7
47.1 41.2
13 8
5
4
38.5 30.8
15 8
7
6
46.7 40.0
15 9
6
6
40.0 40.0
12 8
4
4
33.3 33.3
72
42
30
27
41.7
37.5
第六章 参数估计与假设检验
=
参数估计
统 计 推 断 假设检验
准正态分布是 t 分布的特例。
36
2.参数(only one):
2t.界参值数(o表nly:one):
3.t 界值表:详见附表 2,可反映 t 分布曲下的面
t界3.值t 表界值:表详:见详见附附表表22,,可可反反映映t 分t分布布曲曲下的面积
相关文档
最新文档