(医学)医学统计学 第14章
医学统计学章节重点归纳

医学统计学章节重点归纳第一节概述1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。
2、卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。
4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国家等。
5、变异:是指客观事物的多样性和不确定性。
6、变量:观察单位的某种特征,称为变量。
a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。
7、总体:根据研究目的所确定的同质研究对象的全体。
确切的说是性质相同的所有观察单位的某种变量的集合。
8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。
9、概率:事件发生的可能性大小的量度,通常以符号P表示。
10、误差:测量值与真值之差或样本指标和总体指标之差。
分为随机误差和系统误差。
第二节数值资料的统计描述1、频数分布就是观察值在所取得范围内分布的情况。
重要特征:集中趋势和离散趋势。
2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。
3、集中趋势指标:算术平均数(均数)、几何均数、中位数。
指标使用条件计算公式算术平均数适用于正态或近似正态分布的数值变量资料几何均数①对数正态分布,即数据经过对数变换后呈正态分布的资料;②等比级数资料,即观察值之间呈倍数或近似倍数变化的资料。
中位数①非正态分布资料(对数正态分布除外);②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。
为奇数 , 为偶数,4、离散型趋势指标:极差、标准差和变异系数指标计算公式主要优缺点极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度,不稳定,受样本量影响很大。
《医学统计学》习题册.pdf

(
)
B 变异系数
2
15 可以反映个体离散程度的指标不包括
(
)
C 标准误
16 . 表示
(
)
A 总体方差
17. 一组资料的例数等于 25,均数为 20,标准差等于 5,则方差等于 (
)
B 25
18. 四分位间距的使用条件与哪个指标是一致的
(
)
A 中位数
19. 四分位间距是指
(
)
D P25-P75
二、名词解释
lg 10000 9
lg 100000 2 )
1000
30
平均抗体水平为 1:1000
4. 107 名正常人尿铅含量分布,求平均尿铅含量
尿铅 (mg/l)
例数 f
累计频数 Σ fL
累计频率 (%)
0~
14
14
13.1
4~
22
36
33.6
8~
29
65
60.7
12 ~
18
83
77.6
16 ~
15
98
91.6
2)用来结合均数计算医学参考值
3. 变异系数与标准差的联系和区别是什么?
4
联系: 变异系数与标准差都是用于正态分布资料的离散程度的指标, 除以均数后乘以 100%得到。
区别:在比较离散程度大小时,用标准差一定要满足均数相近,
变异系数可以用在以上两个条件任意一个不能满足的情况。
变异系数等于标准差 单位一致的条件。而
132.0, 141.5.0, 122.5,140.0。求平均数。
1.
X
X 125.5 126 ... 122.5 140
医学统计学习题

《医学统计学》习题集第一章绪论1.下面的变量中,属于分类变量的是(B )。
A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg 间的20人,大于70kg的17人,此种资料本属于(A )。
A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料第二章定量资料的统计描述1.欲比较身高(cm)和体重(kg)哪个指标变异程度大,应采用(D )。
A.标准差B.极差C.四分位数间距D.变异系数2.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为(B )天。
A.9B.9.5C.10D.10.2E.113.调查测定某地107名正常人尿铅含量(mg/L)如下:尿铅0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合计含量例数14 22 29 18 15 6 1 2 107 (1)描述该资料的集中趋势,宜用(B )。
A.均数B.中位数C.几何均数D.极差(2)描述该资料的离散趋势,宜用(C )。
A.极差B.变异系数C.四分位间距D.标准差第三章定性资料的统计描述1.某医院某年住院病人中胃癌患者占5%,则( B )。
A.5%是强度指标B. 5%是频率指标C. 5%是相对比指标D. 5%是绝对数2.某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为(D )。
A.该病男性易得B.该病女性易得C.该病男性、女性易患程度相等D.尚不能得出结论3.一项新的治疗方法可延长病人的生命,但不能治愈该病,则最有可能发生的情况是(A )。
A.该病的患病率增加B.该病的患病率减少C.该病的发病率增加D.该病的发病率减少4.某市有30万人口,2002年共发现2500名肺结核患者,全年总死亡人数为3000,其中肺结核死亡98人,要说明肺结核死亡的严重程度,最好应用()。
医学统计学(MedicalStatistics)

2. 分类数据(categorical) :
• 变量值表现为按某属性划分的定性类别。清点各 类别个数后得到的资料称计数资料。
• 2)多分类(无序):例:副作用(有重复选 择)
• 3.等级(有序)
• 疗效:痊愈=4、显效=3、有效=2、无效=1
例:105人心脏外科病人心理反应情况
• 心理反应 病例
• 症状
数
• 焦虑
102
• 抑郁
57
• 自我认同紊乱 10
• 恐惧
5
• 合计
174
百分比 反应发生率 (%) (%) 58.6 97.14 32.8 54.28
• 例:病情分级(X1):Ⅰ , Ⅱ,Ⅲ
• 疗效(X2):痊愈、显效、有效、无效
• 病人满意度(X3): 好、中、差
•
人数
50 25 5
数据类型及赋值
• 数据(变量)类型 变量的表现
• 1.计量变量:
血压值:12.3kap
• 2.分类(定性)
• 1)两分类: 疗效:有效=1,无效=0
•
性别:男=1,女=2
六、科研工作的步骤 根据研究的目的
1.研究 设计
设计考虑:
研究对象、 指标、例 数、如何 准确得到 数据。
2.收集 资料
来源:
3.整理 资料
目的:
1.日常工作 记录、病历。
2.专门的调 查和实验。
使资料系 统化,便 于进一步 统计分析
4.分析 资料
方法: 用统计方 法分析资 料,阐述 规律性, 得出结论。
医学统计学课后习题答案.

医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
本科《医学统计学》第6版单选题

《医学统计学》单项选择题摘自:李康,贺佳主编.医学统计学.第6版.北京:人民卫生出版社,2013第一章绪论1. 医学统计学研究的对象是()A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 有变异的医学事物E.疾病的预防与治疗2. 用样本推论总体,具有代表性的样本通常指的是()A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于有序数据的是()A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是()A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由操作失误引起的误差5. 系统误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差6. 抽样误差指的是()A. 由某些固定因素引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 样本统计量与总体参数间的误差E. 由不可预知的偶然因素引起的误差7. 收集资料不可避免的误差是()A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差8. 统计学中所谓的总体通常指的是()A. 自然界中的所有研究对象B. 概括性的研究结果C. 同质观察单位的全体D. 所有的观察数据E.具有代表性意义的数据9. 医学统计学中所谓的样本通常指的是A. 可测量的生物样品B. 统计量C. 某一变量的测量值D. 数据中有代表性的一部分E.总体中有代表性的部分观察单位10. 医学研究中抽样误差的主要来源是()A. 测量仪器不够准确B. 检测出现错误C. 统计设计不够合理D. 生物个体的变异E.样本量不够答案:1.D 2.E 3.D 4.B 5.A 6.D 7.A 8.C 9.E 10.D第二章定量数据的统计描述1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是()A. 中位数B. 几何均数C. 均数D. P95百分位数E. 频数分布2. 算术均数与中位数相比,其特点是()A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料E.更适用于分布不明确资料3. 将一组计量资料整理成频数表的主要目的是A.化为计数资料 B. 便于计算C. 提供原始数据D. 为了能够更精确地检验E. 描述数据的分布特征4. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A. 均数B. 几何均数C. 中位数D. 百分位数E. 倒数的均数5. 变异系数主要用于()A. 比较不同计量指标的变异程度B. 衡量正态分布的变异程度C. 衡量测量的准确度D. 衡量偏态分布的变异程度E. 衡量样本抽样误差的大小6. 对于正态或近似正态分布的资料,描述其变异程度应选用的指标是()A. 变异系数B. 离均差平方和C. 极差D. 四分位数间距E. 标准差7.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用()A.全距B.标准差C.变异系数D.方差E.四分位数间距8. 一组原始数据呈正偏态分布,其数据的特点是A. 数值离散度较小B. 数值离散度较大C. 数值分布偏向较大一侧D. 数值分布偏向较小一侧E. 数值分布不均匀9. 对于正偏态分布总体,其均数与中位数的关系是()A. 均数与中位数相同B. 均数大于中位数C. 均数小于中位数D. 两者有一定的数量关系E. 两者数量关系不定10. 在衡量数据的变异度时,标准差与方差相比,其主要特点是()A. 标准差小于方差B. 标准差大于方差C. 标准差更容易计算D. 标准差更为准确E. 标准差的计量单位与原始数据相同答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E第三章正态分布与医学参考值范围1. 正态曲线下,横轴上从均数到+∞的面积为()A.50% B.95% C. 97.5% D.99% E.不能确定(与标准差的大小有关)2. 标准正态分布的形态参数和位置参数分别为()A.0,1 B. 1,0 C. µ,σ D. σ,µ E. S,X3. 正态分布的均数、中位数和几何均数之间的关系为()A. 均数与几何均数相等B. 均数与中位数相等C. 中位数与几何均数相等D. 均数、中位数、几何均数均不相等E. 均数、中位数、几何均数均相等4.正常成年男子的红细胞计数近似服从正态分布,已知X =4.78×1012/L ,S=0.38×1012/L ,z=(4.00-4.78)/0.38=-2.05,1-Φ (z)= 1-Φ (-2.05)=0.9798,则理论上红细胞计数为( )A .高于4.78×1012/L 的成年男子占97.98%B .低于4.78×1012/L 的成年男子占97.98%C .高于4.00×1012/L 的成年男子占97.98%D .低于4.00×1012/L 的成年男子占97.98%E .在4.00×1012/L 至4.78×1012/L 的成年男子占97.98%5. 某项指标95%医学参考值范围表示的是( )A. 在此范围 “异常”的概率大于或等于95%B. 在此范围 “正常”的概率大于或等于95%C. 在“异常”总体中有95%的人在此范围之外D. 在“正常”总体中有95%的人在此范围E. 在人群中检测指标有5%的可能超出此范围6. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人7. 确定某项指标的医学参考值范围时,“正常人”指的是( )A. 从未患过疾病的人B. 患过疾病但不影响研究指标的人C. 排除了患过某种疾病的人D. 排除了影响研究指标的疾病或因素的人E. 健康状况良好的人8. 要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是( )A. 用均数来评价B. 用中位数来评价C. 用几何均数来评价D. 用变异系数来评价E. 用参考值范围来评价9.应用百分位数法估计参考值范围的条件是( )A .数据服从正态分布B .数据服从偏态分布C .有大样本数据D .数据服从对称分布E .数据变异不能太大10.某市1974年238名居民的发汞含量(µmol/kg )如下,则该地居民发汞值的95%医学参考值范围是( )发汞值(µmol/kg )15~ 35~ 55~ 75~ 95~ 115~ 135~ 155~ 175~ 195~215 人数 20 66 60 48 18 16 6 1 0 3A .<P 95B .>P 5C .(P 2.5,P 97.5)D .S X 96.1±E .S X 96.1±答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A第四章定性数据的统计描述1. 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是()A. 该病患病率增加B. 该病患病率减少C. 该病的发病率增加D. 该病的发病率减少E. 该疾病的死因构成比增加2. 计算乙肝疫苗接种后血清学检查的阳转率,分母为()A. 乙肝易感人数B. 平均人口数C. 乙肝疫苗接种人数D. 乙肝患者人数E. 乙肝疫苗接种后的阳转人数3. 计算标准化死亡率的目的是A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较D. 消除各地区内部构成不同的影响E. 便于进行不同时间死亡率的比较4. 已知男性的钩虫感染率高于女性,今欲比较甲乙两乡居民的钩虫感染率,但甲乡女性居民多,而乙乡男性居多,适当的比较方法是()A. 两个率直接比较B. 两个率间接比较C. 直接对感染人数进行比较D. 计算标准化率比较E. 不具备可比性5. 甲县恶性肿瘤粗死亡率比乙县高,经标准化后甲县恶性肿瘤标化死亡率比乙县低,其原因最有可能是()A. 甲县的诊断水平高B. 甲县的肿瘤防治工作比乙县好C. 甲县的人口健康水平高D. 甲县的老年人口在总人口中所占比例更小E. 甲县的老年人口在总人口中所占比例更大6. 相对危险度RR的计算方法是()A. 两个标准化率之比B. 两种不同疾病的发病人数之比C. 两种不同疾病患病率之比D. 两种不同疾病的发病率之比E. 两种不同条件下某疾病发生的概率之比7. 比数比OR值表示的是()A. 两个标准化率的差别大小B. 两种不同疾病的发病率差别程度C. 两种不同疾病患病率差别程度D. 两种不同疾病的严重程度E. 两种不同条件下某疾病发生的危险性程度8. 计算患病率时的平均人口数的计算方法是()A. 年初人口数和年末人口数的平均值B. 全年年初的人口数C. 全年年末人口数D. 生活满一年的总人口数E. 生活至少在半年以上的总人口数9. 死因构成比反映的是()A. 各种疾病发生的严重程度B. 疾病发生的主要原因C. 疾病在人群的分布情况D. 各种死因的相对重要性E. 各种疾病的死亡风险大小10. 患病率与发病率的区别是()A. 患病率高于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关答案 1. A 2. C 3. D 4. D 5. E 6. E 7. E 8. A 9. D 10. E第五章统计表与统计图1.统计表的主要作用是()A. 便于形象描述和表达结果B. 客观表达实验的原始数据C. 减少论文篇幅D. 容易进行统计描述和推断E. 代替冗长的文字叙述和便于分析对比2.描述某疾病患者年龄(岁)的分布,应采用的统计图是()A.线图B.直条图C.百分条图D.直方图E.箱式图3.高血压临床试验分为试验组和对照组,分析考虑治疗0周、2周、4周、6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数线图B.线图C.直条图D.直方图E.百分条图4.研究三种不同麻醉剂在麻醉后的镇痛效果,采用计量评分法,分数呈偏态分布,比较终点时分数的平均水平及个体的变异程度,应使用的图形是()A. 复式条图B. 复式线图C. 散点图D. 直方图E. 箱式图5. 研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A. 直方图B. 箱式图C. 线图D. 散点图E. 直条图6.下列统计图适用于表示构成比关系的是()A. 直方图B. 箱式图C. 误差条图、条图D. 散点图、线图E. 圆图、百分条图7. 有些资料构成统计表时,下列哪一项可以省略()A. 标题B. 标目C. 线条D. 数字E. 备注8.绘制下列统计图纵轴坐标刻度必须从“0”开始的有()A. 圆图B. 百分条图C. 线图D. 半对数线图E. 直方图9.描述某现象频数分布情况可选择()A. 圆图B. 百分条图C. 箱式图D. 误差条图E. 直方图10.对比某种清热解毒药物和对照药物的疗效,其单项指标为口渴、身痛、头痛、咳嗽、流涕、鼻塞、咽痛和发热的有效率,应选用的统计图是()A. 圆图B. 百分条图C. 箱式图D. 复式条图E. 直方图答案 1. E 2. D 3. B 4. E 5. D 6. E 7. E 8. E 9. E 10. D第六章参数估计与假设检验1. 样本均数的标准误越小说明()A. 观察个体的变异越小B. 观察个体的变异越大C. 抽样误差越大D. 由样本均数估计总体均数的可靠性越小E. 由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是()A. 样本不是随机抽取B. 测量不准确C. 资料不是正态分布D. 个体差异E. 统计指标选择不当3. 要减少抽样误差,通常的做法是()A. 减少系统误差B. 将个体变异控制在一定范围内C. 减小标准差D. 控制偏倚E. 适当增加样本含量4. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为()A. 正偏态分布B. 负偏态分布C. 正态分布D. t分布E. 标准正态分布5. 用某种中成药治疗高血压患者100名,总有效率为80.2%,标准误为0.038,则总有效率的95%可信区间估计为()A. 0.082±1.64×0.083B. 0.082±1.96×0.083C. 0.082±2.58×0.083D. > (0.082-1.64×0.083)E. <(0.082+1.64×0.083)6. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是( )A. 估计总体中有95%的观察值在此范围内B. 总体均数在该区间的概率为95%C. 样本中有95%的观察值在此范围内D. 该区间包含样本均数的可能性为95%E. 该区间包含总体均数的可能性为95%7. 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L ,标准差为1.20 mmol/L ,则该地正常成年人血清胆固醇均数的95%可信区间是( )A. 3.64±1.96×1.20B. 3.64±1.20C. 200/20.196.164.3×±D. 200/20.158.264.3×±E. 3.64±2.58×1.208. 假设检验的目的是A. 检验参数估计的准确度B. 检验样本统计量是否不同C. 检验样本统计量与总体参数是否不同D. 检验总体参数是否不同E. 检验样本的P 值是否为小概率9. 假设检验差别有统计学意义时,P 值越小,说明( )A. 样本均数差别越大B. 总体均数差别越大C. 认为样本之间有差别的统计学证据越充分D. 认为总体之间有差别的统计学证据越充分E. 认为总体之间有差别的统计学证据越不充分10. 关于假设检验,正确的说法( )A. 检验水准必须设为0.05B. 必须采用双侧检验C. 必须根据样本大小选择检验水准D. 必须建立无效假设E. 要说明无效假设正确,必须计算P 值答案 1. E 2. D 3. E 4. C 5. B 6. E 7. C 8. D 9. D 10. D第七章 t 检验1. 两样本均数之差的标准误反映的是( )A. 两样本数据集中趋势的差别B. 两样本数据的变异程度C. t 分布的不同形状D. 数据的分布特征E. 两样本均数之差的变异程度2. 两样本均数比较,检验结果05.0>P 说明( )A. 两总体均数的差别较小B. 两总体均数的差别较大C. 支持两总体无差别的结论D. 不支持两总体有差别的结论E. 可以确认两总体无差别3. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指( )A. 两样本均数的差别具有实际意义B. 两总体均数的差别具有实际意义C. 两样本和两总体均数的差别都具有实际意义D. 有理由认为两样本均数有差别E. 有理由认为两总体均数有差别4. 两样本均数比较,差别具有统计学意义时,P 值越小说明( )A. 两样本均数差别越大B. 两总体均数差别越大C. 越有理由认为两样本均数不同D. 越有理由认为两总体均数不同E. 越有理由认为两样本均数相同5. 假设检验中的Ⅱ类错误指的是( )A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误D. 可能出现的无效假设错误E. 可能出现的备择假设错误6. 减少假设检验的Ⅱ类错误,应该使用的方法是( )A. 减少Ⅰ类错误B. 减少测量的系统误差C. 减少测量的随机误差D. 提高检验界值E. 增加样本含量7. 以下不能用配对检验方法的是( )A. 比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B. 比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C. 比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量D. 比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E. 比较15名受试者针刺檀中穴前后的痛阈值8. 两独立样本均数 t 检验,其前提条件是( )A. 两总体均数相等B. 两总体均数不等C. 两总体方差相等D. 两总体方差不等E. 两总体均数和两总体方差都相等9. 若将配对设计的数据进行两独立样本均数 t 检验,容易出现的问题是( )A. 增加出现I 类错误的概率B. 增加出现II 类错误的概率C. 检验结果的P 值不准D. 方差齐性检验的结果不准E. 不满足t 检验的应用条件10.两组定量资料比较,当方差不齐时,应该使用的检验方法是( )A. 配对 t 检验B. Satterthwaite t ′ 检验C. 两独立样本均数t 检验D. 方差齐性检验E. z 检验答案 1. E 2. D 3. E 4. D 5. C 6. E 7. C 8. C 9. B 10. B第八章 方差分析1. 方差分析的基本思想是( )A .组间均方大于组内均方B .组内均方大于组间均方C .不同来源的方差必须相等D .两方差之比服从F 分布E .总变异及其自由度可按不同来源分解2. 方差分析的应用条件之一是方差齐性,它是指( )A. 各比较组相应的样本方差相等B. 各比较组相应的总体方差相等C. 组内方差=组间方差D. 总方差=各组方差之和E. 总方差=组内方差 + 组间方差3. 完全随机设计方差分析中的组间均方反映的是( )A. 随机测量误差大小B. 某因素效应大小C. 处理因素效应与随机误差综合结果D. 全部数据的离散度E. 各组方差的平均水平4. 对于两组资料的比较,方差分析与t 检验的关系是( )A. t 检验结果更准确B. 方差分析结果更准确C. t 检验对数据的要求更为严格D. 近似等价E. 完全等价5.多组均数比较的方差分析,如果0.05P <,则应该进一步做的是( )A .两均数的t 检验B .区组方差分析C .方差齐性检验D .SNK-q 检验E .确定单独效应6.完全随机设计的多个样本均数比较,经方差分析,如果0.05P <,则结论为( )A .各样本均数全相等B .各样本均数全不相等C .至少有两个样本均数不等D .至少有两个总体均数不等E .各总体均数全相等7.完全随机设计资料的多个样本均数的比较,若处理无作用,则方差分析的F 值在理论上应接近于( )A .()21,F νναB .误差处理SS SS / C. 0 D. 1 E. 任意值8.对于多个方差的齐性检验,若P < α,可认为( )A .多个样本方差全不相等B .多个总体方差全不相等C .多个样本方差不全相等D .多个总体方差不全相等E .多个总体方差相等9.析因设计的方差分析中,两因素X 与Y 具有交互作用指的是( )A .X 和Y 的主效应相互影响B .X 与Y 对观察指标的影响相差较大C .X 与Y 有叠加作用D .X 对观察指标的作用受Y 水平的影响E .X 与Y 的联合作用较大10.某职业病防治院测定了年龄相近的45名男性用力肺活量,其中石棉肺患者、石棉肺可疑患者和正常人各15名,其中用力肺活量分别为(1.79±0.74)L 、(2.31±0.87)L 和(3.08±0.65)L ,拟推断石棉肺患者、石棉肺可疑患者和正常人的用力肺活量是否不同,宜采用的假设检验方法是( )A .两组均数比较的 t 检验B .方差齐性检验C .完全随机设计方差分析D .随机区组设计方差分析E .析因设计方差分析答案: 1. E 2. B 3. C 4. E 5. D 6. D 7. D 8. D 9. D 10. C第九章 χ2 检验1. 两样本率比较,差别有统计学意义时,P 值越小说明( )A. 两样本率差别越大B. 两总体率差别越大C. 越有理由认为两样本率不同D. 越有理由认为两总体率不同E. 越有理由认为两样本率相同2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用的假设检验方法是( )A. 四格表χ2检验B. 校正四格表χ2检验C. Fisher 确切概率法D. 配对χ2检验E. 校正配对χ2检验3.进行四组样本率比较的χ2检验,如220.01,3χχ>,可认为( )A. 四组样本率均不相同B. 四组总体率均不相同C. 四组样本率相差较大D. 至少有两组样本率不相同E. 至少有两组总体率不相同4. 从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文220.01,1χχ>,乙文220.05,1χχ>,可认为( ) A. 两文结果有矛盾 B. 两文结果完全相同C. 甲文结果更为可信D. 乙文结果更为可信E. 甲文说明总体的差异较大5. 两组有效率比较的检验功效相关因素是( )A. 检验水准和样本率B. 总体率差别和样本含量C. 样本含量和样本率D. 总体率差别和理论频数E. 容许误差和检验水准6. 通常分析四格表需用连续性校正χ2检验的情况是( )A. T < 5B. T < 1或 n < 40C. T < 5且n < 40D. 1≤T< 5且n > 40E. T < 5或n < 407. 当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是( )A. 增大B. 减小C. 不变D. 不确定E. 随该格实际频数的增加而增减8. 对四种药物进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较,用Bonferroni 方法校正后的检验水准(进行了6次多重比较,校正后的检验水准为0.05/6)应该是( )A. 0.017B. 0.008C. 0.025D. 0.005E. 0.0139. 对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验,计算有效率,规定检验水准α=0.05,若需要进行多重比较(多个实验组与对照组比较),用Bonferroni 方法校正后的检验水准(进行了3次多重比较,校正后的检验水准为0.05/3)应该是( )A. 0.050B. 0.010C. 0.025D. 0.005E. 0.01710. 利用χ2检验公式不适合解决的实际问题是( )A. 比较两种药物的有效率B. 检验某种疾病与基因多态性的关系C. 两组有序试验结果的药物疗效D. 药物三种不同剂量显效率有无差别E. 两组病情“轻、中、重”的构成比例答案: 1. D 2. C 3. E 4. C 5. B 6. D 7. C 8. B 9. E 10. C第十章非参数检验1.对医学计量资料成组比较, 相对参数检验来说,非参数秩和检验的优点是()A. 适用范围广B. 检验效能高C.检验结果更准确 D. 充分利用资料信息E. 不易出现假阴性错误2. 对于计量资料的比较,在满足参数法条件下用非参方法分析,可能产生的结果是()A. 增加Ⅰ类错误B. 增加Ⅱ类错误C. 减少Ⅰ类错误D. 减少Ⅱ类错误E. 两类错误都增加3. 两样本比较的秩和检验,如果样本含量一定,两组秩和的差别越大说明A. 两总体的差别越大B. 两总体的差别越小C. 两样本的差别可能越大D. 越有理由说明两总体有差别E. 越有理由说明两总体无差别4. 多个计量资料的比较,当分布类型未知时,应选择的统计方法是()A. 方差分析B.Wilcoxon T检验C. Kruskal-Wallis H检验D. u检验E. 列联表χ2检验5. 两组数据的秩和检验和t检验相比,其优点是()A. 计算简便B. 检验假设合理C. 检验效能高D. 抽样误差更小E. 对数据分布不做限制6. 两样本比较的秩和检验,其检验统计量T是()A. 例数较小的秩和B. 例数较大的秩和C. 较小的秩和D. 较大的秩和E. 任意一组数据的秩和7. 两样本比较的秩和检验,其无效假设是()A. 两样本有相同的秩和B. 两总体有相同的秩和C. 两样本分布相同D. 两总体分布相同E. 两总体分布的位置相同8. 两样本比较的Wilcoxon秩和检验结果为P值小于0.05,判断孰优孰劣的根据是()A. 比较两样本的秩和大小B. P值大小C. 检验统计量T值大小D. 两样本秩和的差别大小E. 比较两样本平均秩(Mean Rank)的大小9.在一项临床试验研究中,疗效分为“痊愈、显效、有效、无效”四个等级,现欲比较试验组与对照组治疗效果有无差别,宜采用的统计方法是A. Wilcoxon 秩和检验B. 24×列联表χ2检验C. 四格表χ2检验D. Fisher 确切概率法E. 计算标准化率10. 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次是( )A. 0.2B. 1.0C. 5.0D. 2.5E. 3.0答案 1. A 2. B 3. D 4. C 5. E 6. A 7. E 8. E 9. A 10. E第十一章 线性相关与回归1. 两数值变量相关关系越强,对应的是( )A. 相关系数越大B. 相关系数的绝对值越大B. 回归系数越大C. 回归系数的绝对值越大E. 相关系数检验统计量的t 值越大2. 回归分析的决定系数2R 越接近于1,说明( )A. 相关系数越大B. 回归方程的显著程度越高C. 应变量的变异越大D. 应变量的变异越小E. 自变量对应变量的影响越大3. 对两变量X 和Y 作简单线性相关分析,要求的条件是( )A. X 和Y 服从双变量正态分布B. X 服从正态分布C. Y 服从正态分布D. X 和Y 有回归关系E. X 和Y 至少有一个服从正态分布4. 两组资料作回归分析,直线回归系数b 较大的一组,表示( )A .相关系数r 也较大较大B .假设检验的P 值较小C .决定系数R 2较大D .决定系数R 2较小E .Y 随X 变化其数量关系有更大的变化5. 1~7岁儿童可以用年龄(岁)估计体重(市斤),回归方程为ˆ144YX =+,若将体重换成国际单位kg ,则此方程( )A .常数项改变B .回归系数改变C .常数项和回归系数都改变D .常数项和回归系数都不改变E .决定系数改变6. 对同一资料进行线性回归与相关分析时,下列正确的情形是( )A .ρ=0时,r=0B .ρ>0时,r>0C .r>0时,b<0D .r<0时,b<0E .ρ<0时,r>07. 下列双变量中,适用于进行线性相关分析的是( )A .年龄与体重B .民族与血型C .体重与体表面积D .母亲文化水平与子女智商E .工龄与患病率8. 若直线回归系数的假设检验结果P<0.05,则可认为两变量间( )A .有密切的关系B .有一定的因果关系C .相关关系密切D .存在数量依存关系E .有较强的回归关系9. 作线性相关分析时,当n=12,r=0.767,查r 界值表823.010,2/001.0=r ,795.010,2/002.0=r ,750.010,2/005.0=r ,则P 值范围为( )A .0.001<P<0.002B .P<0.001C .P<0.002D .P>0.005E .0.002<P<0.00510. 通过线性回归分析(n =48),得决定系数R 2=0.49,则下列说法中错误的是( )A .两个变量具有回归关系B .一定有相关系数r=0.70或r= - 0.70C .假设检验的自由度ν=46D .回归平方和大于剩余平方和E .Y 的总变异有49%可以由X 的变化解释答案 1. B 2. E 3. A 4. E 5. C 6. D 7. C 8. D 9. E 10. D第十二章 多元线性回归1. 在疾病发生危险因素的研究中,采用多变量回归分析的主要目的是( )A .节省样本B .提高分析效率C .克服共线影响D .减少异常值的影响E .减少混杂的影响2. 多元线性回归分析中,反映回归平方和在应变量Y 的总离均差平方和中所占比重的统计量是( )A. 简单相关系数 B .复相关系数C. 偏回归系数D. 回归均方E. 决定系数R 23. 对同一资料作多变量线性回归分析,若对两个具有不同个数自变量的回归方程进行比较,应选用的指标是( )A .决定系数 B. 相关系数C. 偏回归平方和D. 校正决定系数E. 复相关系数。
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例 为研究12名高血压病人用A、B两方案疗效的差别,采用交叉设计随机地 让其中6名病人先以A法治疗,后以B法治疗;另外6名病人先B法、后A法。 记录治疗后血压的下降值(kPa),试作统计分析。
表12.1 12名病人用A、B两法治疗的血压下降值 (kPa)
– 两种处理先后作用于同一批受试对象,并且以同等 的机会出现在两个试验阶段中,故称为两阶段交叉 设计。
例 现有20例(10对)实验对象,将其按交叉设计的要求进行 A、B两种处理方式的随机分配。 受试者号 1.1 2.1 3.1 4.1 5.1 6.1 7.1 8.1 9.1 10.1
1.2 2.2 3.2 4.2 5.2 6.2 7.2 8.2 9.2 10.2 随机数字 9 3 0 2 1 5 8 6 4 7 用药顺序 AB AB BA BA AB AB BA BA BA AB
解(1)建立检验假设、确定检验水准。
H0: A= B, H1: A B, =0.05; H0: I= II, H0: 1= 2 =···= 12, H1: 各i 不全相等, =0.05
H1: I II, =0.05;
(2)计算统计量F SS总= SS个体+ SS阶段+SS处理+SS误差
二. 实验设计的4个基本原则 重复、随机、对照、均衡是实验设计的4个基本原则。 1.对照的原则 就是要设立参照物。
对照有多种方式:空白对照、安慰剂对照 、实验对照、标准对 照、自身对照。
2.随机化 的原则 就是每一个实验单位都有同等的机会被分配到任何一个组中去, 分组的结果不受人为因素的干扰和影响。
C= (X)2Biblioteka nSS总= X2 - CSS个体=
1 J
i Ti2 - C,
J:试验阶段数; Ti:第i个个体的合计,i=1,2,,I
1
SS阶段= I j Gj2 - C
Gj:第j试验阶段的合计,j=1,2,,J
SS处理=
1 I
kRk2 - C ,
Rk:第k种处理的合计,k=1,2,,K
第二节 实验设计的方法
1.完全随机设计 2.随机区组设计 3.拉丁方设计 4.交叉设计 5.析因设计 6.正交设计
一.交叉设计
• 交叉设计时可以采用下述方法来安排受试对象:
– 选取n(n为偶数)个受试对象,随机地使半数受试 者先接受A处理,后接受B处理,而另一半受试者则 正好相反,即先接受B处理再接受A处理。
阶段
病人编号
12 3 4 5 67 8 9
阶段 疗法 10 11 12 合计(Gj) 合计Rk
I B B A B A AA A B B B A
3.07 1.33 4.40 1.87 3.20 3.73 4.13 1.07 1.07 2.27 3.47 2.40 32.01 33.61 II A A B A B B B B A A A B
2.80 1.47 3.73 3.60 2.67 1.60 2.67 1.73 1.47 1.87 3.47 1.73 28.81 27.21 合计 5.87 2.80 8.13 5.47 5.87 5.33 6.80 2.80 2.54 4.14 6.94 4.13 60.82 60.82 (Ti)
BA BA AB AB BA BA AB AB AB BA
优点: 1.平衡了实验顺序的影响,避免了时间上的误差,而且能将 实验处理之间的差异和时间先后之间的差异分开; 2.获得了同一个体先后比较的好处,缩小了实验误差; 3.减少了被试的数目。
缺点: 1.至少需要增加一倍的时间,因此不适用于急性疾患; 2.要求当前一个处理停止时,没有残留效应。
例 将实验对象随机的分配到甲、乙两组。 对象编号 1 2 3 4 5 6 7 8 9 10 随机数字 6 1 5 4 0 7 8 3 9 2 所属组别 甲 乙 乙 甲 甲 乙 甲 乙 乙 甲
3.均衡的原则 就是要设法使各条件下的受试对象受到非实验因素的干扰和 影响的机会和数量基本相等。
4.重复的原则 就是实验因素各水平组合下要有足够的样本含量。
来源 个体 阶段 处理 误差 总
表12.2 交叉设计方差分析表
SS
MS
F
17.9081 11
1.6280
4.39
0.4267 1
0.4267
1.15
1.7067 1
1.7067
4.60
3.7107 10
0.3711
23.7522 23
P 0.01 < P<0.05
第十四章 实验设计
第一节 实验设计的要素和原则
一. 实验设计中的基本要素 1.实验因素(处理因素) 实验中的处理因素是根据研究目的而施加的特定实验措施。在选 择和确定处理因素时,应注意以下几个问题: (1)分清处理因素和非处理因素; (2)处理因素应当标准化。
2.实验单位(受试对象)
3.实验效应 实验效应主要指处理因素作用于实验对象的反应。 这种效应通过某些观测指标数值的大小来体现。 指标的选择应当注意以下几点: (1)选用客观性较强的指标; (2)注意指标的合理性; (3)选用灵敏度较高的指标。 (4)选用精确性较强的指标。
SS误= SS总- SS个体 -SS阶段-SS处理
数据代入计算得:
C= (60.82)2/24=154.1280 SS总= (3.072 +1.332 ++3.472 +1.732 )-154.1280
=177.8802-154.1280=23.7522 SS个体= (5.872 + 2.802 + + 6.942 + 4.132 )/2- 154.1280=17.9081 SS阶段=(32.012 + 28.812 )/12-154.1280=0.4267 SS处理=(33.612 + 27.212 )/12-154.1280=1.7067 SS误= 23.7522-17.9081-0.4267-1.7067=3.7107 总=n-1=24-1=23, 个体=I-1=12-1=11, 阶段=J-1=2-1=1, 处理=K-1=2-1=1, 误差=23-11-1-1=10