医学统计学学时的次实验要求及习题
《医学统计学》复习资料与习题答案
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 《医学统计学》复习资料与习题答案《医学统计学》复习资料与习题答案教学提要(一)《医用统计学》基本概念 1、变异:宇宙中的事物,千差万别,各不相同。
即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。
同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。
2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。
3、总体:即根据研究目的确定的同质的研究对象的全体。
更确切地说,是性质相同的所有观察单位的某种变量值的集合。
4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。
为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。
5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资1 / 9料称为计量资料,一般有度量衡等单位。
6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。
可分为二项式或多项式分类变量。
7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。
8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。
(二)统计工作的基本步骤 1、设计: 这是关键的一步。
卫生统计学第1-5次实验内容
卫生统计学第1-5次实验内容实验一统计表与统计图(一)实验目的1、掌握统计表的基本概念和列表原则;2、掌握统计图的基本概念和常用统计图的绘制方法。
(二)实验内容1、统计表常见错误的纠正。
2、常用统计图的绘制。
(三)实验资料的分析过程1.某地调查脾肿大和疟疾临床分型的关系、程度与血片查疟原虫结果列表2.试根据下表资料绘制适当统计图形。
3. 根据下表分别绘制普通线图和半对数线图,并说明两种统计图型的意义。
某地某年食管癌年龄别发病率(1/10万)年龄(岁)男女40~ 4.4 2.145~7.2 3.350~7.3 4.555~ 6.9 5.560~19.3 6.765~50.2 16.470~68.5 12.575~86.2 19.980~97.0 15.2实验二计量资料的统计描述(一)实验目的1、掌握各种平均数指标的计算及其适用条件;2、掌握离散趋势指标标准差的计算及其适用条件;3、熟悉频数表和直方图的绘制方法。
(二)实验内容1、编制大样本定量资料的频数分布表,了解资料的分布规律;2、算术均数、几何均数、中位数、极差、标准差的计算,医学参考值范围的制订。
(三)实验资料的分析过程1、某地100例30-40岁健康男子血清总胆固醇值(mg/dl )测定结果如下: 202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适; (3)计算百分位数5P 、25P 、75P 和95P 。
《医学统计学》教学大纲(医学检验)
《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。
其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。
本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。
通过实验实习,使学生加深对理论的理解。
三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。
理解:统计工作的基本步骤,医学统计学的主要内容。
了解:学习统计学的目的和要求。
《医学统计学》实习指导
内曲线下面积 C. 对于同一自由度,单侧尾部面积为 0.05 时所对应的 t 值小于双侧尾
部面积为 0.05 的所对应的 t 值 D. t 分布的标准差小于 1 (5)用大量来自同一总体的独立样本对总体参数作估计时, 关于 95%可信 区间(CI), 正确的说法是: A. 大约有 95%的样本的 CI 覆盖了总体参数 B. 对于每一个 CI 而言, 总体参数约有 95%的可能性落在其内 C. 各个样本的 CI 是相同的 D. 对于每一个 CI 而言,有 95%的可能性覆盖总体参数
6. 若正常成人血铅含量近似对数正态分布,拟用 300 名正常成人血铅值
确定 99%参考值范围, 最好采用____
A X ±2.58S
B lg-1( X lgX+2.58SlgX)
C
P99=L+
i fx
( 300 × 99 100
−
ΣfL )
D lg-1( X lgX+2.33SlgX)
作业: P326: 第 2 题、第 4 题
1. 频数表的编制
Range(max-min)
length of the interval(10-15)
set
groups
counting the numbers
Histogram
(以便观察资料的分布;容易估计集中趋势与变异性;发现异常值)
2. 描述分布的指标
1) average(平均数):the position of the distribution or
二、讨论内容
1. 抽样误差是如何产生的? 2. 正态分布的图形有何特征? 3.t 分布的图形有何特征?与正态分布有何关系? 4.制定正常值范围的方法有哪些? 如何选用?为什么有时用双侧, 有时用
医学统计学习题及答案
医学统计学习题及答案Revised at 16:25 am on June 10, 2019一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+σB.μσC.μ+σD.μ+σE.μσ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群如成年男子的某个生理指标如收缩压或生化指标如血糖水平的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.α α C.β β E.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显着性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=B.α=C.α=D.α=E.α=20.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=B.α=C.α=D.α=E.α=21.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. 1p +2p /2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=发展速度一1/100表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或1-p 不太小C. np 或n1-p 均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显着性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下;欲评价该资料的集中趋势和离散程度,最合适的指标是:───────────────────────────────────潜伏期小时 12- 24- 36- 48- 60- 72- 84- 96- 108- 合计───────────────────────────────────病例数 1 10 18 14 5 4 4 2 2 60_______________________________________________________________________A.均数和标准差B.几何均数和全距C.中位数和四分位数间距D.均数和方差E.均数和变异系数49.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,结果如下;最合适描述其集中趋势的指标是:抗体滴度: 1:8 1:16 1:32 1:64 1:128 1:256 合计例数: 2 6 5 11 4 2 30A.均数B.几何均数C.百分位数D. 中位数E.标准差50.某市1998年调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人的发汞含量,结果如下;欲估计该市居民发汞值的95%医学参考值范围,宜计算:发汞值μmol/kg~~~~~~~~人数: 20 66 80 28 18 6 2 2A. X ±B. X +C. ~D. P9551.现随机抽取调查某市区某年男孩200人出生体重,得均数为kg,标准差为kg;按95%可信度估计该市男孩出生体重均数所在范围,宜用:A. X ±B. X ±C. X ±,v S D. X ±,vSE.μ±σx52. 测定尿铅含量有甲乙两种方法;现用甲乙两法检测相同样品,结果如下;要比较两法测得的结果有无差别,宜用:10名患者的尿样分别用两法测定尿铅结果───────────────────样品号甲法乙法───────────────────12.. .. ..910──────────────────A.配对设计t检验 B.两样本均数的t检验C.两样本均数的u检验D.协方差分析E. 配对设计u检验53. 测得10名正常人和10名病毒性肝炎患者血清转铁蛋白的含量g/L,结果如下,比较患者和正常人的转铁蛋白是否有显着性差别,用:正常人病毒性肝炎患者A. 两样本均数的u检验B.样本均数与总体均数的t检验C. 两样本均数的t检验D. 配对设计t检验E. 先作方差齐性检验, 再决定检验方法54. 从9窝大鼠的每窝中选出同性别、体重相近的2只, 分别喂以水解蛋白和酪蛋白饲料,4周后测定其体重增加量,结果如下,比较两种饲料对大鼠体重的增加有无显着性影响,宜用:窝编号 1 2 3 4 5 6 7 8 9含酪蛋白饲料组 82 66 74 78 82 76 73 90 92含水解蛋白饲料组15 28 29 28 24 38 21 37 35A.单因素方差分析B.协方差分析C. 配对设计t检验D.两样本均数的t检验E. 配对设计u检验55.已知正常人乙酰胆碱酯酶活力的平均数为,现测得10例慢性气管炎患者乙酰胆碱酯酶活力分别为:,,,,,,, ,;欲比较慢性气管炎患者乙酰胆碱酯酶活力的总体均数与正常人有无显着性的差别,用:A. 两样本均数的t检验B. 配对设计t检验C. 两样本均数的u检验D. 样本均数与总体均数的t检验E. 样本均数与总体均数的u检验56. 某医院用中药治疗8例再生障碍性贫血患者,其血红蛋白g/L治疗前后变化的结果如下,治疗前后血红蛋白g/L值是否有显着性差别,可用:患者编号 1 2 3 4 5 6 7 8治疗前血红蛋白 68 65 55 75 50 70 76 65治疗后血红蛋白 128 82 80 112 125 110 85 80A. 样本均数与总体均数的t检验B. 两样本均数的t检验C. 配对设计t检验D. 两样本均数的u检验E.协方差分析57. 应用免疫酶法对鼻咽癌患者和非癌患者分别测定11人的血清病毒VCA-LOG抗体滴度,其倒数如下,比较两组患者的血清病毒的VCA-LOGA 抗体滴度倒数平均水平之间有无显着性的差别,宜用:鼻咽癌患者 5 20 40 80 80 80 160 160 320 320 640非癌患者 5 10 10 20 20 20 40 40 80 80 80A. 配对设计t检验B. 两样本均数的t检验C. 两样本几何均数的t检验方差齐时D. 两样本均数的u检验E. 样本均数与总体均数的t检验58.下表是甲、乙两医院治疗同一种疾病的情况,如比较甲、乙两医院的总治愈率有无差别,应用:───────────────────────────────────甲医院乙医院病情──────────────────────────────治疗人数治愈人数治愈率%治疗人数治愈人数治愈率%───────────────────────────────────轻 100 80 300 210重 300 180 100 50───────────────────────────────────合计 400 260 400 260───────────────────────────────────A.按病情轻重分别比较B.四格表的X2检验C.两样本率的u检验D.四格表的确切概率法E.先作率的标准化,再对标化率作假设检验59. 某研究室用甲乙两种血清学方法检查422例确诊的鼻咽癌患者,得结果如下表. 分析两种检验结果之间有无差别,检验公式是:──────────────────────────乙法甲法 ───────── 合计+ -──────────────────────────+ 261 110 371- 20 31 39──────────────────────────合计 281 141 422──────────────────────────A. c b c b x +-=22)( B.))()()(()(22d b c a d c b a n bc ad x ++++-= C. ))()()(()2/(22d b c a d c b a n n bc ad x ++++--= D.)1(22-=∑C R n n A n x E.!!!!!)!()!()!()!(n d c b a d b c a d c b a P ++++=60. 有20例急性心肌梗塞并发休克病人,分别采用西药和中西药结合的方法抢救,疗效如下,比较两组病死率有无差别,宜用治疗转归组别 合计康复 死亡西药组 6 5 11中西药组 9 0 9合计 15 5 20A.两样本率的u 检验B.四格表的X 2 检验C. 四格表的校正X 2 检验 ×2表的X 2检验E. 四格表的确切概率法61.为研究血型与胃溃疡、胃癌的关系,得下表资料,AB 型因例数少省略去,问各组血型构成差别有无统计意义,宜用:血 型 ────────── 合计 O A B ──────────────────── 胃溃疡 993 679 134 1806 胃 癌 393 416 84 893 对 照 2902 2652 570 6097 ──────────────────── 4288 3720 788 8796 ────────────────────A. 3×3表的X 2检验 ×4表的X 2检验C. 3×3列联表的X 2检验D. 4×4列联表的X 2检验E.秩和检验62.某山区小学男生80人,其中肺吸虫感染23人,感染率为%;女生85人,感染13人,感染率为%,如比较男女生的肺吸虫感染率有无差别,可用:A.两样本率的u检验B.四格表的X2 检验×2表的X2检验 D. 四格表的确切概率法E.以上方法均可63. 二种方案治疗急性无黄疸型病毒肝炎180例,结果如下;比较二组疗效有无差别,宜用:例数组别无效好转显效痊愈合计西药组 49 31 5 15 100中西药组 45 9 22 4 80合计 94 40 27 19 180A. 3×3表的X2检验B. 2×4表的X2检验C. 3×3列联表的X2检验D. 2×4列联表的X2检验E.成组设计两样本比较的秩和检验64.四种呼吸系疾病痰液内嗜酸性白细胞的含量如下;比较各组间的嗜酸性白细胞的含量有无差别,宜用:含量支气管扩张肺气肿肺癌病毒性呼吸系统感染— 0 3 5 3+ 2 5 7 5++ 9 5 3 3+++ 6 2 2 0合计 17 15 17 11A. 成组设计的方差分析B. 成组设计的多个样本的秩和检验C.配伍组设计的方差分析D.配伍组设计的多个样本的秩和检验×4表的X2检验65.三种药物治疗某病的观察结果如下.检验何种药物疗效较好,宜用:药物疗效A B C 合计治愈 15 4 1 20显效 49 9 15 73好转 31 50 45 126无效 5 22 24 51合计 100 85 85 270A. 4×3表的X2检验B. 4×3列联表的X2检验C. 5×4表的X2检验D. 5×4列联表的X2检验E. 成组设计的多个样本的秩和检验66.某地1952和1998年三种死因别死亡率如下表,将此资料绘制成统计图,宜用:某地1952和1998年三种死因别死亡率死因 1952 1998肺结核心脏病恶性肿瘤A.直条图B.百分条图C.圆图D.线图E.直方图67.图示下表资料,应选用的统计图是:某市1949~1953年15岁以下儿童结核病和白喉死亡率1/10万年份结核病死亡率白喉死亡率19491950195119521953A.条图B.百分条图C.圆图D.线图或半对数线图E.直方图68.某人测得140名一年级男性大学生第一秒肺通气量FEV1,结果如下.图示此资料宜用:FEV1 频数- 1- 3- 11- 38- 46-26- 12───────合计137──────────────A.条图B.百分条图C.圆图D.线图或半对数线图E.直方图69.我国1988年部分地区的死因构成如下表.图示此资料宜用:我国1988年部分地区的死因构成死因构成比%呼吸系病脑血管病恶性肿瘤损伤与中毒心脏疾病其它合计A.条图B.百分条图或圆图C.半对数线图D.线图E.直方图70.某地一年级10名女大学生的体重和肺活量数据如下.图示此资料宜用:编号 1 2 3 4 5 6 7 8 9 10体重kg 42 42 46 46 50 50 52 52 58 58肺活量LA.条图B.散点图C.半对数线图D.线图E.直方图71.某医院观察三种药物驱钩虫的疗效,服药后7天得粪检钩虫卵阴转率%如下,问这三种药疗效是无差别,宜用:三种药物驱钩虫的疗效比较──────────────────────────────药物治疗例数阴转例数阴转率%──────────────────────────────复方敌百虫片 37 28纯敌百虫片 38 18灭虫宁 34 10──────────────────────────────A. 3×2表的X2检验B. 3×2列联表的X2检验C. 3×3表的X2检验D. 3×3列联表的X2检验E. 4×4表的X2检验72.对15个猪肝给予某种处理,在处理前后各采一次肝外表的涂抹标本进行细菌培养,结果如下.欲比较处理前后的带菌情况有无差别,宜用:带菌情况处理合计阳性阴性前 7 8 15后 2 13 15合计 9 21 30A. 2×2表的X2检验B. 2×2列联表的X2检验C. 3×3表的X2检验D. 3×3列联表的X2检验E. 四格表的确切概率法二、辩析题;要求先判断对错,然后给出理由;例题:由于t 检验效率高于秩和检验,在做两小样本均数检验时,均应使用t检验;答:不正确;因为t 检验属参数检验,只有满足参数检验的条件才能采用t 检验;1.等级资料的比较只能采用秩和检验;2.抽样误差是不可避免的,但其大小是可以控制的;3.开口资料只要呈正态分布,也可用均数反映其集中趋势;4.统计学的假设检验是对总体特征的假设,其结论是完全正确的;5.在直线回归分析中,|b|值越大,回归线越陡;6.同一资料根据不同分析目的可采用不同的统计分析方法;7.在两个同类的研究中,A研究结果P<,B研究结果P<,就表明前者两样本均数差别大,后者两样本均数相差小;8.标准差越大,表示个体差异就越大;9.若两组计量资料的单位相同,可使用标准差来比较其变异大小,而不必考虑采用变异系数;10.当V=∞时,t分布的t值就是标准正态分布的u值;11.秩相关分析不要求两变量呈正态分布;12.在科学研究中,如实测值与真实值不一致即为误差,且这种称为抽样误差;13.在统计分析中,只要标准差大于均数,该指标的频数分布就不呈正态分布;14.在假设检验中,无论是否拒绝H0,都有可能犯错误;15.当资料分布的末端无确切数据时不能计算平均数;16.在卡方检验中,只要P<,就可认为两样本率不同;17.在样本含量确定后,个体差异越大,抽样误差越小;18.用频数表加权法计算的均数比用直接法计算的均数准确;19.普查由于没有抽样误差,结果最准确;20.不同计量单位资料的变异度比较只能用变异系数;21.理论上秩和检验可用于任何分布型资料的比较;三、名词解释1、变异:即同质的观察单位之间某项特征所存在的差异;2、总体:根据研究目的确定的同质观察单位某项变量值的集合;3、样本:从总体中随机抽取的部分观察单位某项变量值的集合组成样本;4、概率:描述随机事件发生可能性大小的数值,用P表示,0≤P≤1;5、中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值;6、变异系数:标准差S与均数X之比用百分数表示;公式是CV=S/X×100%;7、参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计;8、可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围;9、抽样误差:由于总体中存在个体变异,随机抽样所得样本仅仅是总体的一部分,从而造成样本统计量与总体参数之间的差异,称抽样误差;10、P值:指由H所规定的总体中作随机抽样,获得等于及大于或等于及小于现有样本检验统计量的概率,P的取值范围在0-1之间;11、检验效能1-β:又称把握度,即两总体确实有差别, 按α水准能发现它们有差别的能力;12、检验水准:用于判断是否拒绝H的概率标准,用α表示,一般取α=,P>α,不拒绝H0;P≤α,拒绝H;13、第一类错误:拒绝了实际上是成立的H所产生的错误,即"弃真", 其概率大小为α;14、第二类错误:接受了实际上不成立的H所产生的错误,即"存伪",其概率大小用β表示,一般β是未知的,其大小与α有关;15、假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析;16、构成比:又称构成指标;它说明一事物内部各组成部分所占的比重或分布;构成比=某一组成部分的观察单位数/同一事物各组成的观察单位总数×100%;17、率:又称频率指标;它说明某现象发生的频率或强度;率=发生某现象的观察单位数/可能发生该现象的观察单位总数×K;18、率的标准化法:采用一个共同的内部构成标准,把两个或多个样本的不同内部构成调整为共同的内部构成标准, 以消除因内部构成不同对总率产生的影响,使算得的标准化率具有可比性;19、参数统计: 在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知, 统计推断的目的就是对这些未知参数进行估计或检验;20、非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验;21、相关系数: 说明两变量间相关关系的密切程度与相关方向的指标,用r表示;22、回归系数b:即回归直线的斜率,它表示当X变动一个单位时,Y平均改变b个单位;23、偏回归系数bi: 在其它自变量保持恒定时,Xi每增减一个单位时y平均改变bi个单位;24、决定系数: 相关系数或复相关系数的平方,即r2或R2;它表明由于引入有显着性相关的自变量,使总平方和减少的部分,r2或R2越接近1, 说明引入相关变量的效果越好;25、计量资料:用定量方法对每个观察对象测定某项指标量的大小,所得的资料称为计量资料;26、计数资料: 先将观察单位按某种属性或类别分组,然后清点各组的观察单位数所得资料,称为计数资料;27、等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料;四、简答题1、统计资料可以分成几类答: 根据变量值的性质,可将统计资料分为数值变量资料计量资料,无序分类变量资料计数资料,有序分类变量资料等级资料或半定量资料;用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料;2、不同类型统计资料之间的关系如何答: 根据分析需要,各类统计资料可以互相转化;如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资料;计数资料或等级资料也可经数量化后,转化为计量资料;如性别,结果为男或女,属于计数资料,如男性用0或1,女性用1或0表示,则将计数资料转化为计量资料;3、频数分布有哪两个重要特征答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面;将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征;一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势;另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势;4、标准差有什么用途答: 标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度;两组同类资料总体或样本均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好;②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误;5、变异系数CV常用于哪几方面答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度;如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度;如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV;6、制定参考值范围有几种方法各自适用条件是什么答: 制定参考值范围常用方法有两种: ①正态分布法: 此法是根据正态分布的原理,依据公式:X±uS计算,仅适用于正态分布资料或对数正态分布资料;95%双侧参考值范围按: X±计算;95%单侧参考值范围是: 以过低为异常者,则计算: X-,过高为异常者,计算X+;若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可;②百分位数法;用~估计95%双侧参考值范围;P5或P95为95%单侧正常值范围;百分位数法适用于各种分布的资料包括分布未知,计算较简便,快速;使用条件是样本含量较大,分布趋于稳定;一般应用于偏态分布资料、分布不明资料或开口资料;7、计量资料中常用的集中趋势指标及适用条件各是什么答: 常用的描述集中趋势的指标有: 算术均数、几何均数及中位数;①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数, 适用于等比资料,对数正态分布资料;③中位数: 用M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值;它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料;8、标准差,标准误有何区别和联系答: 标准差和标准误都是变异指标,但它们之间有区别,也有联系;区别: ①概念不同;标准差是描述观察值个体值之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等;标准误常用于表示样本统计量样本均数,样本率对总体参数总体均数,总体率的波动情况,用于估计参数的可信区间,进行假设检验等;③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 ;联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同;9、统计推断包括哪几方面内容答: 统计推断包括: 参数估计及假设检验两方面;参数估计是指由样本统计量样本均数,率来估计总体参数总体均数及总体率,估计方法包括点值估计及区间估计;点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X±uσX或X±uSX来估计;假设检验是根据样本所提供的信息,推断总体参数是否相等;10、假设检验的目的和意义是什么答: 在实际研究中,一般都是抽样研究,则所得的样本统计量均数、率往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体;如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等;样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定;因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等;11、何谓假设检验其一般步骤是什么答: 所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后用。
医学统计学练习题及答案
练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
医学统计学课后习题-全
第一章:单选题(5/5 分数)1.统计学中所说的样本是指()。
.随意抽取的总体中任意部分.有意识的选择总体中的典型部分.依照研究者要求选取总体中有意义的一部分.依照随机原则抽取总体中有代表性的一部分.依照随机原则抽取总体中有代表性的一部分- 正确. 有目的的选择总体中的典型部分2.下列资料属等级资料的是()。
.白细胞计数.住院天数.门急诊就诊人数.病人的病情分级.病人的病情分级- 正确. ABO血型分类3.为了估计某年华北地区家庭年医疗费用的平均支出,从华北地区的5个城市随机抽样调查了1500户家庭,他们的平均年医疗费用支出是997元,标准差是391 元。
该研究中研究者感兴趣的总体是().华北地区1500户家庭.华北地区的5个城市.华北地区1500户家庭的年医疗费用.华北地区所有家庭的年医疗费用.华北地区所有家庭的年医疗费用- 正确. 全国所有家庭的年医疗费用4.欲了解研究人群中原发性高血压病(EH)的患病情况,某研究者调查了1043人,获得了文化程度(高中及以下、大学及以上)、高血压家族史(有、无)、月人均收入(元)、吸烟(不吸、偶尔吸、经常吸、每天)、饮酒(不饮、偶尔饮、经常饮、每天)、打鼾(不打鼾、打鼾)、脉压差(mmHg)、心率(次/分)等指标信息。
则构成计数资料的指标有().文化程度、高血压家族史吸烟、饮酒、打鼾.月人均收入、脉压差、心率.文化程度、高血压家族史、打鼾.文化程度、高血压家族史、打鼾- 正确.吸烟、饮酒. 高血压家族史吸烟、饮酒、打鼾5.总体是指().全部研究对象.全部研究对象中抽取的一部分.全部样本.全部研究指标. 全部同质研究对象的某个变量的值-正确第二章-单选题(10/10 分数)1.描述一组偏态分布资料的变异度,以()指标较好。
. 全距. 标准差. 变异系数. 四分位数间距. 四分位数间距- 正确.方差2.用均数和标准差可以全面描述()资料的特征。
. 正偏态分布. 负偏态分布. 正态分布. 正态分布- 正确. 对称分布.对数正态分布3.各观察值均加(或减)同一数后()。
医学统计学习题及答案
医学统计学习题及答案医学统计学是一门应用广泛的学科,它在医学研究和临床实践中扮演着重要的角色。
以下是一些医学统计学的基础习题及答案,供学习者参考。
习题一:描述性统计问题:某医院对100名患者的体重进行了测量,测得的平均体重为70公斤,标准差为10公斤。
请计算该组数据的变异系数。
答案:变异系数(Coefficient of Variation, CV)的计算公式为:\[ CV = \frac{标准差}{平均值} \times 100\% \]代入数据得:\[ CV = \frac{10}{70} \times 100\% \approx 14.29\% \]习题二:概率分布问题:假设某疾病的发病率为0.01,即每1000人中有1人患病。
如果随机抽取100人,求至少有1人患病的概率。
答案:使用二项分布的补数原理,计算没有人患病的概率,然后求其补数。
没有人患病的概率为:\[ P(0) = (1 - 0.01)^{100} \]至少有1人患病的概率为:\[ P(\geq 1) = 1 - P(0) \]习题三:假设检验问题:某药物对降低血压有显著效果。
在一项研究中,研究人员将100名高血压患者随机分为两组,每组50人。
一组接受药物治疗,另一组接受安慰剂。
治疗后,药物治疗组的平均血压降低了10毫米汞柱,而安慰剂组的平均血压降低了2毫米汞柱。
假设两组的血压降低量服从正态分布,标准差均为5毫米汞柱。
请问药物治疗是否显著优于安慰剂?答案:使用独立样本t检验来比较两组的血压降低量。
首先计算t值:\[ t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s^2}{n_1} +\frac{s^2}{n_2}}} \]其中,\(\bar{X}_1\) 和 \(\bar{X}_2\) 分别是两组的平均血压降低量,\(s\) 是标准差,\(n_1\) 和 \(n_2\) 是样本大小。
代入数据得:\[ t = \frac{10 - 2}{\sqrt{\frac{5^2}{50} + \frac{5^2}{50}}} \]计算t值后,与t分布的临界值进行比较,如果t值大于临界值,则拒绝原假设,认为药物治疗显著优于安慰剂。
医学统计学课后习题答案解析
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
《医学统计学》课程标准
《医学统计学》课程标准第一部分课程概述一、课程名称中文名称:《医学统计学》英文名称:《Medical Statistics》二、学时与适用对象课程总计40学时,均为理论课。
本标准适用于五年制临床医学、空军临床医学、口腔医学、康复医学与疗养学、生物医学工程专业。
三、课程性质地位医学统计学是临床医学专业一门必修的专业基础课程,它是用统计学理论和方法研究生物医学批量数据收集、分析、解释与表达的普遍原理和方法的一门科学。
医学统计学被喻为整个医学大厦中的一个重要支柱,医学统计学知识是医学知识的组成部分,医学统计学方法是医学科研的基本方法,医学统计学结果是所有医学科学研究最重要的证据之一。
理解医学统计学知识、掌握基本的医学统计学方法,将为后续临床医学、军事医学学习,以及毕业后从事临床工作和科学研究工作奠定坚实基础。
预修课程为《高等数学》、《生理学》等,主修完本课程后,学员将进一步学习《物理诊断》、《实验诊断》等后续临床医学专业课程。
四、课程基本理念1.要坚持学员为主体,教员为主导的教学理念。
全程渗透素质教育、创新教育、个性化教育等现代教育思想和观念。
2.教学内容上突出启发式教学,灵活利用讨论式教学、案例式教学、问题式教学等先进的教学方法,灵活运用和组合视频录像、电子幻灯、CAI课件、网络课程、学科专业网站等多种现代化教学手段,发挥信息化教学的特点和优势,激发学生学习兴趣、调动学生的主动性,进一步强化学生的知识与实践操作技能,开扩视野,培养科学的思维方式。
3. 在教学过程中注意以如何分析医学观察结果的“变异”来源为出发点,培养学员的统计思维方式。
强调医学统计的全过程,提高学员的综合素质。
理论与实践相结合,提高学员的动手能力。
五、课程设计思路1、框架设计与内容安排医学统计学课程包括医学统计学入门、医学研究的统计设计、医学数据的统计描述、统计推断四个教学单元。
第一个教学单元医学统计学入门,主要讲授内容为医学统计学定义、医学统计学的作用、统计学在医学中的应用。
医学统计学练习及参考答案
医学统计学练习及参考答案《医学统计学》练习题及参考答案一、填空题:1、频数分布通常具有集中趋势、离散趋势两个基本特征。
P412、统计表一般需有标题、线条(横线)、标目、数字四个基本结构。
3、四格表应用基本公式进行卡方检验的条件是:n≥40 、T≥5 。
4、正态分布的两个决定参数是:位置参数μ、形状参数。
P535、正态分布中央95%的观察值的分布区间是(μ-1.96σ,μ+1.96 σ)。
P536、概率抽样三个基本原则是:随机化原则、同质性原则、 n足够大。
7、实验设计的三大原则是对照、随机化、重复。
P20二、单项选择题:1.下面的变量中,属于分类变量的是---B--.A.脉搏 B.血型 C.肺活量 D.血压2. 已知我国部分县1988年死因构成比资料如下:心脏疾病11.41%,损伤与中毒11.56%,恶性肿瘤15.04%,脑血管病16.07%,呼吸系统病25.70%,其他20.22%.为表达上述死因的构成的大小,根据此资料应绘制统计图为--D---.A.线图 B.直方图 C.直条图 D.百分条图 E.统计地图 3. 在一项研究的最初检查中,人们发现30~40岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同.这个结论是---C--. A.正确的B. 不正确的,因为没有可识别的队列人群 C.不正确的,因为没有区分发病率与患病率D.不正确的,因为用百分比代替率来支持该结论 E.不正确的,因为没有设立对照组 4. sx表示---C--.A.总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D.变量值x的离散程度 E.变量值x的可靠程度5.做两个总体均数比较t检验,计算t>t0.01,(n1+n2-2时,可以认为-B----.A.反复随机抽样时,出现这种大小的均数差异的可能性大于0.01B.样本均数差异是由随机抽样误差所致的可能性小于0.01,可认为两总体有差别。
医学统计学课后习题答案
医学统计学课后习题答案在医学统计学课程中,课后习题是帮助学生巩固和应用课堂所学知识的重要环节。
以下是一些可能的课后习题及其答案,供学习参考。
习题1:某医院对100名患者进行了治疗效果的评估,其中70名患者病情有所改善。
请计算该治疗的有效率。
答案:有效率 = (改善的患者数 / 总患者数) × 100%有效率= (70 / 100) × 100% = 70%习题2:假设某研究中,有200名受试者,其中100名为实验组,接受新药治疗;另外100名为对照组,接受安慰剂。
研究结束时,实验组有30人出现副作用,对照组有10人出现副作用。
请计算两组的副作用发生率,并进行卡方检验,判断两组副作用发生率是否有显著差异。
答案:实验组副作用发生率= (30 / 100) × 100% = 30%对照组副作用发生率= (10 / 100) × 100% = 10%卡方检验计算:期望值 = (总人数× 总副作用数) / 总人数= (200 × 40) / 200 = 40实验组期望值= 40 × (100 / 200) = 20对照组期望值= 40 × (100 / 200) = 20卡方值 = [(30 - 20)^2 / 20] + [(10 - 20)^2 / 20] = 50自由度 = (组数 - 1) = 1卡方分布表中查得,自由度为1时,显著性水平为0.05的卡方临界值为3.841。
由于50 > 3.841,所以拒绝原假设,认为两组副作用发生率有显著差异。
习题3:某研究中,对50名高血压患者进行了血压测量,测量结果如下(单位:mmHg):- 收缩压:120, 130, 140, 150, 160, 170, 180, 190- 舒张压:80, 85, 90, 95, 100, 105, 110, 115请计算收缩压和舒张压的平均值和标准差。
医学统计学课后习题答案.
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
《卫生学》医学统计学基本内容实验指导
实习一统计工作的基本步骤及图表制备一、目的要求1、正确理解统计工作的四个基本步骤:统计设计、搜集资料、整理资料、分析资料,它们之间的关系。
2、学会拟制调查表,整理表的统计表的基本原则和方法。
3、重点学会如何对原始资料进行整理,并正确绘制图表。
二、时间2学时三、内容(一)统计表1、按下题要求自制调查卡片一份,某医师想观察胎盘娩出方式与人工流产史的关系,须要统计项目是人工流产史(流产胎次)和胎盘娩出方式(包括自娩、人工剥离和子宫切除),请你帮他拟制调查卡片,以便调查登记。
总例数:252例自娩:176例。
其中有人工流产史1次者34例,有2次者1例,无人工流产史者141例。
人工剥离:75例。
其中有人工流产史1次者17例,2次者6例,3次者1例;无人工流产史者51例。
子宫切除:1例。
该例为植入性胎盘,既往无人工流产史。
2、按下题要求编制统计表某研究者研究文化活动与老年人生活满意率的关系,调查了经常参加文化活动的老年人306人,对生活满意者有219人,不经常参加文化活动者246人,对生活满意者有159人。
(二)统计图1、对以下资料绘制适当统计图(1)某年某地儿童近视情况:年龄8 9 10 11 12 13 14 15人数100 150 120 110 120 130 100 120近视人数20 32 28 25 30 38 40 58(2)某年某地某病按月发病人数月份 1 2 3 4 5 6 7 8 9 10 11 12发病人数9 8 14 26 32 43 45 45 40 18 12 10(3)两种气管炎病人疗效比较分组临床治愈显效好转无效单纯型60985112喘息型238365112、以下表资料绘成下面的统计图,你有何意见?试根据资料性质选择正确的统计图表示。
1955年某地几种传染病的病死率传染病病死率(%)白喉10.9流行性乙型脑炎18.0流行性脑脊髓膜炎11.0伤寒与副伤寒 2.7痢疾 1.2脊髓灰质炎 3.41955年某地几种传染病的病死率3、根据下面资料绘成的图是否恰当,如不当,请改制。
医学统计学练习题与答案
一、单向选择题1. 医学统计学研究的对象是 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E. 由偶然因素引起的误差5. 收集资料不可避免的误差是 A.随机误差1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A. 中位数2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征1. 变异系数主要用于 A .比较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布4. 假设检验的目的是 D.检验总体参数是否不同5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是 E.该区间包含总体均数的可能性为95%1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料1. 利用2χ检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用C.Fisher 确切概率法二、简答题1.抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
医学统计学实训报告答案
一、实训目的通过本次医学统计学实训,使学员掌握医学统计学的基本概念、常用统计方法及其应用,提高学员运用统计学方法解决实际问题的能力。
二、实训内容1. 数据收集与整理本次实训以某医院某科室100名患者的临床数据为样本,收集患者年龄、性别、病情、治疗方案、治疗结果等数据。
2. 数据描述性统计(1)计算样本的均值、标准差、中位数、方差等指标。
(2)绘制直方图、箱线图等图形,直观展示数据分布情况。
3. 假设检验(1)采用t检验比较两组数据(如男女患者)在年龄、病情等指标上的差异。
(2)采用方差分析比较两组或多组数据在多个指标上的差异。
4. 相关性分析(1)计算两组数据之间的相关系数,判断其相关性。
(2)进行回归分析,建立预测模型,预测患者治疗效果。
5. 生存分析(1)计算生存率、中位生存时间等指标。
(2)绘制生存曲线,分析患者生存情况。
三、实训过程1. 数据收集与整理收集100名患者的临床数据,包括年龄、性别、病情、治疗方案、治疗结果等。
2. 数据描述性统计(1)计算样本的均值、标准差、中位数、方差等指标。
(2)绘制直方图、箱线图等图形,直观展示数据分布情况。
3. 假设检验(1)采用t检验比较男女患者在年龄、病情等指标上的差异。
(2)采用方差分析比较不同治疗方案在多个指标上的差异。
4. 相关性分析(1)计算患者年龄与治疗效果的相关系数。
(2)进行回归分析,建立预测模型,预测患者治疗效果。
5. 生存分析(1)计算患者生存率、中位生存时间等指标。
(2)绘制生存曲线,分析患者生存情况。
四、实训结果与分析1. 数据描述性统计(1)年龄:男性平均年龄为45.2岁,标准差为8.5岁;女性平均年龄为42.8岁,标准差为7.2岁。
(2)病情:根据病情严重程度划分等级,等级1-5,平均等级为2.5。
(3)治疗方案:共分为三种方案,方案A、B、C,各方案患者人数分别为40、30、30。
2. 假设检验(1)t检验:男女患者在年龄、病情等指标上无显著差异(P>0.05)。
《医学统计学》实验课习题
2. 某地 107 名正常人尿铅含量(mg/L)列于下表。计算 x 、G、M、Q、M0,并进行各
指标的比较观察和分析,哪一个指标较好并具有代表性?
表 2-5
某地正常人尿铅含量数据
尿铅含量(mg/L) 0~ 4~ 8~ 12~ 16~ 20~ 24~ 28~ 合计
人数
14 22 29 18 15
6
1
2 107
3. 表 2-9
102 名健康人的钩端螺旋体血凝抗体滴度分布。求平均滴度。
抗体滴度 1:100
1:200
1:400
1:800
1:1600
合计
人数
7
19
34
29
13
102
1
4. 据下列资料:求 x 、G、M、Q,不同人群选择哪些指标较好?为什么?
表 2-8
不同人群血清效价资料
不同人群 ≤1:8 1:16 1:32 1:64 1:128 1:256 1:512 ≥1:1024 n
《医学统计学》实验课习题
第二章 定量资料的统计描述
一、计算题
1. 根据下表资料:①编制频数表及绘制频数分布图,简述其分布特征;②计算 X 、S、
S2、R、CV;③计算 x ±S, x ±1.96S, x ±2.58S 的范围,估计总体均数 95%和 99%的
可信区间,并比较各实际分布与理论分布;④现测得二名女学生血清总蛋白含量,甲生为
二、思考题 1. 解释名词:绝对数 相对数 率 构成比 相对比
定基比 平均速度 率的标准化 2. 绝对数与相对数的特点、意义和区别是什么?
动态数列
环比
5
3. 写出计算各相对数的公式,掌握各相对数的分子、分母及比例基数的意义。 4. 率和构成比的意义是什么?两者的特点及主要区别是什么? 5. 常用动态数列有哪几种?其意义及区别是什么? 6. 为什么要进行率的标准化?意义是什么?如何选择标准人口? 7. 某年龄组病人数多,是否就说明该年龄组的人较其他年龄组更易患病?为什么? 8. 某年龄组患病率高,是否说明该年龄组的病人数就较其他年龄组的要多?为什么? 9. 应用相对数的注意事项是什么? 10. 医学中常用的相对数指标有哪些,其特点及意义是什么?
医学统计学学习与实习题集
医学统计学学习与实习题集目录第四章定量资料的统计描述2第五章定性资料的统计描述7第六章总体均数的估计10第七章假设检验13第八章 t检验16第九章方差分析20第十章二项分布和Poisson分布及其应用25第十一章2检验27第十二章秩和检验31第十三章双变量关联性分析35第十四章直线回归分析40第十五章生存分析43第四章定量资料的统计描述【思考与习题】一、思考题1.均数、中位数、几何均数的适用范围有何异同?2.同一资料的标准差是否一定小于均数?3.极差、四分位数间距、标准差、变异系数的适用范围有何异同?4.正态分布有哪些基本特征?5.制定医学参考值范围时,正态分布法和百分位数法分别适用于何种资料?二、案例辨析题某市抽样测定了150名健康成年男性的血清甘油三酯(TG)含量(mmol/L),资料如下,据此资料计算集中趋势指标和离散程度指标。
0.23 0.84 1.16 1.39 1.64 1.76 1.89 2.04 2.18 2.280.34 0.85 1.24 1.39 1.68 1.78 1.91 2.05 2.21 2.290.49 0.86 1.25 1.41 1.70 1.79 1.91 2.06 2.21 2.300.57 0.87 1.30 1.41 1.71 1.81 1.91 2.06 2.21 2.300.62 0.91 1.30 1.43 1.71 1.82 1.92 2.06 2.22 2.320.62 0.95 1.33 1.44 1.71 1.83 1.93 2.10 2.24 2.330.65 0.96 1.33 1.47 1.72 1.83 1.94 2.10 2.24 2.350.67 0.99 1.34 1.53 1.73 1.83 1.96 2.10 2.25 2.360.68 1.04 1.35 1.56 1.74 1.84 1.97 2.12 2.25 2.360.71 1.08 1.35 1.58 1.74 1.84 1.98 2.14 2.25 2.370.71 1.08 1.36 1.58 1.74 1.86 2.00 2.15 2.25 2.380.72 1.09 1.36 1.58 1.75 1.87 2.01 2.15 2.26 2.390.78 1.14 1.37 1.60 1.75 1.87 2.01 2.15 2.27 2.390.80 1.15 1.39 1.60 1.75 1.88 2.02 2.16 2.27 2.400.80 1.16 1.39 1.61 1.75 1.89 2.03 2.17 2.28 2.41X=(mmol/L)计算结果为:集中趋势指标 1.6839离散程度指标0.5599S=(mmol/L)以上分析是否恰当,为什么?三、最佳选择题1. 频数分布的两个重要特征是A. 总体与样本B.集中趋势与离散程度C.统计量与参数D.标准差与标准误E. 样本均数与总体均数2. 描述一组正态分布资料的平均水平,宜选用的指标是A. CVB. 2SC. GD. SE. X3.数据分布类型无法确定时,描述集中趋势宜选用的指标是A.XB.MC.GD.S4.反映一组血清抗体滴度资料的平均水平,常选用的指标是 A. X B. M C. G D. R E. CV5. 以下资料类型中,适宜用均数与标准差进行统计描述的是 A.正偏态分布 B.负偏态分布 C.对称分布 D.正态分布 E.任意分布6. 当资料两端含有不确切值时,描述其变异度宜采用 A. R B.CV C. 2S D.SE.四分位数间距 7. CV 越大,表示 A.资料变异程度越大 B. 资料变异程度越小 C.均数越大 D. 样本含量越大 E.均数的代表性越好8. 正态分布曲线下( 2.58, 2.58)μσμσ-+范围内的面积(%)为 A .95 B .90 C .97.5E .99.59. 某地拟制定正常学龄前儿童血铅值99%参考值范围,若正常学龄前儿童血铅含量服从近似对数正态分布,宜采用 A . 2.58X S + B .1lg lg lg ( 2.58)XX XS -+C . 4.84(mmol/L) 0.96(mmol/L)X S ,==D .1lg lg lg ( 2.32)XX XS -+E . 2.32X S + 四、综合分析题1.测定了176名燃煤型砷中毒患者的尿总砷含量(μg/L ),资料如下,0.0169 0.0262 0.3433 0.0505 0.2266 0.1690 0.0165 0.0356 0.0968 0.1628 0.0904 0.1059 0.05820.0211 0.0867 0.0318 0.0256 0.0267 0.1592 0.13640.0583 0.0275 0.2285 0.0246 0.0508 0.1076 0.0195 0.0400 0.06460.11090.0212 0.0164 0.1401 0.0646 0.0139 0.0377 0.0161 0.0121 0.0617 0.2686 0.0532 0.0724 0.1280 0.0143 0.0980 0.5678 0.0228 0.1279 0.0872 0.0675 0.0361 0.0680 0.0591 0.0821 0.1418 0.1051 0.0662 0.1033 0.11880.08870.0102 0.0154 0.1775 0.0223 0.0319 0.0986 0.1019 0.0419 0.0678 0.0347 0.0753 0.0532 0.0151 0.0219 0.11390.11240.0524 0.0290 0.0376 0.15100.1250 0.0339 0.0549 0.0974 0.0753 0.2902 0.0222 0.0204 0.1325 0.0462 0.3047 0.0464 0.1486 0.0271 0.3953 0.0288 0.1520 0.0559 0.1244 0.1264 0.0576 0.0112 0.0222 0.4085 0.1128 0.0463 0.1240 0.0226 0.0809 0.0371 0.0183 0.1430 0.0559 0.0353 0.1333 0.2383 0.0929 0.0209 0.2748 0.0189 0.4542 0.0782 0.0741 0.1460 0.1317 0.0456 0.0499 0.0317 0.0863 0.0505 0.2691 0.3570 0.0227 0.0392 0.0406 0.0596 0.0260 0.0906 0.1516 0.0695 0.0723 0.0389 0.0810 0.2326 0.0311 0.0174 0.0868 0.0516 0.0970 0.0372 0.0126 0.0678 0.2133 0.5265 0.4385 0.0357 0.3706 0.06210.2330 0.0947 0.1591 0.0636 0.1845 0.0445 0.0430 0.0236 0.04290.0134 0.5805 0.0600 0.0387 0.0392 0.0747 0.0470 0.0425 0.2218(1) 绘制频数分布图,简述分布类型和分布特征;(2) 计算适当的集中趋势指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验一定量资料的统计描述
实验目的及要求:
(1)掌握定量资料统计描述的概念、公式、意义及应用条件。
(2)熟悉正态分布的概念和特点。
(3)了解:正态分布的应用及医学参考值的制定方法。
实验内容:《实验指导与练习》p6
4.某地120名12岁健康男孩身高(cm)资料如下表。
计算x、S、CV及正常值范围。
表2-4某地12岁健康男孩身高数据
身高分组120~125~130~135~140~145~150~155 人数8 15 23 29 22 22 16
四、思考题
1.算术均数、几何均数、中位数应用条件是什么?
2.标准差、四分位数间距各自应用条件是什么?
3.简述正态分布的特点及应用?
实验二t、u检验与方差分析
实验目的及要求:
(1)掌握:均数t检验和u检验适用条件及计算方法,方差分析的基本思想。
(2)熟悉:总体均数区间估计的概念、意义及计算方法。
(3)了解:方差齐性检验的概念。
实验内容:《实验指导与练习》p9-10
1.据下表问:中草药治疗后舒张压有否变化?
表3-1某医院用中草药治疗10名高血压病人的舒张压值
治疗前115 110 129 109 110 116 116 116 120 104
治疗后116 90 108 87 92 90 110 120 88 96
5.健康成年男子脉搏平均次数为72次/分。
现调查25名某山区健康成年男子脉搏平均次数为74.2次/分,标准差为
6.5次/分。
问:山区健康成年男子脉搏数与一般健康成年男子脉搏数有否不同?
10.调查18岁泰安市区及乡村男生各60名的身高数据(cm),市区平均身高170.6cm,标准差5.62cm;乡村的平均身高166.86cm,标准差为5.08cm,
①试比较泰安城乡之间男生身高有无显着差别?
②试估计泰安城区男生身高总体均数的95%及99%可信区间。
四、思考题
1.标准差与标准误的区别主要有哪几点?
2.参考值范围与可信区间的区别是什么?
3.简述假设检验的基本思想。
实验三相对数与卡方检验
实验目的及要求:
(1)掌握:总体率区间估计的概念;
(2)率的z检验及卡方检验适用条件及计算方法。
(3)熟悉:行列表卡方检验的适用条件及计算方法。
(4)了解:精确概率法的概念及适用条件。
实验内容:《实验指导与练习》p23
6.根据下表资料,检验两种疗法疗效有无差别?
表6-3两种疗法治疗乙脑患者情况
分组病例数治愈数治愈率(%)
中西医结合组中医组100
200
50
70
50
35
合计300 120 40
14.根据下表资料,试判断四种剂型的疗效有无差异?
表6-11某药四种剂型的治疗效果
剂型号观察例数显效例数
1 80 42
2 5
3 18
3 61 25
4 40 21
16.用两种方法对110份乳品作细菌培养,结果如下。
试比较两方法效果是否相同?两种方法有无联系?联系程度是多大?
表6-13两种方法的培养结果
乳胶凝集
常规培养
合计+ -
+ 27 1 28 - 8 74 82 合计35 75 110
四、思考题
1.为什么要进行率的标准化?如何选择标准人口?
2.应用相对数的注意事项是什么?。