《医学统计学》复习题
医学统计学复习题一及答案
医学统计学复习题一一、名词解释1. 变异即同质的观察单位之间某项特征所存在的差异2. 等级资料 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
3. 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。
固定的常数4. 统计量:样本的统计指标,如样本均数、标准差, 参数附近波动的随机变量5. 算术均数 简称均数,描述一组同质计量资料的平均水平。
统计学中常用希腊字母μ表示总体均数,用x 表演示样本均数6. 中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值7. 百分位数 :将顺序排列的一组观察值分为一百等分,位于某百分位置上的数值,以Px 表示,它是一种位置指标,理论上有x%的观察值比它小,有(100-X)%的观察值比它大。
二、单项选择1.表示事物内部各个组成部分所占比重的相对数是( b )。
A.相对比B.率C.构成比D.率的标准误E.均数2.说明样本均数抽样误差大小的指标是( c )。
A.变异系数B.标准差C.标准误D.全距 E 四分位数间距3.正态分布曲线下中间面积为95% 的变量值范围为( a )。
A.μσ±196.B.μσ±258.C.μσ±1D.μσ±125.E.σ±μ24.在两样本均数假设检验中,P ≤α时,拒绝H 0,认为( b )。
A.两样本均数有差别B.两总体均数有差别C.两样本均数无差别D.两总体均数无差别E.两总体均数差别很大5.下述( c )种资料为计数资料。
A.血红蛋白(g/L)B.红细胞计数(×1012/L)C.抗体滴度D.血型E.身高(cm)6.某地某年肺癌死亡率城区为郊区的194.1%,本指标是( b )。
A.率B.构成比C.相对比D.中位数E.百分率7.用均数和标准差可全面描述( b )资料的特征。
A.正偏态分布B.正态分布和近似正态分布C.负偏态分布D.t 分布E.χ2分布8.四格表的自由度( b )。
医学统计学总复习练习题(含答案)
一、最佳选择题1.卫生统计工作的步骤为 CA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有 DA.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括EA.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指 BA.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指 BA.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用 DA.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是 CA.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用 AA.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是 CA.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有 BA.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为 DA.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 D A.s x μ- B.σμ-x C. x s x μ- D.xx σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指 CA.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布e A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ-15.统计推断的主要内容为 BA.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指 BA.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大CA.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明 CA.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 DA.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高DA.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为 EA. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与 值的大小无关22.假设检验中的第二类错误是指 DA.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.多组均数的两两比较中,若不用q 检验而用t 检验,则 CA. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对24.说明某现象发生强度的指标为 EA.构成比B.相对比C.定基比D.环比E. 率25.对计数资料进行统计描述的主要指标是 BA.平均数B.相对数C.标准差D.变异系数E.中位数26.构成比用来反映CA.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对27.下列哪一指标为相对比EA. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数28.两个样本率差别的假设检验,其目的是BA.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同29.用正态近似法进行总体率的区间估计时,应满足DA. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求30.由两样本率的差别推断两总体率的差别,若P 〈0.05,则DA. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义31.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为DA. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u32.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为EA. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4033.三个样本率比较得到2χ>2)2(01.0χ,可以为AA.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同34.四格表2χ检验的校正公式应用条件为CA. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<135.下述哪项不是非参数统计的优点DA.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料36.秩和检验和t 检验相比,其优点是AA. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小37.等级资料比较宜用CA. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验38.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为CA.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大39.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用AA.普通线图B.直方图C.统计地图D.半对数线图E.圆形图40.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:BA.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料41. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
医学统计学复习题
中国医科大学网络教育学院医学统计学复习题一、最佳选择题1. 下列资料何为定性资料?A 体重(kg)B 血型(A、B、O、AB)C 血红蛋白(g/L)D 坐高指数(%,坐高/身高)E 白细胞计数(个/L)2. 下列资料属于等级资料的是_______A 白细胞计数(个/L)B 血型(A、B、O、AB)C 体重(kg)D 病人的病情分级(轻、中、重)E 坐高指数(%,坐高/身高)3.医学科学研究中的随机样本是指_______A 总体中的一部分B 研究对象的全体C 总体中特殊的一部分D 总体中有代表性的一部分E 研究对象中一部分有特殊代表性的样本4.统计工作的基本步骤是_______A 设计、搜集资料、整理资料和分析资料B 设计、统计分析、统计描述和统计推断C 选择对象、计算统计指标、参数估计和假设检验D 搜集资料、计算均数、标准差、标准误E 搜集资料、整理资料和分析资料5.统计学的小概率事件是指随机事件发生的概率_______A 等于0.05B 小于等于0.05C 大于0.05D 小于0.05E 大于等于0.056.医学统计学的主要研究对象是_____。
A.随机事件B.必然事件C.不可能发生的事件D.发生可能性很小的事件E.发生可能性很大的事件7.编制组段数为10的频数表,在确定组距时______A常取最大值的1/10取整作为组距B常取最小值的1/10取整作为组距C常取极差的1/10取整作为组距D组距等于极差E常取极差的一半取整作为组距8.频数分布的两个重要特征是______A 集中趋势和分布类型B 集中趋势和离散趋势C 标准差和离均差D 对称分布和偏锋分布E 资料的类型9.一些以儿童为主的传染病,患者的年龄分布,集中位置偏向年龄小的一侧,称为______ A 正态分布 B 正偏态分布 C 负偏态分布 D 均匀分布E 对称分布10.欲表示末端无确定数据的资料平均水平时,宜采用的指标是______A 算术均数B 几何均数C 中位数D 百分位数E 算术均数和中位数11.一组变量值,其大小分别为13,10,12,9,8,11,98。
医学统计学复习题
预防医学复习题(统计部分)复习重点(及简答题)1. 医学统计学的基本概念如:总体与样本的联系区别2. 资料的分类如:请列举资料的类型并举例说明3. 定量资料统计描述的指标(集中与离散趋势)如:定量统计描述指标有哪些?如:正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如:正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用(P值的含义)如:P值的含义是什么,对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中:A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指:A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数(次/分)是:A、观察单位B、数值变量C、名义变量 D.等级变量 E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤0.05或P≤0.01的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体8.概率P=0,则表示A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对9.总体应该由A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成10. 在统计学中,参数的含义是A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本12.统计学中的小概率事件,下面说法正确的是:A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于0.1的事件D.发生概率小于0.001的事件 E.发生概率小于0.1的事件13、统计上所说的样本是指:A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。
医学统计学复习题(名词解释和简答)
医学统计学复习题(名词解释和简答)一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学复习题
医学统计学复习题一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学复习考试题库完整
第一部分复习练习题一.最讎择丿Y 表示一m 称分布的变量值的 ______________ a.平均水平 b.频数分布c.离散情况d.极差 一组正态分布资料,理论上有 ____________ a. T>M b.X <M c ・商 A X^MngKM 反映一组血淸学滴度资料或效价资料平均水平采用 a. Y b. M c. G d R 在O 未知且n 较大时,估计u 95%町售区间可用_ a. X+1.96S b. T±2.58S c. X±2. 58Sx d. T±1.96S X 来自同一总体中的两个样本,其中—小的那个样本均数估计u 时更可靠。
a. Sx b. S c. S : d. CV在假设检验中,由于抽样的偶然性,拒绝了实际上成立的Ho 假设,贝IJ —0 a.犯第I 类错误 b.犯第II 类错误 c.推断正确 d. a, b 都有可能 在假设检验中,由于抽样偶然性,接受了实际上不成立的比假设,贝9—o a.犯第I 类错误 b.犯第II 类错误c.推断正确d. a, b 都有可能 在假设检验中,接受了实际上成立的出假设,则 _________ 。
a.犯第I 类错误 b.犯第II 类错误c.推断正确d. a,b 都有可能 a 二0・05, t>t a os. v,统计•上可认为 o a.两总体均数差别无显著意义b.两样本均数差别无显著意义 c.两总体均数差别有显著意义d.两样本均数差别有显著意义 10、 在均数为方差为/的正态总体中随机抽样,每组样本含量n 相等,u=(X L u)/ox ;则u21. 96 的概率是 ______ 。
a. P>0.05 b. PW0.05 c. PM0.025 d. PW0.025 11、 ____________________________________________________________ 在均数为u,标准差为。
医学统计学复习题
一、最正确选择题1.抽样研究是一种科学高效的方法,目的是研究〔B 〕• A.样本 B.总体• C.抽样误差 D.概率2.由样本推断总体,样本应该是〔D 〕• A.总体中的典型局部• B.总体中有意义的局部• C.总体中有价值的局部• D.总体中有代表性的局部3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中〔C 〕• A.四种误差都不可防止• B.过失误差和测量误差不可防止• C.测量误差和抽样误差不可防止• D.系统误差和抽样误差不可防止4.统计描述是指〔C 〕• A.比拟指标的差异有无显著性• B.估计参数• C.用统计指标描述事物的特征• D.判断无效假设是否成立5.统计推断是指〔D 〕• A.从总体推断样本特征• B.从总体推断总体特征• C.从样本推断样本特征• D.从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于〔A 〕• A.系统误差 B.随机测量误差• C.抽样误差 D.过失误差7.随机抽样的目的是〔D 〕• A.能消除系统误差• B.能消除测量误差• C.能消除抽样误差• D.能减小样本偏性8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于〔B 〕• A.计量资料 B.计数资料• C.等级资料 D.三个都不是9.计量资料是〔C 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料10.计数资料是〔B 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料11.等级资料是〔D 〕• A.用仪器测量出来的资料• B.按观察单位的类别,清点各类观察单位数的资料• C.用定量方法测定观察单位某个变量的大小的资料• D.按观察单位的等级,清点各等级观察单位数的资料12.以下哪种不属于计量资料〔C 〕• A.红细胞数 B.血钙浓度• C.阳性人数 D.脉搏13.以下哪种属于等级资料〔A 〕• A.治疗痊愈、有效、无效人数• B.各血型人数• C.白细胞分类百分比• D.贫血和不贫血人数二、判断题• 1.统计工作的主要内容是对资料进行统计分析。
医学统计学复习题
抽样误差与总体均数的估计1. ( C )A. 总体均数B. 总体均数离散程度C. 样本均数的标准差D. 个体变量值的离散程度E. 总体标准差2.抽样研究中,S为定值,若逐渐增大样本含量,则样本( B )A. 标准误增大B. 标准误减小C. 标准误不改变D. 标准误的变化与样本含量无关E. 标准误为零3. 关于以0为中心的t分布,叙述错误的是( E )A. t分布是一簇曲线B. t分布是单峰分布C. 当v→∞时,t→μD. t分布以0为中心,左右对称E. 相同v时,∣t∣越大,p越大4.均数标准误越大,则表示此次抽样得到的样本均数( C )A. 系统误差越大B. 可靠程度越大C. 抽样误差越大D. 可比性越差E. 测量误差越大5.要减小抽样误差,最切实可行的办法是( A )A. 适当增加观察例数B. 控制个体变异C. 严格挑选观察对象D. 考察总体中每一个个体E. 提高仪器精度6."假设已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg, 标准差为11.2 mmHg ,后者反映的是"( E )A. 总体均数不同B. 抽样误差C. 抽样误差或总体均数不同D. 系统误差E. 个体变异7. "已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg, 标准差为11.2 mmHg 。
从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为112.8mmHg。
则112.8mmHg 与120.2mmHg 不同的原因是" ( B )A. 个体变异B. 抽样误差C. 总体均数不同D. 抽样误差或总体均数不同E. 系统误差8. "已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg, 标准差为11.2 mmHg 。
从该地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5 mmHg ,标准差为10.4mmHg,则90.5mmHg 与120.2mmHg不同,原因是" ( C )A. 个体变异B. 抽样误差C. 总体均数不同D. 抽样误差或总体均数不同E. 系统误差9.从某地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5 mmHg ,标准差为10.4mmHg,则该地7岁正常男孩的收缩压总体均数的95%的置信区间为( A )A.B.C. 90.5±1.96×10.4D. 120.2±t(0.05/2,9)×10.4E. 90.5±2.58×10.410.随机抽取上海市区120名男孩作为样本,测得其平均出生体重为3.20kg,标准差0.50kg.则总体均数95% 置信区间的公式是( B )A.B.C. 3.20±1.96×0.50/120D. 3.20±2.58×0.50E. 3.20±1.96×0.5011.关于t分布的图形,下述哪项是错误的( C )A. n 越小,则t分布的尾部越高B. t分布是一簇曲线,故临界值因自由度的不同而不同C. t分布是一条以n 为中心左右对称的曲线D. 当n 趋于¥时,标准正态分布是t分布的特例E. 当n 逐渐增大,t分布逐渐逼近标准正态分布12.总体概率的区间估计中, α值越大( B )A. 抽样误差越大B. 置信度越低C. 置信度越高D. 估计的精度越高E. 抽样误差越小13.样本均数的标准误越大( C )A. 置信度越低B. 抽样误差越小C. 抽样误差越大D. 估计的精度下降E. 置信度越大14.为了解某城市女婴出生体重的情况, 随机得到该市区120名新生女婴的平均出生体重为3.10kg, 标准差为0.50kg。
医学统计学 选择复习题
一、最佳选择题1.收集资料的方法是:eA.收集各种报表B.收集各种工作记录C.进行专题调查D.进行科学实验E.以上都对2.统计工作的基本步骤是:dA.调查资料、审核资料、整理资料B.收集资料、审核资料、分析资料C.调查资料、整理资料、分析资料D.收集资料、整理资料、分析资料E.以上都对3.在抽样研究中样本是:dA.总体中的一部分B.总体中任意一部分C.总体中典型部分D.总体中有代表性的一部分E.总体中有意义的一部分4.计量资料、计数资料和等级资料的关系:是:cA.计量资料兼有计数资料和等级资料的一些性质B.计数资料兼有计量资料和等级资料的一些性质C.等级资料兼有计量资料和计数资料的一些性质D.计数资料有计量资料的一些性质E.以上都不是5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制:A.普通线图B.直方图C.构成比直条图D.半对数线图E.直条图6.直方图可用于:A.某现象的内部构成B.各现象的比较C.某现象的比较D.某现象的频数分布E.某现象的发展速度7.统计图表的要求是:A.简单明了B.层次清楚C.说明问题明确D.避免臃肿复杂E.以上都对8.在列频数表时,分组数目一般为:A.5-10B.8-15C.10-30D.15-20E.>209.平均数作为一种统计指标是用来分析:A.计数资料B.计量资料C.等级分组资料D.调查资料E.以上都不对10.表示变量值变异情况的常用指标是d :A.全距B.标准差C.方差D.变异系数E.以上均是11.确定正常人某个指标正常值范围时,调查对象是:cA.从未患过病的人B.健康达到了要求的人C.排除影响被研究指标的疾病和因素的人D.只患过小病但不影响研究指标的人 bE.排除了患过某病或接触过某因素的人12.标准误:bA.与标准差呈反比B.与标准差呈正比C.与标准差的平方呈反比D.与标准差平方呈正比E.以上都不对 13.x σ是指:eA.所有观察值对总体均数的离散程度B.某一个样本均数的离散程度C.所有样本均数对总体均数的离散程度D.某些样本均数对总体均数的离散程度E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示:dA .95%的正常值范围B .95%的可信区间C .99%的正常值范围D .99%的可信区间E .以上都不对15.构成比通常以下列哪项指标为比例基数a :A.100%B.1000‰C.10000/万D.100000/10万E.视具体情况而定16.一事物各构成比部分相对数之和应为:cA.大于1B.小于1C.等于1D.不一定E.以上都不对16.一事物各构成比部分相对数之和应为:cA.大于1B.小于1C.等于1 D 、47.5% E 、不能确定18. 进行统计分析的资料必须是( a )A 、完整、准确、及时的B 、随机取得的C 、满足条件齐同的D 、数量足够的E 、以上都对19.指出下列变量中哪一个指标为统计量aA .pB .σC .μD .πE .β20.计算样本率的抽样误差适用公式为:aE.以上都不对21.R ×C 表的2χ检验的自由度为:dA.1R -B.1C -C.1RC -D.(1)(1)R C --E.2R C ⨯-22.实验设计的基本原则为eA .齐同原则B .随机原则C .对照原则D .重复原则E .以上都是23.在相关分析中:a A.r 越接近1,散点图越集中 B. r 越接近0,散点图越集中C.0r <,散点图越集中D.0r >,散点图越集中E.以上全不对24.已知1r =,则一定有:cA.1b =B.1a =C. ,0Y X S =D. ,Y X Y S S =E. ,Y X X S S =25.相关分析的主要内容包括:dA.确定变量间的数量关系B.确定变量之间有无关系C.确定变量之间有无因果关系D.确定变量之间关系的密切程度E.以上都不是26.在配对法秩和检验中,共有8对数据,且差值中没出现0,27T -=,则T += b :A. -3B.9C.-9D.-27E.3027.配对比较的秩和检验的基本思想是:如果假设检验成立,则对样本来说:cA.正秩和的绝对值大于负秩和的绝对值B.正秩和的绝对值小于负秩和的绝对值C.正秩和的绝对值与负秩和的绝对值不会相差很大D.正秩和的绝对值与负秩和的绝对值相等E.正秩和的绝对值与负秩和的绝对值相差很大28.在成组设计两样本比较的秩和检验中,甲组中最小数据有2个(0.2,0.2),乙组中最小数据也有2个(0.2,0.2),则数据0.2 的秩次为:dA.2B.3C.4.5D.2.5E.3.529.当第二类错误β由0.2变到0.3时,则第一类错误α是:bA.增大B.减小C.不确定D.不变化E.以上都不对30.下列指标除了哪项均为疾病统计指标:cA.治愈率B.某病病死率C.某病死亡专率D.感染率E.发病率31.计算某抗体滴度的平均水平,一般宜选择(b )A 、算术均数B 、几何均数C 、中位数D 、百分位数E 、极差32.统计推断的内容( e )A 、是用样本指标估计相应的总体指标B 、是检验统计上的“假设”C 、估计正常值范围D 、A 、B 均不是E 、A 、B 均是33.比较身高与体重的变异程度宜用的指标是( d )A 、标准差B 、标准误C 、四分位间距D 、变异系数E 、全距34.观察值 2、 5、 10、 7、 9、 8、 20、 100的平均数是(a )A 、20.14B 、6.15C 、8.5D 、 20E 、1035.当n 一定时,第二类错误β由0.2变到0.3时,第一类错误α( b )A 、增大B 、减小C 、不确定D 、不变化E 、以上都不对36.两小样本计量资料比较的假设检验,应首先考虑( d )A 、用t 检验B 、用u 检验C 、用秩和检验D 、资料符合t 检验还是秩和检验的条件E 、任选一种检验方法37.抽样误差指的是( b )A 、个体值与总体值之差B 、样本统计量之间及样本统计量与总体参数值之差C 、个体值与统计量值之差D 、总体参数值与总体参数值之差E 、以上都不对38.同一双变量资料进行直线相关与回归分析,有( b )A 、0,0r b ><B 、0,0r b >>C 、0,0r b <>D 、r b =E 、r 与b 的符号无关39.用均数和标准差可全面描述下列哪项资料的特征(c )A 、正偏态分布B 、负偏态分布C 、正态分布D 、非对称分布40.四个样本率作比较,220.01,(3)χχ>,可认为( a )A 、 各总体率不等或不全相等B 、各总体率均不相等C 、各样本率均不相等D 、各样本率不等或不全相等E 、各总体率相等二、填空题1、统计工作的基本步骤是()、()、()。
医学统计学复习题
医学统计学复习题(总13页) --本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--预防医学复习题(统计部分)复习重点(及简答题)1. 医学统计学的基本概念如:总体与样本的联系区别2. 资料的分类如:请列举资料的类型并举例说明3. 定量资料统计描述的指标(集中与离散趋势)如:定量统计描述指标有哪些如:正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如:正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用(P值的含义)如:P值的含义是什么,对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中:2.A、任意一部分 B、典型部分 C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指:A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数(次/分)是:A、观察单位B、数值变量C、名义变量 D.等级变量 E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤或P≤的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体8.概率P=0,则表示A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大 E以上均不对9.总体应该由A.研究对象组成B.研究变量组成C.研究目的而定 D.同质个体组成E.个体组成10. 在统计学中,参数的含义是A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料B.计量资料C.总体D.个体E.样本12.统计学中的小概率事件,下面说法正确的是:A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于的事件D.发生概率小于的事件E.发生概率小于的事件13、统计上所说的样本是指:A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。
医学统计学复习题
医学统计学复习题一、名词解释1、总体2、样本3、随机抽样4、变异5、概率6、随机误差(偶然误差)7、参数8、统计量9、算术均数10、中位数11、百分位数12、频数分布表13、几何均数14、四分位数间距15、方差16、标准差17、变异系数18、标准正态分布19、医学参考值范围20、可信区间21、统计推断22、参数估计23、标准误及24、检验水准25、检验效能26、率27、直线相关28、直线回归29、实验研究30、回归系数二、单项选择1.观察单位为研究中的()。
A.样本B.全部对象C.影响因素D.个体E.观察指标2.总体是由( )组成。
A.部分个体B.全部对象C.全部个体D.同质个体的所有观察值E.相同的观察指标3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例D.研究总体统计量E.研究特殊个体的特征4.参数是指( ) 。
A.参与个体数B.总体中研究对象的总和C.样本的统计指标D.样本的总和E.总体的统计指标5.关于随机抽样,下列哪一项说法是正确的( )。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随机抽取个体D.为确保样本具有更好的代表性,样本量应越大越好E.选择符合研究者意愿的样本6.反映计量资料平均的指标是( )。
A.频数B.参数C.百分位数D.平均数E.统计量7.表示总体均数的符号是( ) 。
A.σB.μC.XD. SE. M8.下列指标中,不属于集中趋势指标的是( )。
A.均数B.中位数C.百分位数D.几何均数E.众数9. ( )分布的资料,均数等于中位数 。
A.对称分布B.正偏态分布C.负偏态分布D.对数正态分布E.正态分布10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的 指标该选( )。
A.中位数B.算术均数C.几何均数D.平均数E.百分位数末端有确定数据11.利用频数分布表和公式 ∑-+=L m f n f i L M 2(计算中位数时,要求( )。
医学统计学复习题
医学统计学复习题
1. 简述医学统计学的定义及其在医学研究中的重要性。
2. 列举医学统计学中的几种主要研究设计,并简述其特点。
3. 描述医学统计学中数据的类型,包括定量数据和定性数据,并举例说明。
4. 阐述医学统计学中描述性统计分析的主要内容。
5. 解释医学统计学中的中心趋势度量和离散程度度量,并给出相应的计算公式。
6. 论述医学统计学中概率分布的概念及其在医学研究中的应用。
7. 简述医学统计学中假设检验的基本原理和步骤。
8. 描述医学统计学中相关性分析和回归分析的区别及其应用场景。
9. 论述医学统计学中生存分析的基本概念和方法。
10. 简述医学统计学中样本量的确定方法及其重要性。
11. 描述医学统计学中数据的收集、整理和分析流程。
12. 论述医学统计学中数据质量控制的重要性及其方法。
13. 简述医学统计学中多变量分析的概念及其在医学研究中的应用。
14. 描述医学统计学中临床试验设计的原则和步骤。
15. 论述医学统计学中因果推断的挑战和方法。
16. 简述医学统计学中生物统计学的应用及其重要性。
17. 描述医学统计学中数据可视化的常用方法及其在医学研究中的作用。
18. 论述医学统计学中统计软件的选择和使用。
19. 简述医学统计学中的伦理问题及其在研究中的应用。
20. 论述医学统计学在公共卫生领域的应用及其对健康政策制定的影响。
(完整版)医学统计学题库
For personal use only in study and research; not for commercial use第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A . 调查、录入数据、分析资料、撰写论文B . 实验、录入数据、分析资料、撰写论文C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A.10.0≤PB. 05.0≤P 或01.0≤PC. 005.0≤PD.05.0≤PE. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.角度资料3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A )。
4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C )。
5.空腹血糖测量值,属于( C )资料。
6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。
该资料的类型是(B )。
7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是(D )。
8. 100名18岁男生的身高数据属于(C )。
二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
医学统计学复习(练习及答案)
第36题:使用相对数时容易犯的错误是。
A.把构成比作为相对比
B.把构成比作为率
C.把率作为相对比
D.把率作为构成比
E.把相对比作为构成比
第37题:描述一组偏态分布资料的变异度,宜用。
A.全距
B.标准差
C.变异系数
D.四分位数间距
E.方差
第38题:当统计分析结果是差别无显着性,但所求得的检验统计量在界值附近时,下结论应慎重,是因为。
A.差值的总体均数为0
B.差值的总体中位数为0
C. μd≠0
D. Md≠0
E. μ1≠μ2
第23题:样本率的标准误sp的特点有。
A.n越大,则sp越大
B.p越大,则sp越大
C.1-p越大,则sp越大
D.np越大,则sp越大
E.n越大,则sp越小
第24题:统计地图可用于表示。
A.某现象内部构成
B.某现象地理分布
A. ∑(X-X)2
B. ∑(Y-Y)2
C. ∑XY-(∑X)( ∑Y)/n
D. ∑Y2-(∑Y)2/n
E. ∑(X-X)2/n
第32题:t分布与正态分布存在如下哪一种关系。
A.二者均以0为中心,左右对称
B.曲线下中间95%面积对应的分位点均为±1.96
C.当样本含量无限大时,二都分布一致
D.当样本含量无限大时,t分布与标准正态分布一致
C.用该市5岁男孩身高的均数来评价
D.用该市5岁男孩身高的1-α可信区间来评价
E.用该市5岁男孩身高的全距来评价
第44题:同一双变量资料,进行直线相关与回归分析,有。
A. r>0时,b<0
B. r>0时,b>0
医学统计学复习题
一、最佳选择题1.抽样研究是一种科学高效的方法,目的是研究(B )? A.样本 B.总体? C.抽样误差 D. 概率2.由样本推断总体,样本应该是( D )? A.总体中的典型部分? B.总体中有意义的部分? C.总体中有价值的部分? D. 总体中有代表性的部分3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中( C )? A.四种误差都不可避免? B.过失误差和测量误差不可避免? C.测量误差和抽样误差不可避免? D. 系统误差和抽样误差不可避免4.统计描述是指( C )? A.比较指标的差别有无显著性? B.估计参数? C.用统计指标描述事物的特征? D. 判断无效假设是否成立5.统计推断是指( D )? A.从总体推断样本特征? B.从总体推断总体特征? C.从样本推断样本特征? D. 从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )? A.系统误差 B.随机测量误差? C.抽样误差 D. 过失误差7.随机抽样的目的是( D )? A.能消除系统误差? B.能消除测量误差? C.能消除抽样误差? D. 能减小样本偏性54 人,该资料属于( B )8.对某地 200 名 16 岁中学生口腔检查,发现患龋齿的人数为? A.计量资料 B.计数资料? C.等级资料 D. 三个都不是9.计量资料是( C )? A.用仪器测量出来的资料? B.按观察单位的类别,清点各类观察单位数的资料? C.用定量方法测定观察单位某个变量的大小的资料? D. 按观察单位的等级,清点各等级观察单位数的资料10.计数资料是( B )? A.用仪器测量出来的资料? B.按观察单位的类别,清点各类观察单位数的资料? C.用定量方法测定观察单位某个变量的大小的资料? D. 按观察单位的等级,清点各等级观察单位数的资料11.等级资料是( D )? A.用仪器测量出来的资料? B.按观察单位的类别,清点各类观察单位数的资料? C.用定量方法测定观察单位某个变量的大小的资料? D. 按观察单位的等级,清点各等级观察单位数的资料12.下列哪种不属于计量资料( C )? A.红细胞数 B.血钙浓度? C.阳性人数 D.脉搏13.下列哪种属于等级资料( A )? A.治疗痊愈、有效、无效人数? B.各血型人数? C.白细胞分类百分比? D. 贫血和不贫血人数二、判断题? 1.统计工作的主要内容是对资料进行统计分析。
医学统计学部分试题及复习资料
第一章绪论1.下列关于概率的说法,错误的是A. 通常用P表示B. 大小在0%及100%之间C. 某事件发生的频率即概率D. 在实际工作中,概率是难以获得的E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件[参考答案] C. 某事件发生的频率即概率2.下列有关个人基本信息的指标中,属于有序分类变量的是A. 学历B. 民族C. 血型D. 职业E. 身高[参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是A. 性别B. 民族C. 职业D. 血型E. 身高[参考答案] E. 身高4.下列关于总体与样本的说法,不正确的是A. 个体间的同质性是构成总体的必备条件B. 总体是根据研究目的所确定的观察单位的集合C. 总体通常有无限总体与有限总体之分D. 一般而言,参数难以测定,仅能根据样本估计E. 从总体中抽取的样本一定能代表该总体[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是A. 所有糖尿病患者B. 所有成都市居民C. 2007年所有成都市居民D. 2007年成都市居民中的糖尿病患者E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民6.简述小概率事件原理。
答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。
答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的答:研究人员通常需要了解与研究某一类个体,这个类就是总体。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学复习题一、名词解释1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。
7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序资料。
如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。
8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
误差变量一般服从正态分布。
随机误差可以通过统计处理来估计。
11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
12.参数:指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
13.统计量:是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
14.频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
15.算术均数(arithmetic mean )描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用 表示。
16.几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G 。
17.中位数(median )将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
18.极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
19.百分位数(percentile )是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学参考值范围。
20.四分位数间距(inter-quartile range )是由第3四分位数和第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。
21.方差(variance ):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
22.标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
23.变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV 表示。
24.正态分布:若指标X 的频率曲线对应于数学上的正态曲线,则称该指标服从正态分布(normal distribution )。
通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。
25.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布(standard normal distribution ),通常记为2(0,1)N 。
26.抽样误差:抽样研究中,由抽样引起的样本统计量与总体参数间的差别称为抽样误差(sampling error )。
统计上用标准误(standard error ,SE )来衡量抽样误差的大小。
其产生的本质原因是由于个体间存在变异。
27.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α。
28.相对数(relative number )是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等。
29.率(rate )又称频率指标,说明一定时期内某现象发生的频率或强度。
30.构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布。
31.标准化法(standardization method)是常用于内部构成不同的两个或多个率比较的一种方法。
标准化法的基本思想就是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
32.统计表:将统计资料及其指标以表格形式列出,称为统计表(statistical table)。
狭义的统计表只表示统计指标。
33.统计图(statistical graph):是将统计指标以点的位置、线段的升降、直条的长短或面积的大小等几何图形直观的表示事物间的数量关系。
34.普通线图适用于连续性资料。
用线段的升降来表示一事物随另一事物变化的趋势。
35.散点图以点的密集程度和趋势表示两种事物间的相关关系。
二、简答题1. 一位研究人员欲做一项实验研究,研究设计应包括那几方面的内容?答:一般来讲,研究设计应包括两方面的设计:专业设计和统计设计。
专业设计是针对专业问题进行的研究设计,如选题、形成假说、干预措施、实验对象、实验方法等;统计设计是针对统计数据收集进行的设计,如样本来源、样本量、干预措施的分配、统计设计类型测量指标的选择等。
统计设计是统计分析的基础,任何设计上的缺陷,都不可能在统计分析阶段弥补和纠正。
2.试述极差、四分位数间距、标准差及变异系数的适用范围。
答:这三个指标均反映计量资料的离散程度。
极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。
3.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。
医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。
所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。
制定参考值范围的一般步骤:(1)定义“正常人”,不同的指标“正常人”的定义也不同。
(2)选定足够数量的正常人作为研究对象。
(3)用统一和准确的方法测定相应的指标。
(4)根据不同的用途选定适当的百分界限,常用95%。
(5)根据此指标的实际意义,决定用单侧范围还是双侧范围。
(6)根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。
4.正态分布的特征:服从正态分布的变量的频数分布由均数、标准差完全决定。
(1) 是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于。
(2) 描述正态分布资料数据分布的离散程度,越大,数据分布越分散,越小,数据分布越集中。
也称为是正态分布的形状参数,越大,曲线越扁平,反之,越小,曲线越瘦高。
5. 四格表资料卡方检验校正条件:分析四格表资料时,应注意连续性校正的问题,当1<T <5,n >40时,用连续性校正2χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。
6.统计表的结构与编制要求统计表由标题、标目、线条和数字所构成。
如下表所示:顶线表 号 标 题横标目名称纵标目名称 合计 横标目合 计数 字(1) 标题位于表的上方,概括表的主要内容,一般需注明时间与地点。
(2)标目有横、纵标目之分,分别说明横行和纵行数字的含义,应做到文字简明,层次清楚。
(3)线条多采用三条半线,即顶线、底线、纵标目下的横隔线及合计上的半线。
忌斜线和竖线。
(4)数字表内数据一律采用阿拉伯数字。
同一指标小数点位数要一致,位次要对齐。
表内不应有空项,无数字用“—”表示,数字若为零则填“0”,暂缺项或未记录用“…”表示。
(5)备注不为表的必备内容,如有必要,可在表内用“*”号标记,然后在表的下方加以说明。
7.统计表的种类统计表可分为简单表(simple table)和复合表(combinative table)两种类型。
简单表:只按单一特征或标志分组。
复合表:按两个或两个以上主要标志分组,如年龄和性别结合起来分组。
8.制图的基本要求(1)根据资料的性质和分析目的,选择合适的图形。
(2)标题扼要说明图的主要内容,位于图的下方,必要时注明时间和地点。