医学统计学(期末总复习)
医学统计学总复习--资料

平均数与变异度
均数±标准差(min,max)
中位数±四分位数间距 (min,max) 几何均数± 对数标准差 变异度小,则均数代表性好! 变异度大,数据分散,则均数代表性差! 平均数所表示的集中性与变异度所表示的离散性,从两个 不同的角度阐明计量资料的特征!
1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用 的统计指标是() A. 中位数 B. 几何均数 C. 均数 D. 频数分布 2. 算术均数与中位数相比,其特点是() A.不易受极端值的影响 B.能充分利用数据的信息 C.抽样误差较大 D.更适用于偏态分布资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧
男
女 女 男 女
1.71
1.58 1.60 1.76 1.62
A
B O AB O
异常
正常 异常 正常 正常
++
++ ++ +++ +
工人
工人 干部 干部 军人
3.49
5.48 6.78 7.10 5.24
研究设计的常见类型
完全随机设计:将实验对象完全随机地分配 到实验组与对照组或几个对比组中或从几个 不同总体中随机抽样 配对设计:
参考值范围(reference interval)
参考值范围又称正常值范围(normal range)。
什么是参考值范围:
是绝大多数正常人的某观察指标所在的范围。
绝大多数:90%,95%,99%等等。
确定参考值范围的意义:
用于判断正常与异常。
《医学统计学》总复习

§1 统计分析
一,定量资料的统计分析
定量资料的统计描述
反映集中趋势的指标: X 反映集中趋势的指标: 反映离散趋势的指标: 反映离散趋势的指标:
定量资料的统计推断
G
S
M
S2 Q CV
R
参数估计 假设检验
参数估计
点估计:用样本均数直接作为总体 点估计:
三,等级资料的统计分析(秩和检验) 等级资料的统计分析(秩和检验)
非参数检验的概念 非参数检验的优缺点 常用的秩和检验方法
(1) Wilcoxon符号秩和检验 配对设计 符号秩和检验(配对设计 符号秩和检验 配对设计) (2) Wilcoxon 两样本比较法 成组设计两样本 两样本比较法(成组设计两样本 成组设计两样本) (3) Kruskal-Wallis 法或 检验 (成组设计多样本 法或H 成组设计多样本) 成组设计多样本 (4) Friedman 法(随机区组设计 随机区组设计) 随机区组设计 (5) Nemenyi 法(成组设计多样本两两比较) 成组设计多样本两两比较) 成组设计多样本两两比较 (6) 随机区组设计两两比较的秩和检验
u 检验应用类型: 检验应用类型: 1)样本均数与总体均数的比较 2)完全随机设计的两样本均数的比较 ANOVA 检验应用类型: 检验应用类型: 1)完全随机设计的方差分析 2)随机区组设计的方差分析 3)交叉设计的方差分析 4)析因设计的方差分析 5)重复测量资料的方差分析
二,计数资料的统计分析
t 检验 t'检验 检验 ′
t
u 检验 ANOVA
正态分布的经验判断方法
若 若 , S ≥ 3X可认为资料呈偏态分布
S ≥ ,有理由怀疑资料呈偏态分布 X
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学总复习练习题(含答案)

一、最佳选择题1.卫生统计工作的步骤为 CA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有 DA.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括EA.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指 BA.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指 BA.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用 DA.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是 CA.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用 AA.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是 CA.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有 BA.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为 DA.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 D A.s x μ- B.σμ-x C. x s x μ- D.xx σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指 CA.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布e A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ-15.统计推断的主要内容为 BA.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指 BA.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大CA.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明 CA.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 DA.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高DA.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为 EA. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与 值的大小无关22.假设检验中的第二类错误是指 DA.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.多组均数的两两比较中,若不用q 检验而用t 检验,则 CA. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对24.说明某现象发生强度的指标为 EA.构成比B.相对比C.定基比D.环比E. 率25.对计数资料进行统计描述的主要指标是 BA.平均数B.相对数C.标准差D.变异系数E.中位数26.构成比用来反映CA.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对27.下列哪一指标为相对比EA. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数28.两个样本率差别的假设检验,其目的是BA.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同29.用正态近似法进行总体率的区间估计时,应满足DA. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求30.由两样本率的差别推断两总体率的差别,若P 〈0.05,则DA. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义31.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为DA. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u32.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为EA. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4033.三个样本率比较得到2χ>2)2(01.0χ,可以为AA.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同34.四格表2χ检验的校正公式应用条件为CA. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<135.下述哪项不是非参数统计的优点DA.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料36.秩和检验和t 检验相比,其优点是AA. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小37.等级资料比较宜用CA. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验38.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为CA.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大39.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用AA.普通线图B.直方图C.统计地图D.半对数线图E.圆形图40.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:BA.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料41. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
《医学统计学》期末考试试卷附答案

《医学统计学》期末考试试卷附答案一、单项选择题(每小题3分,共20小题,共60分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制()A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述( )资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是()A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用()A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是()A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6.男性吸烟率是女性的10倍,该指标为()A.相对比B.构成比C.定基比D.率7.统计推断的内容为()A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验()A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A.n1+ n2B. n1+ n2 –1C. n1+ n2 +1D. n1+ n2 -210、标准误反映()A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的( )A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?()A.tr>tbB. tr<tbC. tr= tbD. 二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验()A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为()A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学复习题

医学统计学复习题一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学总复习

医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。
几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。
四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
方差和标准差—正态分布和近似正态分布。
变异系数—比较计量单位不同以及均数相差悬殊的几组资料。
21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。
不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。
3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。
当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。
两小样本均数比较时,若两总体方差不相等,还可使用t’检验。
6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。
《医学统计学》期末考试试题及答案

一.单选题(每题Label 分)1 .体重指数(kg/m2)是()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B2 .统计量()。
A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标正确答案:E3 .血压(Kpa)是()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B4 .小概率事件在统计学上的含义是()。
A.指发生概率P≥0.5的随机事件B.指一次实验或者观察中绝对不发生的事件C.在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05D.在一次实验或者观察中发生的可能性较大的事件,一般指P>0.05E.以上说法均不正确正确答案:C5 .某次研究进行随机抽样,测量得到该市110名健康成年男子的血清总胆固醇值,则研究的总体是()。
A.所有成年男子的血清总胆固醇值B.该市所有成年男子的血清总胆固醇值C.该市所有健康成年男子的血清总胆固醇值D.110名健康成年男子的血清总胆固醇值E.所有男子的血清总胆固醇值正确答案:C6 .搞好统计工作,达到预期目标,最主要的是:()。
A.原始资料要多B.原始资料要准确C.整理资料要细D.分析资料要先进E.以上都不是正确答案:B7 .下面的变量中,属于定量变量的是()。
A.性别B.体重C.血型D.职业E.民族正确答案:B8 .表示血型(A.B.AB.O型)的资料,该资料为()。
A.观察单位B.数值变量C.分类变量D.等级变量E.研究个体正确答案:C9 .若要通过样本作统计推断,样本应是()。
A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分正确答案:C10 .脉搏数(次/分)是:()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B11 .下列关于概率的说法,错误的是()。
医学统计学期末复习(1-7章)

医学统计学期末复习(第1-8章版)医学统计工作的步骤:统计设计、收集资料、整理资料、资料分析总体:根据研究目的确定的研究对象全体样本:从总体中抽取的具有代表性的部分个体,具有代表性的称为个体,个体组成样本同质:总体中个体大同的性质变异:个体之间的小异统计学任务:在变异的背景下描述同一总体的同质性,揭示不同总体的异质性定性变量(分类变量):无序、有序(等级、半定量)定量变量:离散型、连续型参数:描述总体特征的指标统计量:反映样本特征的量误差:实测值与真实值之差抽样误差:因个体差异由于抽样原因引起的样本指标与总体指标间的差异(n大,抽样误差小;个体间变异大,抽样误差大;抽样误差无法避免)f次,f/n为A出现的频率A出现的概率=极差/预计组段数)3.确定组段:不重叠,第一组段含min,最后一组段含上限值;下限闭、上限开4.列表:三线表,上下粗、中间细频数分布图:更直观形象,可能存在潜在异常值1.描述频数分布类型:正态分布、正偏态分布(高峰左移、长尾右伸)、负偏态分布(高峰右移、长尾左伸)2.描述频数分布特征:集中趋势、离散趋势3.便于发现可疑值4.便于进一步分析处理描述集中位置的统计指标:1.算术均数:适用对称分布,尤其是正态分布 直接法:X X n=∑频数表法:fX X f =∑∑,为近似均值,f 起加权作用,X 为各段中值 2.几何均数:适用对数正态分布,或数据呈倍数变化直接法:G =,或lg 10XnG ∑=,X 存在负值?X X k '=+,G G k '=−频数表法:lg 10f X fG ∑∑=,为近似均值,f 起加权作用,X 为各段中值3.中位数、百分位数:适用于任何分布 直接法:分奇偶,略 频数表法:()%XX X L Xi P L n X f f =+⋅−∑,其中,Lx 为Px 所在组段下限,ix 为对应组距,fx 为对应频数,∑fL 为小于L 各组段的频数累计描述离散程度的统计指标:为自由度ν4.标准差:适用对称分布,尤其正态分布方差开平方根,标准差小,离散程度小,观察值多在均数周围,代表性好5.变异系数:适用比较均数相差较大/度量单位不同的资料又称离散系数,标准差与均数之比,即100%SCV X=⨯,没有单位正态分布的特征:①曲线在横轴上方均数处最高;②以均数为中心,左右对称;③两个参数,均数μ(位置参数)、标准差σ(形状参数);μ大右移,σ大分散Z 变换:转变为μ=0,σ=1的标准正态分布,=X Z μσ−从而()Z φ为 -∞到Z 的面积(单侧!)正态曲线下面积分布规律: 总面积为1±1,68.27%;±1.645,90.00% ±1.96,95.00%;±2.58,99.00% 可用于参考值范围确定,(±)双侧界限,(-)单侧下界,(+)单侧上界 (*过高、过低都不正常的,双侧;仅过高或过低才异常的,单侧)正态分布应用:估计频数分布、确定参考值范围、质量控制、理论基础中心极限定理:正态分布总体中抽n 个样本,样本均数服从正态分布;即使总体偏态分布,n 足够大时,样本均数也近似服从正态分布 样本均数标准差:X σ均数的抽样误差:抽样过程中产生的样本均数与总体均数之间的差异/样本均数之间的差异σ常未知,常用标准误代替样本均数标准差,标准误:X S σ常未知,因此采用的不是Z 变换,而是t 变换,X t =结果为t 分布,自由度为n-1,t 分布的特征: 1.以0为中心,左右对称,单峰2.相似于正态分布曲线,但更矮胖(变异大)3.为一簇曲线,形态变化与自由度有关,自由度越小,t 值越分散,曲线越低平4.自由度为正无穷时,与正态分布曲线吻合统计推断:参数估计、假设检验总体均数参数估计: 1.点估计(误差大):样本均数估计总体均数;样本标准差估计总体标准差 2.区间估计:1α−的置信区间CI 为:/2,X X t S αν±假设检验:样本均数与总体均数不同,原因可能是:①抽样误差;②本质差别0μμ=,仅抽样误差;0μμ≠,存在本质差别,如何判断?假设检验假设检验的基本步骤:1.建立假设检验0H (*需为保守假设,如相等、无效、无变化、无区别) 相应1H 为反面,根据实际情况选择单双侧检验,检验水准α常取小概率,也即0.05或0.012.选定检验方法,计算检验统计量选用t 检验、方差分析、卡方检验、秩和检验等检验方法… 以t 检验为例,则计算t 值,X t =3.确定P 值,作出推断结论 查附表(t 界值表等),根据自由度,得出P 值P α≤,差异有统计学意义,拒绝0H ,接受1HP α>,差异无统计学意义,不拒绝0H ,也即暂不能认为有差别 假设检验结论可能错误:0H 真实:拒绝0H ,接受1H →Ⅰ类错误(拒绝正确,假阳性)0H 不真实:不拒绝0H →Ⅱ类错误(不拒绝错误,假阴性)(Ⅱ类错误更严重)t 检验:1.单样本资料t 检验:样本均数与已知总体均数比较目的:推断样本是否来自某总体(通常为被接受的指标)2.配对样本t 检验:自身配对:同一对象的不同处理/处理前后比较异体配对:条件相同或近似的对象接受不同处理后进行比较 目的:推断某处理因素有无作用/两种处理因素有无差别(应先计算出前后的差值d ,应用条件是d 值服从正态分布;无差别时,理论上差值d 的总体均数应该为0)3.两独立样本t 检验:两组完全随机设计计量资料的统计推断目的:检验两个样本所代表的两总体均数是否相等t 检验适用的【前提】:1.各个体的独立性;2.正态性:两组样本来自正态分布总体(配对样本的差值d 要求服从正态分布);3.方差齐性:来自的正态总体方差相等。
医学统计学复习资料

医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。
就是同质所有观察单位得某种变量值得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位得某项指标得大小,而获得得资料。
其变量值就是定量得,表现为数值大小,一般有度量衡单位。
根据其观测值取值就是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。
其变量值就是定性得,表现为互不相容得性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。
[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值得集中位置或水平。
常用得平均数有算术平均数、几何平均数与中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。
(完整版)医学统计学复习题

B. 1:16
C. 1:11.6
D. 1:4
E. 1:8
3用频率表计算方差的公式为:A
A
B
C.
D.
E.
4.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为:E
A. 11天
B. 9天
C. 10天
D. 10.2天
E. 9.5天
C.总体均数不同
D.抽样误差或总体均数不同
E.系统误差
9.从某地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5 mmHg,标准差为10.4mmHg,则该地7岁正常男孩的收缩压总体均数的95%的置信区间为(A)
A.
B.
C. 90.5±1.96×10.4
D. 120.2±t(0.05/2,9)×10.4
A.样本与总体之差
B.系统误差
C.随机误差
D.抽样误差
E.随机测量误差
6.某人记录了50名病人体重的测定结果:小于50Kg的13人,介于50Kg和70 Kg间的20人,大于70 Kg的17人,此种资料属于A
A.定量资料
B.分类资料
C.有序资料
D.名义变量资料
E.二分类资料
7.上述资料可以进一步转换为B
A.是统计总体数据得到的量
B.反映总体统计特征的量
C.是由样本数据计算出的统计指标
D.是用参数估计出来的
E.是根据总体中的全部数据计算出的统计指标
4.欲了解某市某年所有三级甲医院的病床数,该市每个三级甲医院就是一个:C
A.有限总体
B.观察值
C.无限总体
D.分类变量
E.观察单位
医学统计学期末试卷四A(1)(1)

医学统计学期末试卷四A题型:A11.关于率的标准化,以下错误的是A.两个率相等时,其标化后的标化率也一定相等B.比较两个内部构成不同的率时,要做标化处理C.标化率只是相对水平,不能代表实际水平D.标准不同,标化率也不同E.两个率相等时,其标化后的标化率不一定相等2.由于仪器未进行归零校正,所引起的误差是A.系统误差B.随机测量误差C.抽样误差D.偶然误差E.相对误差3.从正态分布资料中随机抽样,变量值位于μ-2.58σ到μ+1.96σ间的概率是A.95%B.97%C.99.5%D.视均数而定E.视标准差而定4.描述某地300名健康成人发汞含量的分布,宜绘制的统计图是A.直条图B.直方图C.线图D.散点图E.百分条图5.在下列均数多重比较的方法中,最为保守的是A.LSD法B.SNK法C.Dunnett法D.Bonfferoni法E.z检验6.在总体方差相等的条件下,由两个独立样本计算两个总体均数之差的可信区间包含了0,则A.可认为两样本均数差别无统计学意义B.可认为两样本均数差别有统计学意义C.可认为两总体均数差别无统计学意义D.可认为两总体均数差别有统计学意义E.可认为两总体均数和样本均数差别都有统计学意义7.一般地,方差分析适用的变量类型的资料为A.定性变量B.有序变量C.定量变量D.二分类变量E.多分类变量8.在统计检验中,是否选用非参数统计方法,正确的是A.根据研究目的和数据特征确定B.可在算出几个统计量和得出初步结论后进行选择C.要看哪个统计结论更符合专业理论D.要看哪个P值更小E.基于研究目的9.当两总体方差不等时,适用于两样本均数比较的方法是A.t检验B.t'检验C.Z检验D.方差齐性F检验E.方差分析10.利用一次横断面调查资料,描述职业和肝炎患病率关系应该用A.散点图B.直方图C.直条图D.圆图E.箱式图11.直方图可用于A.某现象的内部构成B.各现象的比较C.某现象随另一现象的伴随变化趋势D.某现象的频数分布E.某现象的发展速度12.百分条图可用于A.某现象的内部构成B.各现象的比较C.某现象随另一现象的伴随变化趋势D.某现象的频数分布E.某现象的发展速度13.观察意外死亡在不同年份的变化趋势,宜选择的图形A.直条图B.线图C.圆图D.半对数线图E.直方图14.描述婴儿和成人的体重变异度大小,宜选择的指标是A.变异系数B.方差C.标准差D.标准误E.全距15.从正态分布资料中随机抽样,变量值位于μ-1.96σ到μ+1.96σ间的概率是A.95%B.92.5%C.99%D.视均数而定E.视标准差而定16.计算相对数的目的是A.为了进行显著性检验B.为了便于比较C.为了表示绝对水平D.为了表示实际水平E.为了表示相对水平17.关于随机抽样,下列说法正确的是A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.随机抽样即随意抽取个体C.研究者在抽样时应精心挑选个体,以使样本更能代表总体D.通过统计设计可以消除抽样误差E.为确保样本具有更好的代表性,样本量应越大越好18.20个人每人抽取一个样本量为50的随机样本并计算80%可信区间。
医学统计学复习(练习及答案)

第36题:使用相对数时容易犯的错误是。
A.把构成比作为相对比
B.把构成比作为率
C.把率作为相对比
D.把率作为构成比
E.把相对比作为构成比
第37题:描述一组偏态分布资料的变异度,宜用。
A.全距
B.标准差
C.变异系数
D.四分位数间距
E.方差
第38题:当统计分析结果是差别无显着性,但所求得的检验统计量在界值附近时,下结论应慎重,是因为。
A.差值的总体均数为0
B.差值的总体中位数为0
C. μd≠0
D. Md≠0
E. μ1≠μ2
第23题:样本率的标准误sp的特点有。
A.n越大,则sp越大
B.p越大,则sp越大
C.1-p越大,则sp越大
D.np越大,则sp越大
E.n越大,则sp越小
第24题:统计地图可用于表示。
A.某现象内部构成
B.某现象地理分布
A. ∑(X-X)2
B. ∑(Y-Y)2
C. ∑XY-(∑X)( ∑Y)/n
D. ∑Y2-(∑Y)2/n
E. ∑(X-X)2/n
第32题:t分布与正态分布存在如下哪一种关系。
A.二者均以0为中心,左右对称
B.曲线下中间95%面积对应的分位点均为±1.96
C.当样本含量无限大时,二都分布一致
D.当样本含量无限大时,t分布与标准正态分布一致
C.用该市5岁男孩身高的均数来评价
D.用该市5岁男孩身高的1-α可信区间来评价
E.用该市5岁男孩身高的全距来评价
第44题:同一双变量资料,进行直线相关与回归分析,有。
A. r>0时,b<0
B. r>0时,b>0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
R软件
Stata 输出:
Egger's test -----------------------------------------------------------------------------Std_Eff | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------slope | .4270146 .286694 1.49 0.197 -.3099558 1.163985 bias | .0547229 .947982 0.06 0.956 -2.382143 2.491589
p25
median
p75
max
t检验
• 资料由什么设计而来:完全随机设计、配 对设计 • 统计学描述(例数、均数、标准差) • 统计学检验方法(单组、两组、配对) • 统计学检验结果(根据方差是否齐,选择 不同结果),t值,p值 • 专业意义
【例1】为了验证肾上腺素有无降低呼吸道阻 力的作用,用豚鼠12只进行支气管灌流法实 验,在注入定量肾上腺素前后,测得豚鼠支 气管功能反映在仪器上的灌流速度(每分钟灌 流滴数),结果见下表 。 问:肾上腺素能否降低豚鼠呼吸道阻力?
• 对检索资料进行评价、评分,分5级。
Jadad评分量表
1 随机分组序列的产生方法 2分:通过计算机产生的随机序列或随机数表产生的序列; 1分:试验提到随机分配,但产生随机序列的方法未予交待; 0分:半随机或准随机试验,指采用交替分配病例的方法,如入院顺 序、出生日期单双数; 2 双盲法 2分:描述了实施双盲的具体方法并且被认为是恰当的,如采用完全 一致的安慰剂等; 1分:试验仅提及采用双盲法; 0分:试验提及采用双盲,但方法不恰当,如比较片剂与注射剂而未 提及使用双伪法; 3 退出与失防 1分:对退出与失防的病例数和退出理由进行了详细的描述; 0分:没有提到退出与失防;
• 结果解读
• 结果解读1
N:用药前、用药后样本例数=12 均值:用药前、用药后均值分别为44.83、52.83 标准差:用药前、用药后标准差分别为9.815、 6.952
• 结果解读2
t:统计量t=-2.653 Sig(双侧):p值=0.022 均值差值:两个均数的差值=-8.000 差值的95%CI:-14.636~-1.364
• 识别异质性:观察几个独立研究的差异 情况,是否合并? • Q检验 p值<0.1表示有异质性
亚组分析 Subgroup Analysis
• 根据性别、年龄、种族等进行分组分析
合并效应
• RevMen软件计算结果:
总体效应检验,p<0.05有意义
发表偏倚 Publication Bias
• 阳性的研究结果发表的机会更多,过分强调阳性 结果可能造成误导。 • 漏斗图描述发表偏倚 • 一项有争议的研究得出来的是一个倒置漏斗图: • 如果有发表偏倚,则图形不对称:
步骤 7:讨论与总结
• 评估该系统评价的
局限性 实用性 论证强度 对医学研究的意义
Meta分析软件:
• RevMan 操作简易 系统综述和meta分析 • Stata • R 功能强大 发表偏倚定量及图片编辑
• Meta-dics • SAS
Meta分析涉及的几个统计处理
• 统计处理流程:
• a.异质性检验(齐性检验)。 • b.统计合并效应量并进行统计推断。 • c.采用“倒漏斗图”了解潜在的发表偏 倚。
Grade A
US Preventive Task Force This is good evidence to support the recommendation There is fair evidence to support the recommendation
NHS R&D Center for EBM 1a SR of RCT 1b individual RCT 1c: All-or-none studies 2a SR of cohort studies 2b individual cohort study or lowquality RCT(<80% follow up) 2c outcome research 3a SR of case-control study 3b individual case-control study 4 Case series and poor quality cohort/case-control studies Expert opinion without explicit critical appraisal, or based on bench research
【例2】为观察中成药青黛明矾片对急性黄疸 肝炎的退黄效果,以单用输液保肝的患者作 为对照进行了完全随机设计观察,受试对象 为黄疸指数在 30~50 之间的成年患者,观测 结果为退黄天数,数据见下表。 试比较中药组与对照组退黄天数有无差别?
表 组别 中药组 对照组 人数 7 8 5 18 急性黄疽性肝炎患者的退黄天数 退黄天数(天) 10 14 21 17 8 21 30 23 22 22
B
C
There is insufficient evidence for or against, but recommendation may be made on other grounds There is fair evidence to exclude the recommendation There is good evidence to exclude the recommendation 评价治疗或筛查的证据质量
步骤 2:全面查找资料
• 1 制定检索词、检索策略 • 2 严格纳入和排除标准
• 3 全面检索资料:
Pubmed、Cochrane、EBMbase、OVID、 Google、国内全文数据库、报告、会议、 摘要等所有可用资源
• 4 文献管理软件:Note express、EndNote
步骤 3:资料评价
• 结果解读1
描述了4组分别的和总的均值、标准差、标 准误、95%CI、最小、最大值。
• 结果解读2
进行了方差齐性检验,p=0.048,p<0.05, 表示方差不齐。
• 结果解读3
总的组间差异比较,F=83.546,p=0.000, p<0.01,表明组间差异有统计学意义。
• 结果解读4:组间均值的两两比较
Meta分析研究步骤:
遵循一个结构式程问题 – 综合搜索资料 – 严格评价资料 – 提取资料数据 – 分析并形成结果 (Meta分析方 法)
步骤 1:提出问题
• 选题:是最重要最困难的事情 • 需要考虑以下几个方面: 重要性 争议性 创新性 可行性
步骤 1:提出问题
如何提高
医 学
英 语 检 索 统 计
系统 综述 /Meta分 析
做一个系统综述研究常需要多人协作
更多了解……
丁香园循证医学专版:
/bbs/post/page?bid=96&sty=0&age=0
医学统计学
一、绪论 九、基于秩次的非参数检验
二、统计描述
医学统计学
一、绪论 九、基于秩次的非参数检验
二、统计描述
三、概率分布
十、实验设计
十一、调查设计
四、参数估计与假设检验
五、t检验 六、方差分析
十二、协方差分析
十三、多重线性回归分析 十四、logistic回归分析
七、双变量相关与回归分析 十五、生存分析 八、x2检验
D
E
预防、诊断、预后、治疗和危害研究 等领域的研究评价
步骤 4:抽取资料
步骤 5:数据分析整理
• 计量资料:均数之差
例1 氟对女童 I I 掌骨皮质厚度的影响
x
标准化均数之差: di =( 1i 权重系数: wi = n 1i + n 2i
2i)
/Sci , i = 1, 2, 3 ,k
步骤 6:结果展示
医学统计学(13) ——复 习
季聪华 2012.12.26
Meta分析
什么是Meta分析?
• 是对具备特定条件的、同课题的诸 多研究结果进行定量合并的一类统 计方法。 • 优点:Meta分析整合大量的研究报告,
增加了样本量,增加了结论的统计功效, 解决分歧意见,比综述的结论更客观全 面, 并可引出新见解。
发表偏倚 Publication Bias
• 绘制漏斗图分析 表示偏倚存在
2 1
log[or]
P<0.05
Begg's funnel plot with pseudo 95% confidence limits
0
-1
-2 0 .2 .4 s.e. of: log[or] .6 .8
Revman
Stata
• 结果解读5
S-N-K检验结果将无统计学意义的比较组列在同 一列中。即样本均数显示在同一列时,表示两组 总体均数差别无统计学意义。
【例4】按2X2析因设计进行临床研究,把 20 名胃癌患者随机分到各实验组,治疗 3 个 月后,应用胃癌患者QOL的测评量表评价 方法,以总分评定A、B两种中药配合抗癌 药物治疗胃癌患者的生存质量,结果如下 表。试分析A、B 两药的治疗效果,以及 A 、B 两药间是否存在交互作用?
• 结果解读3
t:统计量t=-3.351 Sig(双侧):p值=0.004,p<0.05 均值差值:两个均数的差值=-9.694 差值的95%CI:-15.861~-3.528