医学统计学 研究生期末考试版(包含大题)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释
1总体与样本
总体:指根据研究目的确定的同质的所有研究对象的某项或某几项指标测量值的集合。根据总体集合所包括的元素分为有限总体和无限总体。
样本:指以某种方式按预先规定的概率从总体中随机抽取的、足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。
联系:根据研究目的,从总体中抽取的部分有代表性的样本,可用样本统计量推断总体参数。
2标准差与标准误
标准差(S):描述一个变量的所有观察值与均数的平均离散程度的指标。表示单个观测值对某均数的离散程度,用于描述观测值的变异范围。标准差越大表明数据的离散程度越大。
变量值的标准差S S
标准误:描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,相当于多个样本均数的标准差,反映的是样本均数之间的变异。表示样本统计量对总体参数的离散程度,用于推断估计总体参数的可信区间和假设检验。标准误越大表明样本的统计值越差,样本对总体的代表性越差。样本均数的标准误S X
性率的标准误S p
3.X±1.96S与X±t0.05/2,v S X
即算术平均数,描述一个变量的所有观察值的平均水平,适用于频数分布对称数据。
X
S即标准差,描述一个变量的所有观察值与均数的平均离散程度。
S X即标准误,反映样本均数间的离散程度和样本均数与相应总体均数间的差异,是说明均数抽样误差大小的指标。
t0.05/2,v表示双侧尾部面积为0.05,自由度为v的t界值。
X±1.96S:表示从正态总体中抽大样本,观测值95%的波动范围,常用来制定参考值范围,判断某人的某一指标是否正常。
X±t0.05/2,v S X:表示从正态总体中抽大样本或小样本,总体均数95%的可信区间(置信区间),表示该区间有95%的可能性包含总体均数。
4.计量资料与计数资料
计量资料:指通过度量衡的方法,测量每一个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量衡单位和多为连续性资料。
计数资料:指将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量衡单位和多为间断性资料。
5 点估计与区间估计
点估计:就是直接用随机样本的样本均数X作为做为总体均数μ的一个估计,用样本的标准差S作为总体标准差δ的一个估计,即直接用样本统计量X±S作为总体参数μ±δ的估计值。
区间估计:是按预先给定的概率(1-α)用一个区间来估计总体均数,这个区间称为可信度(1-α)的可信区间(CI)或置信区间,预先给定的1-α称为可信度或置信度,常取95%或99%。
6回顾性研究与前瞻性研究
回顾性研究:现有结果,后回顾过去一探求接受因素的百分比,由果溯因,例:病例—对照研究。不能直接估计相对危险度,通常要通过计算优势比或比数比(OR)来近似估计相对危险度。
前瞻性研究:先设定因素,后经过一段时间研究后,分析暴露因素与疾病发生之间的因果关系。由因探果,例:队列研究。可直接估计相对危险度(RR)。
7完全随机设计与完全随机区组设计
完全随机设计:又称为单因素设计或成组设计,是将同质的研究对象随机地分配到各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。
随机区组设计:又称配伍组设计,是在实验设计中用一个非研究因素的变量进行分层,每个层的观察对象数相等,并对每个层进行随机分组。
两种实验设计方案均为单因素实验设计。区别是:①两者观察对象随机分配方式不同;②统计分析方法不同;③误差内涵及大小不同;④检验效能不同。
8独立测定数据与重复测定数据
独立测定数据:对一群观察对象的每个个体都独立测定一次得到的一个测定值,各测量数据之间无关联。 重复测定数据:对一个样本同时或不同时测定得到的多个测量值,各测量数据之间有关联。
9假设检验中的α与P
α:指检验水准(显著性水准),在原假设成立的前提下,规定它拒绝原假设可能要犯I 类错误的最大概率水平。是预先规定的判断小概率事件的概率尺度,通常规定为0.01或0.05。
P :指从已知总体中(或假设总体中)抽得统计量达到当前统计量这么大及比这绝对值还大的总概率,若以当前统计量为拒绝域临界点,在规定α前提下,实际预拒绝H 0可能犯Ⅰ类错误的概率。
假设检验规定,如果一次实验结果P >α,则不拒绝H 0,统计结论为“差别没有统计学意义”。 如果一次实验结果P ≤α,则拒绝H 0,统计结论为“差别有统计学意义”。
10调查研究与实验研究
调查研究:指研究者较被动地进行观察,希望尽可能减少或控制非实验因素干扰的研究。它无法将研究对象随机分组,样本量大,混杂因素多,用多因素分析。
实验研究:指研究者主动地安排实验因素,控制实验条件,排除非实验因素干扰的研究。混杂因素少,可用单因素分析。
二者关系:调查研究常为实验研究提供线索,而实验研究成果又须回到现场实践中去验证。
11.r 与b
r :即样本直线相关系数。计算公式为
x x y y r --,表示具有直线关系的两个变量间相关的密切程度与方向。r >0为正相关。要求x,、y 服从双变量正态分布。常用于流行病学。
b :即样本直线回归系数。计算公式()22
x y xy n b x x n -=-∑∑∑∑∑,表示当x 变化一个单位时y 的平均改变的估计值。b >0时x ↑→y ↑;b <0时x ↑→y ↓。要求x ,y 服从双变量正态分布或y 服从正态分布。常用于实验室研究。 联系:r 无单位,b 有单位;r 与b 符号一致,假设检验也等价。
12敏感度与特异度
敏感度:某病中真病人的阳性率,即真阳性率。表示对真病人的确诊能力。敏感度值愈高,漏诊的可能性愈小,因此该值愈大愈好。
特异度:某病中非病人的阴性率,即真阴性率。表示对非病人的鉴别和排除能力。特异度值愈大,诊断为假阳性的概率越小,误诊的可能性愈小。 13准确度与精密度
准确度:测定值与真实值的接近程度,用于说明测定方法有无系统误差。一般采用回收试验,计算回收率度量其大小。回收率愈接近100%,则准确度愈高;当回收率偏离100%较大时,则测定方法存在系统误差。回收率=(实测值-原有量)/加入量。
精密度:指对同一标本进行多次重复测定时,测定值与平均测定值的接近程度,属于随机误差,常用标准差或变异系数表示。此值愈小,说明测定方法重现性愈好。
联系:准确度与精密度均为评价检测方法可信赖程度的指标,其中以准确度为首要指标,当测定方法存在系统误差时,即使其精密度高,也不能采用此方法;当测定方法的精密度差,其准确度也不会高。
14关联性分析与趋势性分析
关联性分析:研究具有相互作用(对称关系)或单向作用(不对称关系)的两变量取值或取值频数是否存在影响与联系的统计分析方法。关联性分析较趋势性分析内涵更宽广,适用资料广,但量化含义相对粗犷,适合于社会学调查资料分析,对于定类变量一般不计方向。
趋势性分析:针对一个变量随同另一个变量的数量变化有规律性地发生线性、非线性数量协变关系,研究其协变关系规律的统计分析方法。存在自变量与应变量的。
15 阳性预报率与阴性预报率
阳性预报率(PV+):表示预测阳性结果的正确率,即诊断结果为阳性者实际患病的概率。PV (+)=a/a+b 。阴性预报率(PV-):表示诊断结果为阴性者实际未患病的概率。PV (-)=d/c+d
两者是结构预报率的表示方法。
二,填空题
1.科研设计的三点设计要素:处理或观察因素、对象、效应指标。
2.科研设计四个基本原则:随机化、设置均衡对照、足够的样本含量、盲法原则。