武大医学统计学期末复习总结(名解和简答)

合集下载

《医学统计学》复习重点总结

《医学统计学》复习重点总结

计量数据比较的统计公式
X 0 t Sx
样本均数与标准值的比较 *配对数据的比较(不做方 差齐性检验 *两样本均数的比较,例数 较小时(做方差齐性检验)
d d t Sd
X1 X 2 t S x1 x2
t检验与可信区间公式小结
X1 X 2 t , SX1X 2
两独立样本均数的t n1 n2 2 检验公式
病变性质
肿瘤
恶性
1.层次不清,结构混乱,难于理解 2.线条过多,不符要求
修改后:
表 10 病变性质 良性肿瘤 恶性肿瘤﹡ 囊肿 瘤样病变 合 计
口腔颌面部不同病变构成情况 例 数 674 558 192 168 1592 构成比(%) 42.34 35.05 12.06 10.55 100.00
﹡包括癌437例,肉瘤101例,果用统计表表达。
统计表类型:
简单表和组合表
统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图
例: 简单表格式
某地1980年男女HBsAg阳性率的比较 性别 调查例数 男 4234 女 4530 合计 8764 阳性数 303 181 484 阳性率% 7.16 4.00 5.52
第14章基于秩次的统计方法
掌握概念: 1)何为非参数统计? 2) 什么样数据适合采用秩和检验,以及秩和 检验的优缺点。 3)秩和检验有那几种检验方法?
注意:结果(y)数据为等级时,两组比较采 用秩和检验效率高于χ2检验,应首选秩和检验.
表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45 Total 39 33 23 7 102

医学统计学重点简答题和名词解释

医学统计学重点简答题和名词解释

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。

抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。

表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。

可用标准误描述其大小。

标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。

样本均数的标准差称为均数的标准误。

均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。

参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间 揭示的是按一定置信度估计总体参数所在的范围。

t分布法、正态分布法(标准误)、二项分布法。

置信区间估计总体参数所在范围非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。

变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。

参数(parameter):描述总体特征的统计指标。

统计量(statistic):描述样本特征的统计指标。

实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。

在确定接受处理因素的实验组时,要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。

整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。

《医学统计学》复习资料与习题答案

《医学统计学》复习资料与习题答案

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 《医学统计学》复习资料与习题答案《医学统计学》复习资料与习题答案教学提要(一)《医用统计学》基本概念 1、变异:宇宙中的事物,千差万别,各不相同。

即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。

同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。

2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。

3、总体:即根据研究目的确定的同质的研究对象的全体。

更确切地说,是性质相同的所有观察单位的某种变量值的集合。

4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。

为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。

5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资1 / 9料称为计量资料,一般有度量衡等单位。

6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。

可分为二项式或多项式分类变量。

7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。

8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。

(二)统计工作的基本步骤 1、设计: 这是关键的一步。

医学统计学名词与简答题_0

医学统计学名词与简答题_0

---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学名词与简答题医学统计学重点第一章医学统计学基础 1 随机现象是指在一定条件下并不总是出现相同结果的现象。

2 概率 probability 即随机事件发生的可能性大小。

3 小概率事件 P 错误!未找到引用源。

0. 05 或错误!未找到引用源。

0. 01 的事件。

4 总体 population:是根据研究目的所确定的同质观察单位的全体。

5 参数 parameter:描述总体特征的统计指标,一般用希腊字母表示。

6 样本 sample:从总体中抽出的供研究的观察单位。

7 统计量:根据样本观察值计算出的描述样本的特征值。

8 误差 error:使之研究结果与真实情况之间的差别。

根据原因分为:随机测量误差、系统误差和抽样误差。

系统误差对研究结果的影响较大,是可以控制和避免的。

9 抽样误差 sampling error:由于抽样所导致的样本均数与总体均数之差(在抽样研究中,即1 / 11使没有随机测量误差和系统误差,在样本指标和总体指标间仍可能存在误差这种误差是由于抽样所致)。

10 数值变量资料又称计量资料,是对某种随机变量进行定量测量所得的资料。

11 统计工作一般包括研究设计、资料收集、数据整理和统计分析四个基本步骤。

统计分析包括统计描述和统计推断。

12 同质:影响研究指标的主要因素易控制的因素基本上相同。

13 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。

第二章数据变量资料的统计描述 1 频数表的编制步骤:找全距(极差),定组距,写组段,划记,列频数表。

(重点具体看书) 2 集中趋势的描述有:算数均数,几何均数,中位数。

医学统计学名词解释、简答、问答

医学统计学名词解释、简答、问答

名词解释1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。

变异是生物医学研究领域普遍存在的现象。

严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。

4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

等级资料又称有序变量。

如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。

医学统计学期末考试 名词解释

医学统计学期末考试  名词解释

10、测定某地107名正常人尿铅含量(μmol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是中位数和四分位数间距。

12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。

13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。

16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。

19、正态分布是以μ为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。

25、正态分布的形态由σ决定,t分布的形态由自由度决定。

20、正态分布和t分布都呈单峰和对称分布,但是曲线下相同的面积所对应的界值是不同的,t界值比u界值大,而且自由度越小,二者相差越大。

22、计算正态分布资料95%正常值范围的公式是X±1.96S ;估计总体均数95%可信区间的公式是X±1.96Sx 。

26、在抽样研究中,当样本含量趋向无穷大时,X趋向等于μ,Sx趋向于 0 ,t(0.05,v)趋向于1.96 。

①选有代表性的、较稳定的、数量较大的人群做标准;②将相互比较的各组数据合并作标准;③选择相互比较的各组中的一组作为标准。

一、名词解释1、定量资料:又称计量资料,是用定量的方法测定观察单位某项指标数值的大小,所得到的资料称为定量资料。

根据变量的取值特征,可分为连续型数据(身高、体重)和离散型数据(家庭成员数、白细胞计数)。

2、定性资料:又称计数资料,是将观察单位按照某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。

各类别属性没有程度或顺序上的差别,如男女,血型。

3、等级资料:又称有序分类资料,是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料称为等级资料。

各类别属性有程度或顺序上的差别,如显效、有效、无效等。

4、总体:是根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。

2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。

3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。

4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。

5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。

6. 参数 (parameter):参数,也叫参变量,是一种变量。

7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。

8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。

越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。

1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。

4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。

5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。

如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。

医学统计学期末考试 名词解释

医学统计学期末考试  名词解释

10、测定某地107名正常人尿铅含量(μmol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是中位数和四分位数间距。

12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。

13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。

16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。

19、正态分布是以μ为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。

25、正态分布的形态由σ决定,t分布的形态由自由度决定。

20、正态分布和t分布都呈单峰和对称分布,但是曲线下相同的面积所对应的界值是不同的,t界值比u界值大,而且自由度越小,二者相差越大。

22、计算正态分布资料95%正常值范围的公式是X±1.96S ;估计总体均数95%可信区间的公式是X±1.96Sx 。

26、在抽样研究中,当样本含量趋向无穷大时,X趋向等于μ,Sx趋向于 0 ,t(0.05,v)趋向于1.96 。

①选有代表性的、较稳定的、数量较大的人群做标准;②将相互比较的各组数据合并作标准;③选择相互比较的各组中的一组作为标准。

一、名词解释1、定量资料:又称计量资料,是用定量的方法测定观察单位某项指标数值的大小,所得到的资料称为定量资料。

根据变量的取值特征,可分为连续型数据(身高、体重)和离散型数据(家庭成员数、白细胞计数)。

2、定性资料:又称计数资料,是将观察单位按照某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。

各类别属性没有程度或顺序上的差别,如男女,血型。

3、等级资料:又称有序分类资料,是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料称为等级资料。

各类别属性有程度或顺序上的差别,如显效、有效、无效等。

4、总体:是根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。

医学统计学期末复习总结

医学统计学期末复习总结

医学统计学期末复习总结医学统计学期末复习总结名词解释1.参数Patameter:是指总体的统计指标,如总体均数、标准差,,采用希腊字母分别记为μ、σ。

是固定的常数。

多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。

2.统计量statistic:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为X、S。

样本统计量是在总体参数附近波动的随机变量,可用来估计总体参数。

3.系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。

(受确定因素影响,大小变化有方向性)4随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。

(影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析)5 I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。

(1-a)即可信度:重复抽样时,样本区间包含总体参数(m)的百分数。

6 II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。

(1-β)即把握度(或检验效能):两总体确有差别,被检出有差别的能力。

7 P值P-value:在H0成立的前提下,用样本数据获得的样本统计量,及比样本统计量总计更极端的曲线下的面积。

8 置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。

9 多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

10哑变量dummy variable:用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。

医学统计学方法重点简答题和定义解释

医学统计学方法重点简答题和定义解释

医学统计学方法重点简答题和定义解释本文档旨在提供医学统计学方法的重点简答题和定义解释,帮助读者加深对这一领域的理解。

1. 什么是假设检验?定义解释:假设检验是一种统计推断方法,用于判断样本数据是否支持或反对某个假设。

它涉及两个互补的假设:零假设和备择假设。

通过计算样本数据与零假设之间的距离,以及确定这种距离在统计上的显著性,可以得出结论是否拒绝零假设。

假设检验是一种统计推断方法,用于判断样本数据是否支持或反对某个假设。

它涉及两个互补的假设:零假设和备择假设。

通过计算样本数据与零假设之间的距离,以及确定这种距离在统计上的显著性,可以得出结论是否拒绝零假设。

2. 请解释一下T检验和Z检验的区别是什么?定义解释: T检验和Z检验都是假设检验方法,用于比较两个样本均值的差异。

它们的区别在于所依赖的假设和参数。

T检验和Z检验都是假设检验方法,用于比较两个样本均值的差异。

它们的区别在于所依赖的假设和参数。

T检验适用于小样本(样本量较小)情况,它假设样本数据服从正态分布,并使用样本标准差来估计总体标准差。

T检验通常用于实践中,当总体标准差未知时。

Z检验适用于大样本(样本量较大)情况,它假设样本数据和总体数据都服从正态分布,并使用总体标准差。

Z检验通常用于理论研究中,当总体标准差已知时。

3. 请解释一下卡方检验的用途是什么?定义解释:卡方检验是一种统计检验方法,用于判断两个或多个分类变量之间的关联性。

它通过比较观察到的频数和期望频数之间的差异来评估分类变量之间的独立性。

卡方检验常用于分析有序或无序分类变量之间的关联,例如研究治疗方法对疾病治愈率的影响。

卡方检验是一种统计检验方法,用于判断两个或多个分类变量之间的关联性。

它通过比较观察到的频数和期望频数之间的差异来评估分类变量之间的独立性。

卡方检验常用于分析有序或无序分类变量之间的关联,例如研究治疗方法对疾病治愈率的影响。

4. 请解释一下相关系数是什么?定义解释:相关系数是一种用于衡量两个变量之间关联程度的统计量。

医学统计学简答题整理

医学统计学简答题整理

医学统计学简答题整理(by 李勇君)自从统计换了出题老师之后简答题就出得非常任性,所以这些真的只是仅供参考。

= =————————————————————————————————————————————————1.医学统计学方法的基本步骤:(1)设计:统计工作中最关键的一环。

(2)收集资料:主要有四个来源:统计报表;登记和报告卡(单);日常医疗卫生工作记录;专题调查或实验。

(3)整理资料(4)分析资料:统计描述;统计推断。

2.正态分布的特征:(1)正态分布曲线在横轴上方均数处最高;(2)正态分布以均数为中心左右对称;(3)正态分布曲线下面积的分布有一定的规律;(4)正态分布有两个参数:均数μ是位置参数,决定正态曲线的中心位置;σ是形状参数,决定正态曲线的陡峭或扁平程度,σ越小曲线越陡峭,σ越大曲线越扁平。

3.t分布的特点:(1)以0为中心左右对称;(2)曲线形态与自由度大小有关,自由度越小,t分布曲线越平坦,曲线中间越低,两侧尾部翘得越高;自由度越大,t分布曲线越接近正态分布曲线。

4.制定医学参考值范围的基本原则:(1)抽取样本含量足够大的正常人;(2)对抽取的正常人进行准确统一的测定,控制测量误差;(3)判断是否需要分组指定参考值范围;(4)决定参考值范围的单侧或双侧界值;(5)选择适当的百分界值。

5.标准误的应用:(1)反映样本均数的可靠性以及抽样误差的大小(标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差;反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。

)(2)估计总体均数的置信区间;(3)用于均数的假设检验。

6.假设检验的一般步骤:(1)建立假设(无效假设和备择假设)和确定检验水准;(2)选择检验方法和计算检验统计量;(3)确定P值,做出推断结论。

7.t检验与u检验的应用条件:t检验:(1)σ未知且样本例数n较小;(2)要求样本来自正态分布的总体;(3)作两样本均数比较时还要求两样本的总体方差相等(方差齐性)u检验:(1)σ已知或σ未知,但样本含量n较大(一般大于100);(2)要求样本来自正态分布的总体;(3)作两样本均数比较时还要求两样本的总体方差相等(方差齐性)8.假设检验的注意事项:(1)注意资料的可比性;(2)注意选用的假设检验方法的应用条件;(3)结论不能绝对化;(4)正确区分差别有无统计意义和有无专业意义的实际意义;(5)u检验和t检验理论上要求样本来自正态分布的总体,还要注意方差齐性。

医学统计学名解和简答

医学统计学名解和简答

医学统计学(名词解释和简答题)1.总体:是同质的个体所构成的全体。

2.样本:从总体中抽取部分个体的过程为抽样,所抽得的部分为样本。

3抽样误差:样本的数据构成的统计指标与总体的统计指标有误差,这种差异是由抽样引起的。

4. 平均数(算术均数)适用于:对称分布或偏斜度不大的资料,尤其适合正态分布资料。

5.几何均数多用于:血清和W学中,有些明显呈偏态分布的资料经过对数变换后呈对称分布。

如:抗体滴度,细菌计数,血清凝集效价,某物质浓度等,其数据特点是观察值间按倍数关系变化。

6.中位数适用于:在频数分布明显偏态,或频数分布的两端无确定数值时。

7.百分数适用于:可用来描述资料的观察值序列在某百分位置的水平。

8.极差:也叫全距,即观察值中最大值和最小值之差,用符号R表示,是变异指标中最简单的一种。

9.极差使用于:说明传染病食物中毒的最短,最长潜伏期等。

10.方差:将离均差平方和再取平均其结果。

11.标准差:总体观察值中个体值的变异强度。

12.正态分布:标准差与均数结合能够完整地概括一个正态分布。

13. 双侧:有些指标如白细胞数过高或过低均属异常,故其参考值范围需要分别确定下限和上限。

14.单侧:有些指标如24小时尿糖含量仅在过高,肺活量仅在过低时为异常,只需确定其上限或下限。

15.标准误:标本均数的标准差6-,又称(简写SE)。

16.P值:指从H0规定的总体随机抽得等于或大于现有样本统计量值的概率。

17标准差:是一组观察值变异程度的指标。

18总变异=组间变异+组内变异。

19. 率:是表示某种现象发生的频率和强度。

20.构成比:表示事物内部各个组成部分所占整体的比重。

21.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。

22. 相对数:指为了使计数资料具有可比性,取原始两个资料之比所得。

23. 确定组距:将全距除以组数可得到组距的近似值。

24.确定组限:实际组限在每组中只包含下限而不包含上限。

25.算术平均数:说明一组观察值的平均水平或集中趋势,是描述计量资料的一种常用方法。

医学统计学 名词解释 名解 复习资料

医学统计学 名词解释 名解 复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。

只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。

假想的,无时间和空间概念的,称为无限总体(infinite population)。

2. (总体)参数(parameter):总体的统计指标或特征值。

总体参数是事物本身固有的、不变的。

3. 样本(sample):从总体中随机抽取的部分个体。

4. 样本含量(sample size):样本中所包含的个体数。

5. 变量(variable):观察对象个体的特征或测量的结果。

由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。

变量的取值称为变量值或观察值(observation)。

根据变量的取值特性,分为数值变量和分类变量。

6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。

对每个观察单位用定量的方法测定某项指标的数值,组成的资料。

7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。

2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。

等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。

8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。

医学统计学简答题总结 必考大题总结 考前必看

医学统计学简答题总结 必考大题总结 考前必看

描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?答:描述计量资料集中趋势的统计指标常见的有算数均数、几何均数、中位数。

算数均数适用于描述对称分布资料的集中位置,尤其是正态分布的资料;几何均数一般用来描述等比资料和对数正态分布资料的集中位置;中位数可以使用于任何分布的资料,尤其是偏态分布。

分布不明或分布末端无确定值的资料。

描述离散趋势的指标常见的有极差、四分位数间距、方差、标准差和变异系数。

极差与四分位数间距可以用于任何分布,后者比前者稳定,但是这两个指标都不能综合反映各观察值得变异程度;方差和标准差最常用,但要求资料近似正态分布;变异系数可以用于多组资料间量纲不同或均数相差较大的时候变异程度的比较。

频数分布表(图)的用途有哪些?1描述资料的分布类型,是对称分布还是偏态分布;2描述变量的分布特征:集中趋势和离散趋势;3便于发现某些离群值或异常值;4便于进一步的统计分析和处理;5当样本含量够大的时候,我们还可以以频率作为概率的估计值。

变异系数和标准差有何异同?答:不同点:变异系数主要用于量纲不同的变量间,或均数相差较大的变量间的变异程度的比较。

所以变异系数是没有量纲的,而标准差是方差的平方根,标准差的量纲与原指标的一致,它适用于近似正态分布的资料。

相同点和联系:变异系数和标准差都是用于对称分布资料,尤其是正态分布的资料,且还可以知道变异系数是由标准差计算得到的。

应用相对数的注意事项:1、防止概念混淆2.频率型指标的解释要紧扣总体与属性3、计算相对数时分母应有足够数量4.正确计算合计频率5、注意资料的可比性6.正确进行相对数的统计推断。

为什么不能以构成比代率?请联系实际加以说明。

率和构成比所说明的问题不同,因而绝不能以构成比代率。

构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。

.二项分布:如果每个对象阳性结果的发生概率为π,阴性结果的概率为1-π,而且各个观察对象的结果是相互独立的,那么,重复观察N个人,发生阳性次数的概率分布为二项分布。

医学统计学复习题(名词解释和简答)

医学统计学复习题(名词解释和简答)

一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。

是同质所有观察单位的某种变量值的集合。

2、有限总体:是指空间、时间范围限制的总体。

3、无限总体:是指没有空间、时间限制的总体。

4、样本:从总体中随机抽取部分观察单位,其实测值的集合。

5、@计量资料:又称定量资料或数值变量资料。

为观测每个观察单位的某项指标的大小,而获得的资料。

其变量值是定量的,表现为数值大小,一般有度量衡单位。

根据其观测值取值是否连续,又可分为连续型或离散型两类。

6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。

其变量值是定性的,表现为互不相容的性或类别。

分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。

7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

其变量值具有半定量性质,表现为等级大小或属性程度。

8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。

9、平均数:描述一组变量值的集中位置或水平。

常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。

11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。

检验水平,就是预先规定的允许犯I型错误概率的最大值。

I型错误概率大小也用α表示,α可取单尾亦可取双尾。

12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。

其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。

武汉大学医学统计学期末总结

武汉大学医学统计学期末总结

简答:1、简述样本含量的影响因素,解释各因素是如何影响的样本含量的估计取决于:①假设检验的Ⅰ型错误概率α大小:Ⅰ型错误概率α越小,所需样本含量越多。

对于相同α,双侧检验比单侧检验所需样本含量多;②假设检验的Ⅱ型错误概率β或检验效能(1-β)的大小:Ⅱ型错误概率β愈小或检验效能(1-β)愈大,所需样本含量愈多;③容许误差δ的大小:容许误差δ愈大,所需样本含量愈小;④总体的相关信息:总体标准差σ愈大,所需样本含量愈多;总体率π越接近0.05,所需样本含量越多;总体相关系数ρ愈小,所需样本含量愈多;变异指标CV愈大,所需样本含量愈多。

2、Excel如何计算P值与(给定P值)界值,分别举例说明标准正态分布一P{Z≤x} = normsdistx);t分布t(n)-- P{T>x}= tdist(x,n,1); P{|T|> x}= tdist(x,n,2);函数中参数必须x>0!卡方分布x2(n)一P{x2 > x} = chidis(x,n)F分布F(m,n)一P{F> x}= fdist(x, m,n)3、Excel如何进行统计绘图与制表??绘图:1)点“插入→图表”,选择合适类型表格2)“图表工具→设计→选择数据”3)点击“确定”,生成初始图表4)编辑与修饰制表:1)标题:位于表的上方,概括表的内容2)标目:包括横标目和纵标目3)线条:除顶线、底线及纵标目与合计的分割横线外,其余尽量省去4)数字:尽可能用阿拉伯数字。

4、数据一般分为哪三类?不同数据如何进行统计分析,①定量数据:又称计量数据或区间数据或数值数据,由观测每个观测单位某项指标的大小而获得。

允许计算均数、标准差等(可采用t、F检验等,可当做有序或定性数据处理)②定性数据:又称(二项与多项)分类数据或计数数据,将观察单位按某种属性或类别分组计数,分组汇总各组观察单位后而获得。

编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验、z检验等)③等级数据:又称有序数据或半定量数据,将观察单位按某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位数后而获得。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学期末复习总结
名词解释
参数Patameter:是指总体的统计指标,如总体均数、总体率等。

总体参数是固定的常数。

多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。

统计量statistic:是指样本的统计指标,如样本均数、样本率等。

样本统计量可用来估计总体参数。

总体参数是固定的常数,统计量实在总体参数附近波动的随机变量。

系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。

随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。

I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。

II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。

P值P-value:在H0成立的前提下,用样本数据获得的样本统计量及比样本统计量总计更极端的区间下的面积。

置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。

多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

哑变量dummy variable:如果是多分类指标,假定有g类,则用g-1个取值为0,1或-1的变量,称为哑变量。

偏相关系数partial correletion coefficient:表示在一组变量中,任一两个变量在其它变量固定不变时,他们之间相关的密切程度和方向。

或者说,扣除其它变量对它们的影响后,两个变量之间的线性相关情况。

决定系数coefficient of determination:回归平方与总平方和之比,其数值反映了回归贡献的相对程度,其值约接近1,说明模型对数据的拟合程度越好。

随机对照试验Randomized Controlled Trial,RCT:将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。

接受者工作特征曲线receiver operator characteristic,ROC曲线:以不同截断点时的(1-特异度)为横轴,灵敏度为纵轴,作的真阳性率与假阳性率曲线。

简答题:
1.标准差与标准误的区别与联系。


区别:(1)含义不同:①标准差描述个体变量值x之间变异度的大小,S越大,变量值x 越分散;反之变量越集中,均数的代表性就越强;②标准误是描述样本均数之间变异度的大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

(2)与n关系不同:n增大时,①S-σ(恒定);②标准误减少并趋于0(不存在抽样误差);
(3)用途不同:①标准差表示x变异度的大小,计算CV,估计正常值范围,计算标准误
等;②标准误:参数估计和假设检验。

联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。

2.数据的分类及统计学方法处理(描述、推断)√
数据分类:计数资料(定性资料)、计量资料(定量资料)、等级资料。

统计描述:计数资料——相对数(率),结构相对数(构成比)、百分比相对比(OR、RR);计量资料——均数±标准差;等级资料:中位数、四分位数间距等。

统计推断:计数资料——卡方检验;计量资料——t检验、方差分析;等级资料——非参数检验。

3.样本含量与那些因素有关,是怎样影响的?
样本含量的估计取决于:
①假设检验的Ⅰ型错误概率α大小:Ⅰ型错误概率α越小,所需样本含量越多。

对于相同α,双侧检验比单侧检验所需样本含量多;
②假设检验的Ⅱ型错误概率β或检验效能(1-β)的大小:Ⅱ型错误概率β愈小或检验效能(1-β)愈大,所需样本含量愈多;
③容许误差δ的大小:容许误差δ愈大,所需样本含量愈小;
④总体的相关信息:总体标准差σ愈大,所需样本含量愈多;总体率π越接近0.05,所需样本含量越多;总体相关系数ρ愈小,所需样本含量愈多;变异指标CV愈大,所需样本含量愈多。

4.多重回归、logistic回归、Cox回归的区别与联系√
多元线性回归、logistic回归、Cox回归的联系:①自变量可以是连续变量、有序分类变量和无序分类变量,为了将无序分类变量代入回归模型,需要进行哑变量彼岸花,哑变量在回归模型中是一个整体,必须同时引入模型或同时从模型中剔除;②当自变量之间存在较强相关关系可能会导致共线性现象;③自变量之间可能会存在交互作用,通常采用两个或两个以上自变量相乘的积作为交互作用项;④均可采用逐步回归筛选变量,其思路均是先考虑单变量分析再进行多元回归分析;⑤均可进行影响因素的分析、混杂因素的校正、预测分析等。

5.相关与回归的区别与联系
区别:①资料要求上:回归要求变量Y服从正态,X可精确测定和严格控制;相关要求两变量X、Y均服从双变量正态分布。

②应用上:回归说明两变量依存关系(单向);相关说明两变量相关关系(双向)。

联系:对同一资料进行相关与回归分析,则得相关系数r与回归方程中的b正负相同。

r 为正表示两变量间的相互关关系是同向变化;b为正表示X每增/减一个单位,Y平均增/减b个单位。

6.非参数检验的适用条件与优缺点
使用条件:①总体分布为偏态分布或未知的计量资料;②数据两端出现不确定值;③等级资料;④各组离散程度相差悬殊,总体方差不齐。

优点:不受总体分布的限制,适用范围广。

缺点:结果对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。

增加犯II类错误的概率。

7.应用相对数的注意事项
①结构相对数不能代替强度相对数;②计算相对数应有足够数量;③正确计算合计率;
④注意资料的可比性:观察对象是否同质、内部结构是否相同;⑤对比不同时期资料应注意客观条件是否相同;⑥样本率(或构成比)的抽样误差。

8.生存资料的特点,包括那些统计学方法?√
特点:至少15~20倍的自变量个数个数①同时考虑生存时间和生存结局;②通常含有删失数据;③生存时间的分布通常不服从正态分布。

统计学方法:①描述分析:常用Kaplan-Meier法(也叫乘积极限法、KM法),计算生存率需要考虑生存时间的顺序,属于非参数统计方法;②比较分析:常用log-rank检验与Breslow检验,检验无效假设是两组或多组总体生存时间分布相同,而不对其具体的分布形式做要求,所以也属于非参数统计方法;③影响因素分析:常用的半参数法为Cox比例风险模型,常用参数法为指数分布法、Weibull分布法、Gompertz分布法和对数logistic分布法等。

9.置信区间与参考值范围的区别与联系
总体均数的可信区间与个体值的参考值范围无论在含义、用途还是计算上均不相同。

①含义上:置信区间是总体均数的可能范围,参考值范围是指个体值的波动范围。

②计算公式上:
置信区间——σ未知:σ已知或σ未知但n>60:
参考值范围——正态分布:偏态分布:
③用途上:可信区间用于总体均数的区间估计,也可间接进行假设检验;参考值范围用于绝大多数(如95%)观察对象某项指标的分布范围。

10.统计表绘制注意事项√
制表的基本要求:①标题:概括表的主要内容,包括研究时间、地点、研究内容,放在表的上方。

如果整个表的指标统一时,可以将研究指标的单位标在标题后面。

表的序号后面应
该空一格全角格再加题目;②标目:分别用横标目和纵标目来说明表格每行和每列内容或数字的意义,注意标明指标的单位;③线条:至少用三条线,表哥的顶线和底线将表格与文章的其他部分分割开来,纵标目下横线将标目的文字区与表格的数字区分割开来,其它竖线和斜线一概省去;④数字:用阿拉伯数字表示,无数字用“—”表示,缺失数字用“…”表示,数值为0者记为“0”,不留空项。

数字按小数点对齐,小数位数相同;⑤表中数字区不要插入文字,必须说明者用“*”,在表下方以备注形式说明。

制表的注意事项:不要将太多内容放在一个表里,特别是两种不同类型的资料(定量资料和定性资料)的统计量放在同一表中;纵标目由左到右排序应为主、谓、宾,左边通常为分类变量,纵列为统计数指标;每一列中间应该隔开,不能连起来。

相关文档
最新文档