医学统计学简答题35506
医学统计学重点简答题和名词解释
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间 揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
参数(parameter):描述总体特征的统计指标。
统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。
在确定接受处理因素的实验组时,要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。
医学统计学简答题
1、正态分布的特点及其应用性质:①以均数为中心,两头低中间高,左右完全对称的钟型曲线;②只有一个高峰,在X=μ,总体中位数亦为μ;③μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为形态参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;④对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布;⑤正态分布在μ±1σ处各有一个拐点;⑥正态曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒为1;区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
2、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布):3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散。
标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与n的关系:随着n增加,样本标准差稳定于总体标准差;随着n增加,样本标准误减少并趋于0。
医学统计学名词解释与简答题(13个章节重点题目,复习备考必备)
医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。
谈谈你的理解。
第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。
2. 请简述统计图的基本结构及绘制统计图的注意事项。
第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。
2. 简述发病率与患病率、死亡率与病死率的不同。
3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。
2. 简述假设检验与置信区间的关系。
第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。
2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。
2. 请简述非参数检验适用范围。
3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。
医学统计学名词解释、简答、问答
名词解释1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。
医学统计学简答题
几何均数(G):呈倍数关系的偏态分布,经对数变换后呈正态或近似正态分布(血清抗体滴度,细菌计数,体内某些微量元素)
中位数(M):可用于各种分布,不受极端值影响,主要用于不对称分布类型的资料,两端无确切值会分布不明的资料
3.n小于40或T<1时用四格表确切概率法
4.多个构成比,用R*C列联表X2检验
11.卡方检验基本思想档
X2值反映了实际频数和理论频数吻合的程度,若H0成立,则应相差不大,A于T相差越大,X2就越大,相应P就越大,当P小雨等于a有理由认为无效假设不成立,拒绝H0做出统计推断
12.非参数检验适用于
4.对于服从双变量正态分布的同一组资料,其相关系数r和回归系数b可以相互换算r=b*Sx/Sy
3.标准差与标准误的区别与联系
均数的标准误:
用途:描述均数抽样误差的大小
符号
计算
公式
意义:越小样本均数分布越集中,与总体均数差别越小,抽样误差越小,由样本均数估计总体均数可靠性越大
2、方差分析的用途:
①两个或多个样本均数间的比较;
②分析两个或多个因素间的交互作用;
③回归方程的线性假设检验;
④多元线性回归分析中偏回归系数的假设检验;
⑤两样本的方差齐性检验等
10.卡方检验应用条件
1.n大于等于40且T大于等于5时,用PearsonX2检验
2.n大于等于40且1大于等于T<5,连续性校正X2检验
标准差:
用途:描述个体值的变异程度
符号
计算
公式
意义:越小个体值越集中,均数对数据的代表性越好
联系:S吧X=S/根号n
医学统计学方法重点简答题和定义解释
医学统计学方法重点简答题和定义解释本文档旨在提供医学统计学方法的重点简答题和定义解释,帮助读者加深对这一领域的理解。
1. 什么是假设检验?定义解释:假设检验是一种统计推断方法,用于判断样本数据是否支持或反对某个假设。
它涉及两个互补的假设:零假设和备择假设。
通过计算样本数据与零假设之间的距离,以及确定这种距离在统计上的显著性,可以得出结论是否拒绝零假设。
假设检验是一种统计推断方法,用于判断样本数据是否支持或反对某个假设。
它涉及两个互补的假设:零假设和备择假设。
通过计算样本数据与零假设之间的距离,以及确定这种距离在统计上的显著性,可以得出结论是否拒绝零假设。
2. 请解释一下T检验和Z检验的区别是什么?定义解释: T检验和Z检验都是假设检验方法,用于比较两个样本均值的差异。
它们的区别在于所依赖的假设和参数。
T检验和Z检验都是假设检验方法,用于比较两个样本均值的差异。
它们的区别在于所依赖的假设和参数。
T检验适用于小样本(样本量较小)情况,它假设样本数据服从正态分布,并使用样本标准差来估计总体标准差。
T检验通常用于实践中,当总体标准差未知时。
Z检验适用于大样本(样本量较大)情况,它假设样本数据和总体数据都服从正态分布,并使用总体标准差。
Z检验通常用于理论研究中,当总体标准差已知时。
3. 请解释一下卡方检验的用途是什么?定义解释:卡方检验是一种统计检验方法,用于判断两个或多个分类变量之间的关联性。
它通过比较观察到的频数和期望频数之间的差异来评估分类变量之间的独立性。
卡方检验常用于分析有序或无序分类变量之间的关联,例如研究治疗方法对疾病治愈率的影响。
卡方检验是一种统计检验方法,用于判断两个或多个分类变量之间的关联性。
它通过比较观察到的频数和期望频数之间的差异来评估分类变量之间的独立性。
卡方检验常用于分析有序或无序分类变量之间的关联,例如研究治疗方法对疾病治愈率的影响。
4. 请解释一下相关系数是什么?定义解释:相关系数是一种用于衡量两个变量之间关联程度的统计量。
医学统计学重点简答题和名词解释
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大臵信度的包含总体参数的范围,该范围称为臵信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常t臵信区间揭示的是按一定臵信度估计总体参数所在的范围。
分布法、正态分布法(标准误)、二项分布法。
臵信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
医学统计学名词与简答题
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学名词与简答题医学统计学重点第一章医学统计学基础 1 随机现象是指在一定条件下并不总是出现相同结果的现象。
2 概率 probability 即随机事件发生的可能性大小。
3 小概率事件 P0. 05 或0. 01 的事件。
4 总体 population:是根据研究目的所确定的同质观察单位的全体。
5 参数 parameter:描述总体特征的统计指标,一般用希腊字母表示。
6 样本 sample:从总体中抽出的供研究的观察单位。
7 统计量:根据样本观察值计算出的描述样本的特征值。
8 误差 error:使之研究结果与真实情况之间的差别。
根据原因分为:随机测量误差、系统误差和抽样误差。
系统误差对研究结果的影响较大,是可以控制和避免的。
9 抽样误差 sampling error:由于抽样所导致的样本均数与总体均数之差(在抽样研究中,即使没有随机测量误差和系统误差,在样本指标和总体指标间仍可能存在误差这种误差是由于抽样所致)。
1 / 1010 数值变量资料又称计量资料,是对某种随机变量进行定量测量所得的资料。
11 统计工作一般包括研究设计、资料收集、数据整理和统计分析四个基本步骤。
统计分析包括统计描述和统计推断。
12 同质:影响研究指标的主要因素易控制的因素基本上相同。
13 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。
第二章数据变量资料的统计描述 1 频数表的编制步骤:找全距(极差),定组距,写组段,划记,列频数表。
(重点具体看书) 2 集中趋势的描述有:算数均数,几何均数,中位数。
医学统计学简答题
三、简答题(20分)2、何谓假设检验?可以举例说明。
(5分)首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。
3、请你谈谈对假设检验结论的认识。
(5分)由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
4、请你谈谈标准差和标准误的异同点。
(5分)四、简答题 15分1. 抽样研究中如何才能控制或减小抽样误差?答:合理的抽样设计,增大样本含量。
2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?答:不能,因为P值的大小与总体指标间差异大小不完全等同。
P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。
四、简答题 20分2 某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。
答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。
3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95%表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L) 4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b 也越大。
医学统计学名解和简答
医学统计学(名词解释和简答题)1.总体:是同质的个体所构成的全体。
2.样本:从总体中抽取部分个体的过程为抽样,所抽得的部分为样本。
3抽样误差:样本的数据构成的统计指标与总体的统计指标有误差,这种差异是由抽样引起的。
4. 平均数(算术均数)适用于:对称分布或偏斜度不大的资料,尤其适合正态分布资料。
5.几何均数多用于:血清和W学中,有些明显呈偏态分布的资料经过对数变换后呈对称分布。
如:抗体滴度,细菌计数,血清凝集效价,某物质浓度等,其数据特点是观察值间按倍数关系变化。
6.中位数适用于:在频数分布明显偏态,或频数分布的两端无确定数值时。
7.百分数适用于:可用来描述资料的观察值序列在某百分位置的水平。
8.极差:也叫全距,即观察值中最大值和最小值之差,用符号R表示,是变异指标中最简单的一种。
9.极差使用于:说明传染病食物中毒的最短,最长潜伏期等。
10.方差:将离均差平方和再取平均其结果。
11.标准差:总体观察值中个体值的变异强度。
12.正态分布:标准差与均数结合能够完整地概括一个正态分布。
13. 双侧:有些指标如白细胞数过高或过低均属异常,故其参考值范围需要分别确定下限和上限。
14.单侧:有些指标如24小时尿糖含量仅在过高,肺活量仅在过低时为异常,只需确定其上限或下限。
15.标准误:标本均数的标准差6-,又称(简写SE)。
16.P值:指从H0规定的总体随机抽得等于或大于现有样本统计量值的概率。
17标准差:是一组观察值变异程度的指标。
18总变异=组间变异+组内变异。
19. 率:是表示某种现象发生的频率和强度。
20.构成比:表示事物内部各个组成部分所占整体的比重。
21.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。
22. 相对数:指为了使计数资料具有可比性,取原始两个资料之比所得。
23. 确定组距:将全距除以组数可得到组距的近似值。
24.确定组限:实际组限在每组中只包含下限而不包含上限。
25.算术平均数:说明一组观察值的平均水平或集中趋势,是描述计量资料的一种常用方法。
医学统计学简答题
医学统计学简答题1.简述标准差、标准误得区别与联系?区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(x)之间得变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数得代表性越强、标准误。
.估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
(2)与n得关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。
(3)用途不同:标准差表示x得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。
联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。
2.简述假设检验得基本步骤。
1.建立假设,确定检验水准。
2.选择适当得假设检验方法,计算相应得检验统计量、3、确定P值,下结论3.正态分布得特点与应用:特点: 1、集中性:正态曲线得高峰位于正中央,即均数所在得位置;2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数μ与标准差σ,可记作N(μ,σ):均数μ决定正态曲线得中心位置;标准差σ决定正态曲线得陡峭或扁平程度、σ越小,曲线越陡峭;σ越大,曲线越扁平;5、u变换:为了便于描述与应用,常将正态变量作数据转换;应用: 1。
估计医学参考值范围2、质量控制3。
正态分布就是许多统计方法得理论基础4.简述参考值范围与均数得可信区间得区别与联系可信区间与参考值范围得意义、计算公式与用途均不同、1。
从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是:±1.96s。
医学统计学简答题
医学统计学简答题三、简答题(20分)2、何谓假设检验?可以举例说明。
(5分)⾸先建⽴检验假设,然后在该假设下进⾏随机抽样,计算得到该统计量及其极端情形的概率,如果概率较⼩,则拒绝该假设,如果概率不是⼩概率,则接受该假设,这个过程称为假设检验。
3、请你谈谈对假设检验结论的认识。
(5分)由于假设检验的结论是依据⼩概率事件⼀次试验实际不可能发⽣的原理进⾏的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
4、请你谈谈标准差和标准误的异同点。
(5分)四、简答题 15分1. 抽样研究中如何才能控制或减⼩抽样误差?答:合理的抽样设计,增⼤样本含量。
2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象⼜是总体的⼀部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越⼩,⽐较的两个总体指标间差异越⼤?为什么?答:不能,因为P值的⼤⼩与总体指标间差异⼤⼩不完全等同。
P值的⼤⼩除与总体差异⼤⼩有关,更与抽样误差⼤⼩有关,同样的总体差异,抽样误差⼤⼩不同,所得的P也会不⼀样,抽样误差⼤⼩实际⼯作中主要反映在样本量⼤⼩上。
四、简答题 20分2 某医⽣⽤某药治疗10例⼩⼉⽀⽓管哮喘,治愈8例,结论为“该药对⼩⼉⽀⽓管哮喘的治愈率为80%,值得推⼴”。
答:⼀是没有对照组,⼆是样本例数太少,抽样误差⼤,可信区间宽。
3.某地1岁婴⼉平均⾎红蛋⽩95%可信区间为116.2~130.1(g/L),表⽰什么意义?该地1岁正常婴⼉⾎红蛋⽩95%的参考值范围为111.2~135.1(g/L),⼜说明了什么含义?答:表⽰该地1岁婴⼉⾎红蛋⽩总体平均数在116.2~130.1(g/L),估计正确的概率为95%表⽰该地有95%1岁正常婴⼉的⾎红蛋⽩值在111.2~135.1(g/L) 4.对同⼀组资料,如果相关分析算出的r越⼤,则回归分析算出的b 也越⼤。
统计学简答题
医学统计学简答题第二章定量数据的统计描述1.变异系数与标准差的区别标准差使用的度量衡单位与原始数据相同,在两组数据均数相差不大,单位也相同时,从标准差的大小就可以直接比较两样本的变异程度。
但是有时我们需要对均数相差较大或单位不同的几组观测值的变异程度进行比较,标准差不再适宜,这时就应该使用变异系数了。
2.集中趋势和离散趋势的指标及适用范围(1)集中趋势:算术均数、几何均数、中位数,统称平均数,均反映集中趋势。
算术均数:主要适用于对称分布,尤其适合正态分布资料。
几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。
在医院中主要用于抗原(体)滴度资料。
中位数:适合条件:a.极偏态资料。
b.有不确定的数据(有>或<)。
c.有特大值或特小值。
d.分布不明的资料。
(2)离散趋势:极差、四分位数间距、方差和标准差、变异系数均反映离散趋势极差:除了两端有不确定数据之外,均可计算极差。
四分位间距:用于描述偏态分布资料。
方差和标准差:用于描述正态分布计量资料的离散程度。
变异系数:a.均数相差较大。
b.单位不同。
3.简述变异系数的实用时机变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
4.怎样正确描述一组计量资料(1)根据分布类型选择指标(2)正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。
5.标准差与标准误的联系和区别有哪些?区别:(1)概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,标准误越小,均数的可靠性越高。
(2)用途不同:标准差与均数结合估计参考值范围。
(3)计算含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:标准差、标准误均为变异指标,当样本含量不变是,标准误与标准差成正比。
6.正态分布的主要特征(1)正态曲线在横轴上方均数处最高,即频数最大(2)正态分布以均数为中心,左右对称,无限接近于x轴(3)曲线与横轴所围面积为1。
医学统计学简答题
1.简述实验设计的基本要素,基本原则。
(8分)答:实验设计的原则是随机化原则,是保证非处理因素在各对照组之间均衡一致的重要条件;对照原则,建立对照是比较的基础,也是控制实验过程中非实验因素的影响和偏倚的有力措施;重复的原则,应该保证足够的样本量。
其基本要素是处理因素,作用于受试对象,要求在实验过程中观察其处理的因素;受试对象,处理因素作用的对象;实验效应,用一空白指标来反映,指标要求精确性、客观性、关联性、灵敏性。
2.描述离散趋势的指标有哪些?适用于何种情况?答:描述离散趋势的指标有全距,是一组变量值中最大值与最小值之差,反映资料的分布范围,全距大说明数据的变异度大,适用于任何资料;四分位间距是两个特定的百分位数,第25%分位数和第75%分位数,常用于描述不对称资料的特征;方差和标准差常用来描述正态分布的资料;变异系数,是标准差与均数之比,常用于比较度量衡单位不同的两组或多组资料的变异度,以及比较均数相差悬殊的两组或多组资料的变异度。
3.标准差与标准误有何不同?答:1)概念不同:标准差是由个体变异造成的,标准误是由抽样误差引起的。
将样本统计量的标准差称为标准误2)计算公式不同:22()xNμσ-=∑,s=xs=3)性质不同:n越大标准差越稳定,标准误越趋近于0。
4)用途不同:标准差用来估计参考值范围,计算标准误;标准误用来估计正态参数。
5.可信区间:按一定概率(可信度)确定的包含未知总体参数的可能范围。
标准差越大,区间越宽;n越大,区间越窄。
参考值范围:按一定比例确定的绝大多数正常人所在的范围。
标准差越大,区间越宽;n越大,区间越稳定。
6. 3.方差分析中常用的数据转换有哪些?转换的目的是什么?对数变换,是服从对数正态分布的数据正态化,即使数据达到方差齐性;平方根转换,是服从Possion分布的计数资料或轻度偏态的资料正态化,当各样本的方差与均数呈正相关时,可是资料达到方差齐性;倒数变换,用于数据两端波动较大的资料可使极端值的影响减小;平方根反正弦变换,使服从二项分布的率或百分比的资料接近正态分布,达到方差齐性的要求。
医学统计学重点简答题和名词解释
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学.总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error)样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小.样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大臵信度的包含总体参数的范围,该范围称为臵信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常t臵信区间揭示的是按一定臵信度估计总体参数所在的范围.分布法、正态分布法(标准误)、二项分布法。
臵信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性.回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
医学统计学——简答题一览
简答题(规则是:知道多少,写多少,不要空白,尽量多写)1. 频数表和频数图的用途答:1.描述频数分布的类型(1)对称分布 :若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布(2)偏态分布 :右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。
左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。
2. 描述计量资料分布的集中趋势和离散趋势①集中趋势(central tendency):变量值集中位置。
——平均水平指标②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。
离“中心”位置越远,频数越小;且围绕“中心”左右对称。
——变异水平指标3.便于发现一些特大或特小的可疑值;4.便于进一步做统计分析和处理。
2.计量资料集中趋势和离散趋势的描述答:集中趋势常用指标位算数均数、几何均数和中位数。
1.算数均数简称均数,适合描述对称分布或近似对称分布资料的集中趋势。
可以分为总体均数和样本均数。
(总体均数:是指根据研究目的所确定的全体研究对象的某项指标观察值的平均水平;样本均数:是指研究所收集到的研究对象的某项观察值的算数均数。
)注意计算方法:原始数据的样本均数计算方法 频数表资料的样本均数计算方法2.几何均数适用于对数对称分布(原始变量分布不对称,但是经过对数变换后近似呈对称分布)的资料,并且要求所有数据均大于0.典型代表——滴度。
原始资料的几何均数计算方法频数表资料的几何均数计算方法3.中位数 意义:中位数是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。
符号:Md适用条件:适合各种类型的资料。
尤其适合于①大样本偏态分布的资料; ②资料有不确定数值;③资料分布不明等。
离散趋势的常用描述指标是:方差标准差、全距、四分位数间距、变异系数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学简答题1.简述标准差、标准误的区别与联系?区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。
标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
(2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。
(3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。
联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。
2.简述假设检验的基本步骤。
1.建立假设,确定检验水准。
2.选择适当的假设检验方法,计算相应的检验统计量。
3.确定P值,下结论3.正态分布的特点和应用:特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。
σ越小,曲线越陡峭;σ越大,曲线越扁平;5、u变换:为了便于描述和应用,常将正态变量作数据转换;应用: 1.估计医学参考值范围 2.质量控制 3.正态分布是许多统计方法的理论基础4.简述参考值范围与均数的可信区间的区别和联系可信区间与参考值范围的意义、计算公式和用途均不同。
1.从意义来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指95%可信度估计的总体均数的所在范围2.从计算公式看若指标服从正态分布,95%参考值范围的公式是:±1.96s。
总体均数95%可信区间的公式是:前者用标准差,后者用标准误。
前者用1.96,后者用α为0.05,自由度为v的t界值。
5.频数表的用途和基本步骤。
用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。
基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。
6.非参数统计检验的适用条件。
(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能7.线性回归的主要用途。
1.研究因素间的依存关系,自变量和应变量之间是否存在线性关系,即研究一个或多个自变量对应变量的作用,或者应变量依赖自变量变化而变化的规律。
2.利用直线回归方程可进行预测估计。
3.用容易测量的指标估计不易测量的指标。
4.获得精确度更高的医学参考值范围。
8.简述检验假设与可信区间的联系与区别。
(1)可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同。
前者估计总体参数的大小,后者推断总体参数有无质的不同。
(2)可信区间也可回答假设检验的问题。
但可信区间不能提供确切的P值范围,只能给出在α水准上有无统计意义。
(3)可信区间还可提示差别有无实际意义。
9.简述直线回归与直线相关的区别与联系。
区别:(1)资料要求不同:直线回归中应变量y是来自正态总体的随机变量,而x既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量。
(2)回归反映的是两个变量的依存关系,取值范围是(-∞,∞)。
相关反应两个变量的相互关系,取值范围是(-1,1);(3)回归有单位,相关无单位。
联系:统一资料r与b符号相同,即方向一致性,r与b假设检验结果等价,r与b可互相换算,有相关不一定有回归,有回归一定有相关(回归可用来解释相关)10.标准差的实际应用。
1表示数据分布的离散程度2常用“x±s”作为计量资料的数字特征描述的专用符号3计算临床上的各种生化、生理指标的参考范围4在单纯随机抽样中,是计量资料估计样本量不可缺少的重要依据之一5可用来计算均数的抽样误差大小。
相对数的注意事项p33医学统计学名词解释*总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。
*样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。
变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
统计量:由样本所算出的统计指标或特征值。
*抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。
(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值变异程度的指标,为方差的算术平方根。
标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。
系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
*Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。
*Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。
参数:反应总体统计学特征的数字。
*计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。
*医学参考值范围:绝大多数正常人(正常人的90%,95%,99%,尤其最常用95%)的某一指标都在一定的范围内,则这个范围为医学参考值范围。
参考值:临床上应用的参考值是指包括绝大部分正常人的人体形态、机能和代谢产物等各种生理及生化指标。
*计量资料:用定量的方法测量某项指标的大小所得的资料。
(用仪器、工具或其他定量方法准确获得的定量结果,一般带有计量单位)*概率:描述随机事件发生的可能性大小的数值。
P值:在Ho规定的总体中进行随机抽样,得到的等于及大于或等于及小于现有样本统计率,或说是比现有实验结果更极端的样本统计量出现的概率, P值越小越不利于接受Ho。
线性相关的情况:正相关、负相关、零相关、非线性相关正态分布:又称高斯分布,是一种概率分布。
标准正态分布:当μ=0,σ2 =1时,称为标准正态分布,记为N (0,1)。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。
(线性)相关系数r:用以描述两个随机变量之间相关关系的密切程度与相关方向的统计指标。
回归:分析两个变量或多个变量之间某种数量依存关系的一类统计方法直线回归:统计学上将分析某变量随另一变量变化而变化依存关系的方法称为直线回归*回归系数b:即回归直线的斜率,统计学意义是自变量X改变一个单位时,应变量Y平均改变b个单位。
离散系数(变异系数):标准差与均叔之比。
统计量:用样本观察值确定的,反应总体统计学特征且不依赖于未知参数的数字。
假设检验:用样本统计量对总体参数或分布的特征假设进行检验,进而对该假设是否成立作出判断。
假设检验的步骤:1、建立假设确定检验水平(显著性水平)2、选择适当的假设检验的方法,记录相应的检验统计量3、确定p值下结论。
**检验效能:即1-β,指两总体确有差异,按规定的检验水平α所能发现该差异的能力。
*中位数(median):将一组观察值按大小顺序排列后,位次居中的观察值。
直线回归:统计学上将分析某变量随另一变量变化而变化依存关系的方法成为直线回归。
方差分析:是检验多个总体均值是否相等的统计方法。
它是通过检验各总体的均值是否相等来判断分类型自变量对数值型自变量是否有显著影响。
区间估计:总体的区间估计是利用样本信息给出一个区间并同时给出重复试验时该区间包含总体均数的概率。
可信区间(CI):按一定概率100(1-a)%(即可信度)估计总体均数的所在范围,得到的范围是可信区间。
统计表:统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
统计图:用点的位置、线段的升降、直条的长短及面积的大小等几何图形表达事物的统计指标大小、对比关系及变化趋势。
非参数检验最小二乘法相关系数(r)决定系数(r2)医学统计学填空题*1.统计表结构:标题标目线条数字备注*2.统计图结构:标题图域标目尺度图例*3.统计工作的基本步骤:设计收集资料整理资料分析资料9.影响检验效能的四个因素:1. 总体参数的差异越大,检验效能越大 2. 个体差异越小,检验效能越大 3. 样本量越大,检验效能越大 4. 检验水准a定的越宽,检验效能越大10.编秩号注意:1. 方差为0的数据忽略 2. 余下的n个差数按绝对值由小到大排秩号 3求秩和即将正负秩号分别相加4. 检验统计量R 取较小一个秩11.正态分布的特点:1. 集中性,正态分布曲线的高峰位于正中央,即均数所在位置2. 对称性,以x=u为中心,左右对称,x轴为渐近线3均匀变动性,正态分布曲线由均数所在处开始分别向左右两侧逐渐均匀下降4. 两个参数:均数u和标准差6,记作N(u, 6),均数u决定正态曲线的中心位置,标准差6决定正态曲线的陡峭或扁平程度。
6越大,曲线越扁平,6越小曲线越陡峭5. u变换*12.正态分布应用:1. 估计医学参考值范围 2. 质量控制 3. 正态分布是许多统计学方法的理论基础*13.离散趋势指标:极差方差标准差四分位数间距变异系数集中趋势指标:14.标准差应用:1. 表示数据分布的离散程度 2常用x±s作为计量资料的数字特征描述的专用符号 3. 计算临床上的各种生化、生理指标的参考范围 4. 在单纯随机抽样中,是计量资料估计样本量不可缺少的重要依据之一 5. 可用来计算均数的抽样误差大小。
15.检验水准与两类误差:Ι型误差:当H0为真时,假设检验结论拒绝H0接受H1,Ⅱ型错误,当真实情况H0不成立H1成立时。
16.随即完全区组设计资料的方差分析特点:1分析两个因素(处理因素和区组因素)2两个因素相互独立无交换作用3分析效率高节约样本4设计要求严格。
原则:1区组划分2受试单位数量恒定3完全随机化的分组17.医学测量结果按其数源类型分为计量资料.计数资料。
18卡方检验的基本思想:检验实际频数和理论频数分布的符合程度,若原假设成立,卡方值不会太大,反之若A与T的差值大,卡方值也越大,当卡方值超出一定范围时,就有理由认为原假设不成立。