完整word版,医学统计学简答题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学简答题
1.简述标准差、标准误的区别与联系?
区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
(2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。
(3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。
联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。
2.简述假设检验的基本步骤。
1.建立假设,确定检验水准。
2.选择适当的假设检验方法,计算相应的检验统计量。
3.确定P值,下结论
3.正态分布的特点和应用:
特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;
2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;
3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;
4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平;
5、u变换:为了便于描述和应用,常将正态变量作数据转换;
应用: 1.估计医学参考值范围 2.质量控制 3.正态分布是许多统
计方法的理论基础
4.简述参考值范围与均数的可信区间的区别和联系
可信区间与参考值范围的意义、计算公式和用途均不同。
1.从意义来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指95%可信度估计的总体均数的所在范围
2.从计算公式看若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。
5.频数表的用途和基本步骤。
用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。
基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。
6.非参数统计检验的适用条件。
(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能
7.线性回归的主要用途。
1.研究因素间的依存关系,自变量和应变量之间是否存在线性关系,即研究一个或多个自变量对应变量的作用,或者应变量依赖自变量变化而变化的规律。
2.利用直线回归方程可进行预测估计。
3.用容易测量的指标估计不易测量的指标。
4.获得精确度更高的医学参考值范围。
8.简述检验假设与可信区间的联系与区别。
(1)可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同。前者估计总体参数的大小,后者推断总体参数有无质的不同。(2)可信区间也可回答假设检验的问题。但可信区间不能提供确切的P值范围,只能给出在α水准上有无统计意义。(3)可信区间还可提示差别有无实际意义。
9.简述直线回归与直线相关的区别与联系。
区别:(1)资料要求不同:直线回归中应变量y是来自正态总体的随机变量,而x既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量。(2)回归反映的是两个变量的依存关系,取值范围是(-∞,∞)。相关反应两个变量的相互关系,取值范围是(-1,1);(3)回归有单位,相关无单位。
联系:统一资料r与b符号相同,即方向一致性,r与b假设检验结果等价,r与b可互相换算,有相关不一定有回归,有回归一定有相关(回归可用来解释相关)
10.标准差的实际应用。
1表示数据分布的离散程度2常用“x±s”作为计量资料的数字特征描述的专用符号3计算临床上的各种生化、生理指标的参考范围4在单纯随机抽样中,是计量资料估计样本量不可缺少的重要依据之一5可用来计算均数的抽样误差大小。
相对数的注意事项p33
医学统计学名词解释
*总体:根据研究目的确定的同质的全部研究单位的观测值,即某个
随机变量X可取值的全体。
*样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。
变量:观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
统计量:由样本所算出的统计指标或特征值。
*抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以
及样本统计量和总体参数之间的差异。(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)
标准差:是描述个体值变异程度的指标,为方差的算术平方根。
标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。
系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
*Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。*Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。
参数:反应总体统计学特征的数字。
*计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。
*医学参考值范围:绝大多数正常人(正常人的90%,95%,99%,尤其最常用95%)的某一指标都在一定的范围内,则这个范围为医学参考值范围。
参考值:临床上应用的参考值是指包括绝大部分正常人的人体形态、机能和代谢产物等各种生理及生化指标。
*计量资料:用定量的方法测量某项指标的大小所得的资料。(用仪器、工具或其他定量方法准确获得的定量结果,一般带有计量单位)*概率:描述随机事件发生的可能性大小的数值。
P值:在Ho规定的总体中进行随机抽样,得到的等于及大于或等于及小于现有样本统计率,或说是比现有实验结果更极端的样本统计量出现的概率, P值越小越不利于接受Ho。
线性相关的情况:正相关、负相关、零相关、非线性相关
正态分布:又称高斯分布,是一种概率分布。
标准正态分布:当μ=0,σ2 =1时,称为标准正态分布,记为N (0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。