医学统计学简答题
医学统计学重点简答题
一、平均水平常用的统计指标及其适用范围?常用统计指标包括算术均数,几何均数,中位数。
算术均数适用于对称分布,特别是正态分布的数据;几何均数适用于经对数变换后频数分布对称或呈等比级数的数据;中位数主要适用于三种情形:①非正态分布资料(对数正态分布除外)。
②频数分布的一端或两端无确切数据的资料。
③总体分布不清楚的资料.二、应用相对数的注意事项1。
计算相对数时应有足够的观察单位数. 例数太少会使相对数波动较大,这种情况下最好用绝对数表示。
2。
正确计算合计率. 计算观察单位不等的几个率的合计率(平均率)时,不能将几个率直接相加求其平均率,而应分别将分子分母合计,再求出合计率.3不能以构成比代替率。
构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度。
4。
注意资料的可比性。
在比较相对数时,除了要比较的因素外,其余的因素应尽可能相同或相近。
5.样本率或构成比的比较应做假设检验。
由于样本率或构成比也存在抽样误差,比较两个或多个率或构成比时,不能凭样本率或构成比的差别作出结论,而必须进行差别的假设检验。
三、正常值范围与置信区间的区别四、标准误与标准差的区别与联系。
区别点标准误标准差含义样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数的接近程度。
描述个体间的变异程度计算公式1k)xx(s2x--=∑---1n)xx(s2--=∑-用途总体均数的区间估计医学参考值范围估计相似点性质相似,都是用来说明变异程度五、简述四格表卡方检验统计方法的选择条件六、行×列表资料χ²检验的注意事项1。
行×列表资料中各格的理论频数T均不应小于1,并且1≤ T<5的格子数不宜超过格子总数的1/5,否则可能产生偏性。
处理的方法有三种:①增大样本含量,使理论频数增大;②根据专业知识,删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。
③改用双向无序R×C表的Fisher确切概率法.2。
医学统计学简答题总结 必考大题总结 考前必看
描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何?答:描述计量资料集中趋势的统计指标常见的有算数均数、几何均数、中位数。
算数均数适用于描述对称分布资料的集中位置,尤其是正态分布的资料;几何均数一般用来描述等比资料和对数正态分布资料的集中位置;中位数可以使用于任何分布的资料,尤其是偏态分布。
分布不明或分布末端无确定值的资料。
描述离散趋势的指标常见的有极差、四分位数间距、方差、标准差和变异系数。
极差与四分位数间距可以用于任何分布,后者比前者稳定,但是这两个指标都不能综合反映各观察值得变异程度;方差和标准差最常用,但要求资料近似正态分布;变异系数可以用于多组资料间量纲不同或均数相差较大的时候变异程度的比较。
频数分布表(图)的用途有哪些?1描述资料的分布类型,是对称分布还是偏态分布;2描述变量的分布特征:集中趋势和离散趋势;3便于发现某些离群值或异常值;4便于进一步的统计分析和处理;5当样本含量够大的时候,我们还可以以频率作为概率的估计值。
变异系数和标准差有何异同?答:不同点:变异系数主要用于量纲不同的变量间,或均数相差较大的变量间的变异程度的比较。
所以变异系数是没有量纲的,而标准差是方差的平方根,标准差的量纲与原指标的一致,它适用于近似正态分布的资料。
相同点和联系:变异系数和标准差都是用于对称分布资料,尤其是正态分布的资料,且还可以知道变异系数是由标准差计算得到的。
应用相对数的注意事项:1、防止概念混淆2.频率型指标的解释要紧扣总体与属性3、计算相对数时分母应有足够数量4.正确计算合计频率5、注意资料的可比性6.正确进行相对数的统计推断。
为什么不能以构成比代率?请联系实际加以说明。
率和构成比所说明的问题不同,因而绝不能以构成比代率。
构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。
.二项分布:如果每个对象阳性结果的发生概率为π,阴性结果的概率为1-π,而且各个观察对象的结果是相互独立的,那么,重复观察N个人,发生阳性次数的概率分布为二项分布。
医学统计学简答题
1、正态分布的特点及其应用性质:①以均数为中心,两头低中间高,左右完全对称的钟型曲线;②只有一个高峰,在X=μ,总体中位数亦为μ;③μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为形态参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;④对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布;⑤正态分布在μ±1σ处各有一个拐点;⑥正态曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒为1;区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
2、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布):3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散。
标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与n的关系:随着n增加,样本标准差稳定于总体标准差;随着n增加,样本标准误减少并趋于0。
医学统计学名词解释与简答题(13个章节重点题目,复习备考必备)
医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。
谈谈你的理解。
第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。
2. 请简述统计图的基本结构及绘制统计图的注意事项。
第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。
2. 简述发病率与患病率、死亡率与病死率的不同。
3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。
2. 简述假设检验与置信区间的关系。
第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。
2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。
2. 请简述非参数检验适用范围。
3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。
医学统计学名词解释、简答、问答
名词解释1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。
医学统计学简答题
几何均数(G):呈倍数关系的偏态分布,经对数变换后呈正态或近似正态分布(血清抗体滴度,细菌计数,体内某些微量元素)
中位数(M):可用于各种分布,不受极端值影响,主要用于不对称分布类型的资料,两端无确切值会分布不明的资料
3.n小于40或T<1时用四格表确切概率法
4.多个构成比,用R*C列联表X2检验
11.卡方检验基本思想档
X2值反映了实际频数和理论频数吻合的程度,若H0成立,则应相差不大,A于T相差越大,X2就越大,相应P就越大,当P小雨等于a有理由认为无效假设不成立,拒绝H0做出统计推断
12.非参数检验适用于
4.对于服从双变量正态分布的同一组资料,其相关系数r和回归系数b可以相互换算r=b*Sx/Sy
3.标准差与标准误的区别与联系
均数的标准误:
用途:描述均数抽样误差的大小
符号
计算
公式
意义:越小样本均数分布越集中,与总体均数差别越小,抽样误差越小,由样本均数估计总体均数可靠性越大
2、方差分析的用途:
①两个或多个样本均数间的比较;
②分析两个或多个因素间的交互作用;
③回归方程的线性假设检验;
④多元线性回归分析中偏回归系数的假设检验;
⑤两样本的方差齐性检验等
10.卡方检验应用条件
1.n大于等于40且T大于等于5时,用PearsonX2检验
2.n大于等于40且1大于等于T<5,连续性校正X2检验
标准差:
用途:描述个体值的变异程度
符号
计算
公式
意义:越小个体值越集中,均数对数据的代表性越好
联系:S吧X=S/根号n
医学统计学简答题
a一类错误小于取真接受H1 拒绝H0(真)抽样误差根号下[p*(1-p)/n]正态性检验H0:服从有错:β方差s2=(xi-xba)2求和之后/n-1 {xi2求和后-【x求和后的平方再除n】}/n-1 95%置信区间X吧+_1.96s/根号nOR^(1+_1.96/根号X2)假设检验步骤(1)资料类型:定性定量(2)设计类型:完全随机设计(两独立样本t检验,四格表X;多组独立样本方差分析,R*C列联表X、多组独立样本方差分析,等级资料有序多分类资料秩和检验)(3)判断条件及采用的统计学方法:独立正态(小样本进行正态性检验,由中心极限定理可知,n>50样本均数来自正态分布的总体)方差齐性等方差,等级资料。
(4)有序多分类等级资料秩和检验:建立检验假设,确定检验水准H0:Md=0,即前后变化分数的总体中位数为0;H1:Md≠0,总体中位数不为零a=0.05(5)计算检验统计量T,若相同秩次较多,采用近似正态法,用矫正公式,计算Zc,Z0.05/2=1.96(6)确定P值,做出推断(P》a不拒绝H0,认为差异无统计学意义)查T界值表,若T统计量落在上下界值之间,【检验统计量T选T+-小的值】P>0.05,按a=0.05水准,不拒接H0,差异不具有统计学意义,尚不能说明、、有效。
单因素方差分析=完全随机设计的方差分析 1. 方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与t 检验等价。
2设计思路:主要用于多组定量资料的比较,先进行总的比较,避免一类错误增加。
当组间有统计学差异时再进行组间比较。
2. 方差分析基本思想:根据研究目的和设计类型,将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量 F 值,实现对总体均数是否有差别的推断。
(根据研究目的和设计类型,将全部观测值的总变异分解为两个或多个部分,各部分的变异可由不同处理因素的效应或者误差的效应解释。
医学统计学简答题
三、简答题(20分)2、何谓假设检验?可以举例说明。
(5分)首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。
3、请你谈谈对假设检验结论的认识。
(5分)由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
4、请你谈谈标准差和标准误的异同点。
(5分)四、简答题 15分1. 抽样研究中如何才能控制或减小抽样误差?答:合理的抽样设计,增大样本含量。
2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?答:不能,因为P值的大小与总体指标间差异大小不完全等同。
P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。
四、简答题 20分2 某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。
答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。
3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95%表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L) 4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b 也越大。
医学统计学试题及答案
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
医学统计学问答题(含答案)
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学问答题(含答案)简答题 0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料); C资料分布不明。
1. 对于一组近似正态分布的资料,除样本含量 n 外,还可计算SX,和SX96. 1,问各说明什么?(1) X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2) S 为标准差,说明正态分布或近似正态分布的离散趋势(3)SX96. 1可估计正态指标的 95%的医学参考值范围,即此范围在理论上应包含 95%的个体值。
2. 试述正态分布、标准正态分布的联系和区别。
正态分布标准正态分布原始值 X 无需转换作 u=(X-) / 转换分布类型对称对称集中趋势 =0 均数与中位数的关系 =M1 / 22=M 参考:标准正态分布的均数为 0,标准差为 1;正态分布的均数则为,标准差为(为任意数,而为大于 0 的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3. 说明频数分布表的用途。
1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理 4. 变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
医学统计学简答题
医学统计学简答题1.简述标准差、标准误得区别与联系?区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(x)之间得变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数得代表性越强、标准误。
.估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
(2)与n得关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。
(3)用途不同:标准差表示x得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。
联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。
2.简述假设检验得基本步骤。
1.建立假设,确定检验水准。
2.选择适当得假设检验方法,计算相应得检验统计量、3、确定P值,下结论3.正态分布得特点与应用:特点: 1、集中性:正态曲线得高峰位于正中央,即均数所在得位置;2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数μ与标准差σ,可记作N(μ,σ):均数μ决定正态曲线得中心位置;标准差σ决定正态曲线得陡峭或扁平程度、σ越小,曲线越陡峭;σ越大,曲线越扁平;5、u变换:为了便于描述与应用,常将正态变量作数据转换;应用: 1。
估计医学参考值范围2、质量控制3。
正态分布就是许多统计方法得理论基础4.简述参考值范围与均数得可信区间得区别与联系可信区间与参考值范围得意义、计算公式与用途均不同、1。
从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是:±1.96s。
医学统计学简答题
医学统计学简答题三、简答题(20分)2、何谓假设检验?可以举例说明。
(5分)⾸先建⽴检验假设,然后在该假设下进⾏随机抽样,计算得到该统计量及其极端情形的概率,如果概率较⼩,则拒绝该假设,如果概率不是⼩概率,则接受该假设,这个过程称为假设检验。
3、请你谈谈对假设检验结论的认识。
(5分)由于假设检验的结论是依据⼩概率事件⼀次试验实际不可能发⽣的原理进⾏的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。
4、请你谈谈标准差和标准误的异同点。
(5分)四、简答题 15分1. 抽样研究中如何才能控制或减⼩抽样误差?答:合理的抽样设计,增⼤样本含量。
2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象⼜是总体的⼀部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越⼩,⽐较的两个总体指标间差异越⼤?为什么?答:不能,因为P值的⼤⼩与总体指标间差异⼤⼩不完全等同。
P值的⼤⼩除与总体差异⼤⼩有关,更与抽样误差⼤⼩有关,同样的总体差异,抽样误差⼤⼩不同,所得的P也会不⼀样,抽样误差⼤⼩实际⼯作中主要反映在样本量⼤⼩上。
四、简答题 20分2 某医⽣⽤某药治疗10例⼩⼉⽀⽓管哮喘,治愈8例,结论为“该药对⼩⼉⽀⽓管哮喘的治愈率为80%,值得推⼴”。
答:⼀是没有对照组,⼆是样本例数太少,抽样误差⼤,可信区间宽。
3.某地1岁婴⼉平均⾎红蛋⽩95%可信区间为116.2~130.1(g/L),表⽰什么意义?该地1岁正常婴⼉⾎红蛋⽩95%的参考值范围为111.2~135.1(g/L),⼜说明了什么含义?答:表⽰该地1岁婴⼉⾎红蛋⽩总体平均数在116.2~130.1(g/L),估计正确的概率为95%表⽰该地有95%1岁正常婴⼉的⾎红蛋⽩值在111.2~135.1(g/L) 4.对同⼀组资料,如果相关分析算出的r越⼤,则回归分析算出的b 也越⼤。
医学统计学复习题(名词解释和简答)
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
医学统计学简答题
1.简述实验设计的基本要素,基本原则。
(8分)答:实验设计的原则是随机化原则,是保证非处理因素在各对照组之间均衡一致的重要条件;对照原则,建立对照是比较的基础,也是控制实验过程中非实验因素的影响和偏倚的有力措施;重复的原则,应该保证足够的样本量。
其基本要素是处理因素,作用于受试对象,要求在实验过程中观察其处理的因素;受试对象,处理因素作用的对象;实验效应,用一空白指标来反映,指标要求精确性、客观性、关联性、灵敏性。
2.描述离散趋势的指标有哪些?适用于何种情况?答:描述离散趋势的指标有全距,是一组变量值中最大值与最小值之差,反映资料的分布范围,全距大说明数据的变异度大,适用于任何资料;四分位间距是两个特定的百分位数,第25%分位数和第75%分位数,常用于描述不对称资料的特征;方差和标准差常用来描述正态分布的资料;变异系数,是标准差与均数之比,常用于比较度量衡单位不同的两组或多组资料的变异度,以及比较均数相差悬殊的两组或多组资料的变异度。
3.标准差与标准误有何不同?答:1)概念不同:标准差是由个体变异造成的,标准误是由抽样误差引起的。
将样本统计量的标准差称为标准误2)计算公式不同:22()xNμσ-=∑,s=xs=3)性质不同:n越大标准差越稳定,标准误越趋近于0。
4)用途不同:标准差用来估计参考值范围,计算标准误;标准误用来估计正态参数。
5.可信区间:按一定概率(可信度)确定的包含未知总体参数的可能范围。
标准差越大,区间越宽;n越大,区间越窄。
参考值范围:按一定比例确定的绝大多数正常人所在的范围。
标准差越大,区间越宽;n越大,区间越稳定。
6. 3.方差分析中常用的数据转换有哪些?转换的目的是什么?对数变换,是服从对数正态分布的数据正态化,即使数据达到方差齐性;平方根转换,是服从Possion分布的计数资料或轻度偏态的资料正态化,当各样本的方差与均数呈正相关时,可是资料达到方差齐性;倒数变换,用于数据两端波动较大的资料可使极端值的影响减小;平方根反正弦变换,使服从二项分布的率或百分比的资料接近正态分布,达到方差齐性的要求。
医学统计学简答题05456
医学统计学简答题1.简述标准差、标准误得区别与联系?区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(x)之间得变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数得代表性越强。
标准误、、估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
(2)与n得关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。
(3)用途不同:标准差表示x得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。
联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。
2.简述假设检验得基本步骤、1.建立假设,确定检验水准。
2.选择适当得假设检验方法,计算相应得检验统计量。
3、确定P值,下结论3.正态分布得特点与应用:特点: 1、集中性:正态曲线得高峰位于正中央,即均数所在得位置;2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数μ与标准差σ,可记作N(μ,σ):均数μ决定正态曲线得中心位置;标准差σ决定正态曲线得陡峭或扁平程度、σ越小,曲线越陡峭;σ越大,曲线越扁平;5、u变换:为了便于描述与应用,常将正态变量作数据转换;应用: 1.估计医学参考值范围2。
质量控制3。
正态分布就是许多统计方法得理论基础4.简述参考值范围与均数得可信区间得区别与联系可信区间与参考值范围得意义、计算公式与用途均不同。
1。
从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围2.从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是:±1、96s。
医学统计学——简答题一览
简答题(规则是:知道多少,写多少,不要空白,尽量多写)1. 频数表和频数图的用途答:1.描述频数分布的类型(1)对称分布 :若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布(2)偏态分布 :右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。
左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。
2. 描述计量资料分布的集中趋势和离散趋势①集中趋势(central tendency):变量值集中位置。
——平均水平指标②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。
离“中心”位置越远,频数越小;且围绕“中心”左右对称。
——变异水平指标3.便于发现一些特大或特小的可疑值;4.便于进一步做统计分析和处理。
2.计量资料集中趋势和离散趋势的描述答:集中趋势常用指标位算数均数、几何均数和中位数。
1.算数均数简称均数,适合描述对称分布或近似对称分布资料的集中趋势。
可以分为总体均数和样本均数。
(总体均数:是指根据研究目的所确定的全体研究对象的某项指标观察值的平均水平;样本均数:是指研究所收集到的研究对象的某项观察值的算数均数。
)注意计算方法:原始数据的样本均数计算方法 频数表资料的样本均数计算方法2.几何均数适用于对数对称分布(原始变量分布不对称,但是经过对数变换后近似呈对称分布)的资料,并且要求所有数据均大于0.典型代表——滴度。
原始资料的几何均数计算方法频数表资料的几何均数计算方法3.中位数 意义:中位数是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。
符号:Md适用条件:适合各种类型的资料。
尤其适合于①大样本偏态分布的资料; ②资料有不确定数值;③资料分布不明等。
离散趋势的常用描述指标是:方差标准差、全距、四分位数间距、变异系数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学简答题1.简述标准差、标准误的区别与联系?区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。
标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
(2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。
(3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。
联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。
2.简述假设检验的基本步骤。
1.建立假设,确定检验水准。
2.选择适当的假设检验方法,计算相应的检验统计量。
3.确定P值,下结论3.正态分布的特点和应用:?特点:?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;?2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;?4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。
σ越小,曲线越陡峭;σ越大,曲线越扁平;?5、u变换:为了便于描述和应用,常将正态变量作数据转换;??应用:?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础4.简述参考值范围与均数的可信区间的区别和联系可信区间与参考值范围的意义、计算公式和用途均不同。
?1.从意义来看?95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指?95%可信度估计的总体均数的所在范围?2.从计算公式看?若指标服从正态分布,95%参考值范围的公式是:±1.96s。
?总体均数95%可信区间的公式是:??前者用标准差,后者用标准误。
前者用1.96,后者用α为0.05,自由度为v的t界值。
5.频数表的用途和基本步骤。
用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。
基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。
6.非参数统计检验的适用条件。
(1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能7.线性回归的主要用途。
1.研究因素间的依存关系,自变量和应变量之间是否存在线性关系,即研究一个或多个自变量对应变量的作用,或者应变量依赖自变量变化而变化的规律。
2.利用直线回归方程可进行预测估计。
3.用容易测量的指标估计不易测量的指标。
4.获得精确度更高的医学参考值范围。
8.简述检验假设与可信区间的联系与区别。
(1)可信区间用于推断总体参数所在的范围,假设检验用于推断总体参数是否不同。
前者估计总体参数的大小,后者推断总体参数有无质的不同。
(2)可信区间也可回答假设检验的问题。
但可信区间不能提供确切的P值范围,只能给出在α水准上有无统计意义。
(3)可信区间还可提示差别有无实际意义。
9.简述直线回归与直线相关的区别与联系。
区别:(1)资料要求不同:直线回归中应变量y是来自正态总体的随机变量,而x既可以是来自正态总体中的随机变量,也可以是严密控制、精确测量的变量;相关分析则要求x,y是来自双变量正态分布总体的随机变量。
(2)回归反映的是两个变量的依存关系,取值范围是(-∞,∞)。
相关反应两个变量的相互关系,取值范围是(-1,1);(3)回归有单位,相关无单位。
联系:统一资料r与b符号相同,即方向一致性,r与b假设检验结果等价,r与b可互相换算,有相关不一定有回归,有回归一定有相关(回归可用来解释相关)10.标准差的实际应用。
1表示数据分布的离散程度2常用“x±s”作为计量资料的数字特征描述的专用符号3计算临床上的各种生化、生理指标的参考范围4在单纯随机抽样中,是计量资料估计样本量不可缺少的重要依据之一5可用来计算均数的抽样误差大小。
相对数的注意事项p33医学统计学名词解释*总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。
*样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。
变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
统计量:由样本所算出的统计指标或特征值。
*抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。
(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值变异程度的指标,为方差的算术平方根。
标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。
系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
*Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。
*Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。
参数:反应总体统计学特征的数字。
*计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。
*医学参考值范围:绝大多数正常人(正常人的90%,95%,99%,尤其最常用95%)的某一指标都在一定的范围内,则这个范围为医学参考值范围。
参考值:临床上应用的参考值是指包括绝大部分正常人的人体形态、机能和代谢产物等各种生理及生化指标。
*计量资料:用定量的方法测量某项指标的大小所得的资料。
(用仪器、工具或其他定量方法准确获得的定量结果,一般带有计量单位)*概率:描述随机事件发生的可能性大小的数值。
P值:在Ho规定的总体中进行随机抽样,得到的等于及大于或等于及小于现有样本统计率,或说是比现有实验结果更极端的样本统计量出现的概率,?P值越小越不利于接受Ho。
线性相关的情况:正相关、负相关、零相关、非线性相关正态分布:又称高斯分布,是一种概率分布。
标准正态分布:当μ=0,σ2 =1时,称为标准正态分布,记为N (0,1)。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。
(线性)相关系数r:用以描述两个随机变量之间相关关系的密切程度与相关方向的统计指标。
回归:分析两个变量或多个变量之间某种数量依存关系的一类统计方法直线回归:统计学上将分析某变量随另一变量变化而变化依存关系的方法称为直线回归*回归系数b:即回归直线的斜率,统计学意义是自变量X改变一个单位时,应变量Y平均改变b个单位。
离散系数(变异系数):标准差与均叔之比。
统计量:用样本观察值确定的,反应总体统计学特征且不依赖于未知参数的数字。
假设检验:用样本统计量对总体参数或分布的特征假设进行检验,进而对该假设是否成立作出判断。
假设检验的步骤:1、建立假设确定检验水平(显着性水平)2、选择适当的假设检验的方法,记录相应的检验统计量3、确定p值下结论。
**检验效能:即1-β,指两总体确有差异,按规定的检验水平α所能发现该差异的能力。
*中位数(median):将一组观察值按大小顺序排列后,位次居中的观察值。
直线回归:统计学上将分析某变量随另一变量变化而变化依存关系的方法成为直线回归。
方差分析:是检验多个总体均值是否相等的统计方法。
它是通过检验各总体的均值是否相等来判断分类型自变量对数值型自变量是否有显着影响。
区间估计:总体的区间估计是利用样本信息给出一个区间并同时给出重复试验时该区间包含总体均数的概率。
可信区间(CI):按一定概率100(1-a)%(即可信度)估计总体均数的所在范围,得到的范围是可信区间。
统计表:统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。
统计图:用点的位置、线段的升降、直条的长短及面积的大小等几何图形表达事物的统计指标大小、对比关系及变化趋势。
非参数检验最小二乘法相关系数(r)决定系数(r2)医学统计学填空题*1.统计表结构:标题标目线条数字备注*2.统计图结构:标题图域标目尺度图例*3.统计工作的基本步骤:设计收集资料整理资料分析资料9.影响检验效能的四个因素:1. 总体参数的差异越大,检验效能越大 2. 个体差异越小,检验效能越大 3. 样本量越大,检验效能越大 4. 检验水准a定的越宽,检验效能越大10.编秩号注意:1. 方差为0的数据忽略 2. 余下的n个差数按绝对值由小到大排秩号 3求秩和即将正负秩号分别相加4. 检验统计量R 取较小一个秩11.正态分布的特点:1. 集中性,正态分布曲线的高峰位于正中央,即均数所在位置2. 对称性,以x=u为中心,左右对称,x轴为渐近线3均匀变动性,正态分布曲线由均数所在处开始分别向左右两侧逐渐均匀下降4. 两个参数:均数u和标准差6,记作N(u, 6),均数u决定正态曲线的中心位置,标准差6决定正态曲线的陡峭或扁平程度。
6越大,曲线越扁平,6越小曲线越陡峭5. u变换*12.正态分布应用:1. 估计医学参考值范围 2. 质量控制 3. 正态分布是许多统计学方法的理论基础*13.离散趋势指标:极差方差标准差四分位数间距变异系数集中趋势指标:14.标准差应用:1. 表示数据分布的离散程度 2常用x±s作为计量资料的数字特征描述的专用符号 3. 计算临床上的各种生化、生理指标的参考范围 4. 在单纯随机抽样中,是计量资料估计样本量不可缺少的重要依据之一 5. 可用来计算均数的抽样误差大小。
15.检验水准与两类误差:Ι型误差:当H0为真时,假设检验结论拒绝H0接受H1,Ⅱ型错误,当真实情况H0不成立H1成立时。
16.随即完全区组设计资料的方差分析特点:1分析两个因素(处理因素和区组因素)2两个因素相互独立无交换作用3分析效率高节约样本4设计要求严格。
原则:1区组划分2受试单位数量恒定3完全随机化的分组17.医学测量结果按其数源类型分为计量资料.计数资料。
18卡方检验的基本思想:检验实际频数和理论频数分布的符合程度,若原假设成立,卡方值不会太大,反之若A与T的差值大,卡方值也越大,当卡方值超出一定范围时,就有理由认为原假设不成立。