医学统计学简答题

合集下载

医学统计学重点简答题和名词解释

医学统计学重点简答题和名词解释

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。

抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。

表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。

可用标准误描述其大小。

标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。

样本均数的标准差称为均数的标准误。

均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。

参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间 揭示的是按一定置信度估计总体参数所在的范围。

t分布法、正态分布法(标准误)、二项分布法。

置信区间估计总体参数所在范围非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。

变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。

参数(parameter):描述总体特征的统计指标。

统计量(statistic):描述样本特征的统计指标。

实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。

在确定接受处理因素的实验组时,要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。

整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。

医学统计学简答题总结 必考大题总结 考前必看

医学统计学简答题总结 必考大题总结 考前必看

描述计量资料得集中趋势与离散趋势得指标有哪些?各指标得适用范围如何?答:描述计量资料集中趋势得统计指标常见得有算数均数、几何均数、中位数。

算数均数适用于描述对称分布资料得集中位置,尤其就是正态分布得资料;几何均数一般用来描述等比资料与对数正态分布资料得集中位置;中位数可以使用于任何分布得资料,尤其就是偏态分布。

分布不明或分布末端无确定值得资料。

描述离散趋势得指标常见得有极差、四分位数间距、方差、标准差与变异系数.极差与四分位数间距可以用于任何分布,后者比前者稳定,但就是这两个指标都不能综合反映各观察值得变异程度;方差与标准差最常用,但要求资料近似正态分布;变异系数可以用于多组资料间量纲不同或均数相差较大得时候变异程度得比较。

频数分布表(图)得用途有哪些?1描述资料得分布类型,就是对称分布还就是偏态分布;2描述变量得分布特征:集中趋势与离散趋势;3便于发现某些离群值或异常值;4便于进一步得统计分析与处理;5当样本含量够大得时候,我们还可以以频率作为概率得估计值。

变异系数与标准差有何异同?答:不同点:变异系数主要用于量纲不同得变量间,或均数相差较大得变量间得变异程度得比较.所以变异系数就是没有量纲得,而标准差就是方差得平方根,标准差得量纲与原指标得一致,它适用于近似正态分布得资料。

相同点与联系:变异系数与标准差都就是用于对称分布资料,尤其就是正态分布得资料,且还可以知道变异系数就是由标准差计算得到得。

应用相对数得注意事项:1、防止概念混淆2、频率型指标得解释要紧扣总体与属性3、计算相对数时分母应有足够数量4、正确计算合计频率5、注意资料得可比性6、正确进行相对数得统计推断。

为什么不能以构成比代率?请联系实际加以说明。

率与构成比所说明得问题不同,因而绝不能以构成比代率。

构成比只能说明各组成部分得比重或分布,而不能说明某现象发生得频率或强度。

、二项分布:如果每个对象阳性结果得发生概率为π,阴性结果得概率为1-π,而且各个观察对象得结果就是相互独立得,那么,重复观察N个人,发生阳性次数得概率分布为二项分布。

医学统计学试题及答案

医学统计学试题及答案

医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。

A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。

A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。

A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。

答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。

答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。

答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。

答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。

答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。

医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。

其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。

医学统计学简答题

医学统计学简答题

1、正态分布的特点及其应用性质:①以均数为中心,两头低中间高,左右完全对称的钟型曲线;②只有一个高峰,在X=μ,总体中位数亦为μ;③μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为形态参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;④对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布;⑤正态分布在μ±1σ处各有一个拐点;⑥正态曲线下的面积分布有一定的规律:X轴与正态曲线所夹面积恒为1;区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。

应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。

2、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。

方法:①正态分布法:②百分位数法(偏态分布):3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散。

标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。

计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与n的关系:随着n增加,样本标准差稳定于总体标准差;随着n增加,样本标准误减少并趋于0。

医学统计学名词解释与简答题(13个章节重点题目,复习备考必备)

医学统计学名词解释与简答题(13个章节重点题目,复习备考必备)

医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。

谈谈你的理解。

第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。

2. 请简述统计图的基本结构及绘制统计图的注意事项。

第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。

2. 简述发病率与患病率、死亡率与病死率的不同。

3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。

2. 简述假设检验与置信区间的关系。

第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。

2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。

2. 请简述非参数检验适用范围。

3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。

医学统计学试题及答案

医学统计学试题及答案

医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。

答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。

它通常包括零假设(H0)和备择假设(H1)。

通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。

2. 解释什么是“置信区间”。

答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。

它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。

(完整版)卫生统计学简答题汇总.doc

(完整版)卫生统计学简答题汇总.doc

统计学简答汇总第一章:绪论(无)第二章:定量变量的统计描述1.均数﹑几何均数和中位数的适用范围有何异同?答 : 相同点 , 均表示计量资料集中趋势的指标。

不同点 : 表 2-5.表 2-5 均数 , 几何均数和中位数的相异点平均数意义应用场合均数几何均数中位数平均数量水平平均增减倍数位次居中的观察值水平应用甚广 , 最适用于对称分布, 特别是正态分布①等比资料;②对数正态分布资料①偏态资料;②分布不明资料;③分布一端或两端出现不确定值2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?答:1)意义:中位数是百分位中的第50 分位数,常用于描述偏态分布资料的集中位置,映位次居中的观察值水平。

百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。

多个百分位数结合使用,可更全面地描述总体或样本的分布特征。

反( 2)计算:中位数和百分位数均可用同一公式计算,即Px=L+( i/f x)(n·x%-Σf L)可根据研究目的选择不同的百分位数代入公式进行计算分析。

(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。

中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。

百分位数还可以用来描述变量值的离散趋势(四分位数间距)。

3.同一资料的标准差是否一定小于均数?答:不一定。

同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。

变异大,标准差就大,有时比均数大;变异小,标准差小。

4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?( 1)样本含量的大小,样本含量越大,标准差越稳定。

(2)分组的多少(3)分布形状的影响,偏态分布的标准差较近似正态分布大(4)随机测量误差大小的影响(5)研究总体中观察值之间变异程度大小5.标准差与变异系数的异同点有哪些?答:标准差:是以算数平均数为中心, 反映各观测值离散程度的一个绝对指标. 当需要对同一总体不同时期或对不同总体进行对比时, 缺乏可比性 . 当总体平均水平不同或计量单位不同时 , 用标准差是无法实现两组数据离散程度大小对比的.变异系数:标准差与平均数的比值称为变异系数, 记为 C·V. 变异系数可以消除单位和(或)6.如何表达一批计量数据的基本特征?答:从集中趋势和离散趋势两方面回答。

医学统计学简答题

医学统计学简答题
对称分布资料,特别是正态分布或近似正态分布的资料
几何均数(G):呈倍数关系的偏态分布,经对数变换后呈正态或近似正态分布(血清抗体滴度,细菌计数,体内某些微量元素)
中位数(M):可用于各种分布,不受极端值影响,主要用于不对称分布类型的资料,两端无确切值会分布不明的资料
3.n小于40或T<1时用四格表确切概率法
4.多个构成比,用R*C列联表X2检验
11.卡方检验基本思想档
X2值反映了实际频数和理论频数吻合的程度,若H0成立,则应相差不大,A于T相差越大,X2就越大,相应P就越大,当P小雨等于a有理由认为无效假设不成立,拒绝H0做出统计推断
12.非参数检验适用于
4.对于服从双变量正态分布的同一组资料,其相关系数r和回归系数b可以相互换算r=b*Sx/Sy
3.标准差与标准误的区别与联系
均数的标准误:
用途:描述均数抽样误差的大小
符号
计算
公式
意义:越小样本均数分布越集中,与总体均数差别越小,抽样误差越小,由样本均数估计总体均数可靠性越大
2、方差分析的用途:
①两个或多个样本均数间的比较;
②分析两个或多个因素间的交互作用;
③回归方程的线性假设检验;
④多元线性回归分析中偏回归系数的假设检验;
⑤两样本的方差齐性检验等
10.卡方检验应用条件
1.n大于等于40且T大于等于5时,用PearsonX2检验
2.n大于等于40且1大于等于T<5,连续性校正X2检验
标准差:
用途:描述个体值的变异程度
符号
计算
公式
意义:越小个体值越集中,均数对数据的代表性越好
联系:S吧X=S/根号n

医学统计学简答题

医学统计学简答题

a一类错误小于取真接受H1 拒绝H0(真)抽样误差根号下[p*(1-p)/n]正态性检验H0:服从有错:β方差s2=(xi-xba)2求和之后/n-1 {xi2求和后-【x求和后的平方再除n】}/n-1 95%置信区间X吧+_1.96s/根号nOR^(1+_1.96/根号X2)假设检验步骤(1)资料类型:定性定量(2)设计类型:完全随机设计(两独立样本t检验,四格表X;多组独立样本方差分析,R*C列联表X、多组独立样本方差分析,等级资料有序多分类资料秩和检验)(3)判断条件及采用的统计学方法:独立正态(小样本进行正态性检验,由中心极限定理可知,n>50样本均数来自正态分布的总体)方差齐性等方差,等级资料。

(4)有序多分类等级资料秩和检验:建立检验假设,确定检验水准H0:Md=0,即前后变化分数的总体中位数为0;H1:Md≠0,总体中位数不为零a=0.05(5)计算检验统计量T,若相同秩次较多,采用近似正态法,用矫正公式,计算Zc,Z0.05/2=1.96(6)确定P值,做出推断(P》a不拒绝H0,认为差异无统计学意义)查T界值表,若T统计量落在上下界值之间,【检验统计量T选T+-小的值】P>0.05,按a=0.05水准,不拒接H0,差异不具有统计学意义,尚不能说明、、有效。

单因素方差分析=完全随机设计的方差分析 1. 方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与t 检验等价。

2设计思路:主要用于多组定量资料的比较,先进行总的比较,避免一类错误增加。

当组间有统计学差异时再进行组间比较。

2. 方差分析基本思想:根据研究目的和设计类型,将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量 F 值,实现对总体均数是否有差别的推断。

(根据研究目的和设计类型,将全部观测值的总变异分解为两个或多个部分,各部分的变异可由不同处理因素的效应或者误差的效应解释。

医学统计学重点简答题

医学统计学重点简答题

一、平均水平常用的统计指标及其适用范围?常用统计指标包括算术均数,几何均数,中位数。

算术均数适用于对称分布,特别是正态分布的数据;几何均数适用于经对数变换后频数分布对称或呈等比级数的数据;中位数主要适用于三种情形:①非正态分布资料(对数正态分布除外)。

②频数分布的一端或两端无确切数据的资料。

③总体分布不清楚的资料。

二、应用相对数的注意事项1.计算相对数时应有足够的观察单位数。

例数太少会使相对数波动较大,这种情况下最好用绝对数表示。

2.正确计算合计率。

计算观察单位不等的几个率的合计率(平均率)时,不能将几个率直接相加求其平均率,而应分别将分子分母合计,再求出合计率。

3不能以构成比代替率。

构成比说明事物内部各部分所占的比重,不能说明某现象发生的频率或强度。

4.注意资料的可比性。

在比较相对数时,除了要比较的因素外,其余的因素应尽可能相同或相近。

5.样本率或构成比的比较应做假设检验。

由于样本率或构成比也存在抽样误差,比较两个或多个率或构成比时,不能凭样本率或构成比的差别作出结论,而必须进行差别的假设检验。

三、正常值范围与置信区间的区别四、标准误与标准差的区别与联系。

区别点标准误标准差含义样本均数的标准差,描述样本均数的抽样误差,即样本均数与总体均数的接近程度。

描述个体间的变异程度计算公式1k)xx(s2x--=∑---1n)xx(s2--=∑-用途总体均数的区间估计医学参考值范围估计相似点性质相似,都是用来说明变异程度五、简述四格表卡方检验统计方法的选择条件六、行×列表资料χ²检验的注意事项1.行×列表资料中各格的理论频数T均不应小于1,并且1≤ T<5的格子数不宜超过格子总数的1/5,否则可能产生偏性。

处理的方法有三种:①增大样本含量,使理论频数增大;②根据专业知识,删去理论频数太小的行或列或将理论频数太小的行或列与性质相近的邻行或邻列合并。

③改用双向无序R×C表的Fisher确切概率法。

医学统计学简答题整理

医学统计学简答题整理

医学统计学简答题整理(by 李勇君)自从统计换了出题老师之后简答题就出得非常任性,所以这些真的只是仅供参考。

= =————————————————————————————————————————————————1.医学统计学方法的基本步骤:(1)设计:统计工作中最关键的一环。

(2)收集资料:主要有四个来源:统计报表;登记和报告卡(单);日常医疗卫生工作记录;专题调查或实验。

(3)整理资料(4)分析资料:统计描述;统计推断。

2.正态分布的特征:(1)正态分布曲线在横轴上方均数处最高;(2)正态分布以均数为中心左右对称;(3)正态分布曲线下面积的分布有一定的规律;(4)正态分布有两个参数:均数μ是位置参数,决定正态曲线的中心位置;σ是形状参数,决定正态曲线的陡峭或扁平程度,σ越小曲线越陡峭,σ越大曲线越扁平。

3.t分布的特点:(1)以0为中心左右对称;(2)曲线形态与自由度大小有关,自由度越小,t分布曲线越平坦,曲线中间越低,两侧尾部翘得越高;自由度越大,t分布曲线越接近正态分布曲线。

4.制定医学参考值范围的基本原则:(1)抽取样本含量足够大的正常人;(2)对抽取的正常人进行准确统一的测定,控制测量误差;(3)判断是否需要分组指定参考值范围;(4)决定参考值范围的单侧或双侧界值;(5)选择适当的百分界值。

5.标准误的应用:(1)反映样本均数的可靠性以及抽样误差的大小(标准误大,表示抽样误差大,则样本均数估计总体均数的可靠性差;反之,标准误小,抽样误差小,样本均数估计总体均数的可靠性好。

)(2)估计总体均数的置信区间;(3)用于均数的假设检验。

6.假设检验的一般步骤:(1)建立假设(无效假设和备择假设)和确定检验水准;(2)选择检验方法和计算检验统计量;(3)确定P值,做出推断结论。

7.t检验与u检验的应用条件:t检验:(1)σ未知且样本例数n较小;(2)要求样本来自正态分布的总体;(3)作两样本均数比较时还要求两样本的总体方差相等(方差齐性)u检验:(1)σ已知或σ未知,但样本含量n较大(一般大于100);(2)要求样本来自正态分布的总体;(3)作两样本均数比较时还要求两样本的总体方差相等(方差齐性)8.假设检验的注意事项:(1)注意资料的可比性;(2)注意选用的假设检验方法的应用条件;(3)结论不能绝对化;(4)正确区分差别有无统计意义和有无专业意义的实际意义;(5)u检验和t检验理论上要求样本来自正态分布的总体,还要注意方差齐性。

医学统计学简答题

医学统计学简答题

医学统计学简答题1.简述标准差、标准误得区别与联系?区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(x)之间得变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数得代表性越强、标准误。

.估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

(2)与n得关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。

(3)用途不同:标准差表示x得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。

联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。

2.简述假设检验得基本步骤。

1.建立假设,确定检验水准。

2.选择适当得假设检验方法,计算相应得检验统计量、3、确定P值,下结论3.正态分布得特点与应用:特点: 1、集中性:正态曲线得高峰位于正中央,即均数所在得位置;2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数μ与标准差σ,可记作N(μ,σ):均数μ决定正态曲线得中心位置;标准差σ决定正态曲线得陡峭或扁平程度、σ越小,曲线越陡峭;σ越大,曲线越扁平;5、u变换:为了便于描述与应用,常将正态变量作数据转换;应用: 1。

估计医学参考值范围2、质量控制3。

正态分布就是许多统计方法得理论基础4.简述参考值范围与均数得可信区间得区别与联系可信区间与参考值范围得意义、计算公式与用途均不同、1。

从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是:±1.96s。

医学统计学简答题

医学统计学简答题

医学统计学简答题三、简答题(20分)2、何谓假设检验?可以举例说明。

(5分)⾸先建⽴检验假设,然后在该假设下进⾏随机抽样,计算得到该统计量及其极端情形的概率,如果概率较⼩,则拒绝该假设,如果概率不是⼩概率,则接受该假设,这个过程称为假设检验。

3、请你谈谈对假设检验结论的认识。

(5分)由于假设检验的结论是依据⼩概率事件⼀次试验实际不可能发⽣的原理进⾏的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。

4、请你谈谈标准差和标准误的异同点。

(5分)四、简答题 15分1. 抽样研究中如何才能控制或减⼩抽样误差?答:合理的抽样设计,增⼤样本含量。

2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象⼜是总体的⼀部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越⼩,⽐较的两个总体指标间差异越⼤?为什么?答:不能,因为P值的⼤⼩与总体指标间差异⼤⼩不完全等同。

P值的⼤⼩除与总体差异⼤⼩有关,更与抽样误差⼤⼩有关,同样的总体差异,抽样误差⼤⼩不同,所得的P也会不⼀样,抽样误差⼤⼩实际⼯作中主要反映在样本量⼤⼩上。

四、简答题 20分2 某医⽣⽤某药治疗10例⼩⼉⽀⽓管哮喘,治愈8例,结论为“该药对⼩⼉⽀⽓管哮喘的治愈率为80%,值得推⼴”。

答:⼀是没有对照组,⼆是样本例数太少,抽样误差⼤,可信区间宽。

3.某地1岁婴⼉平均⾎红蛋⽩95%可信区间为116.2~130.1(g/L),表⽰什么意义?该地1岁正常婴⼉⾎红蛋⽩95%的参考值范围为111.2~135.1(g/L),⼜说明了什么含义?答:表⽰该地1岁婴⼉⾎红蛋⽩总体平均数在116.2~130.1(g/L),估计正确的概率为95%表⽰该地有95%1岁正常婴⼉的⾎红蛋⽩值在111.2~135.1(g/L) 4.对同⼀组资料,如果相关分析算出的r越⼤,则回归分析算出的b 也越⼤。

医学统计学简答题

医学统计学简答题

1.简述实验设计的基本要素,基本原则。

(8分)答:实验设计的原则是随机化原则,是保证非处理因素在各对照组之间均衡一致的重要条件;对照原则,建立对照是比较的基础,也是控制实验过程中非实验因素的影响和偏倚的有力措施;重复的原则,应该保证足够的样本量。

其基本要素是处理因素,作用于受试对象,要求在实验过程中观察其处理的因素;受试对象,处理因素作用的对象;实验效应,用一空白指标来反映,指标要求精确性、客观性、关联性、灵敏性。

2.描述离散趋势的指标有哪些?适用于何种情况?答:描述离散趋势的指标有全距,是一组变量值中最大值与最小值之差,反映资料的分布范围,全距大说明数据的变异度大,适用于任何资料;四分位间距是两个特定的百分位数,第25%分位数和第75%分位数,常用于描述不对称资料的特征;方差和标准差常用来描述正态分布的资料;变异系数,是标准差与均数之比,常用于比较度量衡单位不同的两组或多组资料的变异度,以及比较均数相差悬殊的两组或多组资料的变异度。

3.标准差与标准误有何不同?答:1)概念不同:标准差是由个体变异造成的,标准误是由抽样误差引起的。

将样本统计量的标准差称为标准误2)计算公式不同:22()xNμσ-=∑,s=xs=3)性质不同:n越大标准差越稳定,标准误越趋近于0。

4)用途不同:标准差用来估计参考值范围,计算标准误;标准误用来估计正态参数。

5.可信区间:按一定概率(可信度)确定的包含未知总体参数的可能范围。

标准差越大,区间越宽;n越大,区间越窄。

参考值范围:按一定比例确定的绝大多数正常人所在的范围。

标准差越大,区间越宽;n越大,区间越稳定。

6. 3.方差分析中常用的数据转换有哪些?转换的目的是什么?对数变换,是服从对数正态分布的数据正态化,即使数据达到方差齐性;平方根转换,是服从Possion分布的计数资料或轻度偏态的资料正态化,当各样本的方差与均数呈正相关时,可是资料达到方差齐性;倒数变换,用于数据两端波动较大的资料可使极端值的影响减小;平方根反正弦变换,使服从二项分布的率或百分比的资料接近正态分布,达到方差齐性的要求。

医学统计学简答题05456

医学统计学简答题05456

医学统计学简答题1.简述标准差、标准误得区别与联系?区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(x)之间得变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数得代表性越强。

标准误、、估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。

(2)与n得关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。

(3)用途不同:标准差表示x得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。

联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。

2.简述假设检验得基本步骤、1.建立假设,确定检验水准。

2.选择适当得假设检验方法,计算相应得检验统计量。

3、确定P值,下结论3.正态分布得特点与应用:特点: 1、集中性:正态曲线得高峰位于正中央,即均数所在得位置;2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数μ与标准差σ,可记作N(μ,σ):均数μ决定正态曲线得中心位置;标准差σ决定正态曲线得陡峭或扁平程度、σ越小,曲线越陡峭;σ越大,曲线越扁平;5、u变换:为了便于描述与应用,常将正态变量作数据转换;应用: 1.估计医学参考值范围2。

质量控制3。

正态分布就是许多统计方法得理论基础4.简述参考值范围与均数得可信区间得区别与联系可信区间与参考值范围得意义、计算公式与用途均不同。

1。

从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围2.从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是:±1、96s。

医学统计学——简答题一览

医学统计学——简答题一览

简答题(规则是:知道多少,写多少,不要空白,尽量多写)1. 频数表和频数图的用途答:1.描述频数分布的类型(1)对称分布 :若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布(2)偏态分布 :右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。

左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。

2. 描述计量资料分布的集中趋势和离散趋势①集中趋势(central tendency):变量值集中位置。

——平均水平指标②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。

离“中心”位置越远,频数越小;且围绕“中心”左右对称。

——变异水平指标3.便于发现一些特大或特小的可疑值;4.便于进一步做统计分析和处理。

2.计量资料集中趋势和离散趋势的描述答:集中趋势常用指标位算数均数、几何均数和中位数。

1.算数均数简称均数,适合描述对称分布或近似对称分布资料的集中趋势。

可以分为总体均数和样本均数。

(总体均数:是指根据研究目的所确定的全体研究对象的某项指标观察值的平均水平;样本均数:是指研究所收集到的研究对象的某项观察值的算数均数。

)注意计算方法:原始数据的样本均数计算方法 频数表资料的样本均数计算方法2.几何均数适用于对数对称分布(原始变量分布不对称,但是经过对数变换后近似呈对称分布)的资料,并且要求所有数据均大于0.典型代表——滴度。

原始资料的几何均数计算方法频数表资料的几何均数计算方法3.中位数 意义:中位数是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平。

符号:Md适用条件:适合各种类型的资料。

尤其适合于①大样本偏态分布的资料; ②资料有不确定数值;③资料分布不明等。

离散趋势的常用描述指标是:方差标准差、全距、四分位数间距、变异系数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三、简答题(20分)2、何谓假设检验?可以举例说明。

(5分)首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。

3、请你谈谈对假设检验结论的认识。

(5分)由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。

4、请你谈谈标准差和标准误的异同点。

(5分)四、简答题 15分1. 抽样研究中如何才能控制或减小抽样误差?答:合理的抽样设计,增大样本含量。

2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的?答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的3. 能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什么?答:不能,因为P值的大小与总体指标间差异大小不完全等同。

P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。

四、简答题 20分2 某医生用某药治疗10例小儿支气管哮喘,治愈8例,结论为“该药对小儿支气管哮喘的治愈率为80%,值得推广”。

答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。

3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95%表示该地有95%1岁正常婴儿的血红蛋白值在111.2~135.1(g/L) 4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b 也越大。

为什么?答:没有这个规律。

相关分析r值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。

(二)简答题1.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

2.正态分布、标准正态分布与对数正态分布的联系与区别。

3.对称分布在“X± 1.96S标准差”的范围内,也包括95%的观察值吗?1.医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。

所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。

制定参考值范围的一般步骤:(1)定义“正常人”,不同的指标“正常人”的定义也不同。

(2)选定足够数量的正常人作为研究对象。

(3)用统一和准确的方法测定相应的指标。

(4)根据不同的用途选定适当的百分界限,常用95%。

(5)根据此指标的实际意义,决定用单侧范围还是双侧范围。

(6)根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。

2. 三种分布均为连续型随机变量的分布。

正态分布、标准正态分布均为对称分布,对数正态分布是不对称的,其峰值偏在左边。

标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。

一般正态分布变量经标准化转换后的新变量服从标准正态分布。

对数正态分布不属于正态分布的范畴,对数正态分布变量经对数转换后的新变量服从正态分布。

3.不一定。

均数±1.96标准差范围内包含95%的变量值是正态分布的分布规律,不是对称分布的规律。

对称分布不一定是正态分布。

(一)简答题(二)1.假设检验时,当P≤0.05,则拒绝H0,理论依据是什么? 2.假设检验中α与P的区别何在?1.答:P值系由H0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。

当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于α,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。

同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于α,也就是说,有了概率保证。

2.答:以t检验为例,α与P都可用t分布尾部面积大小表示,所不同的是:α值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。

P值是由实际样本获得的,是指在H0成立的前提下,出现等于或大于现有检验统计量的概率。

(三)简答题1.t检验和方差分析的应用条件? 2.如何合理选择检验水准α?3.以t检验为例,说明检验假设中α和P的区别。

1.t检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

2.设置检验水准应根据研究目的,结合专业知识和研究设计要求,在末获得样本信息之前决定,而不应受到样本结果的影响。

3.以t检验为例,α和P都是用t分布尾部面积大小表示,所不同的是:α表示I型错误的概率,即H0为真而被错误地拒绝的概率值。

α是在统计分析时,根据I型错误危害的大小,预先规定的,即规定统计结果为“接受H1”时的误判率的界限值为α(即检验水准)。

P值是由实际样本得出的统计结果为“接受H1”时误判率。

根据P与α的大小关系作出“不拒绝H0”或“拒绝H0”的统计推断。

(一)简答题1. 常用的相对数指标有哪些?它们的意义和计算上有何不同?2. 为什么不能以构成比代率?请联系实际加以说明。

3. 应用相对数时应注意哪些问题?1.常用的相对数指标有:率、构成比和相对比。

意义和计算公式如下:率又称频率指标,说明某现象发生的频率或强度,常以100%、1000‰等表示。

构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。

常以百分数表示。

比又称相对比,是A 、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比=甲指标 / 乙指标(或100%)甲乙两个指标可以是绝对数、相对数或平均数等。

2.率和构成比所说明的问题不同,绝不能以构成比代率。

构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。

例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。

这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。

但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。

若要比较高血压的患病率,应该计算患病率指标。

3. 应用相对数时应注意的问题有:⑴ 计算相对数的分母一般不宜过小。

⑵ 分析时不能以构成比代替率。

⑶ 不能用构成比的动态分析代替率的动态分析。

⑷ 对观察单位数不等的几个率,不能直接相加求其总率。

⑸ 在比较相对数时应注意可比性。

⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。

(三)问答题1.服从二项分布 的条件分别是什么? 2.二项分布 在何种条件下近似正态分布?3.在何种情况下,可以用率的标准误S p 描述率的抽样误差? 1.二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。

2. 二项分布的正态近似:当n 较大,π不接近0也不接近1时,二项分布B (n ,π)近似正态分布N (n π,)1(ππ-n )。

3. 当率P 所来自的样本近似服从正态分布时,即n 较大,P 不接近0也不接近1时,可以用率的标准误S p 描述率的抽样误差。

(四)简答题1. 用什么方法考察回归直线图示是否正确? 2剩余标准差的意义和用途?3某资料n =100,X 与Y 的相关系数为r =0.1,可否认为X 与Y 有较密切的相关关系?4 r 与r s 的应用条件有何不同?5应用直线回归和相关分析时应注意哪些问题?1.用以下三种方法判定:⑴直线必须通过点(Y X ,)。

⑵若纵坐标、横坐标无折断号时,将此线左端延长与纵轴相交,交点的纵坐标必等于截距a 。

⑶直线是否在自变量X 的实测范围内。

2.剩余标准差用s Y.X表示:()()()2ˆ22.--=-=∑n Y Y n SS s X Y 剩其意义是指当X 对Y 的影响被扣除后,Y 方面仍有变异(考虑b=0时,y 估计值是相等的,但此时仍然有剩余平方和存在;y 的估计值不相等,讲的恰好是回归平方和,因为此时估计值与y 的均数存在离差。

)。

这部分变异与X 无关,纯属抽样变异。

故s Y. X 是用来反映Y 的剩余变异的,即不考虑X 以后Y 本身的随机变异。

剩余标准差可用于: ⑴估计回归系数b 的标准误,XXX Y b l s s .=,进行回归系数的区间估计和假设检验。

⑵估计总体中当X 为某一定值时,估计值Yˆ的标准误。

∑--+=22.ˆ)()(1X X X X n s s X Y Y并可计算Yˆ的可信区间,s Y. X 可作为预报精度的指标。

⑶估计总体中当X 为某一定值时,个体Y 值的标准差。

∑--+=22.ˆ)()(1X X X X n s s X Y Y ,并计算个体Y 值的容许区间。

3.n =100,r =0.1时,对相关系数进行t 检验,按检验水准α=0.05,拒绝H 0(ρ=0),接受H 1(ρ≠0),认为两变量有相关关系,但决定系数r 2=0.12=0.01,表示回归平方和在总平方和中仅占1%,说明两变量间的相关关系实际意义不大。

4.积差相关系数r 用于描述双变量正态分布资料的相关关系。

等级相关系数r s 适用于下列资料:⑴不服从双变量正态分布而不宜作积差相关分析的资料; ⑵总体分布型未知的资料; ⑶原始资料是用等级表示的资料。

5.注意以下五个问题⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前,应绘制散点图。

但观察点的分布有直线趋势时,才适宜作回归、相关分析。

如果散点图呈明显曲线趋势,应使之直线化再行分析。

散点图还能提示资料有无可疑异常点。

⑶直线回归方程的应用范围一般以自变量的取值范围为限。

若无充分理由证明超过自变量取值范围外还是直线,应避免外延。

⑷双变量的小样本经t 检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。

⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比。

相关文档
最新文档