最新医学统计学问答题（含答案）

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

最新医学统计学问答题（含答案）
简答题
0. 算术均数、⼏何均数和中位数各有什么适⽤条件？
答：（1）算术均数：适⽤对称分布，特别是正态或近似正态分布的数值变量资料。

（2）⼏何均数：适⽤于频数分布呈正偏态的资料，或者经对数变换后服从正态分布（对数正态分布）的资料，以及等⽐数列资料。

（3）中位数：适⽤各种类型的资料，尤其以下情况：
A 资料分布呈明显偏态；
B 资料⼀端或两端存在不确定数值（开⼝资料或⽆界资料）；
C 资料分布不明。

1.对于⼀组近似正态分布的资料，除样本含量n 外，还可计算
S X ,和S X 96.1±，问各说明什么？
（1）X 为算数均数，说明正态分布或近似正态分布资料的集中趋势
（2）S 为标准差，说明正态分布或近似正态分布的离散趋势
（3）S X 96.1±可估计正态指标的95%的医学参考值范围，即此范围在理论上应包含95%的个体值。

2.试述正态分布、标准正态分布的联系和区别。

正态分布
标准正态分布原始值X ⽆需转换
作u=（X-µ）/σ转换分布类型对称
对称集中趋势 µ
µ=0 均数与中位数的关系
µ=M µ=M 参考：标准正态分布的均数为0，标准差为1；正态分布的均数则为µ，标准差为σ（µ为任意数，⽽σ为⼤于0的任意数）。

标准正态分布的曲线只有⼀条，⽽正态分布曲线是⼀簇。

任何正态分布都可以通过标准正态变换转换成标准正态分布。

标准正态分布是正态分布的特例。

3.说明频数分布表的⽤途。

1）描述频数分布的类型 2）描述频数分布的特征 3）便于发现⼀些特⼤或特⼩的可疑值 4）便于进⼀步做统计分析和处理
4.变异系数的⽤途是什么？
多⽤于观察指标单位不同时，如⾝⾼与体重的变异程度的⽐较；或均数相差较⼤时，如⼉童⾝⾼与成⼈⾝⾼变异程度的⽐较。

5.试述正态分布的⾯积分布规律。

（1）X 轴与正态曲线所夹的⾯积恒等于1或100%；
（2）区间µ±σ的⾯积为68.27%，区间µ±1.96σ的⾯积为95.00%，区间µ±2.58σ的⾯积为99.00%。

6.试举例说明均数的标准差与标准误的区别与联系。

7.标准正态分布(u 分布)与t 分布有何不同？
t分布为抽样分布，标准正态分布（u分布）为理论分布。

t分布⽐正态分布的峰值低，且尾部翘得更⾼。

随着⾃由度的增⼤，t分布逐渐趋近于标准正态分布。

即当⾃由度ν→∞时，t分布→标准正态分布。

8.均数的可信区间与参考值范围有何不同？
9.假设检验时，⼀般当P<0.05时，则拒绝H0，理论根据是什么？
10.假设检验中和P的区别何在？
11.t检验的应⽤条件是什么？
12.I 型错误与II 型错误有何区别与联系？
I 型错误是指拒绝了实际上成⽴的0H 所犯的“弃真”错误，其概率⼤⼩⽤α表⽰。

II 型错误则是“接受”了实际上不成⽴的0H 所犯的“取伪”错误，其概率⼤⼩⽤β表⽰。

当样本含量n 确定时，α愈⼩，β愈⼤；反之α愈⼤，β愈⼩。

13.假设检验和区间估计有何联系？
假设检验⽤于推断质的不同即判断两个（或多个）总体参数是否不等，⽽可信区间⽤于说明量的⼤⼩即判断总体参数的范围。

两者既互相联系，⼜有区别。

假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题，若算得的可信区间包含了0H ，则按α⽔准，不拒绝0H ；若不包含0H ，则按α⽔准，拒绝0H ，接受1H 。

也就是说在判断两个（或多个）总体参数是否不等时，假设检验和可信区间是完全等价的。

14.为什么假设检验的结论不能绝对化？
因为通过假设检验推断作出的结论具有概率性，其结论不可能完全正确，有可能发⽣两类错误。

拒绝0H 时，有可能犯I 型错误；“接受” 0H 时可能犯II 型错误。

⽆论哪类错误，假设检验都不可能将其风险降为0，因此在结论中使⽤绝对化的字如“肯定”，“⼀定”，“必定”就不恰当。

15．⽅差分析的基本思想和应⽤条件是什么？
⽅差分析的基本思想是: 根据研究资料设计的类型及研究⽬的，把全部观察值总变异分解为两个或多个组成部分，其总⾃由度也分解为相应的⼏个部分。

例如完全随机设计的⽅差分析，可把总变异分解为组间变异和组内变异，即SS 总＝SS 组内＋SS 组间，总的⾃由度也分解为相应的两部分，即ν总=ν组内＋ν组间。

离均差平⽅和除以⾃由度得均⽅MS ，组间均⽅(MS 组间)与误差均⽅(MS 误差)之⽐为F 值；如果各组处理的效应⼀样，则组间均⽅等于组内均⽅，即 F ＝1；但由于抽样误差，F 值不正好等于1，⽽是接近 1；如果F 值较⼤，远离1，说明组间均⽅⼤于误差均⽅，反映各处理组的效应不⼀样，即各组均数差别有意义，⾄于F 值多⼤才能认为差别有意义，可查F 界值表(⽅差分析⽤)来确定。

⽅差分析的应⽤条件：①各样本是相互独⽴的随机样本且来⾃正态总体②各组总体⽅差相等，即⽅差齐性。

16．在完全随机设计⽅差分析中SS 组间、SS 组内各表⽰什么含义？
组间SS 表⽰组间变异，指各组处理样本均数⼤⼩不等，是由处理因素（如果有）和随机误差造成的；组内SS 表⽰组内变异，指各处理组内变量值⼤⼩不等，是由随机误差造成的。

17．随机区组设计的⽅差分析与完全随机设计⽅差分析在设计和变异分解上有什么不同？
区别点
完全随机设计随机区组设计设计采⽤完全随机化的分组⽅法，将全部试验
对象分配到g 个处理组（⽔平组），各组
分别接受不同的处理。

随机分配的次数要重复多次，每次随机分配都对同⼀个区组内的受试对象进⾏，且各个受试对象数量相同，区组内均衡。

变异分解
三种变异：
总SS =组间SS +组内SS 四种变异：总SS =处理SS +区组SS +误差SS
18.以实例说明为什么不能以构成⽐代替率？
19.秩和检验的优缺点?
20．简述直线回归与直线相关的区别与联系。

联系:1对于既可做相关⼜可做回归分析的同⼀组数据，计算出的b 与r 正负号⼀致。

2相关系数与回归的假设检验等价，即对于同⼀样本，tb=tr
3同⼀组数据的相关系数和回归系数可以互相换算：r=by ，x*Sx/Sy
4⽤回归解释相关：由于决定系数总回ss ss r /2=，当总和平⽅和固定时，回归平⽅和的
⼤⼩决定了相关的密切程度，回归平⽅和越接近总平⽅和，则2r 越接近1，说明相关的效果越好。

⼆者的区别：（1）资料要求上：相关要求X 、Y 服从双变量正态分布，这种资料进⾏回归分析称为Ⅱ型回归；胡桂要求Y 在给定某个X 值时服从正态分布，X 是可以精确测量和严格控制的变量，称为Ⅰ型回归。

（2）应⽤上：说明两变量间互相关系⽤相关，此时两变量的关系是平等的；⽽说明两变量间依存变化的数量关系⽤回归，说明Y 如何依赖于X ⽽变化。

（3）意义上：r 说明具有直线关系的两变量间相互关系的⽅向和密切程度；b 表⽰X 每变化⼀个单位所导致Y 的平均变化量。

（4）计算上：xy xx xy l l l r //=，xx xy l l b /=
（5）取值范围：-1≤r ≤1,-∞
2、⼆项分布、Poission 分布的应⽤条件⼆项分布的应⽤条件:医学领域有许多⼆分类记数资料都符合⼆项分布(传染病和遗传病除外)，但应⽤时仍应注意考察是否满⾜以下应⽤条件：(1) 每次实验只有两类对⽴的结果；(2) n 次事件相互独⽴；(3) 每次实验某类结果的发⽣的概率是⼀个常数。

Poisson 分布的应⽤条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等）资料都符合 Poisson 分布，但应⽤中仍应注意要满⾜以下条件：（1) 两类结果要相互对⽴；（2) n 次试验相互独⽴；（3) n 应很⼤, P 应很⼩。

3、极差、四分位数间距、标准差、变异系数的适⽤范围有何异同？答：这四个指标的相同点在于均⽤于描述计量资料的离散程度。

其不同点为：极差可⽤于各种分布的资料，⼀般常⽤于描述单峰对称分布⼩样本资料的变异程度，或⽤于初步了解资料的变异程度。

若样本含量相差较⼤，不宜⽤极差来⽐较资料
的离散程度。

四分位数间距适⽤于描述偏态分布资料、两端⽆确切值或分布不明确资料的离散程度。

标准差常⽤于描述对称分布，特别是正态分布或近似正态分布资料的离散程度。

变异系数适⽤于⽐较计量单位不同或均数相差悬殊的⼏组资料的离散程度。

4.中位数、均数、⼏何均数的适⽤条件有何异同。

（1）均数适⽤于描述对称分布，特别是正态分布的数值变量资料的平均⽔平；（2）⼏何均数适⽤于描述原始数据呈偏态分布，但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均⽔平；（3）中位数适⽤于描述呈明显偏态分布（正偏态或负偏态），或分布情况不明，或分布的末端有不确切数值的数值变量资料的平均⽔平。

5.第⼀类错误与第⼆类错误的区别与联系。

当假设检验拒绝了实际上成⽴的零假设时，所犯的错误称为第⼀类错误，其概率⽤α表⽰。

当假设检验接受实际上不成⽴的零假设时，所犯的错误称为第⼆类错误，其概率⽤β表⽰。

当样本含量⼀定时，α愈⼤，β愈⼩，反之，α愈⼩，β愈⼤。

1－β称为检验效能或把握度，其意义是两总体确有差别，按α⽔准能发现它们有差别的能⼒。

6.
7.运⽤相对数时要注意哪些问题？应⽤相对数时应注意以下⼏个事项（1）计算率和构成⽐时观察单位不宜过⼩；（2）注意正确区分构成⽐和率，不能以⽐代率；（3）对率和构成⽐进⾏⽐较时，应注意资料的可⽐性；（4）当⽐较两个总率时，若其内部构成不同，需要进⾏率的标准化；（5）两样本率⽐较时应进⾏假设检验。

7.⽅差分析后进⾏两两⽐较能否⽤t 检验？为什么？t 检验仅⽤在单因素两⽔平设计（包括配对设计和成组设计）和单组设计（给出⼀组数据和⼀个标准值的资料）的定量资料的均值检验场合；⽽⽅差分析⽤在单因素k ⽔平设计（k≥3）和多因素设计的定量资料的均值检验场合。

⽅差分析有⼗⼏种，不同的⽅差分析取决于不同的设计类型。

t 检验进⾏两两⽐较其⼀，将多因素各⽔平的不同组合、简单地看作单因素的多个⽔平（即视为单因素⽔平），混淆了因素与⽔平之间的区别，从⽽错误地确定了实验设计类型；其⼆，分析资料时，常错误⽤单因素多⽔平设计或仍采⽤多次t 检验进⾏两两⽐较。

误⽤这两种⽅法的后果是，不仅⽆法分析因素之间的交互作⽤的⼤⼩，⽽且，由于所选⽤的数学模型与设计不匹配，易得出错误的结论。

参数检验与⾮参数检验的区别何在？各有何优缺点？（1）区别：参数检验：以已知分布（如正态分布）为假定条件，对总体参数进⾏估计或检验。

⾮参数检验：不依赖总体分布的具体形式，检验分布位置是否相同。

（2）优缺点：参数检验：优点是符合条件时，检验效能⾼。

缺点是对资料要求严格，如等级资料、分布不明或末端有不明确数据的资料不能⽤参数检验，要求资料的分布类型已知且总体⽅差相等。

⾮参数检验：优点是应⽤范围⼴、简便；缺点是对于符合参数统计的资料，如果⽤⾮参数统计会造成资料信息的丢失，致使检验效能下降，犯第⼆类错误的概率增⼤。

故符合参数统计条件的资料，要⾸先选⽤参数统计的⽅法。

当参数统计的应⽤条件得不到满⾜时，应选⽤⾮参数统计。

11.对于同⼀资料，⼜出⾃同⼀研究⽬的，⽤参数检验和⾮参数检验所得结果不⼀致时，应以何种结果为准。

当资料满⾜参数检验⽅法的条件时，应使⽤参数检验⽅法，当资料不满⾜参数检验⽅法的条件时，必须采⽤⾮参数检验⽅法。

12、常见的统计图有哪些？如何根据资料的性质选⽤适当的统计图？常⽤的统计图及适⽤条件是: ①条图，适⽤于相互独⽴的资料，以表⽰其指标⼤⼩；②百分条图及远圆图，适⽤于构成⽐资料，反映各组成部分的⼤⼩；③普通线图: 适⽤于连续性资料，反映事物在时间上的发展变化的趋势，或某现象随另⼀现象变迁的情况。

④半对数线图，适⽤于连续性资料，反映事物发展速度(相对⽐)。

⑤直⽅图: 适⽤于连续性变量资料，反映连续变量的频数分布。

⑥散点图: 适⽤于成对数据，反映散点分布的趋势。

14.极差、四分位数间距、标准差、变异系数的适⽤范围有何异同？答：这四个指标的相同点在于均⽤于描述计量资料的离散程度。

其不同点为：极差可⽤于各种分布的资料，⼀般常⽤于描述单峰对称分布⼩样本资料的变异程度，或⽤于初步了解资料的变异程度。

若样本含量相差较⼤，不宜⽤极差来⽐较资料的离散程度。

四分位数间距适⽤于描述偏态分布资料、两端⽆确切值或分布不明确资料的离散程度。

标准差常⽤于描述对称分布，特别是正态分布或近似正态分布资料的离散程度。

变异系数适⽤于⽐较计量。