医学统计学 问答题
《医学统计学》习题及答案
C.甲文结果更可信D.乙文结果更可信
E.甲文说明总体间的差别更大
45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制Байду номын сангаас
A.普通线图B.直方图C.统计地图
D.半对数线图E.圆形图
46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用
C.μ+2.58σD.μ+1.64σ
E.μ-2.58σ
12.下列哪个变量为标准正态变量
A. B. C. D. E.
13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指
A.该指标在所有人中的波动范围
B.该指标在所有正常人中的波动范围
C.该指标在绝大部分正常人中的波动范围
D.该指标在少部分正常人中的波动范围
E.该指标在一个人不同时间的波动范围
14.下列哪一变量服从t分布
A. B. C. D. E.
15.统计推断的主要内容为
A.统计描述与统计图表B.参数估计和假设检验
C.区间估计和点估计D.统计预测与统计控制
E.参数估计与统计预测
16.可信区间估计的可信度是指
A. B.1- C. D.1- E.估计误差的自由度
A.两样本率相差很大
B.两总体率相差很大
C.两样本率和两总体率差别有统计意义
D.两总体率相差有统计意义
E.其中一个样本率和总体率的差别有统计意义
36.假设对两个率差别的显著性检验同时用u检验和 检验,则所得到的统计量u与 的关系为
A. u值较 值准确B. 值较u值准确
C. u= D. u=
医学统计学试题答案
医学统计学试题答案一、选择题1. 医学统计学中,用于描述数据分布集中趋势的指标是()。
A. 方差B. 标准差C. 均数D. 百分位数答案:C2. 下列哪项不是医学研究中的常见随机误差来源?()。
A. 测量误差B. 抽样误差C. 实验设计偏差D. 仪器误差答案:C3. 在医学统计分析中,卡方检验主要用于()。
A. 比较两组连续变量的均值B. 比较两组分类变量的分布C. 检验两组数据的一致性D. 评估变量间的相关性答案:B4. 回归分析的主要目的是()。
A. 确定变量间的因果关系B. 评估变量间的关系强度C. 预测未来数据的趋势D. 以上都是答案:D5. 灵敏度和特异度是评价()的重要指标。
A. 治疗效果B. 诊断试验C. 预防措施D. 病因关系答案:B二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________和________。
答案:方差,标准差2. 医学研究中,为了减少随机误差的影响,常采用的方法有________、________和________。
答案:重复测量,随机化,盲法3. 医学统计分析中,用于评估两组连续变量间差异的非参数检验包括________、________等。
答案:Mann-Whitney U检验,Wilcoxon符号秩检验4. 逻辑回归分析可以用来处理变量间的________和________关系。
答案:线性,非线性5. 医学研究中,为了评估治疗效果的一致性,常用的统计方法是________。
答案:Meta分析三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用十分广泛,它通过使用各种统计方法和技术来分析和解释临床数据,帮助研究者得出科学的结论。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者设计合理的研究方案,如随机对照试验,以减少偏倚和误差。
其次,在数据收集阶段,统计学原理可以指导如何进行有效的数据采集和处理缺失数据。
医学统计学名词解释问答题
医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u服从于均数为0,方差为1的正态分布,即标准正态分布。
应用:①概括估计变量值的频数分布;②制定参考值范围;③质量控制;④是许多统计方法的理论基础。
3、确定参考值范围的一般原则和步骤、方法一般原则和步骤:①抽取足够例数的正常人样本作为观察对象;②对选定的正常人进行准确而统一的测定,以控制系统误差;③判断是否需要分组测定;④决定取单侧范围值还是双侧范围值;⑤选定适当的百分范围;⑥选用适当的计算方法来确定或估计界值。
方法:①正态分布法:②百分位数法(偏态分布)4、总体均数的可信区间与参考值范围的区别概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围5、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
医学统计学题库完整
第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A. 调查、录入数据、分析资料、撰写论文B. 实验、录入数据、分析资料、撰写论文 C 。
调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A 。
10.0≤P B 。
05.0≤P 或01.0≤P C 。
005.0≤PD 。
05.0≤PE 。
01.0≤P3~8A.计数资料 B 。
等级资料 C.计量资料 D 。
名义资料 E.角度资料3。
某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A )。
4.分别用两种不同成分的培养基(A 与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C ). 5。
空腹血糖测量值,属于( C)资料.6。
用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人.该资料的类型是(B ).7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641.该资料的类型是(D )。
8。
100名18岁男生的身高数据属于(C )。
二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本. 2.举例说明同质与变异的概念答:同质与变异是两个相对的概念.对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。
医学统计学试题及答案
医学统计学试题及答案一、选择题1. 医学统计学中的描述性统计主要用来描述()。
A. 总体参数B. 样本数据C. 个体差异D. 随机误差答案:B2. 在医学研究中,双盲法的主要目的是()。
A. 增加样本量B. 控制偏倚C. 减少随机误差D. 提高治疗效果答案:B3. 下列哪种情况下,使用卡方检验是合适的?()A. 比较两个连续变量的均值B. 比较两个分类变量的分布C. 检验一个连续变量的方差D. 检验两个样本的一致性答案:B4. 在医学统计分析中,多元线性回归可以用来评估()。
A. 一个变量对另一个变量的影响B. 两个或多个变量对一个变量的影响C. 一个变量对另一个变量的影响是否显著D. 两个或多个变量之间的相关性答案:B5. 以下哪项是医学统计学中的基本概念?()A. 疾病发生率B. 疾病死亡率C. 疾病预后D. 疾病流行趋势答案:A二、填空题1. 在医学统计中,用于描述数据分布离散程度的指标是________。
答案:方差2. 为了减少样本误差,提高统计效能,医学研究中常用的抽样方法是________。
答案:分层随机抽样3. 在医学研究中,用于比较两个独立样本均值差异的统计方法是________。
答案:独立样本t检验4. 用于评估医学治疗效果的统计指标是________。
答案:治疗效果差异5. 用于描述个体在群体中的分布情况的统计图表是________。
答案:直方图三、简答题1. 请简述医学统计学在临床研究中的应用及其重要性。
医学统计学在临床研究中的应用极为广泛,它通过科学的方法对临床数据进行收集、整理、分析和解释,从而为临床决策提供依据。
其重要性体现在以下几个方面:首先,统计学可以帮助研究者正确设计研究方案,确保研究的有效性和可靠性;其次,通过统计分析,可以评估治疗效果、疾病风险和预后情况,为临床治疗提供指导;再次,统计学还能够识别和控制研究中的偏倚和误差,提高研究结果的准确性;最后,统计学方法在临床试验中尤为重要,它能够确保试验结果的客观性和科学性,为新药物或治疗方法的开发和应用提供支持。
医学统计学试题及答案
医学统计学试题及答案一、选择题(每题2分,共20分)1. 医学统计学中的“总体”是指:A. 所有可能的样本B. 所有可能的个体C. 研究中所关注的全部个体D. 研究中实际测量到的个体答案:C2. 以下哪个是参数估计的常用方法?A. 描述性统计B. 假设检验C. 点估计D. 方差分析答案:C3. 以下哪个是描述数据离散程度的统计量?A. 平均数B. 中位数C. 标准差D. 众数答案:C4. 医学统计学中的“样本”是指:A. 研究中实际测量到的个体B. 所有可能的个体C. 研究中所关注的全部个体D. 所有可能的样本答案:A5. 以下哪个是医学统计学中的“误差”?A. 抽样误差B. 系统误差C. 随机误差D. 所有选项都是答案:D6. 以下哪个是正态分布的特点?A. 均数、中位数、众数相等B. 均数大于中位数C. 中位数大于众数D. 众数大于均数答案:A7. 以下哪个是相关系数的取值范围?A. -1到1B. 0到1C. -∞到∞D. 1到∞答案:A8. 以下哪个是医学统计学中常用的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 秩和检验答案:D9. 以下哪个是医学统计学中的“效应量”?A. 样本量B. 效应大小C. 标准差D. 信度答案:B10. 以下哪个是医学统计学中的“混杂因素”?A. 研究设计中的变量B. 研究中的误差来源C. 影响研究结果的外部因素D. 研究中的随机误差答案:C二、简答题(每题5分,共20分)1. 简述医学统计学中的“假设检验”。
答案:假设检验是统计学中用于检验研究假设是否成立的一个过程。
它通常包括零假设(H0)和备择假设(H1)。
通过收集数据并进行统计分析,我们可以决定是接受零假设还是拒绝零假设,从而支持或反对研究假设。
2. 解释什么是“置信区间”。
答案:置信区间是参数估计中用来表示估计值的可信程度的一个范围。
它给出了一个区间,在这个区间内,我们相信参数的真实值有一定概率(如95%)会落在这个范围内。
医学统计学题库
第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A. 调查、录入数据、分析资料、撰写论文B. 实验、录入数据、分析资料、撰写论文C. 调查或实验、整理资料、分析资料D. 设计、收集资料、整理资料、分析资料E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.角度资料3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A )。
4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C )。
5.空腹血糖测量值,属于( C )资料。
6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。
该资料的类型是(B )。
7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是(D )。
8. 100名18岁男生的身高数据属于(C )。
二、问答题1.举例说明总体与样本的概念.答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
医学统计学问答题考试必备
医学统计学问答题1.试述医学参考值范围的制定方法。
答:(1)选择足够数量的正常人作为参照样本。
所谓“正常人”指排除了影响所研究指标的疾病和有关因素的同质人群。
(2)对选定的正常人进行准确的测定。
要严格控制检测误差,同时必须对测量条件做出统一的规定和说明。
(3)决定取单侧还是双侧范围值。
根据研究目的和专业知识选择适当的方法,一般选用双侧。
(4)选择适当的百分范围。
最常用的百分界限是95%。
(5)估计参考值范围的界限。
最基本的有百分位数法和正态分布法。
2.相对数使用时应注意哪些问题?答:(1)分析时构成比和率不能混淆构成比说明事物内部各部分所占的比重或分布,不能说明某现象发生的强度或频率大小。
(2)使用相对数时,分母不易过小分母过小时结果不稳定。
观察单位数少时最好用绝时数表示。
(3)要注意资料的可比性用以比较的资料应是同质的,除了研究因素之外,其余的因素应相同或相近。
(4)要注意使用率的标准化对于内部构成不同的资料,应先进行标准化后再做比较。
(5)要考虑存在抽样误差,样本之间的差异应做统计学检验。
3.试述线性相关系数与线性回归系数的意义。
答:线形相关系数是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。
它没有测量单位,其数值为-1 < r <o+1-为正,表示正相关;r为负,表示负相关;r为0,表示零相关即无直线关系;r绝对值为1时,表示完全相关。
线形回归系数是表示两变量之间的依存关系的统计量,它的数值表示当自变量变化一个单位,因变量随之变化的单位数。
4.描述计量资料离散趋势的指标有哪些?试述各指标的应用条件。
描述计量资料离散趋势的指标有极差、四分位数间距、方差和标准差、变异系数。
(1)极差(全距):应用于粗略地说明变量的变动范围。
(2)四分位数间距:应用于偏态分布的资料、开口资料或分布不明的资料。
(3)方差和标准差:应用于正态分布的资料。
(4)变异系数:应用于均数相差较大或单位不同的几组观察值得变异程度的比较。
医学统计学题库完整
医学统计学题库完整第⼀章绪论习题⼀、选择题1.统计⼯作和统计研究的全过程可分为以下步骤:(D )A. 调查、录⼊数据、分析资料、撰写论⽂B. 实验、录⼊数据、分析资料、撰写论⽂C. 调查或实验、整理资料、分析资料D. 设计、收集资料、整理资料、分析资料E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为⼩概率事件。
A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8A.计数资料B.等级资料C.计量资料D.名义资料E.⾓度资料3.某偏僻农村144名妇⼥⽣育情况如下:0胎5⼈、1胎25⼈、2胎70⼈、3胎30⼈、4胎14⼈。
该资料的类型是( A )。
4.分别⽤两种不同成分的培养基(A 与B )培养⿏疫杆菌,重复实验单元数均为5个,记录48⼩时各实验单元上⽣长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C )。
5.空腹⾎糖测量值,属于( C )资料。
6.⽤某种新疗法治疗某病患者41⼈,治疗结果如下:治愈8⼈、显效23⼈、好转6⼈、恶化3⼈、死亡1⼈。
该资料的类型是(B )。
7.某⾎库提供6094例ABO ⾎型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是(D )。
8. 100名18岁男⽣的⾝⾼数据属于(C )。
⼆、问答题1.举例说明总体与样本的概念.答:统计学家⽤总体这个术语表⽰⼩异的对象全体,通常称为⽬标总体,⽽资料常来源于⽬标总体的⼀个较⼩总体,称为研究总体。
实际中由于研究总体的个体众多,甚⾄⽆限多,因此科学的办法是从中抽取⼀部分具有代表性的个体,称为样本。
例如,关于吸烟与肺癌的研究以英国成年男⼦为总体⽬标,1951年英国全部注册医⽣作为研究总体,按照实验设计随机抽取的⼀定量的个体则组成了研究的样本。
医学统计学试题及答案
医学统计学试题及答案一、单选题1. 医学统计学的目的是:A. 统计医学信息B. 分析医学数据C. 研究医学现象D. 应用数学方法答案:B2. 在医学研究中,常用的数据类型包括:A. 定量数据B. 定性数据C. 随机数据D. 假设数据答案:A、B3. 下列哪项属于描述性统计学的内容:A. 假设检验B. 变异系数计算C. 抽样分布D. 数据整理和展示答案:D4. 以下哪个指标可以反映一组数据的离散程度:A. 均值B. 中位数C. 标准差D. 百分位数答案:C5. 进行医学实验时,其随机分组的目的是:A. 防止数据泄露B. 确保实验结果的准确性C. 消除实验对象间的差异D. 提高实验效率答案:C二、填空题1. 样本容量越大,抽样误差越________。
答案:小2. 法定代表人同意书中要注明_________。
答案:被代表人的姓名3. 在统计学中,p值代表的是__________。
答案:假设检验的显著性水平4. 方差分析是用来比较__________。
答案:多个样本组间的均值差异5. 临床试验中的“安慰剂”是指__________。
答案:没有治疗作用的物质三、计算题1. 某药物在两组患者中的治疗效果进行比较,结果显示组A的治愈率为70%,组B的治愈率为60%。
请计算治愈率之间的风险差异,并求出其相对风险和绝对风险减少率。
答案:风险差异 = 组A治愈率 - 组B治愈率 = 70% - 60% = 10%相对风险 = 组A治愈率 / 组B治愈率= 70% / 60% ≈ 1.167绝对风险减少率 = 组B治愈率 - 组A治愈率 = 60% - 70% = -10%2. 某研究人员对100名患者的收入进行调查,得到以下数据:平均收入为5000元,标准差为1000元。
请计算收入在(5000 - 1000,5000 + 1000)这一区间内的概率。
答案:根据正态分布的性质,收入在(5000 - 1000,5000 + 1000)区间内的概率为68%。
医学统计学部分精彩试题及问题详解
word 第一章绪论1.如下关于概率的说法,错误的答案是A. 通常用P表示B. 大小在0%与100%之间C. 某事件发生的频率即概率D. 在实际工作中,概率是难以获得的E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件[参考答案] C. 某事件发生的频率即概率2.如下有关个人根本信息的指标中,属于有序分类变量的是A. 学历B. 民族C. 血型D. 职业E. 身高[参考答案] A. 学历3.如下有关个人根本信息的指标,其中属于定量变量的是A. 性别B. 民族C. 职业D. 血型E. 身高[参考答案] E. 身高4.如下关于总体和样本的说法,不正确的答案是A. 个体间的同质性是构成总体的必备条件B. 总体是根据研究目的所确定的观察单位的集合C. 总体通常有无限总体和有限总体之分D. 一般而言,参数难以测定,仅能根据样本估计E. 从总体中抽取的样本一定能代表该总体[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年某某市居民糖尿病患病率的调查研究中,总体是A. 所有糖尿病患者B. 所有某某市居民C. 2007年所有某某市居民D. 2007年某某市居民中的糖尿病患者E. 2007年某某市居民中的非糖尿病患者[参考答案] C. 2007年所有某某市居民6.简述小概率事件原理。
答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进展统计推断的重要根底。
答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的答:研究人员通常需要了解和研究某一类个体,这个类就是总体。
医学统计学名词解释及问答题
1、总体(population):是根据研究目的确定的同质研究对象的全体.2、样本(sample):从总体中抽取的一部分有代表性的个体.3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。
4、变异(variation):指同质个体的某项指标之间的差异。
5、参数(parameter):反映总体特征的指标称为参数。
6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。
7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
8、概率(probability):某事件发生的可能性大小。
9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线.10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。
11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。
12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围.13、方差(variance):是各个数据与平均数之差的平方的平均数。
14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。
16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。
17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。
医学统计学题库及答案
0.05 检验,可认为( )。
A.
2 1
,
2 2
,,
2 k
全不相等
B.
2 1
,
2 2
,,
2 k
不全相等
C. S1, S2 ,, Sk 不全相等
D. X 1, X 2 ,, X k 不全相等
E. 1, 2 ,, k 不全相等
9.变量变换中的对数变换( x lg X 或 x lg( X 1) ),适用于( ):
第一章 绪论(答案)
一、选择题 1.D 2.B 3.A 4. C 5.C 6.B 7.D 8.C 二、问答题 1.统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源 于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多, 因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的 研究以英国成年男子为总体目标,1951 年英国全部注册医生作为研究总体,按照实验设计 随机抽取的一定量的个体则组成了研究的样本。 2.同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体 区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别 同年龄的小学生具有同质性,其身高、体重等存在变异。 3.统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前, 然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分 析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析。
表 5-2. 大鼠经 5 种方法染尘后全肺湿重
对照 1.4 1.5 1.5 1.8 1.5 1.5
A组
3.3 3.6 4.3 4.1 4.2 3.3
医学统计学问答题(含答案解析)
简答题0. 算术均数、几何均数和中位数各有什么适用条件?答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:A 资料分布呈明显偏态;B 资料一端或两端存在不确定数值(开口资料或无界资料);C 资料分布不明。
1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势(2)S 为标准差,说明正态分布或近似正态分布的离散趋势(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。
2.试述正态分布、标准正态分布的联系和区别。
正态分布标准正态分布 原始值X 无需转换作u=(X-µ)/σ转换 分布类型 对称对称 集中趋势 µµ=0 均数与中位数的关系µ=M µ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为µ,标准差为σ(µ为任意数,而σ为大于0的任意数)。
标准正态分布的曲线只有一条,而正态分布曲线是一簇。
任何正态分布都可以通过标准正态变换转换成标准正态分布。
标准正态分布是正态分布的特例。
3.说明频数分布表的用途。
1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理4.变异系数的用途是什么?多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。
5.试述正态分布的面积分布规律。
(1)X 轴与正态曲线所夹的面积恒等于1或100%;(2)区间µ±σ的面积为68.27%,区间µ±1.96σ的面积为95.00%,区间µ±2.58σ的面积为99.00%。
医学统计学--问答题
1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何了解与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
医学统计学题库完整
第一章 绪论习题一、选择题1.统计工作和统计研究的全过程可分为以下步骤:(D )A 。
调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C 。
调查或实验、整理资料、分析资料 D 。
设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料2.在统计学中,习惯上把(B )的事件称为小概率事件。
A 。
10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤PD.05.0≤PE. 01.0≤P3~8A.计数资料 B 。
等级资料 C.计量资料 D.名义资料 E 。
角度资料3。
某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。
该资料的类型是( A ).4.分别用两种不同成分的培养基(A 与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。
该资料的类型是(C )。
5。
空腹血糖测量值,属于( C)资料。
6。
用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。
该资料的类型是(B )。
7。
某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。
该资料的类型是(D )。
8。
100名18岁男生的身高数据属于(C ). 二、问答题1.举例说明总体与样本的概念。
答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。
实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本.例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。
医学统计学简答题
医学统计学简答题1.简述标准差、标准误的区别与联系?区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。
标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
(2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。
(3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。
联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。
2.简述假设检验的基本步骤。
1.建立假设,确定检验水准。
2.选择适当的假设检验方法,计算相应的检验统计量。
3.确定P值,下结论3.正态分布的特点和应用:特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交;3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。
σ越小,曲线越陡峭;σ越大,曲线越扁平;5、u变换:为了便于描述和应用,常将正态变量作数据转换;应用: 1.估计医学参考值范围 2.质量控制 3.正态分布是许多统计方法的理论基础4.简述参考值范围与均数的可信区间的区别和联系可信区间与参考值范围的意义、计算公式和用途均不同。
1.从意义来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指95%可信度估计的总体均数的所在范围2.从计算公式看若指标服从正态分布,95%参考值范围的公式是:±1.96s。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。
第一章医学统计中的基本概念2、抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。
由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。
每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。
需要作“样本例数估计”。
3、什么是两个样本之间的可比性?可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
实习一统计研究工作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科统计学:是研究数据的收集、整理、分析与推断的科学。
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。
2、医学统计的资料主要来源于那些方面?有何要求?医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。
实验数据是指在试验过程中活的的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。
这些资料的手机过程中,必须进行质量抗旨,包括它的统一性、确切性、可重复性。
这些原始数据的精读和偏性应有明确的范围。
3、医学统计学的资料类型有哪些?(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
4、常见的三类误差是什么?应采取什么措施和方法加以控制?常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
实习二单变量资料的统计描述1、试述频数表的要素及用途。
要素:组段,频距。
用途:①描述资料的分布特征和分布类型。
频数分布有两个重要特征:集中趋势和离散趋势。
大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。
频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。
②便于进一步计算有关指标或进行统计分析。
当数据较多且需手工计算时,常先编制频数表,再进行统计计算。
③发现特大、特小的可疑值。
如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。
④当样本含量比较大时,可用各组段的平率作为概率的估计值。
2、描述单变量资料的统计指标分哪两大类,分别是什么指标?分类:①描述数据分布集中趋势的指标:算术均数、几何均数、中位数。
②描述数据分布离散程度的指标:极差、四分位数间距、方差、标准差、变异系数。
3、试述平均数、标准差、变异系数的含义及用途?4、标准正态分布曲线下面积有何分布规律?所有的正态分布曲线,在υ左右的相同倍数的标准差范围内的面积相同。
并且,在υ±σ范围内的面积约为68.3%;在υ±1.96σ范围内的面积约为95%;在υ±2.58σ范围内面积约为99%。
5、同一资料的标准差是否一定小于均数?均数和标准差是两类不同性质的统计指标.标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小.标准差可大于均数,也可小于均数。
实习三单变量资料的统计推断1、标准差与标准误有何区别和联系?•区别:1.含义不同:⑴s描述个体变量值(x)之间的变异度大小,s越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。
⑵标准误是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。
2.与n的关系不同:n增大时,⑴s σ(恒定)。
⑵标准误减少并趋于0(不存在抽样误差)。
3.用途不同: ⑴s:表示x的变异度大小,计算cv,估计正常值范围,计算标准误等⑵:参数估计和假设检验。
•联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。
2、简述Ⅰ型错误和Ⅱ型错误的区别和联系。
·区别:Ⅰ型错误(弃真):拒绝实际成立的H0,型错误的概率记为α。
(1-a)即置信度:重复抽样时,样本区间包含总体参数(μ)的百分数。
当p≤α而拒绝H0时,只能犯Ⅰ型错误,不可能犯Ⅱ型错误。
Ⅱ型错误(存伪):不拒绝实际不成立的H0,Ⅱ型错误的概率记为β。
(1-β)即把握度(或检验效能:两总体确有差别,被检出有差别的能力。
当p≥α而拒绝H0时,只能犯Ⅱ型错误,不可能犯Ⅰ型错误。
·联系:对同一资料,α与β反方向变化,若要同时减小α与β,唯一的办法是增加样本含量。
3、可信区间与参考值范围的不同点。
应注意:可信区间与参考值范围的意义、计算公式和用途均不同。
1.从意义和用途来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。
可信区间用于估计总体参数,总体参数只有一个。
参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。
2.从计算公式看:若指标服从正态分布,95%参考值范围的公式是:±1.96s。
总体均数95%可信区间的公式是:。
前者用标准差,后者用标准误。
前者用1.96,后者用α为0.05,自由度为v的t界值。
4、在统计推断中,如何区别单侧检验和双侧检验?如果将拒绝性概率平分于理论抽样分布的两侧,称为双侧检验。
例如选定显著性水平α= 0.05,双侧检验就是将α概率所规定的拒绝区域平分为两部分而置于概率分布的两边,每边占有=0.025。
双侧检验只强调差异是否显著而不强调方向性。
如果将拒绝性概率置于理论抽样分布的一侧(左侧或右侧),称为单侧检验(右侧检验或左侧检验)。
单侧检验强调差异的方向性。
在具体的假设检验中,选择双侧检验或单侧检验可分为以下三种情况:第一种:H0:μ=μ0:μ≠μ0双侧第二种:H0:μ≥μ0 :μ<μ0单侧(左侧)第三种:H0:μ≤μ0:μ>μ0 单侧(右侧)5、t检验、z检验的公式有那些类型,在应用上有何异同?t检验:当样本例数n较小时,要求样本取自正态总体。
t检验的类型:单样本t检验,独立t检验,配对t检验z检验:样本例数较大,或n虽小而总体标准差已知。
6、假设检验和总体均数区间估计有何联系?假设检验:是对总体做出某种假定,然后根据样本信息推断总体是否成立的一类统计学方法总称。
假设检验有三个基本步骤:①建立假设和确定检验水准;②选择检验方法和计算检验统计量;③确定P值和做出统计推断结论。
总体均数的估计:1、点估计:样本统计量直接作为总体指标的估计值。
它未考虑抽样误差的大小。
2、区间估计:按预先给定的概率(1-α)确定的包含未知总体参数的可能范围。
实习四方差分析1、方差分析的基本思想是什么?方差分析(analysis of variance,ANOV A )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean,SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。