(完整版)医学统计学实习册第7版武汉大学答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实习一
1 总体:根据研究目的所确定的同质观察单位的全体。
2 样本:从总体中随机抽取的部分个体。
3 参数:总体的统计指标或特征值。
4 统计量:由样本所算出的统计指标或特征值。
5 概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,
这个常数p就称为事件A出现的概率,记作P(A)或P。
6 频率:在n次随机试验中,事件A发生了m次,则比值f=m/n=A发生的试验次数/试验的
总次数称为A在n次试验中出现的频率。
7 变异:同质事物间的差别。
8 指标:说明总体综合数量特征和数量关系的数字资料。
简答与思考题
1 什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是应用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科。
统计学:是研究数据的收集、整理、分析与推断的科学
卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。
生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学。
2 医学统计资料主要来源于哪些方面?有何要求?
医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。
这些资料的收集过程中,必须进行治疗控制,包括它的统一性、确切性、可重复性。这些原始数据的精度和偏差应用明确的范围。
3 当今医学研究的趋势和特点如何?医学统计方法主要有哪些?
医学统计学在本世纪二十年代以后才逐渐形成为一门学科。解放前,我国学者即致力于把统计方法应用到医学中去,但人力有限、范围较窄。解放后,随着医学科研工作的发展,本学科得到迅速普及与提高,通过大量实践,在不少方面积累了自己的经验,丰富了医学统计学的内容,而电子计算机的作用,更促进了多变量分析等统计方法在医学研究中的应用。
4 医学统计资料的类型有哪些?
(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得资料称为计量资料。计量资料也称定量资料、测量资料,其变量值是定量的,表现为数值大小,一般有质量衡单位。如某一患者的身高(cm)、体重(kg)脉搏(次/分)等
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位称为计数资料。计数资料也称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性,如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。等级资料又称为有序变量。如患者的治疗结果可分为治愈、好转、有效、死亡。
5 误差、系统误差、随机测量误差、抽样误差有何区别?对误差的控制各有何要求?如何控制?
误差:一个量的观测值或计算值与其真值之差,即一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量,误差是不可避免的。
系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差,要尽量查明原因,必须克服。
随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作技术不稳定,不同实验操作员之间的操作差异,电压不稳定及环境温度差异等因素造成测量结果的误差,对于这种误差应采取相应的措施加以控制,至少应控制
在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是有抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。
实习二
平均数:也叫平均值,是一组数据典型或有代表性的值,这个值倾向于落在根据数据大小排列的数据的中心,包括算术平均值、几何平均数、中位数等。
均数:指在一组数据中所有数据之和再除以数据的个数,是反应数据集中趋势的一个指标。
几何均数:是用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平
中位数:将一组观察值按升序或降序排列,位次居中的数,常用M表示
百分位数:是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有(1-x%)的观察值大于Px
全距(极差):最大与最小观察值之差。
标准差:是描述个体值变异程度的指标,为方差的算术平方根。
变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,用CV表示。
计算:标准差/均数*100%。
简答与思考题
1 试诉频数表的要素与用途?
要素:组段、频距。
用途:①描述资料的分布特征和分布类型。频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,成离散趋势,是个体差异所致,可用一系列的变异指标来反映。
②便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,