医学统计学章节重点归纳
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学章节重点归纳
第一节概述
1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医
学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。
2、
卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析
3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。
4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国
家等。
5、变异:是指客观事物的多样性和不确定性。
6、变量:
观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。
7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。
8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。
9、概率:事件发生的可能性大小的量度,通常以符号P表示。
10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。
第二节数值资料的统计描述
1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。
2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。
3、集中趋势指标:算术平均数(均数)、几何均数、中位数。
指标使用条件计算公式
算术平均数适用于正态或近似正态分布
的数值变量资料
几何均数①对数正态分布,即数据经
过对数变换后呈正态分布的
资料;②等比级数资料,即
观察值之间呈倍数或近似倍
数变化的资料。
中位数①非正态分布资料(对数正
态分布除外);②频数分布
的一端或两端无确切数据的
资料③总体分布不清楚的资
料。为奇数 , 为偶数,
4、离散型趋势指标:极差、标准差和变异系数
指标计算公式主要优缺点
极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映
组内其它观察值的变异度,不稳定,受样本量影响很大。
离均差平
方和
反映了各变量值之间的变异情况,但单位是原观察值单位的平方,不易理解,同时又受观察值个数的影响,不利于比较。 方差
反映了各变量值之间的变异情况,不受观察值个数的影响,但单位是原观察值单位的平方,不易理解。 标准差
反映了各变量值之间的变异情况,不受观察值个数的影响,单位与原观察值单位相同,是最常用的离散程度指标之一,但在两组合多组资料比较时,常受到计量单位不同和均数相差很大的影响而不能比较和不便于比较。 变异系数
反映了各变量值之间的变异情况,不受观察值个数的影响,没有单位,用于比较度量衡单位不同或均数相差悬殊的多组资料的变异度。
5、 正态分布下面积分布规律①标准正态分布时区间(-1,1)或正态分布时区间(μ-1σ,μ+1σ)的面积占总面积的
68.27%;②标准正态分布时区间(-1.96,1.96)或正态分布时区间(μ-1.96σ,μ+1.96σ)的面积占总面积的95%;③标准正态分布时区间(-2.58,2.58)或正态分布时区间(μ-2.58σ,μ+2.58σ)的面积占总面积的99%。 6、 正态分布的应用。a 、医学参考值范围 b 、质量控制 c 、正态分布是其他一些理论分布的极限形式。
第三节 总体均数的估计和t 检验
1、 均数的抽样误差:由抽样引起的样本均数与总体均数之差。均数的抽样误差大小用标准误来描述。标准误σ
X =n σ。一般不知道总体均数σ,可用样本标准差S 来代替:S X =n s 。
2、标准差与标准误的区别与联系: 区别:⑴标准差S (σ):①意义:描述个体观察值变异程度的大小。标准差小,均数对一组观察值得代表性好;②应用:与X 结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n 的关系:n 越大,S 越趋于稳定;⑵标准误S X (σX ):①意义:描述样本均数变异程度及抽样误差的大小。标准误小,用样本均数推断总体均数的可靠性大;②应用于X 结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n 的关系:n 越大,S 越小。联系:①都是描述变异程度的指标;②由S X =n s 可知,S X 与S 正比。n 一定时,s 越大,S X 越大。
3、t 分布:当X 服从均数为μ的正态分布时,统计量 n s X t μ
-=服从自由度为v=n-1的t 分布,是小样本总体均
数的区间估计及假设检验的理论基础。
4、t 分布的图形特征:t 值得分布于自由度有关。t 分布只有一个参数即v 。特征:①单峰分布,以0为中心,左右对称;②v 越小,t 值越分散,曲线的峰部越矮,尾部越高;③随着v 逐渐增大,t 分布逐渐接近标准正态分布;当v 趋向∞时,t 分布趋近标准正态分布,故标准正态分布是t 分布的特例;④t 分布是一簇曲线。
5、一般正态分布转化为标准正态分布就是将变量X 转变为标准正态变量Z 值。Z=(X-X )/S 。
6、小样本均数可信区间:总体均数μ的双侧(1-α)置信区间为X ±t v ,α2/S X ;单侧(X -t v ,αS X ,∞)或(-∞,X + t v ,αS X )。μ95%的可信区间:X ±t 0.05,v S X ;μ99%的可信区间:X ±t 0.01,v S X
7、大样本均数可信区间估计:μ95%的可信区间:X ±1.96S X ;μ99%的可信区间:X ±2.58 S X
8、t 检验主要用于两组均属的比较,它能够判断进行比较的两个均数的差别是由于抽样误差引起,还是来自不