医学统计学知识点汇总
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学总结
绪论
1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之
后呈现统计规律的现象。
2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。
3、变异:同质基础上各观察单位某变量值的差异。
数值变量:变量值是定量的,由此而构成的资料称为数值变量Baidu Nhomakorabea料或计量资料,其
统计描述 1、频数分布有两个重要的特征:集中趋势和离散程度。频数分布有对称分布和偏态分布之 分。后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如 偏向数值大的一侧为负偏态分布。 2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。
均数:适用于正态或近似正态的分布的数值变量资料。样本均数用 x 表示,总体均数用μ
抽样分布与参数估计 抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数 的估计,二是假设检验。 1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样 本统计量之间的差异称为抽样误差。
双侧界值:X±uσ/2S 单侧上界:X+uσ S,或单侧下界:X-σu S
(2) 对数正态分布方法:适用于对数正态分布资料。
双侧界值:Lg-1(X lgx ±uσ/2S lgx)
单侧上界:Lg-1(X
lgx
+u S
σ
lgx),
或单侧下界:Lg-1(X -uσ S lgx) (3)百分位数法:用于lgx偏态分布资料以及资料中一端或两端无确切数值的资料。
表示。 几何均数:适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零,一
组观察值中不能同时有正值和负值。 中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。 3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。 全距:任何资料,一组中最大值与最小值的差。 四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。 方差和标准差:正态分布资料。标准差表示观察值的变异度的大小。 变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。
双侧上界:P2.5和 P97.5;单侧上界:P ,或单侧下界:P5
95
参考值范围(%) 80 90 95 99
常用的 u 值表 单侧 0.842 1.282 1.645 2.326
双侧 1.282 1.645 1.96 2.576
5、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比。 率:说明某现象发生的频率或强度。(病死率不等于死亡率) 构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。 相对比:亦称比,是 A、B 2 个有关指标之比,说明 A 为 B 的若干倍或百分之几。两个指 标可以性质相同,也可以性质不同。
用“…”或“-”表示,数字为 0 者要记作“0”,不应空项,为方便核实和分析,应有合计。 ⑤备注:一般不列入表内,必要时可用“*”标出,列于表下。 8、统计图: ①条图:用于相互对比关系的资料; ②圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成; ③线图:用于连续性资料,用于说明事物在时间上的发展变化,或某现象随另一现象而变动 的情况; ④直方图:表示连续性资料的频数分布; ⑤散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。
4、标准正态分布:对正态分布的(X-μ)/σ进行 u 的变换,u=(X-μ)/σ,则正态分布
变换为μ=0,σ=1的标准正态分布,亦称 u 分布。u 被称为标准正态变量或标准正态离差。 两个参数:μ是位置参数,σ是形状参数。用 N(0,1)表示标准正态分布。
常用估计医学参考值范围的方法有:
(1) 正态分布方法:适用于正态或近似正态分布的资料。
应用相对数时的注意事项: 1、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等
的几个率,不能直接相加求其平均率;4、比较相对数时应注意其可比性;5、对样本率(或 构成比)的比较应遵循随机抽样,并做假设检验。 6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。其基本 思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更 具有可比性。 标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率,以及已知标准组 的年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组的年龄别人口数与发病 (死亡)总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡) 率时。 通常可从下列 3 种方法选用标准组:①以两组资料中任一组的年龄别人口数或构成比作为标 准组;②以两组资料合并的各年龄组的人口数或构成比作为标准组;③以公认的或便于与他 人资料比较的标准作为标准组。 7、统计表: 结构:由标题、标目、线条和数字构成。 编制统计表的要求: ①标题:概括表的内容,列于表的上方居中,应注明时间和地点; ②标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。横标目列于表的左侧,通 常为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。 ③线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线 和底线应略粗些,表的左上角不宜用斜线。 ④数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐,数字暂缺或无数字者分别
数值是连续性的,称之为连续型变量。
变量
无序分类变量:所分类别或属性之间无顺序和程度上的差
异
分类变量 :定性变量
有序分类变量:有顺序和程度上的差异 4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。可以分为有限 总体和无限总体。 5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。样本代表 性的前提:同质总体,足够的观察单位数,随机抽样。 统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。 6、概率:描述随机事件发生的可能性大小的一个度量。若 P(A)=1,则称 A 为必然事件; 若 P(A)=0,则称 A 为不可能事件;随机事件 A 的概率为 0<P<1. 小概率事件:若随机事件 A 的概率 P≤α,则称随机事件 A 为小概率事件,其统计学意义 为:小概率事件在一次随机试验中认为是不可能发生的。
绪论
1、随机现象:在同一条件下进行试验,一次试验结果不能确定,而在一定数量的重复试验之
后呈现统计规律的现象。
2、同质:统计学中对研究指标影响较大的,可以控制的主要因素。
3、变异:同质基础上各观察单位某变量值的差异。
数值变量:变量值是定量的,由此而构成的资料称为数值变量Baidu Nhomakorabea料或计量资料,其
统计描述 1、频数分布有两个重要的特征:集中趋势和离散程度。频数分布有对称分布和偏态分布之 分。后者是指频数分布不对称,集中趋势偏向一侧,如偏向数值小的一侧为正偏态分布,如 偏向数值大的一侧为负偏态分布。 2、常用的集中趋势的描述指标有:均数,几何均数,中位数等。
均数:适用于正态或近似正态的分布的数值变量资料。样本均数用 x 表示,总体均数用μ
抽样分布与参数估计 抽样研究的目的是用样本信息来推断总体特征,即统计推断,包括两个内容:一是总体参数 的估计,二是假设检验。 1、抽样误差:由于变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样 本统计量之间的差异称为抽样误差。
双侧界值:X±uσ/2S 单侧上界:X+uσ S,或单侧下界:X-σu S
(2) 对数正态分布方法:适用于对数正态分布资料。
双侧界值:Lg-1(X lgx ±uσ/2S lgx)
单侧上界:Lg-1(X
lgx
+u S
σ
lgx),
或单侧下界:Lg-1(X -uσ S lgx) (3)百分位数法:用于lgx偏态分布资料以及资料中一端或两端无确切数值的资料。
表示。 几何均数:适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零,一
组观察值中不能同时有正值和负值。 中位数:适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。 3、常用的离散程度的描述指标有:全距,四分位数间距,方差,标准差,变异系数。 全距:任何资料,一组中最大值与最小值的差。 四分位数间距:适用于偏态分布以及分布的一端或两端无确切数据资料。 方差和标准差:正态分布资料。标准差表示观察值的变异度的大小。 变异系数:比较度量单位不同或均数相差悬殊的两组资料的变异度。
双侧上界:P2.5和 P97.5;单侧上界:P ,或单侧下界:P5
95
参考值范围(%) 80 90 95 99
常用的 u 值表 单侧 0.842 1.282 1.645 2.326
双侧 1.282 1.645 1.96 2.576
5、分类变量资料的统计描述:常用相对数指标描述,包括:率,构成比,相对比。 率:说明某现象发生的频率或强度。(病死率不等于死亡率) 构成比:说明某现象内部组成部分所占的比重或分布,常以百分数表示。 相对比:亦称比,是 A、B 2 个有关指标之比,说明 A 为 B 的若干倍或百分之几。两个指 标可以性质相同,也可以性质不同。
用“…”或“-”表示,数字为 0 者要记作“0”,不应空项,为方便核实和分析,应有合计。 ⑤备注:一般不列入表内,必要时可用“*”标出,列于表下。 8、统计图: ①条图:用于相互对比关系的资料; ②圆图与百分条图:适用于百分构成比资料,表示事物各组成部分所占的比重或构成; ③线图:用于连续性资料,用于说明事物在时间上的发展变化,或某现象随另一现象而变动 的情况; ④直方图:表示连续性资料的频数分布; ⑤散点图:适用于直线相关分析,说明两个变量间的数量关系和变化趋势。
4、标准正态分布:对正态分布的(X-μ)/σ进行 u 的变换,u=(X-μ)/σ,则正态分布
变换为μ=0,σ=1的标准正态分布,亦称 u 分布。u 被称为标准正态变量或标准正态离差。 两个参数:μ是位置参数,σ是形状参数。用 N(0,1)表示标准正态分布。
常用估计医学参考值范围的方法有:
(1) 正态分布方法:适用于正态或近似正态分布的资料。
应用相对数时的注意事项: 1、计算相对数的分母不宜过小;2、分析时不能以构成比代替率;3、对观察单位数不等
的几个率,不能直接相加求其平均率;4、比较相对数时应注意其可比性;5、对样本率(或 构成比)的比较应遵循随机抽样,并做假设检验。 6、标准化法:标准化的目的在于消除混杂因素对结果的影响,使资料更具有可比性。其基本 思想是:将所比较的两组或多组资料的构成按统一的“标准”调整后,计算标化率,使其更 具有可比性。 标准化率的计算方法:亦称标化率,直接法用于已知被标化组的年龄别率,以及已知标准组 的年龄别人口数或年龄别人口构成比时;间接法用于已知被标化组的年龄别人口数与发病 (死亡)总数,但年龄别率未知,以及已知标准组年龄别发病(死亡)率与总发病(死亡) 率时。 通常可从下列 3 种方法选用标准组:①以两组资料中任一组的年龄别人口数或构成比作为标 准组;②以两组资料合并的各年龄组的人口数或构成比作为标准组;③以公认的或便于与他 人资料比较的标准作为标准组。 7、统计表: 结构:由标题、标目、线条和数字构成。 编制统计表的要求: ①标题:概括表的内容,列于表的上方居中,应注明时间和地点; ②标目:主语和谓语分别列于横、纵标目,文字简明,层次清楚。横标目列于表的左侧,通 常为被研究的事物,纵标目列于表的上端,为说明横标目的统计指标。 ③线条:通常,除表的顶线、底线、纵标目下以及合计上的横线外,其余线条均省去,顶线 和底线应略粗些,表的左上角不宜用斜线。 ④数字:用阿拉伯数字表示,同一指标的小数位数要一致并对齐,数字暂缺或无数字者分别
数值是连续性的,称之为连续型变量。
变量
无序分类变量:所分类别或属性之间无顺序和程度上的差
异
分类变量 :定性变量
有序分类变量:有顺序和程度上的差异 4、总体:根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。可以分为有限 总体和无限总体。 5、样本:是按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。样本代表 性的前提:同质总体,足够的观察单位数,随机抽样。 统计学中,描述样本特征的指标称为统计量,描述总体特征的指标称为参数。 6、概率:描述随机事件发生的可能性大小的一个度量。若 P(A)=1,则称 A 为必然事件; 若 P(A)=0,则称 A 为不可能事件;随机事件 A 的概率为 0<P<1. 小概率事件:若随机事件 A 的概率 P≤α,则称随机事件 A 为小概率事件,其统计学意义 为:小概率事件在一次随机试验中认为是不可能发生的。