医学统计学重点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.变异:同质事物之间的差别。
2.频数分布的两个特征:集中位置,离散趋势
3.数据分布的类型:对称分布和非对称分布。非对称分布又称偏态分布,包括正偏态和负偏态。单峰分布,双峰分布,多峰分布。
4.统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。
5.集中位置的描述,集中位置指标又称平均数指标。有哪些及适用条件?
(1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料(2)几何平均数:适用于①等比资料②对数正态分布资料
(3)中位数和百分位数:适用于①偏态分布的资料②开口资料③资料分布不明等
6.离散趋势的描述
(1)全距亦称极差,适用于单峰小样本资料
(2)四分位数间距,适用于单峰小样本资料
(3)方差和标准差,适用于对称分布尤其是正态分布资料
(4)变异系数,常用于①比较度量衡单位不同的两组或多种资料的变异度②比较均数相差悬殊的两组或多组资料的变异度
7.常用相对数(1)率,是二分类指标(2)构成比(3)比
8.正确应用相对数应注意几个问题:
(1)计算相对数的分母不宜过小
(2)分析时不能以构成比代替率
(3)对观察单位数不等的几个率,不能直接相加求其总率
(4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性
(5)也有抽样误差,需要假设检验。
9.率的标准法
(1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性。
(2)目的:控制混杂因素对研究结果的影响。
10.正态分布
(1)概念P16
(2)标准正态分布,u变换:u=
σμ
-
X
,u是标准正态离差,μ是均数,σ是标准差。
u~N(0,1)
(3)正态分布的特征:
①是单峰分布,高峰位置在均数X=μ处。
②以均数为中心,左右完全对称。
③取决于两个参数,均数μ和标准差σ。μ为位置参数,μ越大,则曲线沿横轴向右移动;μ越小,则曲线沿横轴向左移动。σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。
④有些指标不服从正态分布,但通过适当的变换后服从正态分布,如对数正态分布。
⑤正态分布曲线下的面积是有规律的:总面积恒定为1,对称区域面积相等,对应区域面积相等。
(4)几个u界值:①90%:双侧u1.0=单侧u0.05=1.64
②95%:双侧u05.0=单侧u025.0=1.96
③99%:双侧u01.0=单侧u0.005=2.58
11.二项分布
(1)样本率的标准差p σ的估计值
s
p
计算公式:s
p
=n
p p )
1(-,p 是样本率 (2)样本个数n 和概率π如何影响二项分布的图形?
给定n 后,形状取决于π。当π=0.5时,分布对称;当π<0.5时分布呈正偏态;当π>0.5时分布呈负偏态。随n 的增大,分布逐渐逼近正态分布。如果n π或n(1-π)大于5时,则可用正态近似原理处理二项分布的相关问题。 (3)应用条件:对立性,重复性,独立性。 12.Poisson 分布
(1)概念,描述罕见事件发生次数的概率分布,是特殊的二项分布。 (2)均数与方差相等,均为λ。
(3)形状取决于λ的大小,为正偏态分布,λ越小分布越偏;随着λ的增大,分布逐渐趋于对称,当λ=20时,已基本接近对称分布;当λ≥50时,可按正态分布原理处理Poisson 分布的有关问题。
(4)Poisson 分布具有可加性。
(5)应用条件:对立性,重复性,独立性。即事件的发生是相互独立的,且发生的概率不变,结果是二分类的(发生或不发生) 13.参考值范围
(1)概念:绝大多数正常人某指标的波动范围。
(2)正态分布法计算100(1—α)% 正常值范围:双侧 X ±
u αS
单侧 X —
u αS (高侧)
X +
u αS (低侧)
注意α取值:双侧95% X ±1.96S
单侧95% 高侧 低侧>X +1.64S (3)百分位数法:知道求得第几个百分位数P26 14.抽样误差 (1)概念:由于个体变异的存在,由抽样引起的样本统计量与总体参数间的差异。 (2)产生的两个必备条件:①抽样研究 ②个体变异,是根本原因 (3)中心极限定理的涵义 ①从均数为μ、标准差为σ的正态总体中独立、重复、随机抽取含量为n 的样本,样本均数的分布仍为正态分布,其均数为μ,标准差为x σ。X ~N(μ,x σ)→X ~N(μ,2 x σ) ②即使从非正态总体(均数为μ、标准差为σ)中独立、重复、随机抽取含量为n 的样本,只要样本含量足够大(如n ≥50),样本均数也近似服从均数为μ,标准差为x σ的正态分布。 (4)标准误意义:1.用来衡量抽样误差的大小 2.x σ= n σ 标准误与个体变异σ成正比,与样本含量n 的平方根成反比 (5)标准误的估计值的计算公式:样本标准差s 代替总体标准差σ, s x =n s (6)标准差与标准误的关系 区别 标准差s 标准误s x 意义 个体变异 统计量的抽样误差 用途 正常值 范 围(x ± 1.96 s) 总体均数的可 信区间( x ± 1.96 s x ) 与 n 关 系 n ↑ ,s 趋于稳 定 n ↑ , s x 趋 于 σ 联系:①两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准 误; ②当样本量不足时,标准差大,标准误也大,均数的标准差与标准误成正比。 s x =n s 15.医学统计学:运用概率论和数理统计等数学的原理和方法,研究医学领域中资料的搜集、 整理、分析和推断的一门学科。 16.三类资料:①定量资料(数值资料)②定性资料(无序分类资料)③等级资料(有序分 类资料) 17.总体:按研究目的所确定的研究对象中,所有观察单位某项指标取值的集合。 18.样本:从研究总体中,随机抽取具有代表性的部分观察单位某项指标取值的集合。 19.同质性:具有相同性质的事物。 20.参数:描述某总体特征的指标。 21.统计量:描述某样本特征的指标。 22.概率:随机事件发生可能性大小的一个度量,取值范围为0≤P ≤1 23.小概率事件:发生概率≤0.05的事件。 24.小概率原理:小概率事件发生的可能性很小,进而认为其在一次抽样中不可能发生。 25.理解和解释可信区间