医学统计学公式总结

合集下载

医学统计学公式整理简洁版

医学统计学公式整理简洁版

医学统计学公式整理简洁版1. 平均数(Mean):一组数据的平均值,通过将所有值相加然后除以数据的个数得到。

公式:X̄=ΣX/n其中,X̄表示平均数,ΣX表示所有数据的总和,n表示数据的个数。

2. 中位数(Median):一组数据的中间值,将所有数据按升序排列,如果数据个数为奇数,则中位数是中间的值;如果数据个数为偶数,则中位数是中间两个值的平均数。

3. 众数(Mode):一组数据中出现次数最多的数值。

4. 标准差(Standard Deviation):衡量数据的离散程度,计算每个数据值与平均值的差的平方和的平均值的平方根。

公式:σ=√(Σ(X-X̄)²/n)其中,σ表示标准差,Σ(X-X̄)²表示每个数据值与平均值的差的平方和,n表示数据的个数。

5. 方差(Variance):标准差的平方。

公式:σ²=Σ(X-X̄)²/n6. 相关系数(Correlation Coefficient):度量两个变量之间的线性关系的强度和方向。

相关系数的值介于-1和1之间,接近-1表示负相关,接近1表示正相关,接近0表示无线性相关。

7. t检验(t-test):用于比较两组样本均值是否有显著差异。

8. 卡方检验(Chi-square test):用于比较观察频数与期望频数之间的差异是否显著。

9. 线性回归(Linear Regression):用于预测一个变量与另一个变量之间的关系,并且可以根据这个关系进行预测。

10. 生存分析(Survival Analysis):用于分析事件发生的概率和时间关系,常用于研究患者生存率和治疗效果。

医学统计学公式整理

医学统计学公式整理

集中趋势的描述算术均数: 频数表资料(X0为各组段组中值)n fXffX x OO∑∑∑==几何均数:n nX X X G ...21= 或)log (log 1nX G ∑-=频数表资料:⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*21+=n X M (2))(21*12*2++=n n X X M百分位数⎪⎭⎫⎝⎛-⋅+=L X X f n X f i L P 100其中:L 为欲求的百分位数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为该组段的的频数 ,L f 为该组段之前的累计频数方差: 总体方差为:式(1); 样本方差为 式(2)(1)N X 22)(μσ-∑=(2)1)(22--∑=n X X S标准差:1)(2--∑=n X X S或 1/)(22-∑-∑=n nX X S频数表资料计算标准差的公式为1/)(22-∑∑∑-∑=f ffx fx S变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数 %100⨯=X SCV常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化NpN p ii∑='∑=i i p N N p )(' 2.间接法标准化预期人数实际人数=SMR ∑=ii P n rSMR SMR P P ⨯='正态分布:密度函数:)2/()(2221)(σμπσ--=X e X f分布函数: 小于X 值的概率,即该点正态曲线下左侧面积)()(x X P x F <=特征:(1)关于x=μ对称。

(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。

(3)曲线下面积为1。

(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。

(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换σμ-=X u ,u 服从总体均数为0、总体标准差为1的正态分布。

医学统计学计算公式

医学统计学计算公式

《统计学原理》主要公式第四章:统计数据的描述一、平均数: (一)算术平均数简单算术平均数:nx x x x n +++=...21加权算术平均数:∑∑=++++++=fxf x ffffx fx f x nnn (2)12211)(∑∑∙=ffx x(二)调和平均数简单调和平均数:nx xnxh∑∑==111 加权调和平均数:∑∑∑∑∙==mm x x m m x h11(三)几何平均数简单几何平均数:nnn G x x x x x π=∙∙= (21)加权几何平均数:∑=∙∙=+++f fnGxx x xxf f f f f f nn π (21)2121...(四)中位数:下限公式:d ffs X M mm l e ∙-+=-∑12上限公式:d ffs X M mm u e ∙--=+∑12(五)众数 下限公式:d X M l o ∙++=∆∆∆211上限公式:d X M u o ∙+-=∆∆∆212(六)平均差未分组资料:nx x D A ∑-=..已分组资料:∑∑-=ff x x D A ..(七)标准差 未分组资料:nx x ∑-=)(2σ已分组资料:∑∑-=ffx x )(2σ(八)离散系数(或标准差系数)%100⨯=xV σσ第五章抽样与参数估计一、区间估计(参见教材P111) 二、样本容量确定1.总体平均数的样本容量确定 (1)重置抽样条件下)(2∆=σZ n(2)不重置抽样条件下σσ22222)1(ZZN N n +-=∆2.总体比例的样本容量确定 (1)重置抽样条件下∆-=22)1(P P Z n(2)不重置抽样条件下)1()1()1(222P P N P P N n Z Z -+--=∆练习题1.某居民小区共有500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。

采用不重置抽样方法随机抽取了50户,其中有32户赞成,18户反对。

要求:(1)在95%的置信水平下,全体住户中赞成该项供水设施户数比例的置信区间(2)如果小区管理者预计赞成的比例能达到80%,估计的极限误差(∆)为10%,问应抽取多少住户进行调查?2.某大学共有本科学生8000人,学校想要估计每个学生一个月的生活费支出金额,准备采取不重置抽样方法。

医学统计学公式整理

医学统计学公式整理

医学统计学公式整理1. 平均数(Mean):平均数是一组数据的所有观察值之和除以观察值的个数。

用数学符号表示为:μ = (x1 + x2 + ... + xn) / n。

其中,μ表示总体均值,x1,x2,...,xn表示样本数据,n表示样本容量。

2. 中位数(Median):中位数是将一组数据按照大小排序后,位于中间位置的数值。

对于有奇数个数的数据,中位数是中间的那个数;对于有偶数个数的数据,中位数是中间两个数的平均值。

3. 众数(Mode):众数是一组数据中出现次数最多的数值,可以有一个或多个。

4. 方差(Variance):方差是一组数据与其均值之差的平方的平均值,用来衡量数据的离散程度。

用数学符号表示为:σ^2 = ( (x1-μ)^2 + (x2-μ)^2 + ... + (xn-μ)^2 ) / n。

5. 标准差(Standard Deviation):标准差是方差的平方根,用来衡量数据的离散程度。

用数学符号表示为:σ = sqrt( ( (x1-μ)^2 + (x2-μ)^2 + ... + (xn-μ)^2 ) / n )。

6. 相对风险(Relative Risk):相对风险是比较两个暴露组之间罹患其中一种疾病的风险大小的指标。

计算方式为:相对风险=(发病率在暴露组中的比例)/(发病率在非暴露组中的比例)。

相对风险大于1表示暴露组的风险大于非暴露组,相对风险小于1表示暴露组的风险小于非暴露组,相对风险等于1表示两组风险相等。

7. 绝对风险差(Absolute Risk Difference):绝对风险差是比较两个暴露组之间发病率差异的指标。

计算方式为:绝对风险差=(发病率在暴露组中的比例)-(发病率在非暴露组中的比例)。

绝对风险差大于0表示暴露组的发病率高于非暴露组,绝对风险差小于0表示暴露组的发病率低于非暴露组,绝对风险差等于0表示两组发病率相等。

8. 相对危险度(Relative Risk Ratio):相对危险度是比较两个暴露组之间发病率的相对大小的指标。

医学统计学公式整理 简洁版

医学统计学公式整理  简洁版

集中趋势的描述算术均数: 频数表资料(X0为各组段组中值)n fXffX x OO∑∑∑==几何均数:n nX X X G ...21= 或)log (log1nX G ∑-=频数表资料:⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*21+=n X M (2))(21*12*2++=n n X X M百分位数⎪⎭⎫⎝⎛-⋅+=L X X f n X f i L P 100其中:L 为欲求的百分位数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为该组段的的频数 ,L f 为该组段之前的累计频数方差: 总体方差为:式(1); 样本方差为 式(2)(1)N X 22)(μσ-∑=(2)1)(22--∑=n X X S标准差:1)(2--∑=n X X S 或 1/)(22-∑-∑=n nX X S 频数表资料计算标准差的公式为1/)(22-∑∑∑-∑=f ffx fx S变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数%100⨯=X SCV常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化NpN pii∑='∑=ii p NN p )('2.间接法标准化预期人数实际人数=SMR ∑=ii P n rSMRS M R P P ⨯='正态分布:密度函数:)2/()(2221)(σμπσ--=X e X f分布函数: 小于X 值的概率,即该点正态曲线下左侧面积)()(x X P x F <=特征:(1)关于x=μ对称。

(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。

(3)曲线下面积为1。

(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。

(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换σμ-=X u ,u 服从总体均数为0、总体标准差为1的正态分布。

医学统计学相关公式汇总

医学统计学相关公式汇总

医学统计学相关公式汇总Chapter 基本概念显著性检验(test of significance ):计算P 值 医学统计工作的内容: 1、实验设计:最关键最重要2、收集资料:最基础 原始资料:实验数据现场调查资料 医疗卫生工作记录 报表 报告卡 质量控制——精度和偏倚 3、整理资料(1) 资料的逻辑检查(坏数) (2) 一致性检查(3) 原始数据加工:频数分布表4、分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断 统计描述类型的选择:集中趋势 离散趋势 对称、正态 μ,x S SS ,, 对数正态 G S lgX 偏态及其他 M Q ,R 单位不同或均数差别大 CV医学统计的资料类型:计量资料、计数资料、等级分组资料 医学统计学的对象:有变异的事物 总体和样本:总体(population )的特性:同质性、大量性、差异性。

抽样的要求:代表性、随机性、可靠性、可比性。

样本的三性:代表性、随机性、可靠性。

可靠性(reliability ):实验的结果要具有可重复性。

即由科研课题的样本得出的结论所推测总体的结论有较大的可信度。

两样本间具有:可比性。

误差的类别:1、系统误差(system error ):在资料的收集过程中,由于仪器初始状态没有调零、标准试剂未经矫正、标准指定偏高或偏低等原因,造成的观察结果的倾向性的偏大或偏小。

必须克服。

2、随机测量误差(random measurement error ):在避免系统误差的情况下,由于各种偶然因素的影响造成对同一对象多次测量值的不一致。

3、抽样误差(sampling error ):由于抽样造成的的样本统计量与总体参数之间的差别。

不可避免。

样本含量越大,抽样误差越小。

如均数的抽样误差:|-X | 。

概率(probability ):P (A )小概率事件:P ≤0.05(有统计学意义)或P ≥0.01(有高度统计学意义)。

Chapter 集中趋势的统计描述手工整理资料频数表(frequency table )的步骤: 1、求极差(全距) 2、确定组数、组距 参考组距=全距 / 组数 3、确定组段4、手工编制划记表 直方图(histogram ): 高度:各组的频数 纵轴 宽度:组距 横轴表示组限 均数(average ):适用:对称分布或偏度不大的资料,尤其适合正态分布。

医学统计学计算公式

医学统计学计算公式
阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度
比值(
概率=比值/(1+比值)
验后概率计算
验后概率=验前概率×似然比/(1-验前概率+验前概率×似然比)
已知灵敏度、特异度及验前概率时:
检验结果
验后概率计算公式
阳性
=验前概率×灵敏度/[(1-验前概率) ×(1-特异度)+验前概率×灵敏度] ×100%
阴性
=验前概率×(1-灵敏度)/[(100-验前概率)×特异度+验前概率×(1-灵敏度)]×100%
似然比
阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度
贝叶斯定理灵敏度、特异度及概率
已知患病率、灵敏度和特异度计算:
阳性预测值=灵敏度×患病率/[灵敏度×患病率+(1-患病率)×(1-特异度)]
阴性预测值=特异度×(1-患病率)/[特异度×(1-患病率)Байду номын сангаас(1-灵敏度)×患病率]

卫生统计学公式

卫生统计学公式

相对数公式(3、1)公式(3、2)公式(3、3)χ2检验公式(3、4)理论频数公式(3、5)χ2基本公式公式(3、6)χ2自由度ν=(R-1)(C-1) 公式(3、7)χ2校正得基本公式公式(3、8)四格表专用公式公式(3、9)四格表校正公式公式(3、10)2×k表专用公式公式(3、11)公式(3、12)R×C表通用公式中位数公式(4、1)当n为奇数时公式(4、2)当n为偶数时公式(4、3)频数表上计算公式(4、4)百分位数公式(4、5)频数表上计算算术均数公式(4、6)χ=(1/n)∑X公式(4、7)χ=C+(1/n)(Xi-C)公式(4、8)χa=Xa-1+(1/n)(Xa-Xa-1)公式(4、9)χ=(1/n)∑fX几何均数公式(4、10)公式(4、11)四分位数间距公式(4、12)Q=P75-P25均差公式(4、13)标准差公式(4、14) 样本标准差公式(4、15)递推计算公式(4、16)直接计算公式(4、17)变异系数公式(4、18)CV=S/X×100%,X>0 正态曲线公式(5、1)正态曲线方程(5、2)正态离差(5、3) 标准正态曲线(5、4)正常值范围X±uαs标准误(6、1)理论标准误(6、2)样本均数得标准误(6、3)率得标准误(6、4)t分布(6、5)总体均数得估计(6、6)95%可信区间X-t0、05,νSχ〈μ<X+T0、05,ν Sχ(6、7)99%可信区间X-t0、01,ν Sχ〈μ<X+T0、01,ν Sχ总体率得估计(6、8)95%可信区间P—1、96Sp〈π〈P+1、96SP<p> (6、9) 99%可信区间P-2、58Sp〈π〈P+2、58SP〈p〉t检验公式(6、5)样本均数与总体均数比较公式(7、1)两样本均数比较得自由度ν=n1+n2-2公式(7、2)合并方差公式(7、3)两均数相差得标准误公式(7、4)t检验u检验公式(7、5)两均数相关得标准误u检验公式(7、6)两样本率比较公式(7、7)公式(6、4)正态性检验公式(7、8)w检验公式(7、9) 偏度系数公式(7、10)公式(7、11)峰度系数公式(7、12)公式(7、13)g1得抽样误差公式(7、14) g2得抽样误差公式(7、15)g1得u检验u1=g1/Sg1公式(7、16) g2得u检验 u2=g2/Sg2两方差齐性检验公式(7、17)F=S12/S22,S1〉S2方差分析公式(8、1) 总离均差平方与公式(8、2)组间离均差平方与公式(8、3) 组内离均差平方与公式(8、4) 总变异自由度ν总=N—1公式(8、5)组间变异自由度ν组间=k-1公式(8、6)组内变异自由度ν组内=N—k 公式(8、7)F检验F=组间均方/组内均方多个均数间两两比较公式(8、8)最小显著相差Dα=t,νS A—B 公式(8、9)两均数得标准误公式(8、10)平均例数i=1,2,…,k公式(8、11)标准误多个方差齐性检验公式(8、12)公式(8、13)直线相关公式(9、1)直线相关系数公式(9、2)离均差积与公式(9、3) 相关系数t检验直线回归公式(9、4)直线回归方程γ=a+bx公式(9、5)回归系数公式(9、6)截距a=γ—bχ公式(9、7)回归系数t检验公式(9、8)回归系数得标准误公式(9、9)标准估计误差公式(9、10)估计误差平方与公式(9、11) 两回归系数相关得t检验公式(9、12)两回归系数相差得标准误公式(9、13)两回归系数得合并方差符号检验公式(10、1)成对资料比较,ν=1公式(10、2)秩号得中位数公式(10、3) 两组符号检验,ν=1公式(10、4) 两组符号检验,ν=组数—1 秩与检验公式(10、6) 成对资料比较公式(10、6)两组资料求较小R'R'=n1(n1+n2+1)-R公式(10、7)两组资料比较公式(10、8) 多组完全随机设计资料得比较公式(10、9)多组随机单位组设计资料得比较公式(10、10)多组秩与得两两比较秩相关系数公式(10、11)Spearman秩相关系数参照单位分析公式(10、12) 平均R值公式(10、13)R得标准误公式(10、14)R得95%可信限样本含量得估计公式(11、1) 两个率比较所需例数,1-β=0、5,α=0、05公式(11、2)大样本成对资料比较均数所需例数n=4S2/X2,1-β=0、5,α=0、05 公式(11、3) 小样本成对资料比较均数所需例数,1-β=0、5。

医学统计学计算公式

医学统计学计算公式

医学统计学计算公式
This model paper was revised by the Standardization Office on December 10, 2020
验后概率计算
验后概率=验前概率×似然比/(1-验前概率+验前概率×似然比)
已知灵敏度、特异度及验前概率时:
似然比(LR)计算
阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度
贝叶斯定理灵敏度、特异度及概率
已知患病率、灵敏度和特异度计算:
阳性预测值=灵敏度×患病率/[灵敏度×患病率+(1-患病率)×(1-特异度)]
阴性预测值=特异度×(1-患病率)/[特异度×(1-患病率)+(1-灵敏度)×患病率]阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度比值(Odds)-概率(P)计算
概率=比值/(1+比值)。

医学统计学公式总结

医学统计学公式总结

一 资料的描述性统计(一)算术均数(mean)(1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法):(二)方差(即标准差的平方)(三)变异系数 二 参数估计与参考值范围(一)均数的标准误(二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数)(四)总体均数的区间估计 (一般要求计算95%或99%的可信区间)(五)总体率的区间估计(六)参考值范围估计 双侧1-a 参考值范围:s u x a 2/±单侧1-a 参考值范围:s u x a ->或s u x a +<(可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书)三 T 检验与方差分析(一)T 检验(1)单样本T 检验检验假设: (假设样本来自均数为0u 的正态总体)统计量t 值的计算: (2)配对T 检验检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验检验假设: 统计量t 值的计算: 其中两样本方差齐性检验 (即为两样本方差的比值)(二)单因素方差分析(1)完全随机设计资料的方差分析222()/1x x ns n -=-∑∑0μμ=:H 0210==-μμμ:H 210μμ=:H 221-+=n n ν这里 (T 即为该组数据之和) (2)随机单位组设计资料的方差分析SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差(两种方差分析的主要区别在于:从组内变异中分解出单位组变异与误差变异。

)四 列联表分析 卡方检验基本公式 其中 ν=(R-1)(C-1) (不太常用,理解)(一)四格表资料的卡方检验(1)两样本率的比较 四格表专用公式校正公式(后面为四格表专用校正公式,注意使用条件) Fisher 确切概率法大家自己掌握 (2)配对四格表 (校正公式)(二)行×列表的 卡方检验基本公式 ν=(R-1)(C-1)(三)双向无序资料的关联性检验列联系数C 取值范围在0~1之间。

《医学统计学》基本统计学部分公式总结

《医学统计学》基本统计学部分公式总结

̅2 ������1 − ������ ������ 2 √ 1 ������1 +
2 ������2
������1 = ������1 − 1, ������2 = ������2 − 1
1 2 的双侧 1 置信区间为:
������2
X
1
X 2 t / 2, S X 1 X 2 , t 值 自 由 度 为
̅������ − ������ ̅0 ������ Dunnett − ������ = ,ν = ������误差 ������������ ̅ ������ −������ ̅������ ������������ ̅ ������ −������ ̅������ 1 1 = √������������误差 ( + ) ������������ ������0
������������组内 =
������������组内 ������组内
������ 2 ∑������ ������=1(������������ − 1) ln 1+
2 ������������ ������������2
������ =
������������组间 ������������组内
第二章 定量资料的统计描述 1.算术均数
X
S
2
fX
2
fX
n 1 n
2
X 或( X fX )
n n
8.变异系数
CV

2.几何均数
lg X G n X 1 X 2 X 3 X n 或 G lg 1 n f lg X G lg 1 n

医学统计学计算公式

医学统计学计算公式

医学统计学计算公式标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]
验后概率计算
验后概率=验前概率×似然比/(1-验前概率+验前概率×似然比)
已知灵敏度、特异度及验前概率时:
似然比(LR)计算
阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度
贝叶斯定理灵敏度、特异度及概率
已知患病率、灵敏度和特异度计算:
阳性预测值=灵敏度×患病率/[灵敏度×患病率+(1-患病率)×(1-特异度)]
阴性预测值=特异度×(1-患病率)/[特异度×(1-患病率)+(1-灵敏度)×患病率]阳性似然比=灵敏度/(1-特异度)
阴性似然比=(1-灵敏度)/特异度比值(Odds)-概率(P)计算
概率=比值/(1+比值)。

医学统计学计算公式索引

医学统计学计算公式索引

相对数相对数公式(3.1)公式(3.2)公式(3.3)χ2检验检验公式(3.4)理论频数)理论频数公式(3.5)χ2基本公式基本公式公式(3.6)χ2自由度自由度 ν=(R -1)(C -1)-1)公式(3.7)χ2校正的基本公式校正的基本公式公式(3.8)四格表专用公式四格表专用公式公式(3.9)四格表校正公式四格表校正公式公式(3.10)2×(3.10)2×k k 表专用公式表专用公式公式(3.11)(3.12)R×C C表通用公式公式(3.12)R×中位数中位数为奇数时公式(4.1)当n为奇数时为偶数时公式(4.2)当n为偶数时频数表上计算公式(4.3)频数表上计算公式(4.4)百分位数百分位数频数表上计算公式(4.5)频数表上计算算术均数算术均数公式(4.6)χ=(1/n)∑X公式(4.7)χ=C+(1/n)(Xi-C) 公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1) 公式(4.9)χ=(1/n)∑fX几何均数几何均数公式(4.10)公式(4.11)四分位数间距四分位数间距公式(4.12) Q =P75-P25 均差均差公式(4.13)标准差标准差公式(4.14) 样本标准差样本标准差公式(4.15) 递推计算递推计算公式(4.16) 直接计算直接计算公式(4.17)变异系数变异系数公式(4.18) CV =S/X×S/X×100%100%, X>0 正态曲线正态曲线公式(5.1) 正态曲线方程正态曲线方程(5.2) 正态离差正态离差(5.3) 标准正态曲线标准正态曲线(5.4) 正常值范围正常值范围 X±X±uu αs 标准误标准误(6.1) 理论标准误理论标准误(6.2) 样本均数的标准误样本均数的标准误(6.3) 率的标准误率的标准误(6.4)t 分布分布(6.5)总体均数的估计总体均数的估计(6.6) (6.6) 95%95%可信区间可信区间 X -t 0.05,νS χ<μ<X +T 0.05,ν S χ(6.7) (6.7) 99%99%可信区间可信区间 X -t 0.01,ν Sχ<μ<X +T 0.01,ν S χ 总体率的估计总体率的估计(6.8) (6.8) 95%95%可信区间P-P-1.96Sp<π<P+1.96SP< 1.96Sp<π<P+1.96SP< 1.96Sp<π<P+1.96SP< p> p> (6.9) (6.9) 99%99%可信区间P-P-2.58Sp<π<P+2.58SP< 2.58Sp<π<P+2.58SP< 2.58Sp<π<P+2.58SP< p> p> t 检验检验公式(6.5)样本均数与总体均数比较样本均数与总体均数比较公式(7.1) 两样本均数比较的自由度两样本均数比较的自由度 ν=n 1+n 2-2 公式(7.2) 合并方差合并方差公式(7.3) 两均数相差的标准误两均数相差的标准误公式(7.4) (7.4) t t 检验检验u 检验检验公式(7.5)两均数相关的标准误两均数相关的标准误u 检验检验公式(7.6)两样本率比较两样本率比较公式(7.7)公式(6.4)正态性检验正态性检验公式(7.8) (7.8) w w 检验检验公式(7.9) 偏度系数偏度系数公式(7.10)公式(7.11) 峰度系数峰度系数公式(7.12)公式公式 (7.13) (7.13) g g 1的抽样误差的抽样误差公式公式 (7.14) (7.14) g g 2的抽样误差的抽样误差公式公式 (7.15) (7.15) g g 1的u 检验检验 u 1=g 1/S g1 公式公式 (7.16) (7.16) g g 2的u 检验 u 2=g 2/S g2 两方差齐性检验两方差齐性检验公式(7.17) F =S 12/S 22,S 1>S 2 方差分析方差分析公式(8.1) 总离均差平方和总离均差平方和公式(8.2) 组间离均差平方和组间离均差平方和公式(8.3) 组内离均差平方和组内离均差平方和公式(8.4) 总变异自由度总变异自由度 ν总=N-1 公式(8.5)组间变异自由度)组间变异自由度 ν组间=k-1 公式(8.6) 组内变异自由度组内变异自由度 ν组内=N-k 公式(8.7) (8.7) F F 检验F=组间均方/组内均方组内均方 多个均数间两两比较多个均数间两两比较公式(8.8) 最小显著相差D α=t,νSA -B两均数的标准误公式(8.9) 两均数的标准误平均例数 i=1,2,…,k 公式(8.10) 平均例数标准误公式(8.11) 标准误多个方差齐性检验多个方差齐性检验公式(8.12)公式(8.13)直线相关直线相关直线相关系数公式(9.1) 直线相关系数离均差积和公式(9.2) 离均差积和检验公式(9.3) 相关系数t检验直线回归直线回归直线回归方程 γ=a+bx 公式(9.4) 直线回归方程回归系数公式(9.5) 回归系数截距 a=γ-bχ公式(9.6) 截距检验公式(9.7) 回归系数t检验,,,公式(10.9) 多组随机单位组设计资料的比较多组秩和的两两比较公式(10.10) 多组秩和的两两比较秩相关系数秩相关系数秩相关系数公式(10.11)Spearman秩相关系数参照单位分析参照单位分析公式(10.12) 平均R值的标准误公式(10.13)R的标准误公式(10.14)R的95%可信限可信限样本含量的估计样本含量的估计两个率比较所需例数 ,1-β=0.5,α=0.05 公式(11.1) 两个率比较所需例数公式(11.2) 大样本成对资料比较均数所需例数n=4S2/X2,1-β=0.5,α=0.05 公式(11.3) 小样本成对资料比较均数所需例数,1-β=0.5 。

《医学统计学》基本统计学部分公式总结

《医学统计学》基本统计学部分公式总结

《医学统计学》基本统计学部分公式总结基本统计学是医学统计学的基础,包括描述性统计和推断性统计。

下面是一些常用的公式总结:一、描述性统计1.平均数(算术平均数):所有观察值的总和除以观察值的个数。

平均数 = (x1 + x2 + ... + xn) / n2.中位数:将所有观察值按顺序排列,位于中间的数值。

如果n为奇数,中位数为第(n+1)/2个观察值;如果n为偶数,中位数为第n/2和(n/2+1)个观察值的平均数。

3.众数:出现次数最多的观察值。

4.百分位数:将所有观察值按大小顺序排列,百分位数为位于相应百分比位置的观察值。

5.方差(样本方差):观察值与均值之差的平方和的平均数。

方差= Σ(xi - 平均数)² / (n - 1)6.标准差(样本标准差):方差的平方根。

标准差=√方差7.四分位数差(IQR):第三四分位数与第一四分位数之差。

8.相对标准差:标准差除以平均数,表示标准偏差在平均水平的相对大小。

二、推断性统计1.假设检验:对总体参数进行推断的一种方法。

t检验:用于比较两个样本均值是否具有显著差异。

z检验:用于比较样本均值与已知总体均值的差异。

χ²检验:用于比较观察频数与期望频数之间的差异。

F检验:用于比较两个样本方差是否具有显著差异。

2.置信区间:对总体参数进行估计的一种方法。

对于平均数的置信区间,通常使用t分布或z分布进行计算。

3.相关分析:皮尔森相关系数:用于衡量两个变量之间的线性相关程度。

斯皮尔曼相关系数:用于衡量两个变量之间的等级相关程度。

4.回归分析:简单线性回归:用于预测一个因变量与一个自变量之间的关系。

多元线性回归:用于预测一个因变量与多个自变量之间的关系。

5.生存分析:生存函数:表示个体存活的概率。

生存率:表示在一定时间内生存下来的概率。

Kaplan-Meier曲线:用于描述生存率随时间变化的曲线。

以上是《医学统计学》中基本统计学部分常用的公式总结,这些公式可以帮助我们理解和分析医学数据,进行数据的描述和推断,为医学研究提供有力的支持。

卫生统计学公式

卫生统计学公式

相对数公式(3.1)公式(3.2)公式(3.3)χ2检验公式(3.4)理论频数公式(3.5)χ2基本公式公式(3.6)χ2自由度ν=(R-1)(C-1)公式(3.7)χ2校正的基本公式公式(3.8)四格表专用公式公式(3.9)四格表校正公式公式(3.10)2×k表专用公式公式(3.11)公式(3.12)R×C表通用公式中位数公式(4.1)当n为奇数时公式(4.2)当n为偶数时公式(4.3)频数表上计算公式(4.4)百分位数公式(4.5)频数表上计算算术均数公式(4.6)χ=(1/n)∑X公式(4.7)χ=C+(1/n)(Xi-C)公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1)公式(4.9)χ=(1/n)∑fX几何均数公式(4.10)公式(4.11)四分位数间距公式(4.12)Q=P75-P25均差公式(4.13)标准差公式(4.14)样本标准差公式(4.15)递推计算公式(4.16)直接计算公式(4.17)变异系数公式(4.18)CV=S/X×100%, X>0 正态曲线公式(5.1)正态曲线方程(5.2)正态离差(5.3)标准正态曲线(5.4)正常值范围X±uαs标准误(6.1)理论标准误(6.2)样本均数的标准误(6.3)率的标准误(6.4)t分布(6.5)总体均数的估计(6.6) 95%可信区间X-t0.05,νSχ<μ<X+T0.05,ν Sχ(6.7) 99%可信区间X-t0.01,ν Sχ<μ<X+T0.01,ν Sχ总体率的估计(6.8) 95%可信区间P-1.96Sp<π<P+1.96SP< p> (6.9) 99%可信区间P-2.58Sp<π<P+2.58SP< p>t检验公式(6.5)样本均数与总体均数比较公式(7.1) 两样本均数比较的自由度ν=n1+n2-2公式(7.2) 合并方差公式(7.3) 两均数相差的标准误公式(7.4) t检验u检验公式(7.5)两均数相关的标准误u检验公式(7.6)两样本率比较公式(7.7)公式(6.4)正态性检验公式(7.8) w检验公式(7.9) 偏度系数公式(7.10)公式(7.11) 峰度系数公式(7.12)公式(7.13) g1的抽样误差公式(7.14) g2的抽样误差公式(7.15) g1的u检验u1=g1/S g1公式(7.16) g2的u检验 u2=g2/S g2两方差齐性检验公式(7.17)F=S12/S22,S1>S2方差分析公式(8.1) 总离均差平方和公式(8.2) 组间离均差平方和公式(8.3) 组内离均差平方和公式(8.4) 总变异自由度ν总=N-1公式(8.5)组间变异自由度ν组间=k-1公式(8.6) 组内变异自由度ν组内=N-k公式(8.7) F检验F=组间均方/组内均方多个均数间两两比较公式(8.8) 最小显著相差Dα=t,νS A-B公式(8.9) 两均数的标准误公式(8.10) 平均例数i=1,2,…,k公式(8.11) 标准误多个方差齐性检验公式(8.12)公式(8.13)直线相关公式(9.1) 直线相关系数公式(9.2) 离均差积和公式(9.3) 相关系数t检验直线回归公式(9.4) 直线回归方程γ=a+bx公式(9.5) 回归系数公式(9.6) 截距a=γ-bχ公式(9.7) 回归系数t检验公式(9.8) 回归系数的标准误公式(9.9) 标准估计误差公式(9.10) 估计误差平方和公式(9.11) 两回归系数相关的t检验公式(9.12) 两回归系数相差的标准误公式(9.13) 两回归系数的合并方差符号检验公式(10.1) 成对资料比较,ν=1公式(10.2) 秩号的中位数公式(10.3) 两组符号检验,ν=1公式(10.4) 两组符号检验,ν=组数-1秩和检验公式(10.6) 成对资料比较公式(10.6) 两组资料求较小R'R'=n1(n1+n2+1)-R公式(10.7)两组资料比较公式(10.8) 多组完全随机设计资料的比较公式(10.9) 多组随机单位组设计资料的比较公式(10.10) 多组秩和的两两比较秩相关系数公式(10.11)Spearman秩相关系数参照单位分析公式(10.12) 平均R值公式(10.13)R的标准误公式(10.14)R的95%可信限样本含量的估计公式(11.1) 两个率比较所需例数,1-β=0.5,α=0.05 公式(11.2) 大样本成对资料比较均数所需例数n=4S2/X2,1-β=0.5,α=0.05公式(11.3) 小样本成对资料比较均数所需例数,1-β=0.5。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一资料的描述性统计
(一)算术均数(mean )
(1)简单算术平均值定义公式为(直接法):
X i X 2 X 3 ........ X n
(2)利用频数表计算均数(加权法):
f i X i f 2X 2 f 3X 3 f k X k
fl + f2 + f3 + …+ fk
方差(即标准差的平方)
'
(X _ X ) 2 ' X 2 X )2/n
s n - 1 n-1
(三)变异系数
CV =■! 100%
X
二参数估计与参考值范围
(三)T 分布
(四)总体均数的区间估计X-匕能爪乂 £卩£ X +切2A A
计算95%或 99%勺可信区间)
(五) 总体率的区间估计 p — u :./2s p = :::
p u /2s p
(六) 参考值范围估计 双侧1-a 参考值范围:X-
U a/2S
单侧1-a 参考值范围:X
脣或"X U a S
(可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书)
三T 检验与方差分析
(一)T 检验
(一) 均数的标准误
(二) 样本率的标准
s
S X :
J n
S p 「
P (1n
P )
(p 为样本率)
(u 为总体均数)
(一般要求
(1)单样本T检验
检验假设:(假设样本来自均数

H 0- 严0
统计量t值的计算:t _ x一%_ x一%t = h二亦,
(2)配对T检验
检验假设:H 0:丄1 _」2 =」=0
d —» d —卜
统计量t值的计算:t :
S d S d Nn
的差值,Sd为差值的标准差)
(3)两样本T检验
检验假设:H : . | - . I
统计量t值的计
算:t =(X
l _ X2)
_ (」1 _」2)
S
Xi _X2
' (捲一XJ2亠二(x2- x2)2
n〔- 2
s1两样本方差齐性检验 F 才 r 的比值)S2 m - 12= n2- 1 (即为两样本方差
(二)单因素方差分析
(1 )完全随机设计资料的方差分析
MS
合计S S T =' x2- c T = N 一1
u 0
的正态总体)
n -1
=n -1 (d为两组数据
SS B '、B MS B
MS W
sw总二ss组间ss组内―总组间组内
SS
组间T 2
SS B八i-c
n
组内
SSv 二ss■- SS B
=k -1 SS B B
= N-k SS M'g 2
这里C =(瓦X)2/N T =瓦X jj (T即为该组数据之和)j (2)随机单位组设计资料的方差分析
SS 总=SS处理+SS区组+SS误差V 总=V处理+V区组+V误差
来源 SS
V
MS F
处理组间 SSB^l-Ti^C B1 = k -■ 1 SR 仁■- B1
MS B1 MS E 单位组间 SS B2 十 B 2-C • B2 二
n -1
SS
32「B2
MS B 2, MS E
误差 SS E SS T 「SS B 〔「SS B 2 E
=
"■ T ~ '■- B1 - '■- B2
SS E E
合计
SSr 八 x 2
C
、、T = kn-1
四列联表分析卡方检验
(四)多个样本率间的多重比较
每一个两两比较的检验水准::-
比较的次数
注意:1、有1/5以上格子的理论频数小于
5;
2、 一个理论频数小于 1;
3、 总样本例数小于 40
当有以上三种情况或之一存在时,均不适宜进行卡方检验
基本公式
n
R
*n C
v= (R-1)(C-1)
(不太常用,理解)
(—)四格表资料的卡方检验
(1 )两样本率的比较 四格表专用
公式
(ad-b 。

2 N (a b)(c d)(a c)(b d)
(|A-T|-0.5)
2
7
.
(ad - be -N/2)2 N T
(后面为四格表专用校正公式,注意使用条件)
Fisher 确切概率法大家自己掌握 (a b)(c d)(a c)(b d)
(2)配对四格表 公式)
(b-c -1)2
(校正
(二)行X 列表的 卡方检验
基本公式
2 _ A
2
= N( 1)
n
R %
v = (R-1)(C-1)
(三)双向无序资料的关联性检验
列联系数C 取值范围在0〜1之间。

关系愈不密切;愈接近于 1,关系愈密切。

0表示完全独立;
1表示完全相关; 愈接近于 0,
'
a 2a
ct = ---------------- = -------------
k(k —1)/2 k(k —1)
五非参数统计秩和检验
(一)配对样本比较的秩和检验
当n <25时,按秩和检验结果查表可得
当 n>25 时,正态近似法做 u 检验 u 二 ___________________________
Jn(n + 1)(2 n +1)/24
T - n(n 1) 4 - 0.5
绝对值相同的数较多时,用校正公式
(tj 为第j 个差值的个数)
T 「n(n 1) 4「0.5
U
, --------------------------------------------------- 3
n(n 1)(2n 1)
' (t j -t j
)
V 24"
48
(二)两独立样本比较的秩和检验
超出附表范围时,按正太近似法计算
T -nJN +1)/2 -0.5 mn
2(N 1)/12
平均秩次较多时,应进行校正
Uc
(t 3 - t j ), (N 3
-N)
(三)H 、M 检验属于理解内容
六回归与相关
(一)直线回归方程的求法
U
' (X -X )(Y -Y )
b -
Z (X -X)
a = Y - bX
l
XX
l yy 的分解:' (Y -Y)2 八 M-Y)2 ' (Y -Y?)2
SS 回二 bl xY = I X Y /I xx 二 b 2|xx
b = I XY /I XX
方差分析 T 检验
MS 回 MS 剩
回二 1,剩二 n 一 2
(2) Y?的估计
(3) 个体Y 值的容许区间
公式中
S YX
为剩余标准差,为了简化计算,当 X 。

与X 接近且n 充分大时,可用 $X
代替S
丫。

(三) 相关系数的计算
无(x —X)(y —y) :(x -x)
2
(y - y)2
这里 ' (X -X)2
二' X 2
-(、X)2
/n
' (X -X)(Y _Y)八 XY
(1)相关系数的假设检验
r -0 r t : S r 1-r 2
(2)总体相关系数 '的可信区间
y 在扣除x 的影响后的离散程度; Sb 为样本回归系数
(二) 直线回归方程的区间估计
(1)总体回归系数B 的可信区间
b - t- /2,(n - 2)3
1 (X 。

一 x )
2 n 、 (X -X)2
(Y?-1 :/2,n-2
S
VF
,
I /2,n
_2
S Y ?
)
/ 2,n 「2S Y ~Y?,Y ?
t 、f/2, n -2S
Y -Y?)
= & x
(X o-X)2

(X -X)2
l XY
l
XX
t 二
1
二 n - 2
SY.X 为回归的剩余标准差,反映了 标准误。

1) 首先对r (r 不是正态分布)作如下Z 转换
3 卡 1 (1+r)
z = tanh - r 或 z In
2 (1-r)
2) 计算Z 的(1- a)可信区间
(Z - ' ./2 / ' n - 3, Z .〔./2 /、“ n - 3)
3)
对计算出的Z 的上下限作如下变换,得到 r
的(1- a)可信区间
服从自由度为n-2的t 分布,查t 界值表。

r 二 tanh(z)或r 二 2z
e -1
2z e - 1
(3)相关系数与回归系数的相互换算
r 二
bjl xx I YY
r 2 二 b xY b yx
(4) 等级相关系数的计算
r^1
6、d 2 n(n 2 -1)
d ——每对观察值 X i 、Y i 所对应的秩次 U i 、V i 之差; n ——
对子数。

等级相关系数的假设检验 当n 二50查rs 界值表 当n ・50按下式计算统计量
r
s
...1 - r s 2 / n - 2
欢迎您的下载,
资料仅供参考!
致力为企业和个人提供合同协议,策划案计划书,学习资料等等
打造全网一站式需求。

相关文档
最新文档