卫生统计学第三章平均数与标准差

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学第三章平均数与标准差
第三章 平均数与标准差
第一节 算术均数和几何均数
l 数值变量资料的统计描述:集中趋势central tendency 和离散趋势tendency of dispersion
l 平均数average:说明一组观察值(变量值)的集中 趋势、中心位置或平均水平。(a measure of location, a measure of central tendency, a mean or an average)
– k 为组数 – f 为各组的频数,又称权数weight – ∑f 各组频数之总和 – ∑fx 为各组组中值与频数乘积之和 l 计算实例见P21
l 3、简捷法short-cut method l 1)在频数表的基础上,以与最大频数相对应的组中
值为假定均数x0, assumed origin l 2)列出简捷法计算均数用表,
– 1)中位数常用于描述偏态分布资料的集中位置, 反映位次居中的观察值的水平,只受居中变量 值波动的影响,对称分布时与均数相同
– 2)百分位数用于描述观察值在某百分位位置时 的水平,多个百分位数结合应用可更全面描述 分布特征
– d为各组组中值减去假定均数后除以组距i,假定均数对 应d为0,向上依次为-1,-2,… 向下依次为1,2,…
l 3)将各行f值与d值 相乘得df,再求∑df
l 4)求均数 xx0 d f(if)7.0 3 1 40 (1 2 )0 7.8 3
l *: 可以任何一组组中值为假定均数,结果一致,但 设在频数最大组或其附近时,计算较简便。计算机 更方便
l 二、几何均数geometric mean,简记为G
l 1)资料偏态分布,少数数据过分偏大,(各观察值 间呈等比关系 ),原始数据进行对数变换后为对称 分布,如平均潜伏期、平均抗体滴度等资料
l 2)公式
Gn x1.x2..x.n 写成对数形式:
Glg1(lgx1lgx2 ...lgxn)lg1(
l (一)不分组资料均数的计算法:直接计算
n
xx1x2...xn
x
xi
i1
n
nn
l 为避免过于复杂,在求和的范围可看清时对sigma
不记上下标(dummy suffix),对x也不加下标
l The mean is the sum of the observations divided by the number of observations.
l 适用于:偏态或分布不明的资料
– 对称分布时接近均数,偏态分布时更合理
l (一)未分组资料: P23例3-4,例3-5
当n为奇数时 M, xn1
2
当n为偶数时 M, 12(xn2
xn1) 2
l (二)分组资料:按频数表计算M l 公式:
MLW(nC) f2
l L中位数所在组的下限 l W中位数所在组的宽度 l f中位数所在组的频数(例数) l n总频数 l C中位数所在组的前一组的累计频数cumulative
Pr
LW(r.n%C) f
l (三)要计算多个百分位数时亦用图解法:y axis is cumulative relative frequency, x axis is observation (incubation period). see Figure 3-2, P25
l 中位数和百分位数的应用
l (一)不分组资料的计算方法
l Pr=x r%(n+1) l 当n为150时计算第5百分位数5%(150+1)=
7.55个变量值,如第7个变量为15,第8个 变量为17,用内插法求x7.55=15+0.55(1715)=16.1,P5为16.1
l (二)分组资料的计算方法 l percentile is estimated by linear interpolation as
lgx )
n
n
l P22例3-3,计算抗体滴度的几何均数;该方法计 算出的G通常偏小,可在计算反对数前+(lgd)/2
l 3)几何均数的应用
– 几何均数常用于等比资料 – 观察值不能有0
– 观察值不能同时有正值和负值,若全为负先把 负号除掉,最后结果前加负号
第二节 中位数和百分位数
l 一、median 用M表示: 把变量值按大小顺序排列, 居于中间位置的那个数值就是M
– 3)列表划记tallying:见P20表3-2。频数表可绘 成直方图histogram
l 2、加权法weighting method
xx1f1x2f2...xkfk f1f2... fk
xf 每组组中值 之 与 和 频
f
每组频数之和
– x为组中值class mid-value (midpoint)=本组下 限与相邻较大组段的下限相加除以2
frequency
l Fra Baidu bibliotek累计频数〔百分数〕法寻找中位数所在 的组段:累计频数刚大于n/2的组段
l 用内插法linear interpolation求中位数
L值 累计频数C
n/2
l 将W等分为f份,从C至n/2的数值长为 (W/f)*(n/2 – C)
l 二、百分位数percentile:指将n个观察值从 小到大依次排列,再把它分成100等份,对 应于r%位的数值即为第r百分位数。通常用 Pr 表示。中位数即第50百分位数
l (二)分组资料的均数计算法:频数表法
l P20例3-2,步骤:
l 1、分组和编制频数分布表frequency distribution table
– 1)找出观察值中最大值、最小值和极差range
– 2)按极差大小决定组段数、组段和组距class interval:8~15组,常用极差的1/10取整作组 距,组段下限和上限low limit and upper limit应 界限分明,无交叉,从下限开始不包括上限, 第一组段包括最小,最后组段包括最大观察值
l 平均数种类:算术均数arithmetic mean、几何均 数geometric mean、中位数median、众数mode、 调和均数harmonic mean, H
l 一、算术均数,简称均数mean。
l 统计表示:总体的参数用希腊字母表示,样本的 统计量用拉丁字母表示
l 用μ表示总体均数,用 x 表示样本均数
相关文档
最新文档