类资料的统计描述
医学统计学-3-定性资料统计描述
解决办法
分层比较 率的标准化法 多元统计分析方法
相对数比较时应注意其可比性(二)
在同一地区不同时期资料的相对数比较时,还 应注意其条件有无变化。 例如,不同时期的发病率比较时,应注意不同 时期疾病的登记制度、诊断水平以及平均人口 数的变化。
5、样本率或构成比进行比较时应作假设检验 由于样本率或构成比是样本指标,同样存 在着抽样误差。 在实际工作中,不能根据样本率或构成比 等相对数的数值大小轻易作出结论,应进 行样本率或构成比差异比较的假设检验。
一、相对数的概念
Question:
通过调查得到某年甲地区的小学生中流脑 发病63例,乙地区的小学生中流脑发病35 例。能否认为甲地流脑的发病严重程度高 于乙地? 绝对数63例和35例表示甲地发病比乙地多 28例,能否说明两地发病的严重程度呢?
假设甲地有小学生50051人,乙地有小学生 14338人,求出两地的发病率: 甲地发病率: 63/50051=1.26‰ 乙地发病率: 35/14388=2.44‰ 乙地区的发病率是甲地区的两倍多。 以上两个发病率为通过绝对数求得的相对 数,用来表示事物出现的频率或强度,便 于比较。
分类资料的统计描述
用率、构成比和相对比等指标来对分类资 料进行统计描述。 由两个有联系的指标之比组成,统称为相 对数。 常用相对数包括率、构成比和相对比。
二、常用相对数
1、率(rate)
又称频率指标。 某现象实际发生数与可能发生总数之比。 说明某现象发生的频率与强度:
某时期内实际发生某现象的观察单位数 率= ×比例基数(K) 同时期可能发生该现象的观察单位总数
三、标准组的选择
标准组应选择有代表性的、较稳定的、来自数 量较大的人群的指标作为标准。
例如世界的、全国的、全省的、本地区的或本 单位历年累计的数据等;
分类资料的统计描述
第六章 分类资料的统计描述一、教学大纲要求(一)掌握内容 1. 绝对数。
2. 相对数常用指标:率、构成比、比。
3. 应用相对数的注意事项。
4. 率的标准化和动态数列常用指标:标准化率、标准化法、时点动态数列、时期动态数列、绝对增长量、发展速度、增长速度、定基比、环比、平均发展速度和平均增长速度。
(二)熟悉内容1. 标准化率的计算。
2. 动态数列及其分析指标。
二、教学内容精要(一) 绝对数绝对数是各分类结果的合计频数,反映总量和规模。
如某地的人口数、发病人数、死亡人数等。
绝对数通常不能相互比较,如两地人口数不等时,不能比较两地的发病人数,而应比较两地的发病率。
(二)常用相对数的意义及计算 相对数是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数大小,如率、构成比、比等。
常用相对数的意义及计算见表6-1。
表6-1 常用相对数的意义及计算常用相对数概念表示方式 计算公式 举例率(rate ) 又称频率指标,说明一定时期内某现象发生的频率或强度 百分率(%)、千分率(‰)等单位时间内的发病率、患病率,如年(季)发病率、时点患病率等构成比(proportion )又称构成指标,说明某一事物内部各组成部分所占的比重或分布 百分数疾病或死亡的顺位、位次或所占比重比(ratio )又称相对比,是A 、B 两个有关指标之比,说明A 是B 的若干倍或百分之几倍数或分数①对比指标,如男:女=106.04:100 ②关系指标,如医护人员:病床数=1.64③计划完成指标,如完成计划的130.5%%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比BA=比(三) 应用相对数时应注意的问题1. 计算相对数的分母一般不宜过小。
2. 分析时不能以构成比代替率 容易产生的错误有 (1)指标的选择错误如住院病人只能计算某病的病死率,不能认为是某病的死亡率; (2)若用构成指标下频率指标的结论将导致错误结论,如 某部队医院收治胃炎的门诊人数中军人的构成比最高,但不一定军人的胃炎发病率最高。
描述分类变量资料的主要统计指标
描述分类变量资料的主要统计指标统计指标是用来描述总体现象数量特征的一些数量表现形式,通常采用频数或频率等来表示。
它是用来说明研究对象数量特征多少的一种语言,而这种数量特征,可以是数量上的也可以是质量上的。
通过统计指标的指标名称和统计指标值就可以了解到研究对象的特点。
因此,运用统计指标能够反映出研究对象的数量特征,是认识事物本质的重要手段。
一、集中趋势指标在大量分类资料中,分类变量的数值经常有很大的差别,并且这种差别可能是偶然的,也可能是由于自变量有意的取舍造成的。
因此,用什么方法对变量进行排列组合才能获得可靠的资料呢?最好的方法是利用极差,即把离中趋势最远的自变量(最大值或最小值)作为总体变量的代表值。
如果在原始分类数据的基础上再进行一次平均计算,就可以得到两个指标,即平均指标和标准差。
(一)成数(Mean)成数是反映总体各单位某一数量占总体单位总数的比重,用公式表示为:成数=n/总体单位总数其中, n是总体单位总数, m是成数的标准差。
总体内各单位成数之间的差别叫做成数的离散程度。
从实际应用上看,成数愈小则成数差愈大,即差异愈大,反之,则成数差愈小,即差异愈小。
在研究总体分布的均匀性时,可以采用成数作为研究对象的主要分析指标。
在许多实际问题中,往往可以直接得到总体成数的具体数值,而不需要进行全面调查计算,这样就可以节省人力、物力和时间,并使资料更加精确。
当然,我们也应注意到:成数受自变量变动范围的影响,当自变量变动较大时,所得到的成数可能与实际情况不符,需要重新估计,因此在分析时应注意选择成数的上下界限。
(1)成数的上限和下限①成数的上限是指超过成数下限的那部分总体单位数,它表示大于或等于该总体单位总数的一定比例的单位数。
在统计学中,把成数的上限叫做正偏态(或上限集中),把成数的下限叫做负偏态(或下限集中)。
1。
离中趋势是指各个变量的平均值在总体平均值的两侧波动,偏离中间较多,表示这一群体在数量上介于总体的中间水平和总体的最高水平之间,数量上居于两者之间的状态。
分类资料的统计描述
100 10 110
• 从表中的合计看,新疗法的治愈率比旧疗法 高。但分别观察成人组和儿童组的治愈率相 同。其合计的差别之所以大,是由于两种疗 法的选择的样本人群年龄构成不同。新疗法 成人所占比例高,而成人的治愈率高,造成 总率较旧法高。要正确比较两法的疗效,需 按照统一标准进行校正,然后进行比较。
统计描述和推断的基本内容
统计描述
计量资料 频数分布 集中趋势 离散趋势 统计图表 相对数及 其标准化 统计图表 r b 统计图表
统计推断
抽样误差、 标准误 t,u 检验 秩和检验 方差分析 二项分 Poisson 分布 u 2检验 秩和检验 t检验 方差分析
应 用
正常值范围 可信区间
计数资料
疾病统计 人口统计 寿命表
乙国的年龄较甲国轻
注意事项
1.标准不同得到的标化值不同 2.内部各小组比较时,可不标化 3.标化后的数值不再反映实际水平。
2016/8/29
21
小 结
• 构成比 • 相对比 • 率
• 标准化:标准化法的目的是消除混杂因素对 结果的影响 • 重点和难点:以比代率和标准化问题
1
2 3
N1
N2 N3 Ni
R1
R2 R3 Ri
P1
P2 P3 Pi
n1
n2 n3 ni
r1
r2 r3 ri
p1
p2 p3 pi
i
k
Nk
NRkR来自PkPnk
n
rk
r
pk
p
合计
例题计算
• • • • 表6.4 ,6.6,6.7,6.8计算结果 有何不同? 不同的标准会出现不同的标化率 在相同的标准下,具有可比性
统计描述
统计描述主要内容⏹频数分布⏹定量资料的描述⏹分类资料的描述被平均⏹中国人公共假期每年已有115天;⏹中国全国家庭平均住房面积116.4㎡;⏹中国人均可支配收入3600美元;⏹中国男性平均身高174.2厘米;⏹中国人平均生育1.18个孩子;⏹中国家庭资产平均为121.69万元,城市家庭平均为247.60万元,农村家庭平均为37.70万元。
变量和研究资料的类型⏹数值变量、定量资料、计量资料⏹分类变量、定性资料、计数资料⏹顺序变量、有序分类变量、等级资料定量资料⏹定量资料是指每个观察单位某个变量用测量或其他定量方法观察结果,一般有计量单位。
⏹定量资料、数值资料、计量资料(measurement data,quantitative data,numeric data)⏹定量资料的各个观察值之间有量的区别,没有性质的不同。
连续型资料和离散型资料⏹连续型资料(continuous data)⏹理论上在任何两个连续型数据之间都还有无穷多个数据;⏹只要测量仪器足够精确,连续型数据可以精确到小数点后第无限位。
⏹离散型资料(discrete data)⏹是一种计数(count data),只能是0和正整数,不会是负数,也没有小数点,如心率、血小板数。
⏹有些离散型数据的描述要参照分类资料处理,如龋齿个数、流产次数、尿失禁次数、交通事故死亡人数等。
随机变量和研究资料的类型定量资料定性资料等级资料连续型资料离散型资料收缩压脉搏数产次文化程度ABO血型频数分布表当观察值很多时,直接从原始数据很难得出概括的印象,为了解资料的分布特征,可通过资料的整理,编制频数分布表,来显示数据分布的范围、数据最集中的区间和分布的形态。
定量资料的频数分布表编制频数表就是把资料的取值范围分割成若干个互不相交的组段,统计每个组段内的观察值个数作为对应的频数,由各个组段的范围及其频数构成最基本的频数分布表。
某地儿研所测得该地150名12岁健康男童体重(kg)原始数据如下,试编制频数表。
实验三 分类资料的统计描述与统计推断
实验三分类资料的统计描述与统计推断一、下表为一抽样研究资料,试:(1)填补空白处数据;(2)根据最后三栏结果作简要分析。
(3)试估计该地死亡率、0~恶性肿瘤死亡率的置信区间。
某地各年龄组恶性肿瘤死亡情况出高血压病人775人,试估计该市中年男性高血压患病率的95%置信区间。
三、一般而言,对某疾病采用常规治疗,其治愈率约为45%。
现改用新的治疗方法,并随机抽取180名该疾病患者进行了新疗法的治疗,治愈117人。
问新治疗方法是否比常规疗法的效果好?四、一般人群先天性心脏病的发病率为千分之八,某研究者为探讨母亲吸烟是否会增大其小孩的先天性心脏病的发病危险,对一群20~25岁有吸烟嗜好的孕妇进行了生育观察,在她们生育的120名小孩中,经筛查有4人患了先天性心脏病。
请作统计分析。
五、某院康复科用共鸣火花治疗癔症患者56例,有效者42例;心理辅导法治疗癔症患者40例,有效者21例。
问两种疗法治疗癔症的有效率有无差别?六、用兰芩口服液治疗慢性咽炎患者34例,有效者31例;用银黄口服液治疗慢性咽炎患者26例,有效者18例。
问两药治疗慢性咽炎的有效率有无差别?七、用甲乙两种方法检查已确诊的乳腺癌患者120名。
甲法的检出率为60%,乙法的检出率为50%,甲乙两法一致的检出率为35%,问甲、乙两法的检出率有无差别?八、某研究者将腰椎间盘突出症患者1184例,随机分为三组,分别用快速牵引法、物理疗法和骶裂孔药物注射法治疗,结果如下表。
问三种疗法的有效率有无不同?三种疗法治疗腰椎间盘突出有效率的比较疗法有效无效合计快速牵引法444 30 474物理疗法323 91 414骶裂孔药物注射法222 74 296合计989 195 1184九、思考题:1、常用的相对数有哪些?应用相对数时应注意的事项?2、率的标准误与率的抽样误差3、简述二项分布、Poisson分布和正态分布的区别与联系。
4、总体率的区间估计方法5、2x卡方检验的用途与基本思想6、行⨯列表资料2x检验的注意事项7、普通四格表资料2x检验的应用条件及其表格、检验公式、步骤等8、配对四格表资料2x检验的应用条件及其表格、检验公式、步骤等χ检验有何异同?9、两样本率比较的z检验与210、对于四格表资料,如何正确选用检验方法?11、资料的对比应注意其可比性,可比性指的是什么?试举两例说明。
描述分类变量资料的主要统计指标
描述分类变量资料的主要统计指标在描述统计中,经常要描述两个变量之间的关系,这就是指标。
描述分类变量资料的主要统计指标有:平均数(AV)、中位数(median)、众数(major)、方差(F)、标准差(SD)、相关系数(r)、误差(SEM)、信赖区间(CI)、 F统计值等。
一、全距n。
平均数在统计学上指全部观察单位的算术平均数,即众数、中位数和方差的算术平均数。
它反映了各个变量在总体中所占的比例。
用公式表示为n=AV。
例如:成人牙齿脱落率调查,共调查成人2046人,其中有根以上完全不能保留者占4.5%,按标准脱落百分数计算,每根牙齿应脱落2%。
则该项调查结果的全距是2.5%。
全距愈小说明变量在总体中所占的比例愈大,代表性愈强。
二、方差 1。
方差又称离散系数或变异系数。
由于各个观察单位所得的资料是来自不同的变量,因而这些资料都是不可比的。
但在抽样调查时,要使各个单位取得同样的结论,在对总体进行分析时,就必须把各单位的观察结果加以平均化,从而消除了由于来源不同引起的资料不可比问题,并使各单位的离散状况趋于一致。
这就需要用变异系数将各单位的资料加以平均,使其成为总体的平均资料。
因此,方差就是各个单位的变异程度的一种度量。
方差的符号是σ,单位是标准差(SD)。
2。
标准差的计算公式为:SD=∑[(X-Y)÷2]×100%。
式中SD表示标准差。
标准差的大小是随研究的目的而异的,通常用于某些问题的检验或推断。
如:某县的全年工业总产值的多少与全年粮食总产量的多少成正比;销售额的增长速度快慢与企业利润成正比。
对于全距,方差,标准差,原因,方差是概率统计的专有名词。
在实际工作中,我们通常简单地用:均数×方差=总体标准差(均值×方差=总体方差),来概括变量之间的关系。
当然,我们在阅读统计资料时,有时也会碰到一些专门用语,如果只看题目或只看这些专门用语,也很难理解题意,但只要知道它们的含义就行了。
分类资料的统计描述
结果:城区肺癌死亡率为郊区的194.1%或1.94倍
三、应用相对数时的注意事项 1.计算相对数时,分母不宜过少
如:用某药治疗某病患者,5例中有3例治愈,计算治愈率为 3/5×100%=60.0%,如果有4例治愈,则其治愈率为80%。显然,这个结果 是不稳定的。 在分母例数很少的情况下,个别的偶然因素会导致结果的变化,只有分 母例数较大时,计算的相对数才比较稳定。在例数较少时,通常直接用绝对 数表示。如果要用相对数表示,则需列出其总体率的臵信区间。 又如:某医生用组织埋藏法治疗了2例视网膜炎患者,1例有效, 即报道有效率为50%。这显然是不可靠的,不能正确反映事实真相。
例: 某地2003-2005年不同性别新生儿数见下表,
试计算该地不同年份新生儿性别比。
表 表11-5 3-5 年 份 2003 2004 2005 某地 2003-2005 年新生儿性别比 新生儿数 90919 109671 125513 男性 48636 58908 66814 女性 42283 50763 58699 性别比
3.关于“死亡率”与“病死率”
这是 2 个不同含义的指标, 在进行人群研究时, 它们的 分子可能相同, 但分母不同。死亡率的分母是同期人口数, 是观察人群中某病的死亡频率, 反映了观察人口因某病的死 亡水平, 是一个人口学指标, 一般以 10 万分率表示; 而病 死率的分母是患某病的患者总数, 是某病患者中因该病而死
下面各率中那个率最能反映疾病对人群的威胁程度
发病率 n年生存率 生存率
患病率
治愈率 有效率 死亡率 病死率
?
感染率
两分类资料的统计描述与推断
频数分布表包括两列,一列表示类别, 另一列表示该类别出现的频数。通过 频数分布表,可以直观地了解各类别 的数量分布情况,为后续的统计分析 提供基础数据。
比例与百分比
总结词
比例和百分比是用来描述两分类资料中各类别的相对大小。
详细描述
比例是各类别的数量与总数量的比值,而百分比则是比例乘以100。通过比例和 百分比,可以了解各类别的相对大小,进一步分析各类别的权重和影响。
详细描述
在两分类资料中,中位数通常用于描述某一类别的中间状态或中心趋势。例如,在一组 关于消费者年龄的数据中,中位数可以表示消费者的平均年龄或年龄分布的中心趋势。
算术平均数
总结词
算术平均数是所有数值的和除以数值的 个数。
VS
详细描述
在两分类资料中,算术平均数可以用于描 述某一类别的平均水平或中心趋势。例如 ,在一组关于消费者购买力的数据中,算 术平均数可以表示消费者的平均购买力水 平。
概率与概率分布
概率
描述随机事件发生的可能性大小。
概率分布
描述随机变量取值可能性的分布情况。
随机抽样与抽样分布
随机抽样
从总体中按照随机原则抽取一部分观察单位进行研究 。
抽样分布
由样本数据推导出的统计量值的分布。
统计量与参数
统计量
基于样本数据计算出的量值,用于描 述样本数据的特征。
参数
描述总体特性的量值,通常通过总体 数据计算得出。
03
CHAPTER
两分类资料的离散程度描述
异众比率
异众比率
异众比率是用于描述分类数据中非众数频数 的相对重要性。其计算公式为异众比率=非 众数频数/总频数。异众比率越大,说明非 众数频数所占比重越大,数据的离散程度越 大。
定量资料的统计描述
四分位数 间距
方差与标 准差 变异系数
频数分析(Frequencies )
下面我们结合人群的年龄(age)数据学习如何使用SPSS计算统计指 标。
部分中英文对照:
描述统计(Descriptives )
对于近似正态分布的资料,我们还可以通过Descriptives获取统计指 标。这是一组使用某法多次测定某水样中碳酸钙含量的数据,符从正态分 布,下面我们用Descriptives的方法计算这组数据的统计指标。
打开SPSS软件自带的数据demo.sav,找到car,这是一组 私家车价格的资料,我们将结合这组数据学习连续型定量资料 频数分布表和频数分布图的绘制。
变量视图
一般步骤
1.求极差 2.确定组段数和组距 3.根据组距写出组段 4.制作频数表和频数图
求极差
求极差
确定组段数和组距
1.极差:R=95.7≈100
定量资料统计描述
定量变量
定量变量可以分为两种类型: 1.离散型变量:只能取整数值,例如,一个月中的
手术病人数,一年里的新生儿数。
2.连续型变量:可以取实数轴上的任何数值,例如, 血压,身高,体重等。
统计描述
统计描述是通过绘制统计表、统计图 或计算相应的统计指标来说明资料的分布 规律及其数量特征,是进一步统计推断的
输出结果
探索分析(Explore )
探索分析(Explore )主要可以分为两个部分
1.未知分布类型数据的统计描述 2.对数据的分布形态进行检验
探索分析(Explore )
统计指标 正态性检验
正态性检验
探索分析(Explore )
四分位数间距
探索分析(Explore )
探索分析(Explore )
分类资料的统计描述及参数估计(预防医学)(精)
172665
172665
253
38
146.5
22.0
5
构成比(proportion)
概念:表示某一事物各组成部分所占的比重或分布的情况. 构成比通常以100%为比例基数.
计算公式:
构成比=
事物内某一构成部分的观察单位数 同一事物内部各构成部分的观察单位数总和
100%
例如:疾病和死亡顺位等 特点:各组成部分的构成比之和为100% 某一部分比重增大,则其它部分相应减少。
治愈率(%) 65.0 41.7 47.5
2018/9/23
19
率的标准化法
在两个及两个以上总率进行对比时,为 了消除内部构成的不同的影响,采用统一标 准,分别计算标准化率后再作对比的方法称 为率的标准化法.
未经标准化的率一般称为粗率,经过标准化 的率称为标准化率或调整率.
2018/9/23 20
两指标互不包含,可以是相对数,绝对数,平均数,可以性质不同,不 一定有相同的量纲 新生儿性别比=男性新生儿数/女性新生儿数 医护比=医生人数/护士人数
2018/9/23 8
动态数列(dynamic series)
指一系列按时间顺序排列起来的统计指标(包 括绝对数、相对数和平均数),用以说明事物 在时间上的变化和发展趋势。常用的分析指标 有绝对增长量、发展速度和增长速度、平均发 展速度与平均增长速度。
a10 = 1.141101200 = 4488(人次)
即根据该医院 2006-2014 年的平均发展速度,预 计到2016年该医院的日门诊量可达4488人次。
应用相对数时的注意事项
计算率时分子与分母的选择
分析时不能以构成比代替率
计算相对数时分母不能太小 平均率的计算:不能直接相加求和
医学统计学课件:分类资料的统计描述
交叉表是一种更为复杂的表格形式 ,可以展示两个或多个分类变量之 间的关系,进一步分析变量之间的 关联。
分层资料的统计描述
分层平均数
对于分层资料,可以使用分层平 均数来描述各层内数据的平均水 平,通过比较不同层的平均数,
可以了解各层之间的差异。
层间方差
层间方差是用来衡量不同层次间 的变异程度,通过计算和比较层 间方差,可以了解各层次之间的
辅助决策制定
准确的分类资料统计描述 能够为决策制定提供有力 支持,帮助决策者了解情 况、制定合理方案。
分类资料统计描述的应用场景
临床研究
在临床研究中,分类资料 统计描述常用于分析患者 的疾病分布、治疗反应等 。
流行病学
流行病学中,分类资料统 计描述用于分析疾病的地 区分布、人群特征等。
公共卫生
公共卫生领域中,分类资 料统计描述用于监测和评 估公共卫生状况、健康问 题分布等。
动态数的计算与解读
动态数的计算
动态数是用来描述某一指标在不同时间点上的变化情况,通常通过将某一指标在 不同时间点的数值进行对比来计算。例如,某医院某年的治愈率与前一年的治愈 率之比。
动态数的解读
动态数的值越大,说明该指标的变化趋势越明显;反之,则越小。动态数可以用 来预测未来的发展趋势,以及评估政策或措施的效果。
相对数与动态数的应用场景
相对数在医学研究中应用广泛,如比较不同地区、不同时间 、不同人群的发病率、患病率、死亡率等指标,以了解疾病 在特定人群中的分布和发生情况。
动态数在医学监测和流行病学研究中应用较多,如监测某种 疾病的发病率、死亡率等指标的变化趋势,以及评估干预措 施的效果等。
04
统计图表在分类资料中的应用
在制作箱线图时,应将数据按照数值 大小进行排序,并使用合适的横轴和 纵轴尺度。
分类资料的统计描述
各种疟疾的构成情况
1955年 类别 发病人数 恶性疟 间日疟 三日疟 合计 68 12 17 97 % 70 12 18 100 发病人数 21 12 17 50 % 42 24 34 100 1956年
疾病统计中常用的相对数指标
发病率(incidence rate):表示在观察期间内,可能
分类资料的统计描述
主要内容
相对数
掌握相对数的概念、计算和应用;
率的标准化
掌握率的标准化的基本思想; 掌握直接法进行率的标准化的基本步骤。
案例
《600例小儿烧伤休克期治疗分析》
600例烧伤患儿,210例早期有休克症状,其中 3岁以下者110例,占52%,3岁以上者100例, 占48%,年龄越小,休克发生率越高。
观察期间某病的现患病 例数 患病率= K 该期间的平均人口数
疾病统计中常用的相对数指标
死亡率(mortality rate):在一定人群中,死于某病的
频率,可用于反映一个地区不同时期人群的健康状况和 卫生保健工作的水平。
观察期间某病的死亡人 数 死亡率= K 该期间的平均人口数
病死率(fatality rate):表示一定时期内,患某病的全
构成比(proportion)
它说明整体和部分之间的关系,即某一事物的内部各
组成部分所占的比重或分布。
事物内部某一部分的观 察单位数 构成比= K 事物内部各部分的的观 察单位总数 构成比与率比较,有以下特点: 同一事物内部各组成部分的构成比之和一定是100%,, 即各分子之和等于分母。 某一组成部分的构成比改变时,其它部分必然发生相应 的改变,但率不受影响。
P= 8 10 2.18% 370 456
分类变量资料的统计描述
(二)标准化率的计算 1、选择标准人口
✓ 代表性的、内部构成相对稳定的较大人群 ✓ 要比较的两组资料内部各相应小组的观察单位数
相加,作为共同的标准 ✓ 两组中任选一组的内部构成作为标准
26
2、计算预期发生数 预期发生数=标准人口数×原发生率
表4-6 甲、乙两地用“标准人口数”计算标准化死亡率(1/10万)
2. 标准化的目的是在两个(或多个)总体率 比较时,采用统一标准消除内部构成不同 的影响。
30
3. 计算资料标准化率时各比较组应选用同一 标准。选用的标准不用,算得的标准化率 也不同。标准化率只反映资料的相对水平, 不代表实际水平,仅在比较时使用,原率 才能反映某时某地某现象的实际水平。
4. 样本标准化率同样存在抽样误差,若要进 行比较,应进行假设检验。
18
例:某医师对本院某年收治的1907例麻疹患者做了年龄 的分布描述,资料如下。该医生认为,1岁儿童的麻疹发 病率高于其他各年龄组,年龄越大,发病率越低。
某医院某年收治的1907例麻疹儿童的年龄分布
1. 该医生的分析是否正确? 2. 由上述资料可以得出什么结论?
19
率和构成比的区别:
1. 二者在概念和计算方法上都不相同,所得结论也不同 2. 率是说明某现象发生的频率或强度的 3. 构成比可以说明某事物内部各组成部分的比重或分布 4. 不能以构成比代替率。
术前中性白细胞构成比
= 术前中性白细胞计数 术前白细胞总数
= 4156 5800
100 %=71.66%
术前中性白细胞构成比是71.66%。
构成比的特点:
①各组成部分的构成比之和为100 %或1。 ②事物内部某一部分的构成比发生变化,其它
部分的构成比也相应地发生变化。
分类变量资料的统计描述
可能发生某现象的总数之比。用以说明某现 象发生的频率或强度。
常用率: 发病率、患病率、死亡率、病死
率、治愈率等。
率的计算方法
率
现象实际发生例数 可能发生某现象的总数
k
率
A( ) A( ) A( )
k
k为比例基数,常取百分率(%)、千分率(‰)、 万分率(1/万)、十万分率(1/10万)等。
计算公式:
构成比(%)
事物内部某一部分的个体数 事物内部各构成部分的个体数总和
100%
构成比(%)
A
100%
A B C
设某事物个体数的合计由A1,A2,· · ·,Ak个
部分组成,构成比的计算为:
构成比1
A1 A1+A2 +Ak
100%
…..构…成…比…2……A…1+A…2+A…2 . + Ak 100%
返 回
计划完成指标
: 定义 说明计划完成的程度,常用实际数达到计划数的百分之
几或几倍表示。
计算公式:
举例:
某县原计划在一个伤寒疫区周围的人群对1500名居民接种伤寒疫苗, 而实际上接种了1958人,计划完成指标为: (1958÷1500)×100%=130.5%,即完成了计划的130.5%,也可用倍数表 示,即完成计划的1.305 倍。
原则:①保留1~2位整数 ②惯例
例如:患病率通常用100% 、婴儿死亡率用1000‰、 肿瘤死亡率以10万/10万表示。
例 某医院1998年在某城区随机调查了 8589例60岁及以上老人,体检发现高血 压患者为2823例。
高血压患病率为: 2823 / 8589 100% = 32.87% 。
医学统计学考试重点
医学统计学考试重点简答 4-5个讨论分析1-2题计算 1-2题考试题型:名词解释10个选择20个填空题 20个绪论2选1总体:总体(population)指特定研究对象中所有观察单位的测量值。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
p值是将观察结果认为有效即具有总体结果?0.05被认为是有统计学意义代表性的犯错概率。
一般小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表 12现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
分类资料的统计描述
同性质的指标。
人中调查中使用的男女性别比例比。 某病年龄组发病率之比。 甲乙两地亩产量之比 医院管理中“医护人员与病床数”之比
动态序列:
(四)动态数列(dynamic series )
是一系列按时间顺序排列出来的统计 指标,用以说明事物在时间上变化和发展 趋势。常用的分析指标有:绝对增长量, 发展速度和增长速度。
甲指标 相对比 (或× 100%) 乙指标
【举例】 某市1977~1979年肺癌死亡率城区为
19.39/10万,郊区为9.99/10万,比较二者的严
重程度。
答: R= 19.39/9.99=1.94
即城区肺癌死亡率为郊区的1.94倍。
相对比
计算相对比的指标既可是相对数,也可是两个 绝对数或平均数。即可是同性质的指标,也可是不
检查人数 阳性人数 阳性率(%)
食管癌
胃癌 大肠癌 合计
8
9 12 29
8
6 7 21
100.0
66.7 58.3 75.0
【问题4-6】 (1)这是什么资料? 计算“阳性率”分母太小 (2)该表中有无不当之处? 合计率计算错误 (3)正确做法是什么?
结论 1
计算相对数的分母不易过小。 计算合计率或平均率时,不能把n个率相 加后除以n,应将绝对数相加后再求合计 率或平均率。
表5 甲乙两地各年龄组人口数和死亡率(‰)
甲 年龄组 人口数 0 5 20 40 60 合计 9300 12200 19000 7600 1900 50000 死亡率 57.2 3.6 5.3 12.1 40.0 16.19 人口数 4800 6600 35300 2800 500 50000 死亡率 72.9 4.6 7.2 14.2 46.0 13.90 地 乙 地
最新 分类资料统计描述与推断
P( X x)
k! e
k 0
x
k
(9.10)
4.Poisson分布具有可加性 如果相互独立的 k 个随机 变量都服从Poisson分布,则它们之和仍服从Poisson 分布,且均数为 k 个随机变量的均数之和。如果以较 小的度量单位观察某一现象的发生数呈 Poisson分布时, 把若干个小单位合并为一个大单位后,总计数亦呈 Poisson分布,其均数等于以较小的度量单位时的均数 之和。例如已知某放射性物质每10分钟放射脉冲数呈 Poisson分布,5次测量的结果分别为35,34,36,38, 34次,那么50分钟的脉冲数Σx = 35 + 34 + 36 + 38 + 34 =177次,亦呈Poisson分布。Poisson分布资料常利 用可加性原理使均数μ=λ≥20,以便用正态近似法处 理。
1
C310.6 1×0.4 2=0.288 C320.6 2×0.4 1=0.432
0.352
0.936
2
0.784
0.648
3
C330.6 3×0.4 0=0.216
1.000
0.216
注:*三例患者中治愈x例的概率函数为P3(x); **P(X≤x)为分布函数
3.二项分布的均数和标准差 记二项分布的总体阳 性率为π,π未知时,用大样本率 p 来估计π。 由式(9.1)推导出二项分布变量X的均数用绝对数表示 时的计算公式为:总体均数μ= E (X) Sp
p(1 p) / n
(9.8)
二、 Poisson分布 Poisson分布(Poisson distribution)是一种重要的离散 型分布。适用条件:① 两分类的资料;② 所考察的事 件发生率π(一般用大样本率p来估计π)很小,n很大, nπ(或np)为一不大的常数;③ 事件的发生是独立的, 如各病人的患病与否与他人无关。如人群中,对某种 物质中过敏的人数,遗传缺陷、癌症等非传染性疾病 的发病例数;又如大量产品中不合格品出现的次数; 用显微镜观察片子上每一格子内的细菌数;细胞发生 某种变化或细菌死亡的数目等等,都服从或近似服从 Poisson分布。Poisson分布可视为二项分布的特例。 Poisson分布常用于研究单位容积(或面积、时间)内稀 有事件发生数的规律。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
同 ቤተ መጻሕፍቲ ባይዱ 事 物 各 组 观成 察部 单分 位 1的 总 0% 0数
h
8
特点: (1)各个组成部分的构成比之和应为100%; (2)事物内部各组成部分之间呈此消彼长的
关系。
h
9
某 种 死 因 占 死 亡 数比 构 成
因某种死因死亡人数
总死亡人数 100%
h
12
(二)分析时不能以构成比代替率。
构成比只能说明某事物内部各组成部 分的比重和分布,不能说明这事物某一部 分发生的强度与频率。
h
13
(三)应分别将分子和分母合计求合计率
(四)要注意资料的可比性
用以比较的资料应是同质的,除了要比较的 处理因素外,其它条件应基本相同。对于不同时期 、地区、条件下的资料应注意是否齐同。
K
公式(4.1)中的“比例基数”
K
主要依据习惯用法或使计算结果
保留一位或二位整数,以便阅读。
死 医学中亡 常用率 的同 率的某 年 计算年 公年 式死 :平亡 均总 人 1数 0口 0‰ 0数
h
5
某病死亡专率
某 同
年某病 年年平
均 死人 亡 100 口 人 0/0 数 数 100万
某病病死率 某期间因某病死亡人数
2. 取比较各组的各层例数的合计为标准构成。
3. 从比较的各组(如各地区)中任选其一的构成作 为标准构成。
h
20
三、注意事项
1.标准化率是通过选择同一参照标准而计算的,目 的是为了消除因年龄构成不同等混杂因素的影响 ,从而达到可比性。但标准化率并不代表真实的 死亡(或患病、发病)率水平,而是相对水平。 选择的标准不同,计算出的标准化死亡(或患病 、发病)率也不同,但标准化率的大小关系并不 改
h
16
率的标准化法的基本思想:就是采用统一的标 准人口或人口构成作为参照,以消除因人口年龄、 性别等因素构成不同对总率的影响,以增强可比性 。
标准化法的目的:在于控制混杂因素对研究结 果的影响。
混杂因素:是指与研究因素有关并对研究结果 产生影响的非研究因素。
h
17
二、标准化率直接法的计算
标准化率( ) p直 接法的计算
h
10
三、相对比
相对比(relative ratio),是两个有关的 指标之比,用以描述两者的对比水平。两个指 标可以是绝对数、相对数或平均数;可以性质 相同,也可以性质不同。常用R表示。其计算公 式如下:
(4R.3)
A指标 B指标
h
11
第二节 应用相对数的注意事项
(一) 计算相对数尤其是率时应有足够数量的观 察单位数或观察次数。 分母过小时相对数不稳定。在观察例数较小时, 直接用绝对数表示。如“5例中4例有效”,而不 要写有效率为80%,以免引起误解。
第四章 分类资料的统计描述
h
1
绝对数:只能表示某事物在某时、
某地发生的实际水平。
相对数:便于相互比较与分析。
例:甲、乙两地麻疹流行,
甲地发病300人
绝对数
乙地发病250人
甲>乙
但不能据此确定甲地麻疹流行
较为严重,需考虑易感人数。
h
2
若甲地易感人数3000人 乙地易感人数1000人
则甲地麻疹发病率=300/3000=10% 乙地麻疹发病率=250/1000=25% 相对数 乙>甲
同期该病的患病人 1数 00%
h
6
某年龄组死亡率
某 年 某组 年 死龄 亡 人 数 同 年 同组 年 年龄 平 均 人 1口 00 ‰ 0 数
治 愈率 接治 受愈 治病 疗人 病 数 1人 0% 0数
h
7
二、构成比 构成比(Constituent ratio)表示事物内部各
个组成部分所占整体的比重,通常以100%为比例基 数,以百分比表示,计算公式如下 :
h
21
变。实际的死亡(或患病、发病)率
水平应用未标化的死亡(或患病、发病)率来反映 。
2.样本的标准化率是样本指标,亦存在抽样误差, 若要比较其代表的总体标准化率是否相同,同样 需作假设检验。
h
22
公式如下 :
1.已知标准组年龄别人口数时:
p Nipi Nipi
Ni
(N 4.4)
h
18
2.已知标准组年龄别人口构成时:
p (4NN .5i)pi
h
19
标准组选取方法有三种:
1. 选取一个包含比较各组(如各地区)的有代表性 的、较稳定的、数量较大的构成为标准。如世界的 、全国的、全省的或本单位历年积累的数据为标准 构成。
h
14
(五)样本率或构成比比较时应作假设检验
由于样本率或构成比也存在抽样误差,因此不 能根据样本率或构成比的差别作结论,而应进行样本 率或构成比差别比较的假设检验 。
h
15
第三节
标准化
一、标准化法的意义
率的标准化(standardization)是为了在比较 两个不同人群的患病率、发病率、死亡率等资料时, 消除其内部构成(如年龄、性别、工龄、病程长短等 )的影响。如年龄影响死亡率,年龄越大,死亡率越 可能大;病情过重,越难治愈。治愈率就越低。从表 4.4可以看出内部构成对总率的影响。
h
3
第一节 一、率
常用相对数
率(rate)是表示某种现象发生的频率和强度 ,常以百分率(%),千分率(‰),万分率(/ 万),十万分率(/10万)等表示,计算公式为 :
率
某某 事事 物物 或或 现现 象 (象 发 有 4.1发 际 )生 可 生 数 的 能 的 比 所 数 实 例基数
h
4
率
A A A