《医学统计学》统计描述 (2)
医学统计学描述
分位数X*是介于x1(最小值)与xn(最大值)之间的 一个数值,它使得n个数据中的一部分观察值小于 或等于它,另一部分观察值大于或等于它。
x1
X*
xn
精选课件
13
如果将顺序排列的一组数据分为q个相等频数 的区间(即每个区间中有相同的数据个数),这 时共有q-1个分位点,则称这些分位点为q分位数。
精选课件
3
步骤:
求全距 R=max-min= 278.8-97.5=181.3
定组数 K 通常取8~15组为宜。本例取K=10.
求组距 I=R/K (注意取整)。 本例I=181.3/10=18.13≈20
制表
确定各组段的下限、统计各组段内的频 数、算出各组段的频率、累计频数、累计 频率,将所得数据填入表中。
1)全距: R=MAX-MIN 2)四分位数间距 :上下四分位数之差
Q=Q3-Q1
称为四分位数间距。
精选课件
22
3).方差
n 2
S2
1 n n1i1
(xi
X)2
n11in1
xi2
xi i1
n
4).标准差
S
1n n1i1 (xi
X)2
1
n
n1i1
xi2
n
xi
i1
n
2
5).变异系数
n
定义式: Gn xi i1
对 数 式 : Glg11ni n1lgxi
加 权 对 数 式 : Glg11 n flgx
精选课件
10
例2 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16, 1:32,1:32,1:64, 1:64,1:128,1:512。试计算其几 何均数。
医学统计学-第二章 统计描述
1. 首先对资料作分布类型的判定; 2. 针对分布类型先用合适的指标描述:
均值、标准差;常记录为 X S
中位数、四分位间距; 常录为M(Ql, Qu)
一、集中趋势:用于描述一组计量资料的集中位置, 说明这种变量值大小的平均水平(average)表示。
频 数
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
(三)频数表的用途:
1.揭示频数的分布特征
频 数
分布 特征
身高(cm)
图3.1 某市100名8岁男童身高(cm)的频数分布
集中趋势
(central tendency)
离散趋势
(tendency of dispersion)
集中趋势与离散趋势结合能全面反映频数的分布特征
2.揭示频数的分布类型
对称 分布
频数 分布
正偏
非对称 分布
负偏
集中部位在中部,两 端渐少,左右两侧的
基本对称,为对称 (正态)分布。
集中部位偏于较小 值一侧(左侧),较大 值方向渐减少,为
正偏态分布。
集中部位偏于较大 值一侧(右侧),较 小值方向渐减少,
为负偏态分布。
(2) 定量资料的描述指标
描述指标: 集中趋势:
累计频数 (4) 1 6 14 31 54 75 89 96 99 100 100
累计频率 (5) 0.01 0.06 0.14 0.31 0.54 0.75 0.89 0.96 0.99 1.00 1.00
频数分布图(frequency distribution figure) :
根据频数分布表,以变量值为横坐标,频数为纵坐 标,绘制的直方图。
医学统计学课后习题答案解析
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学2. 定量数据的统计描述
S 48984 6982 /10 5.41 10 1
5. 变异系数(CV)
变异系数,标准差和均数比值,多用于观察 指标单位不同
如身高与体重的变异程度的比较;或均数 相差较大时,
如儿童身高与成人身高变异程度的比较。
如何有效地组织、整理和表达数据的信息?
浙江中医药大学考试成绩登记表
1. 频数表
频数表:同时列出观察指标的可能取值区间及 其在各区间内出现的频数。
2.频数图
直观、形象地表示频数分布的形态和特征。
频数表制作过程
1.确定组数k:通常选择在8~15之间 2.确定组距: 参考组距为R/k , R为全距 3.确定组限 : 应符合专业习惯 4.确定频数:划记或由软件完成
一端或两端存在着无确切数值的资料。
举例
如由例2.4 算出,50岁~60岁正常女性血清甘油
三脂含量的百分位数P75和P25的位置分别为63.2
mg/dl和135.7 mg/dl,则 :
Q 135.7 63.2 72.5(mg/dl)
3. 方差 (Variance)
为了利用每个观察值的信息,可计算平均偏差
常值 可用各组段的频率作为概率的估计值
用途:考察分布的类型
对称分布 :
若各组段的频数以频 数最多组段为中心左右两 侧大体对称,就认为该资 料是对称分布
如:人体一些生化指标 (血清总胆固醇)、身 高、体重等的分布
偏态分布 :
1)正偏态分布: 高峰左偏,频数向右侧
拖尾
如:人体中一些重金属 (发汞、尿铅)的分布, 血清转氨酶等。
S CV 100%
X
例2-8
《医学统计学》计算题答案
《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
《医学统计学》第四章定性资料的统计描述
1、不要把构成比与率相混淆。即分析时不能以构成 比代率;这是常见的错误。
某文章作者根据上述资料认为,沙眼在20~组的患病率最高,以后随年 龄增大而减少。该作者把构成比当作率进行分析,犯了以比代率的错误。
2、使用相对数时分母不宜过小。分母过小时相对数 不稳定。
3、注意资料的可比性;
不同时期、不同地区、不同条件下的资料比较时应注意具有 可比性。
12965.2
46.3
否
265
660291.4
40.1
说明该地市区非吸烟女性饮酒者的肺癌发病率是
非吸烟女性不饮酒者的1.15倍。
3.比数比
比数比( Odds ratio ,OR) : 常用于流行病学
中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为
一般的,两个地方的出生率、死亡率、发病率、不同级别 医院某病的治愈率等不能直接比较。
无可比性的实例:
由表2-7可见,无论有无腋下淋巴结转移,省医院的5年生存 率均高于市医院,但从总生存率看,省医院的5年生存率低于市 医院。这不符合常理。因此,省医院与市医院的总生存率就不能 直接比较(标准化后再比)。
感谢聆听
率
某事物或现象发生的实 际数 某事物或现象发生的所 有可能数
比例基数
公式中的“比例基数”通常依据习惯而定。
需要注意的是,率在更多情况下是一个具有时间 概念的指标,即用于说明在某一段时间内某现象 发生的强度或频率,如出生率、死亡率、发病率 、患病率等,这些指标通常是指在1年时间内发 生的频率。
例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则
《医学统计学》第1-2章
常用平均数的意义及其应用场合
平均数
意义
应用场合
均数 平均数量水平
几何均数 平均增减倍数
中位数 位次居中的观 察值水平
应用甚广,最适用于对称分布, 特别是正态分布
①等比资料;②对数正态分布 资料
①偏态资料;②分布不明资料; ③分布一端或两端出现不确定 值
22
1. 均数 (mean):
, X
应用:正态分布或近似正态分布的定量资料。
女 B 14.67 37.8
疗效
显效 有效 有效 无效
男B
16.80
37.6 无效
标识变量
用于数据管理
分析变量-表示试验效应或观察结果大小的
分组变量
变量或指标
反应变量
5
处理 复方哌唑嗪 复方降压片 安慰剂
合计
表 3.8 三种药物治疗高血压的疗效
有效
无效
合计
有效率(%)
35
5
40
87.50
20
10
30
15
定量资料的频数表和频数图(直方图)
表2.2 某市120名5岁女孩 身高频数表
组段(cm)
频数(f)
95-
1
98-
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
图2.1 某市城区120名5岁女孩身高频数分布
16
1、 频数分布的特征
如何选用正确的统计指标描述一个定量 资料?
14
第一节 频数分布
第二章 统计描述习题 医学统计学习题
第二章统计描述习题一、选择题1.描述一组偏态分布资料的变异度,以()指标较好。
A.全距B.标准差C.变异系数D.四分位数间距E.方差2.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对3.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距E.方差4.为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的最佳指标是()。
A.标准差B.标准误C.全距D.四分位数间距E.变异系数5.测量了某地152人接种某疫苗后的抗体滴度,宜用()反映其平均滴度。
A.算术均数B.中位数C.几何均数D.众数E.调和均数6.测量了某地237人晨尿中氟含量(mg/L),结果如下:尿氟值:0.2~0.6~ 1.0~ 1.4~ 1.8~ 2.2~ 2.6~ 3.0~ 3.4~ 3.8~频数:7567302016196211宜用()描述该资料。
A.算术均数与标准差B.中位数与四分位数间距C.几何均数与标准差D.算术均数与四分位数间距 E.中位数与标准差7.用均数和标准差可以全面描述()资料的特征。
A.正偏态资料B.负偏态分布C.正态分布D.对称分布E.对数正态分布8.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位数间距9.血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术平均数B.中位数C.几何均数D.变异系数E.标准差10.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距E.几何均数11.现有某种沙门菌食物中毒患者164例的潜伏期资料,宜用()描述该资料。
A.算术均数与标准差B.中位数与四分位数间距C.几何均数与标准差D.算术均数与四分位数间距 E.中位数与标准差12.测量了某地68人接种某疫苗后的抗体滴度,宜用()反映其平均滴度。
医学统计学 第二章 计量资料的统计描述
肌红蛋白含量
人数
0~
2
5~
3
10~
7
15~
9
20~
10
25~
22
30~
23
35~
14
40~
9
45~50
2
18
人数
25 20 15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
医学统计学 第二章 计量资料的统计 描述
计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值:
X1,X2,X3,……,Xn
n为样本例数(样本大小、样本含量)
2
统计描述——描述其分布规律 1、用频数分布表(图)
要求:大样本 如 n〉30
2、用统计指标 描述 集中趋势 离散趋势
6
➢制表步骤 了解分布
1. 求极差(range) 极差也称全 距,即最大值和最小值之差,记作R。 本例
R 5 .7 1 2 .3 5 3 .3 6 ( m m o l/L )
7
2.确定组距(i) :
组段数通常取组 10-15组 本例组距
i 3 .3 6 /1 0 0 .3 3 6 0 .3 0
累计频率(%) (4)
0
402
402
35.80
1
330
732
65.18
2
232
964
85.84
3
118
1082
96.35
4
27
《医学统计学》第二章定量数据的统计描述
累积频数
(3) 27
196 363 457 538 580 608 622 626 629 630
-
累积频率(%)
(4) 4.29 31.11 57.62 72.54 85.40 92.06 96.51 98.73 99.37 99.84 100.00
资料如表,试计算其中位数。
某地630名正常女性血清甘油三酯含量(mmol/L)
甘油三酯(mmol/L)
(1) 0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~ 3.10~
合计
频数
(2) 27 169 167 94 81 42 28 14 4 3 1
练习
例 8名食物中毒患者的潜伏期分别为1,4,3,3,2,5,8,16小时,
求中位数。
n=8,为偶数
M
1
2
(
x (
8 2
)
x (
8
1)
)
2
1 2 ( x4
x5 )
1 3 4
2
3.5(小时)
例 某传染病11名患者的潜伏期(天)分别为1,3,2,2,3,7,5,6,
4,7,9,求中位数。
n=11,为奇数 M xn1 2 x(111) x6 4(天 ) 2
偏态分布
正偏态 负偏态
正偏态:集中位置偏向数值小的一侧 负偏态:集中位置偏向数值大的一侧
医学统计学(第7版)
正 态 分 布
医学统计学(第7版)
正偏态
集中位置偏向 数值小的一侧
负偏态
集中位置偏向 数值大的一侧
(麻疹年龄分布)
(肺癌年龄分布)
《医学统计学》习题解答(最佳选择题和简答题)
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
医学统计学定量数据的统计描述
方差和标准差
方差
一组数据与其平均值偏差的平方和的平均数。
标准差
一组数据各数值与其平均值的差的平方和的平均数 的平方根。
正态分布和偏态分布
1 正态分布
一组数据的分布符合正态曲线,均值、中位数和众数都在同一位置。
2 偏态分布
一组数据的分布不符合正态曲线,左右两侧的数据出现“偏斜”。
频率分布表和直方图
医学统计学定量数据的统 计描述
这个演示文稿将介绍医学统计学中定量数据的基本统计指标和统计描述方法, 为您提供更深入的理解。
医学统计学的介绍
1 定义
医学统计学是一门研究医 学数据的统计量和结果的 学科。
2 目的
通过数据分析,帮助医学 研究者更好地了解疾病的 特点和分布规律,指导医 学决策和治疗方案。
假设检验和t检验
1 假设检验的基本原理
通过样本数据推断总体参数是否符合某个假 设条件。
2 单样本t检验
一种假设检验方法,用于检验某个样本的均 值是否符合总体的规律。
3 多样本t检验
用于比较两组及以上样本的均值是否存在显 著差异。
4 配对t检验
用于比较同一组样本在两个不同时间或条件 下的差异。
方差分析和回归分析
3 应用
医学统计学应用广泛,包 括临床试验、流行病学调 查、疫情监测和医疗卫生 管理等领域。
基本统计指标
均值
一组数据的平均值,即所有数 值相加后再除以数据的个数。
中位数
一组数据中,位于中间位置的 数值。当数据个数为偶数时, 中位数为中间两个数的平均值。
众数
一组数据中出现次数最多的数 值。可能有多个众数。
频率分布表
一种展示数据分布的表格,包括数值范围、频 数、频率和累计频率等。
《医学统计学》考试试题及答案(二)
1第一套试卷及参考答案一、选择题 (40 分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C 线图 D 直方图2、均数和标准差可全面描述 D 资料的特征A 所有分布形式 B负偏态分布 C 正偏态分布 D 正态分布和近似正态分布 3、要评价某市一名 5 岁男孩的身高是否偏高或偏矮,其统计方法是( A )A 用该市五岁男孩的身高的 95%或 99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的 95%或 99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的 10 倍,该指标为( A )(A )相对比 (B ) 构成比 (C )定基比 (D )率 7、统计推断的内容为( D )A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A 和 B 均不是D. A 和 B 均是8、两样本均数比较用 t 检验,其目的是检验( C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为 n 1 和 n 2,在进行成组设计资料的 t 检验时,自 由度是( D ) (A ) n 1+ n 2 (B ) n 1+ n 2– (C ) n 1+ n 2 +1 (D ) n 1+ n 2 -210、标准误反映( A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小 B垂直距离最小 C纵向距离的平方和最小 D 纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
02定量数据的统计描述(医学统计学)
累积频率(%)
4.3
31.1
57.6
M
72.5 85.4 92.1 96.5 98.7 99.4 99.8
100.0 -
思考
三组白鼠体重情况 甲组:26 28 30 32 34 乙组:24 27 30 33 36 丙组:27 28 28 32 35
X甲 X乙 X丙
三组体重的离散程度?
方差( variance )是将离均差平方和再取平均, 即
平均数(average):描述一组变量值的集中位置或 平均水平的指标。
常用的平均数有(算术平)均数、几何(平)均数、中 位数。
不同的分布使用不同的平均数。
一、算术均数
应用:主要适用于单峰对称分布或偏斜度不 大的资料,尤其适合正态分布资料。
例2-3 测得8只正常大白鼠总酸性磷酸酶含量(U/L) 为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。 试求其算术均数。
变异系数(coefficient of variation):用于对均数相
差较大或单位不同的几组观察值的变异程度进行比较。
例3.3 测得某地成年人舒张压均数为77.5mmHg,标准差 10.7mmHg;收缩压均数为122.9mmHg,标准差为 17.1mmHg。试比较舒张压和收缩压的变异程度。
例: 某地120名7岁男孩身高的均数为 123.10cm,标准差为4.71cm;体重均数为 22.29kg,标准差为2.26kg,比较其变异度。
频数
27 169 167
94 81 42 28 14
4 3 1 630
累积频数
27 196 363 457 538 580 608 622 626 629 630
打印第四部(实习指导第页)《医学统计学》实习指导(第页)
实习指导实习一统计表与统计图计量资料的统计描述(一)统计表与统计图一、目的要求:掌握统计表的结构与制表的基本要求,掌握绘制统计图的基本要求及常用统计图的绘制方法,熟悉统计表与统计图的用途,了解统计表和种类。
二、时间安排:1学时三、内容:1.选择填空题:A.散点图 B.条图 C.百分条图或圆图 D.线图 E.直方图(1)描述某地1975-1980年肝炎发病率的变动趋势,宜绘制。
(2)分析胎儿不同出生体重(kg)和围产儿死亡率的关系,应绘制。
(3)比较甲、乙、丙三地某两种传染病的发病率时,应绘制。
(4)某地调查的863例恶性肿瘤死亡者,分别由省、市、县、乡医院最后确认,说明各级医院确认比例,应绘制。
(5)描述某地某年210名健康成人发汞含量的分布,宜绘制。
2.某县防疫站1972年开始在城关建立“预防接种卡”,使计划免疫得到加强。
为说明效果,1975年5月观察了482人的锡克氏试验反应。
其中:幼儿园101人,阳性21人,阳性率20.8%;小学生145人,阳性22人,阳性率15.2%,中学生236人,阳性15人,阳性率为6。
4%,相比起来,1974年为;幼儿园儿童144人,阳性15人,阳性率10.4%,小学生1417人,阳性323人,阳性率为22.8%;中学生为359人,阳性率为11.5%;试用适当的统计表和统计图描述上述结果。
3.某年某公社生产大队的新病例数统计结果如下,用图表示各生产大队的新发病比例。
表1-1 某年某公社各生产大队新病例统计例数百分比(%)第一生产队320 33.0第二生产队234 24.2第三生产队415 42.8合计969 100.04.下表是某地1968-1974年男妇结核病死亡率变动情况,试绘制成统计图表1-2 某年1968-1974年男女结核病率(1/10万)年份男性女性1968 50.19 37.541969 42.97 25.001970 45.37 27.881971 44.42 25.101972 35.59 24.081973 38.31 24.101974 25.29 16.005.根据表3资料绘制适当的统计图。
医学统计学统计描述
缺点:仅考虑两端数据的差异,未考虑其它数据的变异情 况,不能全面反映一组资料的离散程度,受样本含量n的 影响较大,且不稳定,易受极端值的影响。
四分位数间距(inter-quartile range)
▪ 定义:把全部变量值值分为四等分的分位数,其
分位数。它是一个位置指标。 Px ▪ 中位数是第50百分位数,用P50表示。 ▪ 第25,第75,第95百分位数记为P25, P75, P95
是统计学上常用的指标。
百分位数(percentile)
▪ 百分位数(percentile)
X%
PX
(100-X)%
▪ 50%分位数就是中位数 ▪ 25%,75%分位数称四分位数(quartile)
方差(variance)
▪ 定义:离均差平方和的均数 ▪ 表示法:总体方差用2表示;样本方差用
S2表示
▪ 计算公式:
▪ 意义: 方差值越大,说明变异程度越大。
▪ 特点:包括了每个变量值与均值的差异,
但该指标的单位为平方。
标准差(standard deviation, sd) :
▪ 定义:方差开平方,取平方根的正值,每
▪ 例 对于某项风险较高的新手术术后的生存 时间进行跟踪,共调查了7人, 6人死亡之 前分别生存了5天、6天、10天、16天、25 天、29天,还有一人术后30天随访时仍存 活。
▪ 本资料属于“开口”资料。
▪ 本例数据已经按从小到大的升序排列,n=7, 为奇数,其中位数为16天。
2. 频数表法(n较大,已编成频数表)
62.05
1 3 1
79.00 72.25
409.75 4.06(mmol / L) 101
医学统计学——统计描述
布为最常见的一种。
偏态分布:正偏态分布—儿童疾病年龄分布;负偏态分布— 老年疾病年龄分布。
对称分布
频数分布高峰位于 中部,左右两恻的 频数大体对称。
正偏
偏态分布
负偏
生物医学研究的统计方法 第2章
高峰偏于左侧, 长尾向右侧延伸, 则为正偏态
高峰偏于右侧,长 尾向左侧延伸,则 为负偏态。
G lg 1(lg X1 lg X 2 ... lg X n ) lg 1(
lg X )
n
n
例3.2 设有5份血清样品,滴度分别 为:1:1, 1:10, 1:100, 1:1000, 1:10000 求其平均滴度。
G= 5 110100100010000 100
或G=lg-1((lg1+lg10+lg100+lg1000+lg10000)/5) =lg-1((0+1+2+3+4)/5) =lg-12 =100
中位数、算术均数和众数的关系
正偏态分布
对称分布
众数 中位数 算术均数
众数 中位数 算术均数
负偏态分布
算术均数 中位数 众数
三、离散趋势指标
极差(Range, R) 四分位数间距(Quartile,Q) 方差(Variance) 标准差(Standard deviation)
(一)、极差(Range, R)
潜伏期(小时) 频数 f 累计频数 累计频率(%)
①
②
③
④
0—
21
21
15.24
12—
58
79
48.17
24—
《医学统计学》考试试题及答案大全02
(A)95%
(B)49.5% (C)99%
(D)97%
11.两样本均数间的差别的假设检验时,查 t 界值表的自由度为 C
(A)n-1
(B)(r-1)(c-1)
(C)n1+n2-2
(D)1
12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A
(A)总体中个体值存在差别
(B)样本中个体值存在差别
(C)样本只含总体的一部分
(D)总体均数不等于0
13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错
误最小 B
(A)α=0.05 (B)α=0.20
(C)α=0.01
(D)α=0.10
14.比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制 C 。
(A)线图 (B)条图 (C)半对数线图 (D)圆图
20.同一双变量资料,进行直线相关与回归分析,有 B
(A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b
二、填空题 12分
1、 统计资料按其性质不同,通常将资料分为 (计量、计数、等级 ) 三 种类型。 2、 统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四
答:不能,因为 P 值的大小与总体指标间差异大小不完全等同。P 值的大 小除与总体差异大小有关,更与抽样误差大小有关,同样的总体差异,抽 样误差大小不同,所得的 P 也会不一样,抽样误差大小实际工作中主要 反映在样本量大小上。
五、计算分析题
1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。
4
33.3
4
33.3
合计 72
《医学统计学》资料整理:statistical chart(实验课2)
表2-9 某省某工厂 1994、1998年四项检测指标异常检出率
检测
1994年
指标 受检人数 异常人数 检出率(%)
血压 519
55
10.16
心率 519
44
0.48
TTT 519
36
6.94
GPT 519
20
3.85
受检人数
582 582 582 582
1998年
异常人数 检出率(%)
38
6.52
统计图表
第四节 统计图表
统计表(statistical table)——数据代 替文字描述,便于统计结果的精确、简洁的表 达和对比分析
统计图(statistical chart)——用图形 代替数据,获得直观、形象的效果
2020年9月12日
定义: 将统计分析的事物及指标
用表格列出。 特点: 1.避免长篇文字叙述,便于 阅读和对比分析。 2.数据具体。
图2-10 直条图的纵轴尺度起点必须为零示意图
2020年9月12日
(2)圆图(pie chart)
圆图:用于表达事物内部的百分构成比大小。
➢各个扇形面积(3.6°)的大小反映了各组成部 分百分比(1%)的大小。
➢从12点钟处开始绘制,顺时针方向排列。
2020年9月12日
2002年某医院1402例孕妇分娩结果
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ××. ××
┋ ┋ ××. ××
备注:
2020年9月12日
2. 统计表的种类
根据分组标目的复杂程度,统计表可大致分为简单表 和复合表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
36 104 140
疾 病 组 的 暴 露 比 数 a / c 34 88
OR
93.5(倍 )
对 照 组 的 暴 露 比 数 b / d 2 16
(二)比率(proportion)
比率(P57): 分子分母都是绝对数,且分子必须是分
母的一部分。无量纲,[0,1] 。
1.率(rate)(强度相对数)
住院号 2025655 2025653 2025830 2025677 2025647 2025848 2019915 2025861 2024601 2000386
年龄 27 22 25 24 30 32 27 29 25 26
职业 无 无 管理人员 知识分子 管理人员 无 无 无 农民 无
文化程度 中学 小学 大学 中学 大学 小学 中学 大学 中学 小学
( 表 5-3 ) 进 行 了 分 析 , 得 出 40~49 岁 组 患 病 率 高 , 0~9岁组和70岁及以上组患病率低的结论。
1、不能以构成比代替率。 2、计算相对数的分母不宜过小。小则 直接叙述。 3、进行率的对比分析时,应注意资料 可比性。如 比较疗效时,比较组间应 病情轻重相同,性别影响,应按性别 分组后再作比较。
第三节 计数资料的常用 统计指标
一、计数资料的数据整理
二、常用相对数指标
三、应用注意事项
计数资料(分类资料): 总体:有限或无限个定性(分类)变量值
样本:从总体中抽取的n 个定性(分类)变量值
整理为:分类个体数,即:计数资料频数表
绝对数
一、计数资料的数据整理
计数资料:按某种属性分类,然后清点每类 的数据(以下是:孕妇分娩资料)
(1)观察对象是否同质,研究方法是否相同,观 察时间是否相等,以及地区、周围环境、风俗习惯 和经济条件是否一致或相近等。
(2)观察对象内部结构是否相同,若两组资料的 年龄、性别等构成不同,可以分别进行同年龄别、 同性别的小组率比较或对总率(合计率)进行标准 化后再作比较。
表5-4 甲、乙两种疗法治疗某病的治愈率比较
分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 工人 管理人员 农民 商业服务 无 知识分子 总计
18
2
0
0
0
3
0
5
20
9
2
22 28
7
24 50
34
26 50
43
28 34
35
2 两个率之比:如相对危险度(RR)。
R p1
p 2
例 如某地某年龄组男性吸烟和非吸烟的冠心病
死亡资料如表7-2,试分析其相对危害度。
表7-2 某地某年龄组男性吸烟和非吸烟的冠心病死亡资料
吸烟组
非吸烟组
死
亡
数
104
12
观察人年数
43248
10673
死 亡 率 ( 1/10 万 人 年 )
240.5
相对数:两个有联系的指标之比,常用的相对数有: 一、相对比 二、比率 三、速率
(一)相对比
相对比简称比,是两个有关指标之比,说明 两指标间的比例关系。
计算公式为
A指标 R
B指标
式中两指标可以是绝对数、相对数或平均数。
1 两个绝对数之比:
A 类发生例数 R
B 类发生例数
如某年某医院出生婴儿中,男性婴儿为370人, 女 性 婴 儿 为 358 人 , 则 出 生 婴 儿 性 别 比 例 为 370/358×100 = 103,说明该医院该年每出生100 名女婴儿,就有103名男性婴儿出生,它反映了男 性婴儿与女性婴儿出生的对比水平。
30 11
14
32 14
2
34
4
2
36
2
1
38
3
1
40
0
0
合计 207 141
6
10
18
0
45
10
24
70
11
150
28
52
153
44
361
25
45
133
70
366
10
34
78
57
248
11
22
39
17
114
3
14
24
3
60
5
பைடு நூலகம்
3
12
2
28
1
4
5
1
14
1
0
2
1
8
2
0
0
0
2
102
208 537 206 1401
11 2 .4
240.5
R
2.139
112.4
说明男性吸烟组的冠心病死亡率是非吸烟组的2.139倍。
3 两个相对比之比:如流行病学常用的比数比(OR)。
例 服用反应停与肢体缺陷关系病例对照研究资料如表7-3所示:
服用反应停
畸形儿组
对照组
合计
有 无 合计
34(a) 16(c) 50
2(b) 88(d) 90
2.构成比(proportion):
表示事物内部某一部分的个体数与该事物 各部分个体数的总和之比,用来说明各构成 部分在总体中所占的比重或分布。
通常以100%为比例基数。其计算公式为
某一组成部分的观察单位数
构成比
100%
(
同一事物各组成部分的观察单位总数
如:教研室16人高级职称有4人,占
25%;中级职称有8人,占50%;初级职
P58 例4-14
三、应用注意事项
表5-3 口腔门诊龋齿患者年龄构成
年龄组(岁) 患者人数
患者构成比(%)
0~
9
3.8
10~
36
15.3
20~
34
14.4
30~
37
15.7
40~
45
19.1
50~
39
16.5
60~
21
8.9
70~
15
6.3
合计
236
100.0
例如某医师对口腔门诊不同年龄龋齿患病情况
说明某现象或某事物发生的频率或强度。
率=(实际发生数/可能发生总数)×比例基数 如:治愈率、病死率、阳性率、人群患病率等
比例基数:100%、1000‰、10000/万、100000(1/10万) 等 (按习惯,使结果保留1-2位整数)
例如:患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以 十万分率表示。
称有4人,占25%。
构成比有两个特点:
(1)说明同一事物的k个构成比的总和应 等于100%,即各个分子的总和等于分母。
(2)各构成部分之间是相互影响的,某 一部分比重的变化受到两方面因素的影响。 其一是这个部分自身数值的变化,其二是 受其它部分数值变化的影响。
(三)速率(rate):
P58 分母中含有时间量纲。
二、常用相对数
绝对数:通过调查或实验得到的原始数据。如某病的出院人数、治 愈人数、死亡人数等。 但绝对数通常不具有可比性: 1. 如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡 人数没有意义 2. 如2007级附一、附二、附三三个临床学院人数不同时,比较各班 医学统计学的及格人数没有意义 因此需要在绝对数的基础上计算相对数