医学统计学课件:02_统计描述(定量定性)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

频数表的用途
1.揭示计量资料的分布特征(是否正态分布)
2.描述计量资料分布的集中趋势和离散趋势
3.便于发现某些特大或特小的可疑值
4.当样本量较大时,各组段的频率可作为概率的估计值
图示描述 ----频数分布图
Graph of frequency distribution
频数分布图-直方图
正态分布
价、某些物质的浓度等。用G来表示。
直接计算法
几何均数:变量 对数值的算术均 数的反对数。
例2.2 测得5个人的血清滴度的倒数分别是2,4,8,8,32,求
lg 2 lg 4 lg 8 lg 8 lg 32 G lg 1 7 5
平均滴度.
则:5份血清滴度的平均水平是1:7
2003年4月22日全国SARS发病人数频数表
发病地区 北京 山西 广东 河北 内蒙 天津 广西 其他省市 频数 105 16 14 6 3 2 1 0 频率/% 71.4 10.9 9.5 4.1 2.0 1.4 0.7 0.0 累积频数 105 121 135 141 144 146 147 147
18 16 14
25
12
病例数
10 8 6 4 2 0 12 24 36 48 60 72 84 96 108 120 潜伏期(h)
20 15
人数
10 5 0 0 5 10 15 20 25 30 35 40 45 50 肌红蛋白含量(ug/mL)
图2-2 59名链球菌咽喉炎患者的潜伏期(h)
图2-3 101名正常人的血清肌红蛋白含量
中位数(median,M)
将一组观察值从小到大按顺序排列,居于中心位置 的数值。在全部观察值中有半数的值比M大,另有半数 的值比M小。 适用于当大部分观测值比较集中,少数观测值偏向 一侧时;或资料分布情况不清楚时;或数据的最大值
(最小值)无准确测量数据时。如传染病的潜伏期。任
何分布的定量数据均可用中位数描述其分布的集中趋势, 使用范围广。
2 3.90 6 4.10 11 4.30 2 5.70 1 5.90 4.78 1012 / L 140


几何均数(geometric mean,G)
适用于明显呈偏态分布的资料,观察
值间按倍数关系变化的资料,观察值间不
能有0或负数。如抗体滴度、血清凝集效
当样本量为奇数时
例:0.84
2.85
正偏态(右偏态)
峰向左偏移,向右侧拖尾
负偏态(左偏态)
峰向右偏移,向左侧拖尾
集中趋势的特征值
—— 平均水平的度量
算术均数(arithmetic mean,M)
适用于正态分布和近似正态分布的资
料。
总体均数用µ表示;样本均数用 x 表示。
直接计算法
将所有观察值直接相加再除以观察值的个数。
4.76 5.26 5.61 5.02 4.76 x 4.77 10 12 / L 140


加权法
根据频数表计算均数的一种方法.把各组的组中值 视为各组观察值的代表值,分别乘以各组的频数得 到各组观察值之和,然后将它们相加得到观察值的 总和再除以总例数。
X
f i lg X i f1 lg X 1 f 2 lg X 2 f n lg X n 1 lg G lg f f i i
1
频数表资料的几何均数
抗体滴度 ⑴
人数,f ⑵
滴度倒数,X ⑶
lgX ⑷
f· lgX ⑸
累积频率/%
71.4 82.3 91.8 95.9 98.0 99.3 100.0 100.0
合计
147
100.0
某药物疗效的频数表
治疗效果 治愈 频数 65 频率/% 43.3 累积频数 65
累积频率/%
43.3
有效
无效 恶化 合计
45
25 15 150
30.3
16.7 10.0 100.0
110
频数表的分布特征
集中趋势(central tendency)
变量值集中位置。本例在组段“4.60~”。 ——平均水平指标
离散趋势(tendency of dispersion)
变量值围绕集中位置的分布情况。本例4.40~5.00, 频数分布较集中;离“中心”位置越远,频数越小;且围 绕“中心”左右对称。 ——离散水平指标
1:2.5 1:10 1:40 1:160 1:640 合计
14 18 22 12 6 72
2.5 10.0 40.0 160.0 640.0
0.3979 1.0000 1.6021 2.2041 2.8062
5.5706 18.0000 35.2462 26.4492 16.8372 102.1032
135 150
73.6
90.0 100.0
140名成年男子红细胞数
频数表的编制步骤
(1)求全距(range,R):即最大值与最小值之差; 本例极差: R=5.95-3.82=2.13 (2) 决定组数和组距:组数通常取10-15个组,组距为全距的十
分之一, 再略加调整;
本例 i= R /10=2.13/10=0.213≈0.20 (3) 列出组段:第一组段必须包括最小值,最后一个组段必须包 含最大值; (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段 的频数。
统计描述
内容
定量资料平均水平的描述 定量资料离散趋势的描述 定性资料的描述
在医疗卫生工作中,拥有资料本身并 不等于获得了信息,必须对所拥有 的资料、数据进行正确的统计学方 法处理,找到它们的规律,才能了 解资料的信息。那么最基本的方法 就是统计描述,通过统计描述,首 先可以掌握资料的特点、规律,进 一步为统计分析(统计推断)打下基础。
定量资料平均水平描述
频数分布表 频数分布图(直方图) 集中趋势的数字特征值(指标)
列表描述法 -频数分布表(frequency table)
频数(frequency)
Βιβλιοθήκη Baidu
在一批样本中,相同情形出现的次数称该情 形的频数。
频数表(frequency table)
将所有“互相排斥的情形”的频数毫无遗漏 地排列在一起。由频数与组段组成。
相关文档
最新文档