数据统计与分析方法 ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• “不怕太阳晒,也不怕那风雨狂,只怕先生骂我 笨,没有学问无颜见爹娘 ……”
• “太阳当空照,花儿对我笑,小鸟说早早早……”
2021/2/5
4
瞎子王国里,有一只眼精的人就是国王!
心电图的由来
1780年有一天,43岁的意大利解剖学 家伽伐尼Galvani Luigi,1737-1798) ,在实验室解剖青蛙,在用银质手术 刀触碰放在铁盘上的青蛙的时候,无 意间发现青蛙腿部肌肉抽搐了一下, 仿佛受到电流的刺激.如果换用一种 金属器械去触动青蛙,就无此种反应 。1832年,一个晴朗的日子,还是意 大利,还是青蛙,只是做实验的人 换成了马泰乌奇。
数据表现形式
2021/2/5
7
表现形式一
2006年客户销售分析报表
A客户
12月 1月 2月 3月 4月 5月 6月 7月 8月
B客户
99 98 98 100 101 108 108 114 110
C客户
67 70 73 74 75 77 82 80 80
D客户
87 84 88 85 79 85 91 92 93
60%
57.5% 60.2%
50%
49.0%
51.5%
53.5%
47.3%
47.4%
40%
43.4%
36.2%
36.41%
30%
31.0%
30.8%
43.3%
37.4%
39.5% 30.4%
35.5%33.0% 25.5%27.3%
20%
21.1%
10%
13.2%
0% 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
相对比(relative ratio):是A、B两个有关指标之比,说明A是B 的若干倍或百分之几,通常用倍数或分数表示。如:男:女、医生 :护士、教师:学生
2021/2/5
29
例: 率与构成比
白内障 患者年龄
年龄组 受检人数 例数 构成比(%) 患病率(%)




⑸=(3)/(2)
40~ 560
这一次,马泰乌奇探测到损伤和未 损伤的肌肉之间存在一种电流,他 称之为“肌肉电流”。他发现,包 括心脏在内,一切正在收缩的肌肉 都会产生肌肉电流。
医学研究者通 过大量的临床 数据发现正常 和非正常的心
电图
2021/2/5
6
1、什么是数据?
▪数据是指对客观事件进行记录并可以鉴别的 符号,是对客观事物的性质、状态以及相互关 系等进行记载的物理符号或这些物理符号的组 合。它是可识别的、抽象的符号。
2021/2/5
10
数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分
2021/2/5
11
实例数据
住院号 年龄 身高 体重
27 165 71.5 22 160 74.0 25 158 68.0 23 161 69.0 25 159 62.0 27 157 68.0 20 158 66.0 24 158 70.5 29 154 57.0
住院 天数
5 5 6 5 11 2 4 3 7
1
1
0
2
1
8
40
0
0
2
0
0
0
2
合计 207
141
102
208 537 206 1401
2021/2/5
28
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数.
率(rate):说明某现象或某事物发生的频率或强度。 率=(实际发生数/可能发生总数)×比例基数
2021/2/5
15
一般统计方法
▪ 根据数据的类型可以分为以下三种统计方法 ▪ 1 、计量资料的统计方法** ▪ 2 、计数资料的统计方法 ▪ 3 、等级资料的统计方法
2021/2/5
16
运用统计方法应遵循的原则
坚持用数据说话的基本观点。 有目的地收集数据。 掌握数据的来源。 认真整理数据。
2021/2/5
1300 1100
900 700
数据
500
12月
1月
2月
3月
4月
5月
6月
7月
8月
9月
10月
11月
列表
2021/2/5
8
数据表现形式二
销售码洋趋势图
800
700 667
600
595
500
400
422
412 420 381
300
303 320
200
248 269 224 245
100
470
477
410 403
数据统计与分析方法
培训主要内容:
1、数据统计的一般方法; 2、数据分析的一般方法; 3、了解数据统计和分析在实际案例中的应用; 4、了解时间序列分析及相关软件应用;
精品资料
• 你怎么称呼老师?
• 如果老师最后没有总结一节课的重点的难点,你 是否会认为老师的教学方法需要改进?
• 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
68
15.18
12.14
50~ 441
129
28.79
29.25
60~ 296
135
30.13
45.61
70~ 149
97
21.65
65.10
≥80
22
19
4.24
86.36
合计 1468
448
100.00
30.52
2021/2/5
14.85
1.7~1.8 2021/2/5 合计
3
1.75
5.25
160
182.30
21
对称分布:以频数最多组段为中心左右
大体对称.
右(正)偏态分布: 频数最多组段右侧组段
数多.(skewed to the right distribution)
左(负)偏态分布: 频数最多组段左侧组段
数多.(skewed to the right distribution)
2021/2/5
19
表2-1: 160名正常成年女子的血清甘油三酯(mmol/L)
编号 1 2 3 4 5 6 7 8 …
2021/2/5
血清甘油三脂 0.51 0.52 0.59 0.61 0.61 0.62 0.63 0.64 …
编号 … 153 154 155 156 157 158 159 160
X X1 X 2 X n X
n
n
G n X1X2 Xn
G202l1g/2/15
fi
lg fi
Xi
X
f1X1 fX 2 fX3 fk X k f1 f2 f3 fk
fXi fi
Md
x(n1) xn/ 2
/2
x1n / 2
2
n为奇数
n为偶数
23
3、离散趋势的描述
反映数据的离散度(Dispersion), 即个体观察值的变异 (variation)程度, 常用的统计指标有:
等级资 料
<8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压
计量资料 计数资料
以12kPa为界分为正常与异常两组,统计每组例数
2021/2/5
13
第一部 数据统计概述
2021/2/5
14
什么是统计方法
▪ 统计方法是指有关收集、整理、 分析和解释统计数据,并对其所 反映的问题作出一定结论的方法 。统计方法是一种从微观结构上 来研究物质的宏观性质及其规律 的独特的方法。
17
统计分析流程
2021/2/5
确定问题确定分析目标 采用科学方法收集数据 考察数据时效性整理数据
统计分析
出具分析报告,提出解决 意或建议
18
计量资料的统计描述
1、频数分布 (frequency distribution)
为了了解数据的分布情况,可以编制频数表(frequency table).
13
0.85
11.05
0.9~ 正正正
17
0.95
16.15
1.0~ 正正正
18
1.05
18.90
1.1~ 正正正正
20
1.15
Байду номын сангаас
23.00
1.2~ 正正正
18
1.25
22.50
1.3~ 正正正
17
1.35
22.95
1.4~ 正正
13
1.45
18.85
1.5~ 正
9
1.55
12.40
1.6~ 正
8
1.65
职业
无 无 管理员 无 商业 无 无 无 干部
文化 程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩 方式 顺产 助产 顺产 剖宫产 剖宫产 顺产 助产 助产 剖宫产
妊娠 结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
2021/2/5
计量资料
计数资料
12
三类资料间关系
例:一组2040岁成年人的血压
比例基数:100%、1000‰、10000/万、100000(1/10万)等 如:发病率、死亡率、发生率、阳性率、患病率等
构成比(proportion):说明某一事物内部,各组成部分所占的比 重,也叫百分比。
构成比=(某部分观察单位数/各组成部分观察单位总数)×100%
如:教研室20人中高级职称有5人,占25%。
类和多分类两种情形. 特点:无计量单位,如肤色(黑白)、血型(ABO)、职业(工农兵)、
性别(1=男,2=女)等.
3、等级资料 (ordinal data)
半定性或半定量的观察结果,有大小顺序,又称有序分类变量. 如 ①癌症分期:早、中、晚。
②药物疗效:治愈、好转、无效、死亡。
③尿蛋白: ,,,++,+++及以上
S X 2 X 2 n n 1
CV S 100% X
2021/2/5
24
三、SPSS实现计量资料的统计描述
下面是SPSS软件中绘制频数图的步骤
2021/2/5
25
2021/2/5
26
四、计数资料的统计描述
1、计数资料数据的整理
住院号 年龄 职业 文化程度
27

中学
22

小学
25 管理人员 大学
E客户
148 143 143 145 137 141 136 134 139
F客户
75 76 76 77 79 78 82 78 78
G客户
87 86 92 100 103 100 97 89 91
H客户
132 134 141 142 160 154 150 136 137
合计
696 692 712 724 735 743 746 723 728
血清甘油三脂 …
1.65 1.66 1.67 1.67 1.69 1.7 1.71 1.77
20
编制频数表,绘制频数分布图
组段 (1)
划记 (2)
频数,f 组中值,X
fX
(3)
(4)
(5)= (3)×(4)
0.5~
3
0.55
1.65
0.6~ 正
9
0.65
5.85
0.7~ 正正
12
0.75
9.00
0.8~ 正正
366
330 343
255 254 237 211
247
171 166
0 12月 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
描述性分析:数据分时段走势、差距变化情况以及 相应的时间背景
2021/2/5
9
数据表现形式三
销售码洋结构比
90% 85.3%
80%
70%
64.3% 67.0%
1. 极差(Range) (全距) 2. 四分位数间距 (Quartile range) 3. 方差(Variance) 4. 标准差(Standard Deviation) 5. 变异系数(Coefficient of Variation)
R X max X min
四分位间距:QR=P75- P25
24 知识分子 中学
30 管理人员 大学
32

小学
27

中学
29

大学
25
农民
中学
2021/2/5
26

小学
分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月 27
按年龄(2岁一组)与职业整理
年龄 工人 管理人员 农民 商业服务 无 知识分子 总计
18
2
0
0
0
3
0
5
20
9
2
6
10
18
0
45
22 28
7
10
24
70
11
150
24 50
34
28
52
153
44
361
26 50
43
25
45
133
70
366
28 34
35
10
34
78
57
248
30 11
14
11
22
39
17
114
32 14
2
3
14
24
3
60
34
4
2
5
3
12
2
28
36
2
1
1
4
5
1
14
38
3
2021/2/5
22
2、集中趋势的描述
统计上使用平均数(average)来反映计量资料的集中趋势 ( central tendency ).
常用平均数有:
1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median) 4. 百分位数(percentile)
相关文档
最新文档