2018年学习卫生统计学课件PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
发生的频率是:
156 300
0 . 52
4
2、概率
• 频率的这种稳定性,揭示出一个随机事件发生的可能性有 一定大小可言: 频率稳定于较大的数值,表明该随机事件发生的可能性较大,
频率稳定于较小的数值,表明该随机事件发生的可能性较小。
• 频率所接近的这个固定的的数值就是该随机事件发生可能性大 小的一个客观的定量的度量,称为该随机事件的概率。
• 一般来说, 一个样本应具有代表性、随机性和可靠性, 二个样
本之间应具有可比性。
10
(1)代表性
• 就是要求样本中的每一个个体必须符合总体的规定。
• 这就要求对总体有一个明确的规定。这种规定是根据研究目的而
具体确定的。
(2)随机性
• 就是要保证总体中的每个个体有相同的几率被抽作样本。
• 重要的是要避免主客观的“偏性” 。
14
• 计数资料:
A 急性 慢性 34 28 男 治疗组 对照组 58 31
O 25 27 女 62 29
B 21 19
AB 31 35
15
• 等级分组资料 :
痊愈、显效、好转、无效;
-、+、++、+++; 优、良、中、差; 轻、中、重。 痊愈 治疗组 对照组 34 23 显效 28 14 好转 16 20 无效 6 9
11
(3)可靠性
• 即实验的结果要具有可重复性,即由科研课题的样本得出的结果
所推测总体的结论有较大的可信度。 • 由于个体之间存在差异,只有观察一定数量的个体方能体现出其 客观规律性。如果根据少数几例就下结论,这种结论可靠性差, 体现不了规律,可能被后人所否定。
• 每个样本的含量越多,可靠性就会越大,但是例数增加,人力、
16
【第二章】 集中趋势的统计描述
17
第二节 描述集中趋势的统计指标
• 描述一组观察值集中位置或平均水平的统计指标。
• 常用的有算术均数、中位数、众数、百分位数。
18
一、算术均数
• 算术均数(mean),简称均数 x 。
观察值是: x1 , x2 , , xn
n
x
x1 x2 xn n
物力都会发生困难,所以应以“足够”为准。 • 究竟需要多少例数,它与所观察的指标的变异程度有关。
12
(4)可比性
• 如果进行两个或多个样本之间的比较,那么要求每二个样本之间
应具有可比性 。 • 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除 也称为齐同对比原则。 • 临床试验中:要求两组性别、年龄、病情、病程等无差异;
• 12,13,12,14,12,15,500。
20
三、中位数
中位数(median)是将n个观测值从小到大排列后,位置居于中 间的那个数值。记为M。 • 当n为奇数时,中位数取位次居中的变量值。 当n为偶数时,中位数取位次居中的两个变量值的均数。 • 例如:7名病人患某病的潜伏期(天)分别为 2,3,5,6,7,9,15,
6
3、总体和个体
• 总体:一个统计问题所研究对象的全体。
个体:总体中的每一个单个成员。
例如:研究Haier29寸彩电的质量问题。 例如:某次研究进行随机抽样,测量得到北京市100名健康成年 男子的血清总胆固醇值,则研究总体为?
7
4、同质和变异
• 同质:总体中个体存在的共性。
• 变异:总体中个体存在的差异。
5
• 概率:在 n 次试验中,随机事件A发生了 m 次,当加大n时, 事件A发生的频率逐渐稳定在一个固定的常数附近,这个固定 的常数叫事件A的概率。记作:P(A)。
0≤P(A)≤1
• 在统计学上,习惯将 P≤0.05 或 P≤0.01 的事件称为小概
率事件,表示该事件发生的可能性很小。
• 小概率事件: 在一次观察百度文库,可以认为不会发生的事件。
2
【第一章】 基本概念
3
1、频率
在 n 次试验中,随机事件A发生了 m 次,则称 生的频率。 例如:投一枚硬币算一次试验。共投了200次,事件A=“正面
m n
为事件A发
向上”发生了98次,则A发生的频率是:
98 200 0 . 49
另一个人投了300次,事件A=“正面向上”发生了156次,则A
处理因素不同外 , 其他可能影响实验结果的因素要求基本齐同,
动物试验中:要求两组性别、月龄、体重、种别等无差异。
• 对照组可以是空白组、安慰剂组、服用当前最好药物组。
13
6、资料类型
• 医学统计资料一般可分为计量资料和计数资料两大类。
• 不同的统计资料应采用不同的统计分析方法。
• 计量资料:是对每个观察对象的观察指标用定量方法测定其数值 大小所得的资料,一般用度量衡单位表示。 如: 身高(cm)、体重(kg)、脉搏(次/分)、 血红蛋白(g/L)等
则中位数M = 6(天)。
• 例如:8名患者食物中毒的潜伏期(小时)分别为 1,2,2,3,5,6,8,15,
则中位数M =(3+5)/2 = 4(小时)。
• 中位数适用于各种分布类型的资料,尤其是偏态分布资料。 • 对于分布大致对称的资料,中位数接近于算术均数。
21
四、百分位数
• 百分位数(percentile),用PX表示 。 • 将n个观测值从小到大排列,这n个观测值中
卫生统计学
刘仁权
1
本次串讲的说明
• 假设大家看完了教学光盘。 • 主要讲解考试大纲的内容。 • 按本科考试大纲讲解,专科学生可依据专科考试 大纲跳过不考的内容。 • 不会象教学光盘中讲解的那样详细和系统。 • 同学们仔细看教学光盘中相关内容。 • 期末考试题型: 客观题: 35道单选题,70分 主观题: 3道计算题,30分
• 没有同质性就构不成一个总体供人们研究,总体内没有差异就无 需统计学。
8
5、样本
•在一个总体中抽取的n个个体 叫总体的一个容量为n的样本。
•在一次抽取后,样本为具体的数值x1,x2,……,xn 。
统计学的任务就是由样本值来描述总体和推断总体。
9
6、抽样
• 从总体中抽取样本的过程叫抽样。 • 从总体中抽取样本 , 一定要遵循科学原则。
x
i 1
i
n
x n
• 2,4,0,5,0,1
19
(三)均数的应用
• 主要适用于对称分布或偏斜度不大的资料,尤其适合正态分布资 料 。 • 由于在计算均数时用到了每一个观察值 , 在偏态较大的情况下 , 算出的均值容易受到极大或极小值的影响 , 不能真正地反映分
布的集中位置 , 这时应考虑改用其他方法。