绪论(New)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

流 统 志 胡








志 胡

几个重要的统计学概念
抽样人数n 糖尿病人数m 100 12 500 48 1000 102 5000 493 9.86 10000 992 9.92

50000 4999 10.00
统 志 胡
100000 1000000 99999 10.00
频率(患病率%) 12.0 9.60







志 胡

几个重要的统计学概念
• 概率:描述随机事件发生的可能性大小的数值, 常用P来表示。 • 大小:P的大小在0和1之间,越接近于1,说 明发生的可能性越大,越接近于0,说明发生 的可能性越小。统计学中的许多结论是带有概 率性质的,通常一个事件的发生小于5%,就 叫小概率事件。 • 频率:在实际工作中,当观察单位的例数足够 多时,可以用频率来代替概率。频率是概率的 估计值。



志 胡

卫生统计概念
统计学:是一门处理数据中变 异性的科学与艺术,内容包括收 集、分析、解释和表达数据,目 的是求得可靠的结果。(社会统 计、心理统计…) 卫生统计学(health statistics): 是一门应用统计学方法和原理研 究卫生服务数据的收集、分析、 解释和表达的学科。
流 统 志 胡
流 统 志 胡








志 胡

几个重要的统计学概念
抽样(sampling):从研 究总体中抽取一部分有 代表性的个体的方法; 样本(sample):从研究 总体中随机抽取的一部 分有代表性的个体; 数据(data):对样本中个体进行深入的观 察与测量,获取的测量值。
流 统 志 胡





由上述表可以看到频率f呈某种随机性。但随着抽样人数n的增大, 频率(患病率)f随机波动的幅度越来越小并且趋向常数10%。可以 证明:当观察次数n越来越大,频率f的随机波动幅度越来越小, 并最终趋向于一个常数,这个常数被称为随机事件A发生的概率( 又称为统计学上的概率定义)。

10003 10.00
10.2
如何学好卫生统计学
¾ 1976年New Science 杂志关于科研舞弊 行为的调查 (1)74%的调查表反映有不正当修改数据 的情况
流 统 志 胡








志 胡

卫生统计思维进化
★ 德国(1960年代初),药物酞胺
哌啶酮(Thalidomide,又称反应 停)事件(曾引起一次胎儿畸形 (四肢体短缺)的暴发,经过病例 对照研究和干预研究发现危险因素 是反应停)。 美国从这一事件促使有关法律文 件的产生,FDA为临床试验规定了 一整套制度,使之成为确定药物疗 效验的标准方法。
流 统 志 胡





统计设计内容主要涉及对象 选择、随机化、重复、匹配、 盲法、统计方法选择、统计 图表等。



志 胡

几个重要的统计学概念
统计分析:一定的设计样式决定了一定的数 据分析方法;不同设计下获得的资料常常 要用不同的方法来分析。 随机化区组设计(randomized block design)的方差分析不同于析因设计 (factorial design)的方差分析
流 统 志 胡








志 胡

如何学好卫生统计学
医学论文中的统计学问题
流 统 志 胡
¾60年代到80年代,国外医学杂志调查结果: 有统计错误的论文20%~72%。 ¾1996年对4586篇论文统计(中华医学会






系列杂志占6.9%),数据分析方法误用达 55.7%。


志 胡 坚
伪造统计数据违反科学道德
几个重要的统计学概念


志 胡








志 胡

实例数据1
胆管癌患者部分指标
部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月) 编号 性别 年龄(岁) (1)(2) (3) (4) (5) (6) (7) (8) (9) 1 男 61 52 14 上 低分化 Ⅰ 阳性 2 女 58 89 20 中 高分化 Ⅱ 阴性 3 女 63 93 19 上 高分化 Ⅳ 阴性 4 女 71 78 5 下 中分化 Ⅱ 阳性 5 男 59 85 35 上 高分化 Ⅲ 阴性 … … … … … … … … …








志 胡

卫生统计思维进化
• 统计思维的进化(发展简史) 时期 1749-1827 科学家 Pierre-Simon Laplace(拉普拉 斯) Philippe Pinel (菲利普) Louis (路易斯)

发明与应用
统 志 胡

研究概率 (probability)。




1745-1826 1787-1872 1822-1911
流 统 志 胡



胡wenku.baidu.com




志 胡

统计学与公共卫生的关系

胡 流 统 志 坚

志 胡



志 胡

统计学与公共卫生的关系

胡 流 统 志 坚

志 胡

现代公共卫生对统计学的挑战


志 胡

几个重要的统计学概念
总体与样本
总体(population):表示大同小异的对象(某 个测量值)全体。如一个国家的所有成年人 (身高值);某地的所有小学生(身高值) 。 目标总体(target population):研究结果所要 推论到的总体。 研究总体(study population):来源于目标总 体中的一个较小的总体,如关于吸烟与肺癌的 研究以英国成年男子为目标总体;1951年英国 全部注册医生只是成年男子中的一部分,是研 究总体。
流 统 志 胡
推断inference



统计量

流 统
统计量:由观察资料计算出来的量,样本的统计指标,如 样本均数、标准差,采用拉丁字母分别记为 数附近波动的随机变量 。


志 胡
X、S
。参

几个重要的统计学概念
设计与分析
统计设计( statistical design):是医药卫生科研设 计不可或缺的部分。 医药卫生科研主要有两大类:干预性研究 (intervention study)和观察性研究 (observational study)。
流 统 志 胡




医院统计,生物统计 现代统计学奠基 误差理论极大似然《实验 设计》随机化做实验,F检 验

Ronald A. Fisher

1897-1991


志 胡
Hill 爵士
现代临床试验(clinical trial)

卫生统计思维进化
• 一些重要的临床试验 ★英国临床医学研究理事会
流 统 志 胡
(1946年):链霉素(瓦克斯曼, 1943)治疗肺结核的临床试验 (随机化分组、方法有链霉素加 卧床休息或单纯卧床休息。独立 评价X光片子结果,链霉素组病 人的生存和两方面的放射学改善 都有较好)








志 胡

卫生统计思维进化
★ 美国(1954年):评价索尔 克(Salk)疫苗预防小儿麻 痹或死于脊髓灰质炎的效果 (干预试验、现场试验;样 本:180万儿童;花费:500 多万美元。随机化分组,最 后约有1/4参与者得到了随机 化。这项试验最终肯定了索 尔克疫苗的效果)



志 胡

几个重要的统计学概念
总体:5岁男童身高
目标总体: 5岁男童 研究总体:某地区或学校5岁男童
流 统 志 胡

统 胡

Xi:一个样本
流 统 志 胡 坚

样本
5岁男童样本


胡 流 统 志 坚

志 胡



志 胡

几个重要的统计学概念
同质与变异 同质性(homogeneity): 一个总体中有许 多个体大同小异,存在共性,这些个体处 于同一总体。 变异(variation):同一总体内的个体间存 在差异。例如,同性别、同年龄的小学生 属于同一个总体,但他们的身高、体重又 存在变异。变异性是统计学的根本需要。 统计学的任务:在变异的背景上描述同一总体的同质 性,揭示不同总体的异质性(heterogeneity)。


胡志坚
卫生统计学
胡 志 坚

志 胡




志 胡

第一章 绪论
(1)什么是卫生统计学
流 统 志 胡
(2)医学中统计思维的进化 (3)统计学的几个基本概念 (4)统计学的学习方法








志 胡 坚
卫生统计概念
analysis,
A science dealing with the collection, interpretation,
流 统 志 胡
and
The science and art of dealing with variation in data

presentation of masses of numerical data”(Weber’s International Dictionary)




through collection, classification, and analysis in such a way as to obtain reliable results” (A Dictionary of Epidemiology)

应用概率研究疗效 临床疗效,对照 分布与变异


志 胡
Francis Galton (高尔顿)

卫生统计思维进化
时期 1857-1936 1880-1949 1879-1940 1890-1962 科学家
发明与应用
Karl Pearson(皮 现代统计学之父 尔森) 相关分析,χ2 Major 抽样误差 Greenwood Raymond Pearl
流 统 志 胡








志 胡 坚
几个重要的统计学概念
• 离散型变量常常通过适当的变换或连续性 校正后借用连续型变量或有序变量的方法 来分析。
流 统 志 胡




流 统 志 胡
WBC
志 坚
children

几个重要的统计学概念
参数与统计量 总体
参 数
抽取部分观察单位
样本
参数:是统计模型的特征 指标,是对总体而言,其 大小是客观存在的,然而 往往是未知的,如总体均 数、标准差,采用希腊字 母分别记为μ、σ。固 定的常数
流 统 志 胡








志 胡

有序变量(ordinal variable)或等级变量。 分类变量的“取值”中自然地存在着次序。 例如,问卷调查常问对某件事情的满意程度: 极不满意、有点满意、中度满意、很满意、极 满意。有些临床体检或实验室检验常用–、±、 + 、++和+++ 来表示测量结果。 连续型变量 (continuous variable):连续型变量可以 取实数轴上的任何数值。 “连续”是指该变量可以 ◆定性变量(分类变量 (categorical variable)或名 在实数轴上连续变动,由测量而得到。例如,血压、 离散型变量 (discrete variable) :离散型变量 义变量(nominative variable) 。 身高、体重等。 例如,职业(工、农、商、学、兵等)是一个 只能取整数值。例如,一月中的手术病人数, 分类变量;其可能的“取值”不是数字,而是类别, 一年里的新生儿数。 二分类变量(binary variable),称为0-1变量 例如,性别(男女)、疾病(有无)和结局 (生死)等。二分类变量常用0和1来编码,0-1变量 常称为假变量(dummy variable)或哑变量,可以和 真变量一样参与计算。
流 统 志 胡







病例-对照研究(case-control study),成组对照的资料和匹配对 照的资料的分析方法不同

志 胡

几个重要的统计学概念
因果与联系
统计学联系(association) :事物之间存在统计学 联系,如某疾病与危险因素(risk factor)之间存在 联系。 这种联系可能包括:人为联系、虚假联系和因果 关系(causality)。因此存在联系未必有因果关系。 因果关系(causality):在排除了人为 联系、虚假联系后仍然存在的、无法 用其他联系解释的两个变量之间的关 系。但也需要时间顺序等标准进行因 果判断。
流 统 志 胡








志 胡

几个重要的统计学概念
频率与概率
• 抛一枚硬币,是否国徽面一定向上? 明天的股市升还是降?某患者痊愈的 可能性? • 这些问题的答案都不可能绝 对。考察 某个可能的结果,若在n次观察中,有m次观察到这种可 能的结果,则称这种可能的结果发生的比例为频率,m称 为频数。显然有。在医学上所说的患病率、病死率等都是 频率。如治疗了n个幽门螺旋杆菌感染(HP阳性)的患者, 其中有m个人治愈(HP呈阴性),则治愈率。频率f是一个随 机抽样观察的结果,因此频率f呈一定的随机波动。如在 某地区随机抽样调查糖尿病的患病率,其结果如下
相关文档
最新文档