医学统计学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率(probability)
举例:抛一枚硬币,是否国徽面一定向上?明天的股市升还 是降?某患者痊愈的可能性?这些问题的答案都不可能绝对。
概念:描述随机事件发生的可能性大小的数值,常用P来表
示。
大小:0≤P≤1,越接近于1,说明发生的可能性越大,越
接近于0,说明发生的可能性越小。
小概率事件:在统计学上,习惯将P≤0.05或P≤0.01的事
个体individuals
Units;elements
变量 variables
住院号 2025655 2025653 2025830 2022543 2022466 2024535 2025834 2019464 2025783
年龄 27 22 25 23 25 27 20 24 29
身高 体重 165 71.5 160 74.0 158 68.0 161 69.0 159 62.0 157 68.0 158 66.0 158 70.5 154 57.0
随机抽样
随机抽样:为了保证样本的可靠性和代 表性,需要采用随机的抽样方法,以保 证总体中每个个体都具有相同的机会被 抽到)。
随机抽样方法:单纯随机抽样 分层抽样
注意:随机不等于随便
计量资料
对每个观察对象的观察 指标用定量方法测定其 数值大小所得的资料, 一般用度量衡单位表示, 简单的说计量资料就是 用度量衡测量出来带有 单位的资料。如身高、 体重、血红蛋白
例:一组2040岁成年人的血压
<8 低血压
等
8 正常血压
计量资料
级 资 料
12 15
轻度高血压 中度高血压
计数资料
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例数
参数与统计量
参数:描述总体特征的数值,通常是未 知的,一般用希腊字母表示μ 、σ 、π
统计量:描述样本特征的值,是已知的,
A.性别 B.体重 C.血型 D.职业 E.民族
用英文字母表示 S 、 P
随机抽取
总体
样本
参数
统计描述: 统计量
统计推断 (参数估计、假设检验)
误差
误差:统计上所说的误差泛指测量值与真值之差,样本指标 与总体指标之差。主要有以下三种:系统误差、随机测量误 差、抽样误差。
(1)系统误差:指数据搜集和测量过程中由于仪器不准确、 标准不规范等原因,造成观察结果呈倾向性的偏大或偏小, 这种误差称为系统误差。尽可能避免,或可以通过周密的研 究设计解决。
统计描述、统计推断
第三节 医学统计学中的基本概念
变异 总体与样本 计量资料、计数资料 参数与统计量 误差 概率
总体与样本(population and sample)
总体:根据研究目的确定的同质研究对象的
全体(集合)。分有限总体与无限总体
样本:从总体中随机抽取的部分观察单位
样本包含的观察单位数称为样本含量或样本 大小。 用n表示
总
体
样本
为了了解某地20~29岁健康女性血红蛋白的正常值 范围,现随机调查了该地2000名20~29岁的健康女 性,并对其血红蛋白进行测量,请问本次调查的
总体是( B )
A.该地所有20~29的健康女性
B.该地所有20~29的健康女性的血红蛋白测量值 C.抽取的这2000名20~29岁女性 D.抽取的这2000名20~29岁女性的血红蛋白测量 值
三、整理资料
对资料进行整理、清理、核实、查对使资 料系统化、条理化便于计算和分析。
1. 原始资料的检查与核对:数据的取值范围 检错和数据间逻辑关系检错
2. 资料的分组设计与归纳汇总:质量分组和 数量分组和编制频数分布表。
常用软件:Excel、SPSS、SAS
四、分析资料
运用统计学的基本原理和方法,分析计算 有关的指标和数据,揭示事物内部的规律。
(2)随机测量 误差:由于一些非人为的偶然因素使得结果
或大或小,是不可避免的。
(3)抽样误差:由于抽样原因造成的样本指标与总体指标
之间的差别。是不可避免的,可以减少。
减少抽样误差的方法:
(1)改进抽样方法,增加样本的代表性。 样本量 n 相等的情况下: 整群抽样>单纯随机抽样>系统抽样>分层抽样
(2) 增加样本量n (3)选择变异程度较小的研究指标
计数资料
是先将观察对象的观察指标按性质或类别进 行分组,然后计数各组该观察指标的数目所 得的资料。 分为无序分类资料和有序分类资 料(等级资料)
1)无序分类:如各种血型的人数
2)有序分类:等级资料,如尿糖+、++、+++ 注意计量资料和计数资料之间可以相互转化
观察单位 obBaidu Nhomakorabeaervations
A. 随意抽取的总体中任意个体 B. 有意识地选择总体中有典型个体 C. 依照研究者要求选取总体中有意义的个体 D. 最方便获取的部分个体 E. 依照随机原则抽取总体中的个体
2.下列变量的观测结果属于等级 资料的是( D )
A. 白细胞计数 B. 住院天数 C. 门诊就诊人数 D. 患者病情分级 E. 各临床科室的患者数
C. 随机抽样即随意抽取个体 D. 为确保样本具有很好的代表性,样本量应
越大越好 E. 选择符合研究者意愿的样本
5、对某地200名16岁中学生口腔 检查,发现龋齿的人数54人, 该资料属于( B )
A. 计量资料 B. 计数资料 C. 等级资料 D. 经变量转换也可以作为计量资料
6、下面的变量中,属于计数变量 的是( B )
(2)17%拼凑实验结果
(3)7%凭空捏造数据
(4)2%故意曲解结果
第二节 统计工作的基本内容 (步骤)
实验设计
收集资料
整理资料
分析资料
一、实验设计
根据研究目的,制定研究方案,对整个过程进 行安排,是整个工作的关键。
如何进行设计?专业设计和统计学设计 研究对象的纳入标准、排除标准、样本含量、样
住院天数 5 5 6 5 11 2 4 3 7
职业 无 无
管理员 无
商业 无 无 无
干部
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩方式 顺产 助产 顺产
剖宫产 剖宫产
顺产 助产 助产 剖宫产
妊娠结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
Quantitative data 计量资料
4女
71 下 中分化 Ⅱ 阳性
78
5男
59 上 高分化 Ⅲ 阴性
85
…… … … … … …
…
生存时间(月) (9) 14 20 19 5 35 …
实例数据2
体重指数 身高 班制 劳动强度 紧张程度 心率 嗜肥肉史 收缩压 舒张压 中风家族史
(1) (2)(3) (4) (5) (6) (7) (8) (9) (10)
件作为小概率事件。 原理:小概率事件在一次抽样或实验中不发生。例如车祸,
飞机失事,学生上课迟到
小结:
重点:几个基本概念(计量资料与计数 资料、参数与统计量、总体与样本、抽 样误差)
熟悉:小概率事件、统计工作的基本步 骤、减少抽样误差的方法
了解:统计学定义及发展
1.统计学中所说的有代表性的样 本指的是( E )
统计学在医学研究中的运用越来越广泛,越来越深 入。在医学研究报告和医学期刊中,一些研究结果 直接用数据和图表表示,并且充满了均数(X )和 标准差( S )、随机分组、值等统计专业术语。
对医生和医学科学工作者来说,医学论文起到两个 作用。一是通过撰写和发表论文,报告自己观察或 实验的研究结果,二是阅读别人的论文,吸收新知 识,了解学术进展。撰写论文,对自己研究结果的 数据资料要能够正确地表达和分析。
愈40例,是否说明乙法就优于甲法 上课点名,点三次,某同学被抓两次 小说
统计:
统计工作(统计局) 统计资料 GDP 统计学
统计学
统计学(Statistics)是运用概率论和数理 统计的方法,研究数据收集、整理、分 析、推断等的一门学科。
数理统计
按应用划分: 应用统计:工商经业业济统统统计计计学学学
A.脉搏 B. 血型 C.肺活量 D.红细胞计数 E.血压
7、某人记录了50名病人体重的测定结果: 小于50Kg的13人,介于50Kg和70 Kg间 的20人,大于70 Kg的17人 ,此种资 料属于( C )
A.计量资料 B.计数资料 C.等级资料 D.无序分类的计数资料 E. 名义变量资料
8、下面的变量中,属于计量变量 的是( B )
医学统计学
教师:数学统计教研室 胡冬梅
第一章 绪 论
统计学的定义和发展 统计工作的基本内容 医学统计学中的基本概念
第一节 统计学的定义和发展
举例:
生活中,统计班级中男生女生各多少人 治疗两例有效就说明有效率100 药品宣传都说经过多家医院,临床实验上千病例,
总有效率达到百分之90%,而不说治疗两例有效 两种药物治疗某种疾病,甲法治愈20例,乙法治
(2)统计设计
how? 分析目的 研究对象 分析指标、观察单位、检测内容和方法 如何获取资料、怎样整理计算 如何控制误差、组织实施等
二、收集资料
来源:实验数据和现场调查资料、医疗 工作记录、报表和报告卡。
要求: 1、完整、准确、及时 2、要有足够的数量 3、资料的代表性和可比性
3.抽样的目的是( B )
A. 研究样本统计量 B. 由样本统计量推断总体参数 C. 研究典型案例 D. 研究总体统计量 E. 研究特殊个体特征
4.关于随机抽样,下列哪一项说法 是正确的( A )
A. 抽样时应使得总体中的每一个个体都有同 等的机会被抽取
B. 研究者在抽样时应精心挑选个体,以使样 本更能代表总体
Qualitative data 计数资料
实例数据1
胆管癌患者部分指标
编号 性别 年龄(岁)部位 分化程度 分期 肝转移 PCNA 指数
(1)(2) (3) (4) (5) (6) (7) (8)
1男
61 上 低分化 Ⅰ 阳性
52
2女
58 中 高分化 Ⅱ 阴性
89
3女
63 上 高分化 Ⅳ 阴性
93
医学统计学发展:
1. 法国数学家Laplace提出医学是概率论应用 的一个重要领域。
2. 19世纪,Louis 把统计学引入到医学,强 调用数据表达疗效
3. Karl Pearson是现在统计学之父。 4. 另一位统计学奠基人Fisher ,临床随机对
照实验
为什么要学习统计学
对“证据”解释的苛刻要求,使医学研究人员认识 到:要使自己的研究结果成为被同行认可的科学证 据,必须在研究工作中采用科学方法。
医学统计学 管理统计学
医学统计学:
医学统计学(Medical Statistics)就是统计学原理 和方法在医学研究领域的应用。
现在生物医学实验室研究、临床研究、流行病学 探索和公共卫生管理都要寻求统计学家的合作。 美国国立卫生研究院的基金申请要求合作者有统 计学专家,并且必须有统计设计和分析的内容。 在药物开发中,制药公司要招聘统计学家指导研 究设计、分析数据。总之,统计的思维和方法已 经渗透到医学研究和卫生政策之中。
医学论文中的统计学问题
60年代到80年代,国外医学杂志调查结果: 有统计错误的论文20%~72%。 1996年对4586篇论文统计(中华医学会 系列杂志占6.9%),数据分析方法误用达 55.7%。
伪造统计数据违反科学道德
1976年New Science 杂志关于科研舞弊 行为的调查
(1)74%的调查表反映有不正当修改数据 的情况
本获取方法,实验组和对照组的分组原则,确 定观察指标及精度,实验过程中的质量控制, 拟使用的统计方法等 背景-目的-方法-内容-经费预算
(1)专业设计
反映课题研究的深度与水平 why?了解专业现状、学术前沿、研究动态、
水平及发展方向和条件,提出课题(立题依据, 项目研究意义和应用前景、国内外研究现状分 析,附主要参考文献等) what?主要解决的问题(研究目目标,研究内 容和拟解决的关键问题等,提出详尽的分析是 思路和技术路线,做好周密的考虑和安排)
12.24 1.62 1 1
3 70
1
146 90
有
16.47 1.63 3 1
1 72
0
110 70
无
15.19 1.64 1 2
2 72
0
100 70
无
15.59 1.63 1 3
3 84
1
114 70
无
12.60 1.64 3 1
3 68
1
116 68
无
… …… …
…… …
……
…
三类资料间关系