医学统计 绪论统计

合集下载

《医学统计学》之医学统计学绪论[精品文档].ppt

《医学统计学》之医学统计学绪论[精品文档].ppt
1. 随机变量及其分类 2. 同质与变异 3. 总体与样本 4. 参数与统计量 5. 误差 6. 概率
第四军医大学卫生统计学教研室 2021年3月3日
1. 随机变量(random variable)
简称变量(variable) ,统计上习惯用大写 拉丁字母表示 ,如X 、Y 、Z、… 。
变量值习惯用小写拉 丁字母表示 ,如性别 x1=1 (男) 、x2 =1 (男)、x3 =0 (女) 、…。
5
5 男 59 上 高分化 Ⅲ 阴性 85
35
…… … … … … …


第四军医大学卫生统计学教研室 2021年3月3日
实例数据2
体重指数 身高 班制 劳动强度 紧张程度 心率 嗜肥肉史 收缩压 舒张压 中风家族史
(1) (2)(3) (4) (5) (6) (7) (8) (9) (10) 12.24 1.62 1 1 3 70 1 146 90 有 16.47 1.63 3 1 3 72 0 110 70 无 15.19 1.64 1 2 2 72 0 100 70 无 15.59 1.63 1 1 3 84 1 114 70 无 12.60 1.64 3 1 3 68 1 116 68 无 … …… … … … … … … …
果(12)
第四军医大学卫生统计学教研室 2021年3月3日
统计工作的基本步骤
1. 统计设计:包括调查、实验设计。 2. 收集资料:取得准确可靠的原始资料 3. 整理资料:对资料进行清理、改错,数量 化 4. 分析资料:统计描述、统计推断
第四军医大学卫生统计学教研室 2021年3月3日
医学统计学
用统计学原理和方法研究医学问题
胆管癌患者部分指标
编号 性别 年龄(岁)部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月)

《医学统计学》之医学统计学绪论

《医学统计学》之医学统计学绪论
利用样本数据估计总体参数,如总体均数、总体率等。
研究生存时间、生存率等指标,分析影响因素和预测模型。
多元统计分析
如因子分析、聚类分析、主成分分析等,适用于复杂数据结构的研究。
生存分析
适用于长期观察和随访研究的数据分析。
利用多种统计方法综合分析多个变量之间的关系。
01
02
03
04
05
06
05
医学统计学的报告与解读
置信区间
VS
在解释研究结果时,应注意结果的统计学显著性和实际意义。如果观察到的结果具有统计学显著性,但无实际意义或价值较小,则不应过度强调或夸大其效果。同时,应注意结果的稳健性和可重复性,以评估结果的可靠性和可信度。
研究结果的报告
在报告研究结果时,应遵循准确、客观、完整和可理解的原则。结果应清晰明了地呈现,并附有适当的解释和说明。同时,应注意结果的伦理和法律问题,保护受试者的隐私和权益,避免误导读者或造成不必要的困扰。
《医学统计学》之医学统计学绪论
目录
contents
医学统计学简介医学统计学的基本概念医学统计学的应用领域医学统计学的数据处理与分析方法医学统计学的报告与解读医学统计学的挑战与未来发展
01
医学统计学简介
医学统计学是一门应用数理统计学的原理和方法,对医学实验和调查数据进行整理、分析和推断的学科。它具有数学性质和应用性质,是医学领域中不可或缺的工具。
生物统计学在药物研发过程中起到关键作用,如新药临床试验的设计与分析、药物疗效的评估等。
03
02
01
04
医学统计学的数据处理与分析方法
实验室研究:通过实验手段获取有关生物标志物、病理生理等方面的数据。
去除或纠正错误、异常或不完整的数据。

医学统计课件人卫6版第一章绪论

医学统计课件人卫6版第一章绪论

变量与数据类型
变量
描述研究对象特征的量度或度量,具 有可变性。
数据类型
根据变量的性质和测量尺度,将数据 分为不同的类型,如定量数据、定性 数据和等级数据等。
参数与统计量
参数
描述总体特性的度量,通常用希腊字母表示,如均值μ、方差 σ²等。
统计量
描述样本特性的度量,通常用英文字母表示,如样本均值x、 样本方差s²等。

03
药物研发和临床试验
在药物研发和临床试验中ຫໍສະໝຸດ 医学统计学对试验设计、数据收集、分析和
解释起到至关重要的作用。它确保试验结果的可靠性和准确性,为新药
审批和上市提供科学依据。
02
CATALOGUE
医学统计学的基本概念
总体与样本
总体
研究对象的全体集合,具有同质 性。
样本
从总体中随机抽取的一部分研究 对象,用于推断总体的性质。
02
它通过对数据的研究,揭示现象 的内在规律,为医学研究和医疗 实践提供科学依据。
医学统计学在科学研究中的作用
实验设计和数据分析
医学统计学在实验设计中起到关键作用,通过合理的设计和样本量的计算,确保实验结果 的可靠性和准确性。同时,在数据分析阶段,医学统计学提供了一系列统计分析方法,帮 助研究者从数据中提取有意义的信息。
多元统计分析
开始发展多元统计分析方法,以处 理更复杂的数据结构。
现代的医学统计学
数据挖掘与机器学习
利用大数据和机器学习技术进行数据分析和预测。
生物信息学
结合生物信息学方法,对基因组、蛋白质组等大规模数据进行统 计分析。
可视化技术
发展出丰富的可视化技术,帮助更好地理解和解释数据。
05

医学统计学绪论

医学统计学绪论
1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数 据分析方法误用达55.7%。
年《中华预防医学杂志 》:中华医学会系列杂志误用约 54% (1995)。
医学统计学绪论
第191页9
3. 伪造统计数据违反科学道德
➢ 1976年New Science 杂志关于科研舞弊 行为调查
(1)74%调查表反应有不正当修改数据情 况
You should always worry about whether the sampled results are representative of the population, and whether your sample allows you to make inferences about the population.
一、设计
1.专业设计:选题、建立假说、确定 研究对象和技术方法等→个性
2.统计设计:围绕专业设计确定统计 设类型、样本大小、分组方法、统计
分析指标及统计分析方法。
医学统计学绪论
第242页4
二、搜集资料
(一)资料起源
➢ 第一手资料 ① 经常性:统计报表(死亡登记、疫情 汇 报等),工作统计(病历、化验);
(2)17%拼凑试验结果
(3)7%凭空捏造数据
(4)2%有意曲解结果
医学统计学绪论
第20页
A Warning!
Fancy statistical methods cannot rescue garbage data
Fancy statistical methods can help you gain insight into your data, over and above what seems obvious on its face

1- 第一章 绪论-卫生统计学

1- 第一章 绪论-卫生统计学
两个统计描述指标(例数和率),能否可以说明两种疗法的有效 率?如果不能,为什么?
我们能否可依据统计描述( 20%与15%)的数量差,去作“否 定”?的结论。在作任何回答之前,必须判断20%与15%之间的差别 是真实的差异,还是仅仅由于“机遇”所致。
例2、某杂志的一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为 78%,平均疗程为三周左右。
14
调查设计-实例
• 城市老年人生活质量的研究设计:
– 研究目的是了解城市老年人生活质量现状并探讨影响老年人生活 质量的主要因素;
– 研究方法是以问卷访谈和体格检查相结合的方式来评价老年人的 生活质量状况;
– 资料收集是由经过专门培训的调查员对老年人进行入户访问获得; – 调查量表采用专门生活质量量表; – 收集到的资料经核查后用EPI软件建立数据库,并用SPSS统计分
– 统计描述是根据研究设计的要求,选用适当的统计指标、统计表、 统计图等方法,对资料的数量特征及分布规律进行测定和描述。
– 统计推断是根据概率分布和抽样的原理,在随机变量的样本信息 基础上推断总体特征。统计推断包括参数估计和假设检验。
• 在进行统计分析时,要根据统计设计的目的和要求,选用 正确的统计推断方法,对样本资料进行准确的描述和推断, 才能得到真实可靠的分析结果。
定性资料的变量值只能代表事物的某些属性或分类,不能反映 程度上的差别。
30
定性资料又分为两种属性和多重属性 如果变量只有相互独立的两种属性,称为二分类变量,这是
最简单的数据类型,如性别有男或女;检查乙肝表面抗原的携带 情况,有阳性或阴性;给小白鼠注射药物,其结局有生存或死亡 等。
如果变量的观察结果表现为相互独立的多种属性,称为多分 类变量,比如血型分为相互独立的四类:A型、B型、O型和AB型, 肺癌可分为腺癌、鳞癌、腺鳞癌、未分化癌、类癌和支气管腺癌 等,各类之间只有性质的不同,没有大小和程度上的差别。

临床试验相关统计知识教材-医学统计学绪论

临床试验相关统计知识教材-医学统计学绪论
临床试验相关统计知识教材医学统计学绪论
目录
• 医学统计学概述 • 临床试验统计学基础 • 医学统计学的应用 • 医学统计学中的概率与概率分布 • 医学统计学中的抽样与样本量 • 医学统计学中的假设检验与P值
01
医学统计学概述
定义与特点
定义
医学统计学是应用统计学的原理和方 法,研究医学领域中数据的收集、整 理、分析和推断的一门学科。
意义。
根据预期的效应大小和精度要求确定样本量。
使用统计软件进行样本量计算,如Power Analysis and Sample Size (PASS) 软件。
样本量的影响因素
01
研究目的
不同的研究目的对样本量有不同的 要求。
误差率
误差率越小,所需的样本量越大。
03
02
效应指标
效应指标的测量精度和效应大小影 响样本量需求。
20世纪以后,医学统计学逐渐发展成为一门独立的学科,广泛应 用于医学研究和实践中。
现代发展
随着计算机技术和大数据的兴起,医学统计学在数据挖掘、预测模 型和精准医疗等领域取得重要进展。
02
临床试验统计学基础
临床试验设计
试验目的
明确临床试验的目标,是探索性研究还是验证性研究, 或者是描述性研究。
试验设计类型
二项分布
1 2
二项分布
描述伯努利试验中成功的次数的概率分布,其中 每次试验成功的概率为p,失败的概率为q=1-p。
二项分布的概率函数
B(n,p) = C(n,k) * p^k * q^(n-k),其中C(n,k)表 示组合数,k表示成功的次数,n表示试验次数。
3
二项分布的期望值和方差
E(X)=np,D(X)=npq,其中X表示成功的次数。

医学统计学-第一课绪论及基本概念(已整理完毕)

医学统计学-第一课绪论及基本概念(已整理完毕)

《医学统计学》颜虹主编Fundamentals of Biostatistics (BernasrdRosner)孙尚拱译(2004第五版)SPSS统计分析张文彬主编一、绪论【统计学】应用数学的原理和方法,研究数据的搜集、整理与分析的科学,对不确定性数据做出科学的推断。

产生过程:随机现象→随机事件→样本空间→随机变量现象:确定现象随机现象:与确定现象相对的不确定现象,在一定的条件下,其有多种可能的结果,而究竟出现哪一种结果事先不可预言的现象。

≥2种结果。

特征:随机性、规律性两种阶段认识随机现象:1.通过观察或实验取得观测资料;2.通过分析所得资料来认识现象。

注:无论数据分析多么先进,都要以能够代表真实情况的数据为基础。

在偶然的背后发现必然【随机事件】随机现象的一个结果叫随机事件。

【样本空间】为了便于研究随机试验,我们将随机试验E的所有基本事件所组成的集合叫做样本空间,记为Ω。

每一个基本事件为样本点,基本事件也就是集合Ω的元素。

可以把样本空间中的基本事件映射成某个变量的取值,这样就引进了随机变量的概念。

【随机变量】在样本空间中,对不同事件指定有相应概率的数值函数,此函数成为一个随机变量。

P X泛指随机变量(X=x k)=p k,如抛掷硬币:正反1 0→随机事件的选项XkP0.5 0.5→对应概率,所有加起来=1k特征:与普通函数相比有两点不同:1.随机变量随着实验结果不同取不同的值,因此在实验之前只能知道取值的范围,而不能预先知道取什么值。

由于随机试验的各个结果出现有一定的概率,所以随机变量的出现也有一定的概率。

2.普通函数定义在实数轴上,而随机变量是定义在样本空间上,样本空间的元素不一定是实数二、统计学中的基本概念1.总体(Population)、样本(Sample)【总体】根据研究目的确定的、全体同质个体的某个(或某些)变量值。

比如:糖尿病的血红蛋白水平、高血压患者的血压分类:无限总体→新生儿体重有限总体→一所学校今年新生的身高【样本】:总体中的一部分,为了保证样本的代表性,在取样时我们要求X1、X2……Xn互相独立,并且与总体X有相同的概率分布。

医学统计绪论

医学统计绪论

39
4 、误差( error )
误差:实际观察值与客观真实值之差
误差
过失误差 系统误差
随机测量误差 随机抽样误差
40
4 、误差( error )
(1) 系统误差(systematic error):
由于仪器不准确、标准不规范、抽样不均匀,分 配不随机,实验者感觉或操作上的差异等原因, 造成观察结果呈倾向性的偏大或偏小,这种误差 称为系统误差。 特点:观察值有系统性、方向性、周期性的偏离 真值。 通过周密的研究设计和严格的技术措施可以避免
Uniform Requirements for Manuscripts Submitted to Biomedical Journals http://
11
为什么要学统计学?
❖4. 获得循证医学证据的主要手段
▪ “ 良 好 愿 望 的 医 学 ” ( well-meaning medicine) 转 入 “ 以 证 据 为 基 础 的 医 学 ” (evidence-based medicine,EBM)需要 有统计学方法的支持。
20
2、搜集资料(data collection) ❖搜集资料要遵循准确、完整、及时三个原则。
21
3、整理资料(data sorting)
❖ 目的是对搜集到的原始资料整理、清理、核实、 查对,使其系统化、条理化,便于进一步计算统 计指标和深入分析。
❖ 资料整理前要对资料再次检查与核对,发现缺项 或错项较多的调查表,须补查或剔除。审查无误 后,设计分组。
18
2、搜集资料(data collection)
搜集资料:根据研究计划取得可靠、完整的资料。 ❖ 资料的来源:
1、统计报表:如疫情报表,医院工作报表等; 2、报告卡(单):传染病和职业病发病报告卡, 肿瘤发病及死亡报告卡,出生及死亡报告单等; 3、日常医疗卫生工作记录:如门诊病例、住院病 例、健康检查记录、卫生监测记录等; 4、专题调查或实验。

医学统计学-绪论

医学统计学-绪论

描述性统计 统计图表 统计推断 文字表达
一、研究设计(study design)
统计设计首先要考虑选用什么研究方法 调查研究(survey):对特定人群进行观察、分析比较,
从而找出事物变化的规律 按调查范围分为:全面调查、抽样调查、典型调查 设 计 方 案 包 括 6W1H ( What, Why , Whom, Who , When, Where, How)
统计推断:
参数估计:用样本统计量推断总体参数 如:总体均数的可信区间估计
假设检验(hypothesis testing 或significance test):用样 本统计量的差异来推断总体参数是否存在差异,即用样本 信息检验关于总体的两个对立假设 如:t检验(两个均数的比较):根据两个样本均数等信息 推测总体均数之间是否有差别 2 检验(两个率的比较):根据两个样本率的信息推测 总体均数之间是否有差别
调查设计的一般工作流程
确定研究题目 明确研究目的和意义 确定研究的主要指标 明确研究范围 确定研究方法 估计样本含量 调查表设计与资料收集方式 资料的整理与统计分析 调查的组织实施与质量控制
• 实验(试验)研究 (experiment study or trial): • 对研究对象随机分组(使各组间均衡可比)、施加
频率与概率间的关系:
1)样本频率总是围绕概率上下波动 2)样本含量n越大,波动幅度越小,频率越接近概 率
五、变量与随机变量
Variable and random variable
变量:研究对象的某个或某些特征或属性(研究指标或项目)
随机变量:变量的值是随机而获得的非确定值,随机取值的 变量就是随机变量
• 样本:
• 从总体中随机(random) 抽取一部分有代表性的个 体组成样本(sample),

医学统计学:第一章 绪论

医学统计学:第一章 绪论
通过计算各种统计指标和统计图表来描述 资料的集中趋势、离散趋势和分布特征况。
3.统计推断
是通过统计检验方法(如t检验、u检验、F检验、
卡方检验、秩和检验等)来推断两组或多组统计指标 的差异是抽样误差造成的还是有本质的差别。
4.相关与回归
医学中存在许多相互联系、相互制约的现象。如 儿童的身高与体重、胸围与肺活量、血糖与尿糖等, 都需要利用相关与回归来分析。
❖ 注意:抽样误差是不可避免的。无论抽样抽得多么好, 也会存在抽样误差。
五、概率
概率(probability):是描述随机事件发生可 能性大小的量值。用英文大写字母P来表示。 概率的取值范围在0~1之间。当P=0时,称为 不可能事件;当P=1时,称为必然事件。
小概率事件:统计学上一般把P≤0.05或 P≤0.01的事件称为小概率事件。
第一章 绪论
目录
第一节 医学统计学的定义和内容 第二节 统计工作的基本步骤 第三节 统计资料的类型 第四节 统计学中的几个基本概念
第一节 医学统计学的定义和内容
统计学(statistics)- 是搜集,整理,分
析资料,并作出决策的一门学科。
医学统计学(medical statistics)-是
如同质的儿童身高、体重、血压、脉搏等指标会 有一定的差别。
二、总体与样本
总体(population):根据研究目的确定的同质观
察单位某项变量值的集合或全体。 无限总体(infinite population) 有限总体(finite population)
样本(sample):从总体中随机抽出的部分观察单
统计推断(inferential statistics)
使用样本信息推断总体特征。通过样本统计 量进行总体参数的估计和假设检验,以达到了 解总体的数量特征及其分布规律,才是最终的 研究目的。

医学统计学 第一章绪论

医学统计学  第一章绪论

历史上著名的投掷硬币试验 试验者 投币次数 德莫根 浦丰 2048 4040 正面朝上频数 1061 2048 6019 12012 频率 0.5081 0.5069 0.5016 0.5005
皮尔逊 12000 皮尔逊 24000
2. 概率(probabilidy) 概率( ) (1)概率的定义: 概率的定义: 概率的定义 稳定的频率当作概率 概率的统计定义是将稳定的频率当作概率, ①概率的统计定义是将稳定的频率当作概率,用P 表示。 表示。 概率的古典定义: ②概率的古典定义 某种随机现象具有: 某种随机现象具有: a.等可能性( n种结果出现机会均等); 等可能性( 种结果出现机会均等 种结果出现机会均等); 等可能性 b.完备性(至少出现一种结果); 完备性( 完备性 至少出现一种结果); c.互不相容性(只能出现一种结果), 互不相容性( 互不相容性 只能出现一种结果) 则在一次试验中某种结果出现的概率为1/n。 则在一次试验中某种结果出现的概率为 。
随机化抽样
………. 总体指标
样本指标 1
样本指标2 样本指标 样本指标3 样本指标 样本指标4 样本指标
……….Байду номын сангаас
样本指标5 样本指标
随机误差是难以避免的 但具有一定规律, 随机误差是难以避免的,但具有一定规律, 难以避免 规律 可以采用统计指标衡量其大小, 指标衡量其大小 可以采用统计指标衡量其大小,并可进行相 应的分析。 应的分析。 分析 例如抽样误差可用标准误衡量其大小, 例如抽样误差可用标准误衡量其大小,分析 时可以进行总体指标的估计和假设检验。 时可以进行总体指标的估计和假设检验。
医学统计学
基础医学院 统计与预防医学教研室 陈全良
绪论 第1章 章 第一篇 基本统计方法 第2~第10章 ~ 章 第二篇 高级统计方法 第11~第24章 ~ 章 第三篇 基本统计方法 第25~第28章 ~ 章 第四篇 数据处理与条件软件应用 第29~第33章 ~ 章

医学统计学绪论完整

医学统计学绪论完整

医学统计学绪论完整医学统计学是一门应用统计学原理和方法来分析医学数据的学科。

它在医学研究和临床实践中起着至关重要的作用,可以帮助医生和研究人员更好地理解和应用各种医学数据,以推动医学科学的发展和临床实践的进步。

医学统计学的基本任务是收集、整理和分析医学数据。

医学数据可以是临床试验中的实验数据,也可以是临床病历中的观察数据。

为了有效地进行统计分析,首先需要正确地收集数据。

医学研究中常用的收集数据的方法包括问卷调查、临床试验、病历记录等。

在收集数据时,需要注意确保数据的可靠性和有效性,避免数据的偏倚和错误,以提高数据的质量。

在数据收集之后,需要对数据进行整理和描述。

数据的整理工作包括数据清洗、变量定义、缺失值处理等。

数据清洗是指对收集到的数据进行筛选和去除异常值,以保证数据的准确性和完整性。

变量定义是指对各个变量进行定义和分类,以便后续的统计分析。

缺失值处理是指对数据中的缺失值进行处理,可以选择删除缺失值或者使用插补方法进行填补。

数据描述是指对数据进行统计分析和描述性分析。

统计分析可以通过计算基本统计量如均值、中位数、标准差、协方差等来描述和比较不同的数据分布。

描述性分析则通过制作图表、计算频率分布等方式来展示数据的特征和变量之间的关系。

这些分析可以帮助研究人员更全面地理解数据,并发现数据中的规律和趋势。

医学统计学的另一个重要任务是假设检验和推断统计学。

假设检验是指通过对样本数据进行统计分析,进而对总体参数进行判断和推断。

在假设检验中,需要先提出一个零假设和一个备择假设,然后通过计算统计量和P值来判断是否拒绝零假设,从而得出结论。

推断统计学是指通过对样本数据进行分析,推断总体参数的值和性质。

在推断统计学中,需要使用抽样分布、置信区间等方法来推断总体参数的估计值和范围。

医学统计学还涉及到生存分析、回归分析、多元分析等方法。

生存分析是研究和分析患者生存时间和生存率的方法,常用于研究慢性疾病的生存率和预后情况。

卫生统计学第01章 绪论

卫生统计学第01章   绪论

第01章绪论第一节概述【统计学】※(statistics):统计学是处理数据中变异性的科学与艺术,内容包括数据的收集(collection)、分析(analysis)、解释(interpretation)和表达(presentation),目的是求得可靠的结果。

第四版教材中概念:是研究数据的收集、整理、分析和推断的一门科学。

第二节医学统计资料的来源与分类基本概念:【变量及变量值】※:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值),也称为【资料】。

①定性变量分为:分类变量(无序分类变量)或名义变量包括:多分类变量、二分类变量有序变量(有序分类变量)或等效变量②定量变量分为:离散型变量(有缝隙):只能取整数值连续型变量(无缝隙):在实数轴上是连续的按变量值的性质可将资料分为:定性资料定量资料1.【定性资料】(分类资料、分类变量)定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

特点:①没有度量衡单位②多为间断性资料(通过枚举或记数得来)2.【定量资料】(计量资料、数值变量)定义:通过度量衡的方法,测量每个观察单位的某项研究指标的量的大小,得到的一系列数据资料。

特点:①表现为数值大小②有度量衡单位③多为连续性资料(通过测量得到)3.【等级资料】(有序变量)定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。

特点:①每一个观察单位没有确切值②各组之间有性质上的差别或程度上的不同。

第三节统计学中常用的几个基本概念1.总体与样本【总体】:根据研究目的确定的同质的、所有观察单位的某种变量值的集合。

【样本】:从总体中随机抽取的、具有代表性的部分研究对象,其实测值的集合。

2.随机抽样为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到样本中)。

3. 同质与变异【同质】:研究对象具有的相同的状况或属性等共性称同质或同质性;【变异】:对于同质的各观察单位,其某变量值之间的差异,称为变异。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 绪论
医学统计学的定义 医学统计学常用的基本概念 医学统计学的主要内容 统计工作的基本步骤
医学统计学的定义
统计学( ★ 统计学( statistics)是运用概率论与数理统计的原理 ) 和方法,研究资料的收集、整理和分析推断的一门学科。 是认识社会和自然界中随机现象的数量特征的一门科学。 自然界存在的各种现象可归纳为两类: ★ 自然界存在的各种现象可归纳为两类: 必然现象: 必然现象: 在一定条件下必然发生的现象。其发生在一定 条件下是确定性的。如在地球上,上抛的石子必然下落。 随机现象: 。 随机现象: 在同一条件下有不确定结果的现象。 例如,投掷硬币。
四、参数与统计量
五、误差
误差( :指测量值(实际值)与真值(理论值)之差。 误差(Error) ) : 误差的种类: 误差的种类:系统误差、随机测量误差、抽样误差。 ●系统误差(systematic error) 系统误差( ) 数据搜集和测量过程中由于仪器不准确、 数据搜集和测量过程中由于仪器不准确、标准不规范 等原因,造成观察结果呈倾向性的偏大或偏小, 等原因,造成观察结果呈倾向性的偏大或偏小,这种 误差称为系统误差。 误差称为系统误差。 流行病学中称之为偏倚(bias) 。
六、概率
1、随机事件 (random event) 、 对随机现象进行实验或观察称为随机试验 随机试验(random trial)。 随机试验 随机试验的各种可能结果的集合称为随机事件 随机事件,简称事件。 随机事件 在一次随机试验中,某个随机事件可能发生、也可能不发 生;但在无数次的重复试验后该随机事件的发生与否是有 规ndom measurement error) 随机测量误差( ) 由于非人为的偶然因素, 由于非人为的偶然因素,对于同一样本多次测定 结果不完全一样,有时偏大有时偏小,没有倾向性, 结果不完全一样,有时偏大有时偏小,没有倾向性, 这种误差称为随机测量误差。 这种误差称为随机测量误差。 称为随机测量误差 特点:没有倾向性,多次测量计算平均值可以减小 甚至消除随机测量误差。 提高操作者熟练程度可以减少这种误差。 提高操作者熟练程度可以减少这种误差。
变量
2.分类变量(categorical variable) 分类变量 ) 分类变量表现为互不相容的类别或属性,亦称定性变量。 ( 1)无序分类变量 ( unordered categorical variable) )无序分类变量( ) 所分类别或属性之间无程度 或顺序 上的差别 无程度(或顺序 上的差别。 无程度 或顺序)上的差别 其分析应先按类别分组,计各组的观察单位数,编制分类 资料的频数表,所得资料称为计数资料 或无序分类变量资料 计数资料(或无序分类变量资料 计数资料 或无序分类变量资料)。 ( 2)有序分类变量 ( ordinal categorical variable) )有序分类变量( ) 各类别之间有程度( 或顺序) 的差别 有程度(或顺序)的差别。 有程度 其分析应先按等级顺序分组,计各组的观察单位数,编制各 等级的频数表,所得资料称为等级资料 或有序分类变量资料 等级资料(或有序分类变量资料 等级资料 或有序分类变量资料)。
n 表示投掷次数、 m 表示随机事件 A 发生的次数、 f 表示随机
事件 A 发生的频率; 用不同的投掷次数 n 作随机试验,则随机事件 A 发生的频率
f = m n ,结果如下:8/10=0.8,9/20=0.45,…, 249/500=0.498,
501/1000=0.501, 1000/2000=0.50, ……;由此看出当投掷次数
n 足够大时, f = m n → 0.5 ,称 P( A) = 0.5 ,或简写为: P = 0.5 。
当 n 足够大时,可用 f 估计 P 。
3、小概率事件 小概率事件(small probability event) 小概率事件 若随机事件 A 的概率 P( A) ≤ α ,称 A 为小概率事件。 其统计学意义是“小概率事件在一次随机试验中认为不 小概率事件在一次随机试验中认为不 可能发生”。“小概率”的标准 α 是人为规定的。 可能发生 在医学统计学中,通常设 α = 0.05 ;但对于可能引起 严重后果的事件,如术中大出血等,可规定 α = 0.01 , 甚至更小。 利用小概率原理可对科研资料进行假设检验。 利用小概率原理可对科研资料进行假设检验。 可对科研资料进行假设检验
§3 医学统计学的研究内容
实验设计 统计设计 调查设计 研究内容 统计描述 图表描述 统计分析 变量关系 参数估计 统计推断 假设检验 指标描述
医学统计学的主要内容
一、统计设计
专业设计从专业上把关,影响研究的深度和水平,取决 专业设计 于研究者的专业水平。 统计设计是运用统计学的原理和方法,针对研究目的, 统计设计 帮助研究者如何确定研究对象、样本大小、观察指标、合理安 排实验或调查,保证科研课题顺利进行,起到事半功倍的作用。 统计研究设计影响研究的质量,其取决于研究者的统计学水平。 统计设计分为调查研究设计和实验研究设计。
总体的三个基本特征: 总体的三个基本特征:
同质性。 ① 同质性。即构成总体的各单位必须具有某种共同性 质,这是形成总体的客观依据,也是我们确定总体范围 的标准。各单位必须具有这种共同性质,是由统计研究 的目的决定的。 ② 大量性。即总体是由许多单位组成的。一个或少数 大量性。 单位不能形成总体,因为统计研究的目的是要揭示大量 事物的普遍规律性,所以统计研究的对象必须包括足够 多的个体。 差异性。 ③ 差异性。即总体的各单位除了某一方面的共同性外, 在其他方面必须是有差异的,这些差异是统计研究的基 础和前提。
§2 统计学常用的基本概念
一、同质与变异 二、变量与变量值 三、总体与样本 四、参数与统计量 五、概率 六、误差
一、同质与变异
1、同质 ( homogeneity) 、 同质( ) 影响研究指标较大的、可以控制的主要因素尽可能相同。 影响研究指标较大的 、可以控制的主要因素尽可能相同。 例如研究儿童的身高时,要求影响身高较大的、易控制的因 素如性别、年龄、民族、地区要相同。 2、 2、 变异 (variation) 同质基础上的各个观察值间的差异称为变异。 同质基础上的各个观察值间的差异称为变异 。 如同性别、同年龄、同民族、同地区的健康儿童的身高和体 重不尽相同;相同病种、病程的病人,用同一疗法,却未必有相 同疗效。这些不同就是变异。可理解为同质基础上的个体差异。
三、总体与样本
总体: 根据研究目的 研究目的确 总体 : 根据 研究目的 确 同质研究对象的 定的同质 研究对象的全 定的 同质 研究对象的 全 集合) 体 ( 集合 ) 。 分有限总 体与无限总体 样本: 样本 : 从总体中随机抽 取的部分观察单位
总体与样本
1、总体 ( population) 、 总体( ) 总体是根据研究目的所确定的同质研究对象中所有 观察单位某变量值的集合。 观察单位某变量值的集合 。 有限总体( ☆ 有限总体 ( finite population) : 指明确了特定的 ) 时间、空间范围的有限个观察单位所组成的总体。 时间、 空间范围的有限个观察单位所组成的总体 。 无限总体( ☆ 无限总体 ( infinite population) : 没有时间和空间 ) 范围限制的无限个观察单位所组成的总体。 范围限制的无限个观察单位所组成的总体。
变量
1、数值变量 (numerical variable) 、 其变量值是定量的,表现为数值大小,多有度量 单位。如身高(cm)、体重(kg)、心律(次/分)、住院天数(日)、 血压(mmHg 或 kPa)等。这种由数值变量的测定值构成的 资料称为计量资料 计量资料,或数值变量资料 数值变量资料,或定量资料 定量资料。 计量资料 数值变量资料 定量资料 大多数的数值变量为连续型变量,如身高、体重、 血压等;但有的数值变量的测定值只是正整数,如心率、 白细胞计数、脉搏等,在医学统计学中把它们也视为 连续型变量。
二、变量与变量值
在收集资料时,首先要根据研究目的确定同质 观察单位,再对每个观察单位的某项特征进行测量 或观察,这种特征称为变量 (variable)。如“身高”、 变量 “体重”、“疗效”就是变量。 变量的观察结果或测量值称为变量值 变量值,亦称资料。 变量值 变量按其值的性质可分为:数值变量 分类变量 数值变量和分类变量 数值变量 分类变量。
2、样本 ( sample) 、 样本( ) 按随机化原则从同质总体中随机抽取部分观察单位, 按随机化原则从同质总体中随机抽取部分观察单位, 其变量值的集合构成样本。 其变量值的集合构成样本 样本的观察单位个数称为样本含量 样本含量,用 n 表示。 样本含量 样本必须具有代表性。“代表性”的前提是样本来自 样本必须具有代表性 同质总体、足够的观察单位数和随机抽样。 随机化原则通常是指总体中的每个个体都有同样的 随机化原则 机会被抽到样本中。但不同的研究目的,所采用的抽样 方法不同,如单纯随机抽样、系统抽样、整群抽样和分 层抽样等。
统计资料类型的表现形式
变量
变量
• 统计资料类型的名称
1、数值变量资料,定量资料, 计量资料, 、数值变量资料,定量资料, 计量资料, 定量数据, 定量数据,计量数据 2、分类变量资料,定性资料,计数资料, 、分类变量资料,定性资料,计数资料, 定性数据,计数数据, 定性数据,计数数据,分类数据 3、等级资料,有序资料 、等级资料,
变量
变量类型不是一成不变的,可根据分析的需要进行转化。 变量类型不是一成不变的, 可根据分析的需要进行转化 例如白细胞计数原属数值变量,若按正常、异常分组, 则为无序分类变量;若按过低(<4000)、正常(4000~10000)、 过高(>10000)分组,则为有序分类变量。 分类变量也可数量化,有序分类变量可用 0、1、2、3、 4 表示,无序分类变量可用哑变量(dummy variable)表示, 如可将病人的尿糖化验结果-、±、+、++、+++以 0、1、2、 3、4 表示。
相关文档
最新文档