医学]医学统计学-绪论
医学统计学
第一章绪论(一)名词解释1.总体与样本2. 随机抽样3. 变异4. 等级资料5. 概率与频率6. 随机误差7. 系统误差8. 随机变量9.参数10. 统计量(二)单项选择题1.观察单位为研究中的( )。
A.样本B. 全部对象C.影响因素D. 个体2.总体是由()。
A.个体组成B. 研究对象组成C.同质个体组成D. 研究指标组成3.抽样的目的是()。
A.研究样本统计量B. 由样本统计量推断总体参数C.研究典型案例研究误差D. 研究总体统计量4.参数是指()。
A.参与个体数B. 总体的统计指标C.样本的统计指标D. 样本的总和5.关于随机抽样,下列那一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好(三)是非题1.研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。
2.统计分析包括统计描述和统计推断。
3.计量资料、计数资料和等级资料可根据分析需要相互转化。
(四)简答题某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什麽?第二章计量资料的统计描述(一)名词解释1.频数表2.算术均数3.几何均数4.中位数5.极差6.百分位数7.四分位数间距8.方差9.标准差10.变异系数(二)单项选择题1.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变2.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差3.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差4.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距5.各观察值同乘以一个不等于0的常数后,()不变。
医学统计学(MedicalStatistics)
2. 分类数据(categorical) :
• 变量值表现为按某属性划分的定性类别。清点各 类别个数后得到的资料称计数资料。
• 2)多分类(无序):例:副作用(有重复选 择)
• 3.等级(有序)
• 疗效:痊愈=4、显效=3、有效=2、无效=1
例:105人心脏外科病人心理反应情况
• 心理反应 病例
• 症状
数
• 焦虑
102
• 抑郁
57
• 自我认同紊乱 10
• 恐惧
5
• 合计
174
百分比 反应发生率 (%) (%) 58.6 97.14 32.8 54.28
• 例:病情分级(X1):Ⅰ , Ⅱ,Ⅲ
• 疗效(X2):痊愈、显效、有效、无效
• 病人满意度(X3): 好、中、差
•
人数
50 25 5
数据类型及赋值
• 数据(变量)类型 变量的表现
• 1.计量变量:
血压值:12.3kap
• 2.分类(定性)
• 1)两分类: 疗效:有效=1,无效=0
•
性别:男=1,女=2
六、科研工作的步骤 根据研究的目的
1.研究 设计
设计考虑:
研究对象、 指标、例 数、如何 准确得到 数据。
2.收集 资料
来源:
3.整理 资料
目的:
1.日常工作 记录、病历。
2.专门的调 查和实验。
使资料系 统化,便 于进一步 统计分析
4.分析 资料
方法: 用统计方 法分析资 料,阐述 规律性, 得出结论。
医学统计学绪论
绪论
第一章
一、重ห้องสมุดไป่ตู้内容
一、重点内容
医学统计学的定义 统计工作的基本步骤 统计资料的变量类型 统计学中的几个基本概念
医学统计学的定义 医学统计学(medical statistics)是运用概率论和数理统计的基本原理
和方法,结合医学实践,研究医疗卫生领域中资料的收集、整理和分析 的一门应用科学。
的影响因素相同或基本相同。 变异(variation):是指同质观察单位个体间某项指标数值上存在的
差异。
总体(population):是根据研究目的所确定的同质观察单位某项变 量值的集合。
样本(sample):是根据随机性原则从总体中抽取出部分具有代表性 的观察单位某项指标变量值的集合。
参数(parameter):就是用来描述总体特征的统计指标,一般是未 知的常数。
随机误差(random error):受偶然因素的影响,对同一对象的多次 测量结果不完全一致。
抽样误差(sampling error):是指在抽样过程中所产生的样本统计量 与总体参数或样本同一统计量之间的差异。
概率(probability):是描述随机事件发生可能性大小的数值。 频率(frequency):是在相同的条件下进行了n次试验,在这n次试 验中事件A发生的次数m称为事件A发生的频数,其比值m/n称为事件A 发生的频率,记为fn(A)=m/n。
第一章
二、疑难知识点
二、疑难知识点
资料类型的判断 三种误差的区分 参数与统计量的区分 小概率事件的认识
第一章
三、常考知识点
三、常考知识点
统计工作的基本步骤 统计资料类型的判别 总体与样本的概念 统计分析的内容 统计推断的内容
第一章
《医学统计学》之医学统计学绪论
研究生存时间、生存率等指标,分析影响因素和预测模型。
多元统计分析
如因子分析、聚类分析、主成分分析等,适用于复杂数据结构的研究。
生存分析
适用于长期观察和随访研究的数据分析。
利用多种统计方法综合分析多个变量之间的关系。
01
02
03
04
05
06
05
医学统计学的报告与解读
置信区间
VS
在解释研究结果时,应注意结果的统计学显著性和实际意义。如果观察到的结果具有统计学显著性,但无实际意义或价值较小,则不应过度强调或夸大其效果。同时,应注意结果的稳健性和可重复性,以评估结果的可靠性和可信度。
研究结果的报告
在报告研究结果时,应遵循准确、客观、完整和可理解的原则。结果应清晰明了地呈现,并附有适当的解释和说明。同时,应注意结果的伦理和法律问题,保护受试者的隐私和权益,避免误导读者或造成不必要的困扰。
《医学统计学》之医学统计学绪论
目录
contents
医学统计学简介医学统计学的基本概念医学统计学的应用领域医学统计学的数据处理与分析方法医学统计学的报告与解读医学统计学的挑战与未来发展
01
医学统计学简介
医学统计学是一门应用数理统计学的原理和方法,对医学实验和调查数据进行整理、分析和推断的学科。它具有数学性质和应用性质,是医学领域中不可或缺的工具。
生物统计学在药物研发过程中起到关键作用,如新药临床试验的设计与分析、药物疗效的评估等。
03
02
01
04
医学统计学的数据处理与分析方法
实验室研究:通过实验手段获取有关生物标志物、病理生理等方面的数据。
去除或纠正错误、异常或不完整的数据。
医学统计学复习资料(完整版)
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计课件人卫6版第一章绪论
变量与数据类型
变量
描述研究对象特征的量度或度量,具 有可变性。
数据类型
根据变量的性质和测量尺度,将数据 分为不同的类型,如定量数据、定性 数据和等级数据等。
参数与统计量
参数
描述总体特性的度量,通常用希腊字母表示,如均值μ、方差 σ²等。
统计量
描述样本特性的度量,通常用英文字母表示,如样本均值x、 样本方差s²等。
。
03
药物研发和临床试验
在药物研发和临床试验中ຫໍສະໝຸດ 医学统计学对试验设计、数据收集、分析和
解释起到至关重要的作用。它确保试验结果的可靠性和准确性,为新药
审批和上市提供科学依据。
02
CATALOGUE
医学统计学的基本概念
总体与样本
总体
研究对象的全体集合,具有同质 性。
样本
从总体中随机抽取的一部分研究 对象,用于推断总体的性质。
02
它通过对数据的研究,揭示现象 的内在规律,为医学研究和医疗 实践提供科学依据。
医学统计学在科学研究中的作用
实验设计和数据分析
医学统计学在实验设计中起到关键作用,通过合理的设计和样本量的计算,确保实验结果 的可靠性和准确性。同时,在数据分析阶段,医学统计学提供了一系列统计分析方法,帮 助研究者从数据中提取有意义的信息。
多元统计分析
开始发展多元统计分析方法,以处 理更复杂的数据结构。
现代的医学统计学
数据挖掘与机器学习
利用大数据和机器学习技术进行数据分析和预测。
生物信息学
结合生物信息学方法,对基因组、蛋白质组等大规模数据进行统 计分析。
可视化技术
发展出丰富的可视化技术,帮助更好地理解和解释数据。
05
《医学统计学》医统-第一章绪论
医学统计中的基本概念
随机测量误差: 由于各种偶然因素的影响也会造成同一对象多次 测定的结果不完全一致。
非人为的偶然因素使得结果时高时低,没有固定倾 向,是不确定、不可预知的。
特点:没有倾向性,多次测量计算平均值可以减 小甚至消除随机测量误差。
(随机测量误差,抽样误差)。
编辑课件
医学统计中的基本概念
编辑课件
医学统计中的基本概念
误差:观测值-真实值、样本统计量-总体参数 包括:系统误差、随机测量误差、抽样误差
系统误差: 指数据搜集和测量过程中由于仪器初 始状态未调零、标准试剂未经校正、 医生掌握疗效标准偏高或偏低等原因, 造成观察结果呈倾向性的偏大或偏小, 这种误差称为系统误差。
必须克服!
编辑课件
编辑课件
第二节 医学统计学的基本内容 统计描述:描述及总结一组数据的重要特征, 目的是使实验或观察得到的数据表达清楚并便 于分析。统计描述结果的表达方式主要是统计 指标、统计表和统计图。
编辑课件
第二节 医学统计学的基本内容
统计推断:指由样本数据的特征推断总体特 征的方法,包括参数估计和假设检验。参数 估计的重要性在于可以给出区间估计;假设 检验重点则是比较参数的大小。
既有计数资料的特性,又兼有半定量的性质。 特点:每一个观察单位没有确切值
各组之间有性质上的差别或程度上的不同。
统计分析方法的选用与数据类型有密切的关系。根 据分析的需要,不同类型的变量或数据之间可以进 行转换。
编辑课件
军训服装:男装 女装 S M L XL
学霸 学酥 学渣 学灰 西安 宝鸡 渭南 咸阳 榆林
编辑课件
医学统计中的基本概念 同质:指根据研究目的所确定的观察单位其性质应大 致相同。 (同一总体中的每一个体都具有相同的性质的特征。)
医学统计学重点概要
第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。
总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。
资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。
抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。
取值范围0≤P ≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
P ≤0.05或P ≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。
统计分析包括:统计描述和统计推断。
统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。
对称分布:集中位置在中间,左右两侧頻数基本对称。
偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。
(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。
计量资料集中趋势包括算术均数、几何均数和中位数。
算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。
医学统计学重点
医学统计学重点第一章绪论1.根本概念:总体:根据研究目确实定的性质相同或相近的研究对象的某个变量值的全体。
样本:从总体中随机抽取局部个体的某个变量值的集合。
总体参数:刻画总体特征的指标,简称参数。
是固定不变的常数,一般未知。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:假设事件A在n次独立重复试验中发生了m次,那么称m为频数。
称m/n为事件A在n 次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用适宜统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。
用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。
用样本差异或样本与总体差异推断总体之间是否可能存在差异,称为假设检验。
2.样本特点:足够的样本含量、可靠性、代表性。
3.资料类型:〔1〕定量资料:又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的数值,有度量衡单位。
〔2〕分类资料:包括无序分类资料〔计数资料〕和有序分类资料〔等级资料〕①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。
4.统计工作根本步骤:统计设计、资料收集、资料整理、统计分析。
第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差〔抽样误差、随机测量误差〕、系统误差、过失误差。
3.实验设计的三个根本原那么:对照原那么、随机化分组原那么、重复原那么。
统计学--第一章医学统计学-绪论
统计量
parameter
参数
sampling error
抽样误差
systematic error
系统误差
measurement error
测量误差
5/10/2020
random event
课件
随机事件
19
relative frequency parameter numerical variable measurement data categorical variable enumeration data ordinal variable rank data design data collection missing data grouping data sorting data analysis descriptive statistics inferential statistics estimation hypothesis test
➢一个科学结论,除了理论机制的阐述外, 还要有一定数量的重复观察结果和合理的 对照等。
5/10/2020
课件
11
为什么要学习医学统计学?
乙药是否比甲药有效?
表 1 甲、乙两疗法对小儿单纯性消化不良治愈率比较
疗法
痊愈数 未痊愈数 合计 治愈率(%)
甲
26
7
33
78.79
乙
36
2
38
94.74
合计
62
讲解本课程的统计方法,并掌握统计软 件SPSS基本操作过程,以及理解其分析 结果。
5/10/2020
课件
3
授课目的
最终能应用SPSS统计软件,将学过的
各种统计分析方法结合具体实际问题或 有关的数据指标进行分析,领会各种统计 数量分析过程和应用中的意义,合理地解 释各种分析结果。
医学统计学-第一课绪论及基本概念(已整理完毕)
《医学统计学》颜虹主编Fundamentals of Biostatistics (BernasrdRosner)孙尚拱译(2004第五版)SPSS统计分析张文彬主编一、绪论【统计学】应用数学的原理和方法,研究数据的搜集、整理与分析的科学,对不确定性数据做出科学的推断。
产生过程:随机现象→随机事件→样本空间→随机变量现象:确定现象随机现象:与确定现象相对的不确定现象,在一定的条件下,其有多种可能的结果,而究竟出现哪一种结果事先不可预言的现象。
≥2种结果。
特征:随机性、规律性两种阶段认识随机现象:1.通过观察或实验取得观测资料;2.通过分析所得资料来认识现象。
注:无论数据分析多么先进,都要以能够代表真实情况的数据为基础。
在偶然的背后发现必然【随机事件】随机现象的一个结果叫随机事件。
【样本空间】为了便于研究随机试验,我们将随机试验E的所有基本事件所组成的集合叫做样本空间,记为Ω。
每一个基本事件为样本点,基本事件也就是集合Ω的元素。
可以把样本空间中的基本事件映射成某个变量的取值,这样就引进了随机变量的概念。
【随机变量】在样本空间中,对不同事件指定有相应概率的数值函数,此函数成为一个随机变量。
P X泛指随机变量(X=x k)=p k,如抛掷硬币:正反1 0→随机事件的选项XkP0.5 0.5→对应概率,所有加起来=1k特征:与普通函数相比有两点不同:1.随机变量随着实验结果不同取不同的值,因此在实验之前只能知道取值的范围,而不能预先知道取什么值。
由于随机试验的各个结果出现有一定的概率,所以随机变量的出现也有一定的概率。
2.普通函数定义在实数轴上,而随机变量是定义在样本空间上,样本空间的元素不一定是实数二、统计学中的基本概念1.总体(Population)、样本(Sample)【总体】根据研究目的确定的、全体同质个体的某个(或某些)变量值。
比如:糖尿病的血红蛋白水平、高血压患者的血压分类:无限总体→新生儿体重有限总体→一所学校今年新生的身高【样本】:总体中的一部分,为了保证样本的代表性,在取样时我们要求X1、X2……Xn互相独立,并且与总体X有相同的概率分布。
医学统计学绪论
案例3
表1-1 冠心灵与单纯西药疗效对比
组别
显效 有效
无效
合计
单纯西药 9
25
6
40
冠心灵
19
18
5
42
P=0.061
案例
4
表甲乙两校35岁及以上知识分子的高血压患病率
年龄
甲校
乙校
患病率
患病率
(岁) 检查人数 病人数 (%) 检查人数 病人数 (%)
35~ 236
16 6.78 478
医学研究中有关统计学的常见问题
案例1
北京某医院某医生使用乌贝散治疗胃溃疡出血 107例,101例有效,有效率为94.4%。那么其它医 生使用该药,有效率会是多少呢?
(90.04%~98.76%)
案例2
随机抽取50-59岁男性正常人、糖尿病患 者各11人,测定其血浆胆固醇含量分别为3.20± 0.70 (mmol/L) 、5.35±1.19(mmol/L) ,问两 组人的血浆胆固醇有无差别?为什么?
33 6.90
45~ 375
27 7.20 379
28 7.39
55~ 384
38 9.90 235
24 10.21
65~80 402
59 14.68 157
24 15.29
合计 1397 140 10.02 1249 109 8.73
问:甲校高血压预防工作不如乙校吗?
案例
5
表4 某地区5种急性传染病的死亡情况
12012
频率 0.5069 0.5016 0.5005
• 概率:描述随机事件发生的可能性大小的度量,用大写的P表示;取值: 0~1之间。 P越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性 越小。
医学统计学-绪论
描述性统计 统计图表 统计推断 文字表达
一、研究设计(study design)
统计设计首先要考虑选用什么研究方法 调查研究(survey):对特定人群进行观察、分析比较,
从而找出事物变化的规律 按调查范围分为:全面调查、抽样调查、典型调查 设 计 方 案 包 括 6W1H ( What, Why , Whom, Who , When, Where, How)
统计推断:
参数估计:用样本统计量推断总体参数 如:总体均数的可信区间估计
假设检验(hypothesis testing 或significance test):用样 本统计量的差异来推断总体参数是否存在差异,即用样本 信息检验关于总体的两个对立假设 如:t检验(两个均数的比较):根据两个样本均数等信息 推测总体均数之间是否有差别 2 检验(两个率的比较):根据两个样本率的信息推测 总体均数之间是否有差别
调查设计的一般工作流程
确定研究题目 明确研究目的和意义 确定研究的主要指标 明确研究范围 确定研究方法 估计样本含量 调查表设计与资料收集方式 资料的整理与统计分析 调查的组织实施与质量控制
• 实验(试验)研究 (experiment study or trial): • 对研究对象随机分组(使各组间均衡可比)、施加
频率与概率间的关系:
1)样本频率总是围绕概率上下波动 2)样本含量n越大,波动幅度越小,频率越接近概 率
五、变量与随机变量
Variable and random variable
变量:研究对象的某个或某些特征或属性(研究指标或项目)
随机变量:变量的值是随机而获得的非确定值,随机取值的 变量就是随机变量
• 样本:
• 从总体中随机(random) 抽取一部分有代表性的个 体组成样本(sample),
医学统计学:第一章 绪论
3.统计推断
是通过统计检验方法(如t检验、u检验、F检验、
卡方检验、秩和检验等)来推断两组或多组统计指标 的差异是抽样误差造成的还是有本质的差别。
4.相关与回归
医学中存在许多相互联系、相互制约的现象。如 儿童的身高与体重、胸围与肺活量、血糖与尿糖等, 都需要利用相关与回归来分析。
❖ 注意:抽样误差是不可避免的。无论抽样抽得多么好, 也会存在抽样误差。
五、概率
概率(probability):是描述随机事件发生可 能性大小的量值。用英文大写字母P来表示。 概率的取值范围在0~1之间。当P=0时,称为 不可能事件;当P=1时,称为必然事件。
小概率事件:统计学上一般把P≤0.05或 P≤0.01的事件称为小概率事件。
第一章 绪论
目录
第一节 医学统计学的定义和内容 第二节 统计工作的基本步骤 第三节 统计资料的类型 第四节 统计学中的几个基本概念
第一节 医学统计学的定义和内容
统计学(statistics)- 是搜集,整理,分
析资料,并作出决策的一门学科。
医学统计学(medical statistics)-是
如同质的儿童身高、体重、血压、脉搏等指标会 有一定的差别。
二、总体与样本
总体(population):根据研究目的确定的同质观
察单位某项变量值的集合或全体。 无限总体(infinite population) 有限总体(finite population)
样本(sample):从总体中随机抽出的部分观察单
统计推断(inferential statistics)
使用样本信息推断总体特征。通过样本统计 量进行总体参数的估计和假设检验,以达到了 解总体的数量特征及其分布规律,才是最终的 研究目的。
医学统计学 第一章 绪论
第一章绪论第一节医学统计学的地位和作用当人们研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效?最基本的方法就是比较。
通常将患者以随机的方式分成两个组,一组服用该新药,另一组服用对照药物,观测并记录两种药物的疗效,最后统计分析该新药的有效性和安全性,这就是一个常见的临床试验。
其中,统计学扮演什么角色?在这个临床试验中有诸多问题需要回答:需要多少名患者参加试验?如何随机地将患者分为两个组?哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效的因素在两组的分布是一致的?如果分布不一致,如何在诸多的影响因素中,分离出药物因素的效应?应采用什么样的指标来反映新药的有效性和安全性?怎样测量这些指标以保证数据的准确性和可靠性?如何控制临床试验的误差?如果两组疗效存在一定差别,怎样比较两个药物的疗效到底是否存在差别?换言之,我们需要了解这种差别是机会造成的,还是真实存在的?统计学可以回答上述问题。
我们再看另一种情形,假定为了解一个城市居民高血压病的患病现状,通常的做法是在这个城市调查一部分个体,利用这一部分个体的高血压病患病状况来反映整个城市的患病状况。
那么,如何在这个城市选取这一部分个体?因为只有这部分个体能够很好地代表整个城市人群,用这种部分推论全体的做法才是准确的。
此外,需要选取多少人进行调查?如何保证收集到的资料是准确和可靠的,又如何评价这种准确性和可靠性?几百人的血压值(如收缩压值)各不相同,看上去是一堆“杂乱无章”的数据,如何描述高血压病的患病状况,如何才能推论到整个城市人群?我们对于这种推论的正确性抱有多大的信心?统计学也可以回答上述问题。
每个人的血压都不一样,每个高血压病患者对同一种药物治疗的反应也存在着差别,这就是所谓的个体差异和不确定性。
个体差异是自然界普遍存在的现象,个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。
在统计学中,我们将这种差异称为变异(variation)。
卫生统计学和医学统计学 第一章 绪论【考研背诵笔记】【期末考试资料】
第一章绪论一、卫生统计学就是运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的收集、整理、分析和推断的一门科学。
二、同质和变异同质:针对被研究指标来讲,其影响因素相同。
变异:同质观察单位之间的个体差异。
三、总体和样本总体:根据研究目的确定的同质观察单位的全体。
确切地说,是同质的所有观察单位某种变量值的集合。
样本:从研究总体中随机抽取部分有代表性的观察单位。
样本量:样本中所含的观察单位的数量。
抽样:从总体中抽取样本的过程。
抽样研究:从总体中抽取样本,根据样本信息来推断总体特征。
四、参数与统计量参数:是根据总体分布的特征而计算的总体统计指标,是一个固定的常数,通常是未知的。
统计量:由样本计算得到的反映样本资料特征的统计指标,为随机变量,取值在参数附近波动,可作为参数的估计值。
五、变量的类型( 选择题高频考点)(一)定量变量1.离散型定量变量2.连续型定量变量(二)定性变量1.分类变量(名义变量):二分类变量和多分类变量2.等级变量(有序变量)六、频率与概率概率:描述随机事件发生可能性大小的一个度量,为一个固定的常数,取值在0到1之间,常用p来表示。
频率:在相同的条件下,独立地重复进行n次实验,随机事件A 出现了f次,则称f/n为事件A出现的频率。
↓(高频考点)小概率事件:习惯上将P≤0.05或P≤0.01称为小概率事件,通常表示某事件发生的可能性很小,在一次随机抽样中不会发生。
七、误差↓(高频考点)抽样误差:由抽样引起的样本统计量与总体参数之间的差异,或者不同样本统计量之间的差异。
包括系统误差和随机误差(不可避免的,类似抽样误差)。
随机误差:是一类恒定的、随机变化的误差,由多种尚无法控制的因素引起。
系统误差:是实验过程或者干预产生的误差。
过失误差:偶然失误造成的误差。
八、统计工作步骤(↓简答题高频考点)(一)统计设计(最关键的一环)拟定包括资料收集、整理和分析的计划和设想和如何遵循设计的三个基本原则(随机化、重复、对照)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频数 3 3 8
23 24 25 20 12 10
4 132
特点: ①有单位 ②可计算平均数
流行病与卫生统计学教研室 24
(2)计数资料(定性资料或无序分类变量)
对观察对象按属性或类型分组计数所得 的资料。每个对象之间没有量的差异,只有 质的不同。其变量值的定性的,表现为互不 相容的属性或类别。可分为:
样本信息推论总体特征的前提:
1、样本的可靠性: 明确划清总体的同质范围,且样本的
每个个体确属预先确定的总体。 2、样本的代表性:
(1)样本必须遵循随机化原则 (2)有足够的样本例数
2020/4/11
流行病与卫生统计学教研室 15
(三)抽样
指从总体中抽取部分个体的过程。 (1)代表性
样本中的每一个体必须符合总体的规定。 (2)随机性
1、变量 研究者对每个观察单位的某项特征进行
观察或测量,这种特征能表现观察单位的变 异性,称为变量。
例如:身高、体重、性别等。
2020/4/11
流行病与卫生统计学教研室 18
2、变量值 变量的观察指标的结果称为变量值。 (1)定量的变量值 (如身高值等) (2)定性的变量值 (如性别等)
2020/4/11
合计
40 42
问题:某医师用“冠心灵”治疗 冠心病,其疗效是否优于单纯西药?
2020/4/11
流行病与卫生统计学教研室 5
药物临床疗效研究
患者的状况(性别、年龄) 混杂因素
药物
2020/4/11
疗效
病情
心
理
其他因素
因
素
流行病与卫生统计学教研室 6
第一节 医学统计学的定义和内容
一、统计学的概念
统计学是应用概率论和数理统计的原 理、方法研究数据的收集、整理、分析和推 断的一门学科。它在不同领域的应用,就形 成不同的统计学。如医学统计学、生物统计 学和卫生统计学等。
例如:某医生比较两种疗法对活动期十二 二指肠球部溃疡的疗效。
呋喃硝胺 100人 西米替丁 100人
2020/4/11
疗效 90人
疗效 85人
据此能否立即 下结论,呋喃 硝胺的疗效高 于西米替丁?
流行病与卫生统计学教研室 4
冠心灵与单纯西药 疗效对比
单纯西药 冠心灵
显效
9 19
有效
25 18
无效
6 5
2020/4/11
流行病与卫生统计学教研室 7
1、医学统计学定义: 运用统计学的原理和方法,研究
医学科研中有关数据的收集、整理和 分析的一门应用学科。
2020/4/11
流行病与卫生统计学教研室 8
2、与生物统计学和卫生统计学联系与区别:
生物统计学应用于整个生物学范畴有 关的研究,比医学统计学范围更广。
流行病与卫生统计学教研室 19
3、同质与变异
(1)同质(homogeneity):指被研究指标 的影响因素相同。实际工作中,指被研 究指标中可控制的主要因素要尽可能相 同或基本相同。
2020/4/11
流行病与卫生统计学教研室 20
(2)变异 在同质的基础上,个体之间的值各不相同。 例如:同性别、同年龄、同种族的儿童其
对每一观察对象用定量的方法,测定某 项指标所得的资料。其变量值是定量的,表 现为数值的大小,一般有度量衡单位。
①连续型计量资料(如身高、体重等) ②离散型计量资料
(如某医院每年的病死人数等)
2020/4/11
流行病与卫生统计学教研室 23
某年某地健康成人空腹血糖值(mmol/L)
血糖 3.603.804.004.204.404.604.805.005.205.40-5.60 合计
总体的分类
总体
有限总体
2002年某地全部 正常成人白细胞数
无限总体 高血压患者
①有限总体:个体数量是有限的总体。 ②无限总体:个体数量是无限的总体。
2020/4/11
流行病与卫生统计学教研室 13
(二)样本(sample):
从总体中随机抽取部分观察单位,其 某项变量值的集合。
抽样
总体
目的
样本
用样本信息来推断总体特征 例202如0/:4/了11解某地2002年正流常行病成与人卫生白统细计学胞教研数室 14
确保总体中的每一个体有相同的概率被抽 作样本。
2020/4/11
流行病与卫生统计学教研室பைடு நூலகம்16
(3)可靠性
用样本结果推测总体的结论的可信度。 确保可靠性,样本含量必须“足够大”。
(4)可比性
如果进行两个或多个样本之间的比较, 要求资料具有可比性。
2020/4/11
流行病与卫生统计学教研室 17
二、变量及其分类
医学统计学
流行病与卫生统计学教研室
谭盛葵 副教授
2020/4/11
流行病与卫生统计学教研室
1
第一章 绪 论
2020/4/11
流行病与卫生统计学教研室 2
学习目的与要求
1.掌握医学统计学的基本概念。 2.掌握医学统计学的基本步骤。 3.掌握统计资料的类型。
2020/4/11
流行病与卫生统计学教研室 3
身高有高有矮。
2020/4/11
流行病与卫生统计学教研室 21
4、资料
所有的变量值集合构成资料。按变量是 定量或定性,可将资料分为:
(1)计量资料(数值变量) (2)计数资料(无序分类)
分类变量 (3)等级资料(有序分类)
2020/4/11
流行病与卫生统计学教研室 22
(1)计量资料 (定量资料或数值变量)
对照试验、生存分析等。 4、多因素分析的统计分析方法
……………..
2020/4/11
流行病与卫生统计学教研室 10
第二节 统计学中的几个基本概念
一、总体与样本
1、总体(population)
根据研究目的所确定的同质的所有观 察单位某项变量值的集合。
有关总体的三个要点: 研究目的、同质的、全体
2020/4/11
卫生统计学用于医学与卫生学领域的 有关研究,更侧重于医学与卫生学的社会 方面。如居民健康状况统计和卫生服务统 计等。
2020/4/11
流行病与卫生统计学教研室 9
二、医学统计学的主要内容
1、统计研究设计 2、常用基本统计方法 如统计描述和统计
推断、直线回归与相关等。 3、临床医学中常用的统计方法 如随机
流行病与卫生统计学教研室 11
例如:了解某地2002年正常成人白细胞数
目的:了解某地2002年正常成人白细胞数 观察对象:该地2002年全部正常成人 观察单位:每个人 观察值:测得的白细胞数
同质: 同一地区、同一年份、同为正常成人 全体:该地2002年全部正常成人白细胞数
2020/4/11
流行病与卫生统计学教研室 12