医学统计学课件PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、统计学中的几个基本概念
• 6、频率(relative frequency)、概率 (probability)、小概率事件 .(1)、频率(relative freguency): 一次随机试 验有几种可能结果,在重复进行试验时,个别 结果看来是偶然发生的,但当重复试验次数相 当多时,将显现某种规律性。例如,投掷一枚 硬币,结果不外乎出现“正面”与“反面”两 种,现在,我们看一掷币模拟试验:
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation) • (1)、同质(homogeneitywenku.baidu.com:根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
• 同质:同长沙市、同7岁、同男孩、同无 影响身高的疾病。
二、统计学中的几个基本概念
variable)
(1)、 研究单位(unit) :研究中的个体 (individual),是根据研究目的确定的。
二、统计学中的几个基本概念
例如:研究7岁男孩身高的正常值范围 研究大学生视力 研究水污染情况 研究细胞变性 研究肝癌的地区分布 一个人 一只眼睛 一毫升水 一个细胞 一个地区
二、统计学中的几个基本概念
• (2)、变异 (variation) • 变异 (variation):同质研究单位中变 量值间的差异。 • 例如:1)长沙市2004年7岁男孩身高有 高有矮 • 2)相同的药方治疗相同的疾病的 病人,疗效有好有坏
二、统计学中的几个基本概念
• 3、总体(population)和样本(sample) • (1)、总体(population):是根据研究 目的确定的同质研究单位的全体。更确 切地说是同质研究单位某种变量值的集 合。 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
•1) 7岁男孩身高有高有矮 •2)n=100 , 平均身高 =119.5cm • 95%的长沙市7岁男孩的身高在 110.20cm~129.20cm之间
二、统计学中的几个基本概念
1、研究单位(观察单位、unit)和 变量 、研究单位(观察单位、unit) (variable variable)、变量值(value of
二、统计学中的几个基本概念
(2)样本(sample):是总体中抽取的有 代表性的一部分。 注意:随机抽样(无主观性) 样本含量( sample size):样本中包含的 研究单位数。 例如:某药治疗高血压患者30名 样本含量(n)为30
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic) • (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。 • 一般用希腊字母表示 • (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。 • 一般用拉丁字母表示
英国统计学家R.A.Fisher(1890-1962)对遗传学家 ( 英国统计学家 ) Mendel(1822-1884)杂交试验结果的评价 ( )杂交试验结果的评价: 为 什 么 要 学 医 学 统 计 学 ?
杂交试验结果:绿色种子的频率 杂交试验结果 绿色种子的频率2001/8023 绿色种子的频率 期望值=8023 × 0.25=2006, 标准差 标准差=39 期望值 Prop(2001.5~2011.5)=0.11, 结合 结合Mendel历次报告的其它实 历次报告的其它实 验结果,每次都有如此好的吻合的概率约 万分之4。 每次都有如此好的吻合的概率约10万分之 验结果 每次都有如此好的吻合的概率约 万分之 。 第二代 Y/Y Y/G G/Y G/G 第一代 Mendel的豌豆杂交试验 的豌豆杂交试验: 的豌豆杂交试验 父本 YG 母本 YG
第十一章 多因素试验资料的方差分析 第十二章 重复测量设计资料的方差分析 第十五章 多元线性回归分析 第十六章 logistic回归分析 回归分析 第十七章 生存分析 第十八章 判别分析 第十九章 聚类分析 第二十三章 常用综合评价方法 第二十四章 量表研制与量表资料的统计分析方法
“非常痛心地看到,因为数据分析的缺陷和错误,那么多 非常痛心地看到,因为数据分析的缺陷和错误, 好的生物研究工作面临着被葬送的危险” 好的生物研究工作面临着被葬送的危险” 。
二、统计学中的几个基本概念
可见,在相同条件下重复试验,试验结果 为“正面”或“反面”虽不能事先断定, 但我们知道试验的所有可能结果只有两 种。 在重复多次后,出现“正面” 或 “反面”这个结果的比例称之为频率。 。
二、统计学中的几个基本概念
.(2)、概率(probability) 概率是度量随 、概率( ) 机事件发生可能性大小的一个数值。 机事件发生可能性大小的一个数值。 设在相同条件下,独立地重复 次试验, 次试验, 设在相同条件下,独立地重复n次试验 f n f 随机事件A出现 随机事件 出现 次,则称 为随机事 出现的频率。 逐渐增大时, 件A出现的频率。当n逐渐增大时, 频率 出现的频率 逐渐增大时 趋向于一个常数, f n 趋向于一个常数 , 则称该常数为随机事 的概率, 。 件A的概率,可记为 P(A) ,简记为 的概率 0≤ P(A)≤1
二、统计学中的几个基本概念
• 研究单位:一个人 • 变量:红细胞数 • 同质:同某地、同2002年、同成年男子、 同正常。 总体:1)某地所有的正常成年男子 2)某地所有的正常成年男子的 红细胞数
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围 • 2)无限总体(infinite population):研 究单位数是无限的 • 例如:高血压患者←无时间、空间限制。
为 什 么 要 学 医 学 统 计 学 ?
统计知识 的运用
-- F. Yates,M.J.R. Healy ,
撰写论文:报告自己观 撰写论文: 察或实验的研究结果。 察或实验的研究结果。
阅读论文:吸收新知识, 阅读论文:吸收新知识, 了解学术进展。 了解学术进展。
1996年,有机构对申报科技成果的4586篇科研论文分 年 有机构对申报科技成果的 篇科研论文分 统计方法使用率为76%。 析,统计方法使用率为 。
为 什 么 要 学 医 学 统 计 学 ?
医学论文中统计运用错误,除了影响论文的科学性, 医学论文中统计运用错误,除了影响论文的科学性, 还可能导致严重的伦理学问题。 还可能导致严重的伦理学问题。
60年代到 年代,国外医学杂志调查表明:20%~72%的论文有统 年代到80年代 国外医学杂志调查表明: 年代到 年代, 的论文有统 计错误。 计错误。 1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂 年对《中华医学杂志》 中华内科杂志》 年对 中华妇产科杂志》 中华儿科杂志》 志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结 篇论文的调查结 果为: 果为: 相对数误用占 11.2%,抽样方法误用占 , 抽样方法误用占15.9%,统计图表误用占 , 11.7% 1996年对 年对4586篇论文统计(中华医学会系列杂志占 篇论文统计( 年对 篇论文统计 中华医学会系列杂志占6.9%),数据 ) 分析方法误用达55.7%。 分析方法误用达 。 2001年《中华预防医学杂志》:中华医学会系列杂志误用约 年 中华预防医学杂志》 中华医学会系列杂志误用约54% (1995)。 )
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。 • 例如:µ=120.0cm n=100 • N=5万 → X =118.6cm • 特点:1)不可避免性 • 2)有统计规律性
二、统计学中的几个基本概念
•产生原因: •个体差异(生物变异)
二、统计学中的几个基本概念
• 总体参数一般是不知道的 • 统计学抽样研究的目的就是: • 样本统计量→总体参数
二、统计学中的几个基本概念
• 5、系统误差(systematic error) 、非系 统误差(nonsystematic error) 、抽样误 差(sampling error) • 误差(error)是指实际观察值与观察真 值之差、样本指标与总体指标之差。
(2)变量(variable 变量(variable):
研究单位的研究特征。 例如:研究7岁 男孩身高的正常值范围 变量: 身高 (3)
变量值(value of variable)
二、统计学中的几个基本概念
变量值(value of variable) : 变量的观察结果。 例如:研究7岁男孩身高 变量值:测得的身高值 (120.2cm,118.6cm,121.8cm,…) 研究某人群性别构成 变量值:男、女。
一、医学统计学的意义
3.统计学方法的特点: (1)用数量反映质量 1)体格检查(量血压、脉搏…) →个体健 康质量 2)考试分数→个体学习质量
3)期望寿命——反映人群健康状况的指标 期望寿命 4) 婴儿死亡率——反映卫生服务质量的指标
………….
一、医学统计学的意义
• (2)用群体归纳个体
• 请同学们回答: • 2002年长沙市7岁男孩有多高?
二、统计学中的几个基本概念
这类误差可以通过实验设计和技术措施 实验设计和技术措施来消除或 实验设计和技术措施 使之减少。 观察性研究由于组间不可比性产生的系统误 差称为偏倚(bias),如吸烟组的平均年龄大 于吸烟组,两组死亡率的差异包含年龄偏倚。
二、统计学中的几个基本概念
• (2)、非系统误差(nonsystematic error) • 由于研究者偶然 失误而造成的误差。 • 例如:仪器失灵、抄错数据、点错小数点、写 错单位等,亦称过失误差(gross error) • 这类误差应当通过认真检查核对予以清除,否 则将会影响研究结果的准确性。
二、统计学中的几个基本概念
• (1)、系统误差(systematic error):由于仪 器未校正、测量者感官的某种障碍、医生掌握 疗效标准偏高或偏低等原因,使观察值不是分 散在真值两侧,而是有方向性、系统性或周期 性地偏离真值。 • 例如:测量血糖,有斑氏法和葡萄糖氧 化法, 斑氏法的测量结果偏高←易受体内还原性物质 的影响。
医学统计学 Medical Statistics
医学统计学讲授内容
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章 绪论 计量资料的统计描述 总体均数的估计与假设检验 多个样本均数比较的方差分析 计数资料的统计描述 几种离散型变量的分布及其应用 χ2 检验 秩转换的非参数检验 双变量回归与相关 统计表与统计图
绪论 Introduction
讲授内容: 一、医学统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、医学统计工作的基本步骤 五、学习医学统计学应注意的问题
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。 2.医学统计学( statistics of medicine ):统 计学的原理与方法应用于医学科研与实 践。
二、统计学中的几个基本概念
• • • • • • • • • • • 实验者 投掷次数 Hu Pingcheng 1 Hu Pingcheng 2 Hu Pingcheng 3 Hu Pingcheng 4 Hu Pingcheng 5 Hu Pingcheng 6 Hu Pingcheng 7 Buffon 4040 K.Pearson 12000 K.Pearson 24000 出现“正面”次数 1 0 2 3 3 2 4 2048 6019 12012 频率 1.0000 0.0000 0.6667 0.7500 0.6000 0.4000 0.5714 0.5069 0.5016 0.5005