医学统计学——变量的分类与统计资料的类型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 例如:高血压患者←无时间、空间限制。
二、统计学中的几个基本概念
(2)样本(sample):是总体中抽取的有 代表性的一部分。
注意:随机抽样(无主观性) 样本含量( sample size):样本中包含的
研究单位数。 例如:某药治疗高血压患者30名
样本含量(n)为30
二、统计学中的几个基本概念
二、统计学中的几个基本概念
这类误差可以通过实验设计和技术措施来消除或 使之减少。 观察性研究由于组间不可比性产生的系统误 差称为偏倚(bias),如吸烟组的平均年龄大 于吸烟组,两组死亡率的差异包含年龄偏倚。
二、统计学中的几个基本概念
• (2)、非系统误差(nonsystematic error) • 由于研究者偶然 失误而造成的误差。 • 例如:仪器失灵、抄错数据、点错小数点、写
二、统计学中的几个基本概念
➢ 0< P(A) <1 随机事件
➢ P(A)=1
必然事件
➢ P(A)=0
不可能事件。
二、统计学中的几个基本概念
频率是就样本而言的,而概率从总体 的意义上说的,m/n是概率 p(A) 的估计值。试验次数越多,估计越 可靠。
二、统计学中的几个基本概念
(3)小概率事件:统计分析中的很多结论都基于 一定置信程度下的概率推断,习惯上将
2.医学统计学( statistics of medicine ):统 计学的原理与方法应用于医学科研与实 践。
一、医学统计学的意义
3.统计学方法的特点: (1)用数量反映质量 1)体格检查(量血压、脉搏…) →个体健 康质量 2)考试分数→个体学习质量
3)期望寿命——反映人群健康状况的指标 4) 婴儿死亡率——反映卫生服务质量的指标
• 3、总体(population)和样本(sample) • (1)、总体(population):是根据研究
目的确定的同质研究单位的全体。更确 切地说是同质研究单位某种变量值的集 合。 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
二、统计学中的几个基本概念
• 研究单位:一个人 • 变量:红细胞数 • 同质:同某地、同2002年、同成年男子、
二、统计学中的几个基本概念
• 实验者
投掷次数
• Hu Pingcheng 1
• Hu Pingcheng 2
• Hu Pingcheng 3
• Hu Pingcheng 4
• Hu Pingcheng 5
• Hu Pingcheng 6
• Hu Pingcheng 7
• Buffon
4040
• K.Pearson
为 什 么 要
学 医 学 统
计 统计知识 学 的运用 ?
-- F. Yates,M.J.R. Healy
撰写论文:报告自己观 察或实验的研究结果。
阅读论文:吸收新知识, 了解学术进展。
1996年,有机构对申报科技成果的4586篇科研论文分 析,统计方法使用率为76%。
医学论文中统计运用错误,除了影响论文的科学性,
•
变量
数值变量………………………………..构成计量资料 分类变量 无序分类变量……………...构成计数资料
有序分类变量……………...构成等级资料
三、统计资料的类型
2. 数值变量与计量资料
1). 数值变量(numerical variable) :变量值是定量的,表现为数值 大小,一般有度量衡单位。如:身高(cm)、体重(kg)、血压(pa)、 坐高/身高。
12000
• K.Pearson
24000
出现“正面”次数 1 0 2 3 3 2 4 2048 6019 12012
频率 1.0000 0.0000 0.6667 0.7500 0.6000 0.4000 0.5714 0.5069 0.5016 0.5005
二、统计学中的几个基本概念
可见,在相同条件下重复试验,试验结果 为“正面”或“反面”虽不能事先断定, 但我们知道试验的所有可能结果只有两 种。 在重复多次后,出现“正面” 或“反 面”这个结果的比例称之为频率。
(measurement data) 3.无序分类变量(unordered categories variable )
和计数资料 (enumeration data) 4.有序分类变量(ordinal categories variable)和等
级资料(ranked data)
三、统计资料的类型
1. 概述
第十一章 多因素试验资料的方差分析 第十二章 重复测量设计资料的方差分析 第十五章 多元线性回归分析 第十六章 logistic回归分析 第十七章 生存分析 第十八章 判别分析 第十九章 聚类分析 第二十三章 常用综合评价方法 第二十四章 量表研制与量表资料的统计分析方法
“非常痛心地看到,因为数据分析的缺陷和错误,那么多 好的生物研究工作面临着被葬送的危险” 。
错单位等,亦称过失误差(gross error) • 这类误差应当通过认真检查核对予以清除,否
则将会影响研究结果的准确性。
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100
•
N=5万 → X =118.6cm
(variable)、变量值(value of variable)
(1)、 研究单位(unit) :研究中的个体 (individual),是根据研究目的确定的。
二、统计学中的几个基本概念
例如:研究7岁男孩身高的正常值范围 研究大学生视力 研究水污染情况 研究细胞变性 研究肝癌的地区分布
一个人 一只眼睛 一毫升水 一个细胞 一个地区
• 同质:同长沙市、同7岁、同男孩、同无 影响身高的疾病。
二、统计学中的几个基本概念
• (2)、变异 (variation)
• 变异 (variation):同质研究单位中变 量值间的差异。
• 例如:1)长沙市2004年7岁男孩身高有 高有矮
•
2)相同的药方治疗相同的疾病的
病人,疗效有好有坏
二、统计学中的几个基本概念
二、统计学中的几个基本概念
• (1)、系统误差(systematic error):由于仪 器未校正、测量者感官的某种障碍、医生掌握 疗效标准偏高或偏低等原因,使观察值不是分 散在真值两侧,而是有方向性、系统性或周期 性地偏离真值。
• 例如:测量血糖,有斑氏法和葡萄糖氧 化法, 斑氏法的测量结果偏高←易受体内还原性物质 的影响。
验结果,每次都有如此好的吻合的概率约10万分之4。
绪论 Introduction
讲授内容: 一、医学统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、医学统计工作的基本步骤 五、学习医学统计学应注意的问题
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
医学统计学 Medical Statistics
医学统计学讲授内容
第一章 绪论 第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用
第七章 2 检验
第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图
• 4、参数(parameter)和统计量(statistic) • (1)参数(parameter):根据总体个体 值统
计计算出来的描述总体的特征量。 • 一般用希腊字母表示 • (2)、统计量(statistic):根据样本个体值统
计计算出来的描述样本的特征量。 • 一般用拉丁字母表示
二、统计学中的几个基本概念
同正常。 总体:1)某地所有的正常成年男子
2)某地所有的正常成年男子的 红细胞数
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的
• 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
• 2)无限总体(infinite population):研 究单位数是无限的
二、统计学中的几个基本概念
.(2)、概率(probability) 概率是度量随 机事件发生可能性大小的一个数值。
设在相同条件下,独立地重复n次试验, 随机事件A出现 次,f 则称 为f 随n 机事 件A出现的频率。当n逐渐增大时, 频率 趋向于f 一n 个常数,则称该常数为随机事 件A的概率,可记为 P(A) ,简记为 。 0≤ P(A)≤1
为 Mendel的豌豆杂交试验:
什 么
父本
母本
要 第一代
YG
YG
学
医
学 第二代
Y/Y Y/G G/Y G/G
统
计 学 ?
杂交试验结果:绿色种子的频率2001/8023 期望值=8023 0.25=2006, 标准差=39
Prop(2001.5~2011.5)=0.11, 结合Mendel历次报告的其它实
P( A) 0.05或 P( A) 0.01称为小概率事件,我
们认为小概率事件在一次试验中不可能发生。
二、统计学中的几个基本概念
• 湖南风采: • 中奖概率大约为: 1/671万 • 交通事故: • 发生概率为:1/20万
三、统计资料的类型
变量与统计资料的分类方法 1.概述 2.数值变量(numerical variable)和计量资料
• 特点:1)不可避免性
•Hale Waihona Puke Baidu
2)有统计规律性
二、统计学中的几个基本概念
• 产生原因: • 个体差异(生物变异)
二、统计学中的几个基本概念
• 6、频率(relative frequency)、概率 (probability)、小概率事件
.(1)、频率(relative freguency): 一次随机试 验有几种可能结果,在重复进行试验时,个别 结果看来是偶然发生的,但当重复试验次数相 当多时,将显现某种规律性。例如,投掷一枚 硬币,结果不外乎出现“正面”与“反面”两 种,现在,我们看一掷币模拟试验:
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
二、统计学中的几个基本概念
(2)变量(variable): 研究单位的研究特征。
例如:研究7岁 男孩身高的正常值范围
变量:
身高
(3)变量值(value of variable)
二、统计学中的几个基本概念
变量值(value of variable) : 变量的观察结果。 例如:研究7岁男孩身高 变量值:测得的身高值
• 总体参数一般是不知道的
• 统计学抽样研究的目的就是:
•
样本统计量→总体参数
二、统计学中的几个基本概念
• 5、系统误差(systematic error) 、非系 统误差(nonsystematic error) 、抽样误 差(sampling error)
• 误差(error)是指实际观察值与观察真 值之差、样本指标与总体指标之差。
计 11.7%
学
1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据
? 分析方法误用达55.7%。
2001年《中华预防医学杂志》:中华医学会系列杂志误用约54% (1995)。
英国统计学家R.A.Fisher(1890-1962)对遗传学家 Mendel(1822-1884)杂交试验结果的评价:
………….
一、医学统计学的意义
• (2)用群体归纳个体
• 请同学们回答: • 2002年长沙市7岁男孩有多高?
•1) 7岁男孩身高有高有矮
•2)n=100 , 平均身高 =119.5cm
•
95%的长沙市7岁男孩的身高在
110.20cm~129.20cm之间
二、统计学中的几个基本概念
1、研究单位(观察单位、unit)和 变量
为 还可能导致严重的伦理学问题。 什
么
60年代到80年代,国外医学杂志调查表明:20%~72%的论文有统
要 计错误。
学
1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂
医 志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结
学 果为:
统
相对数误用占 11.2%,抽样方法误用占15.9%,统计图表误用占
二、统计学中的几个基本概念
(2)样本(sample):是总体中抽取的有 代表性的一部分。
注意:随机抽样(无主观性) 样本含量( sample size):样本中包含的
研究单位数。 例如:某药治疗高血压患者30名
样本含量(n)为30
二、统计学中的几个基本概念
二、统计学中的几个基本概念
这类误差可以通过实验设计和技术措施来消除或 使之减少。 观察性研究由于组间不可比性产生的系统误 差称为偏倚(bias),如吸烟组的平均年龄大 于吸烟组,两组死亡率的差异包含年龄偏倚。
二、统计学中的几个基本概念
• (2)、非系统误差(nonsystematic error) • 由于研究者偶然 失误而造成的误差。 • 例如:仪器失灵、抄错数据、点错小数点、写
二、统计学中的几个基本概念
➢ 0< P(A) <1 随机事件
➢ P(A)=1
必然事件
➢ P(A)=0
不可能事件。
二、统计学中的几个基本概念
频率是就样本而言的,而概率从总体 的意义上说的,m/n是概率 p(A) 的估计值。试验次数越多,估计越 可靠。
二、统计学中的几个基本概念
(3)小概率事件:统计分析中的很多结论都基于 一定置信程度下的概率推断,习惯上将
2.医学统计学( statistics of medicine ):统 计学的原理与方法应用于医学科研与实 践。
一、医学统计学的意义
3.统计学方法的特点: (1)用数量反映质量 1)体格检查(量血压、脉搏…) →个体健 康质量 2)考试分数→个体学习质量
3)期望寿命——反映人群健康状况的指标 4) 婴儿死亡率——反映卫生服务质量的指标
• 3、总体(population)和样本(sample) • (1)、总体(population):是根据研究
目的确定的同质研究单位的全体。更确 切地说是同质研究单位某种变量值的集 合。 • 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
二、统计学中的几个基本概念
• 研究单位:一个人 • 变量:红细胞数 • 同质:同某地、同2002年、同成年男子、
二、统计学中的几个基本概念
• 实验者
投掷次数
• Hu Pingcheng 1
• Hu Pingcheng 2
• Hu Pingcheng 3
• Hu Pingcheng 4
• Hu Pingcheng 5
• Hu Pingcheng 6
• Hu Pingcheng 7
• Buffon
4040
• K.Pearson
为 什 么 要
学 医 学 统
计 统计知识 学 的运用 ?
-- F. Yates,M.J.R. Healy
撰写论文:报告自己观 察或实验的研究结果。
阅读论文:吸收新知识, 了解学术进展。
1996年,有机构对申报科技成果的4586篇科研论文分 析,统计方法使用率为76%。
医学论文中统计运用错误,除了影响论文的科学性,
•
变量
数值变量………………………………..构成计量资料 分类变量 无序分类变量……………...构成计数资料
有序分类变量……………...构成等级资料
三、统计资料的类型
2. 数值变量与计量资料
1). 数值变量(numerical variable) :变量值是定量的,表现为数值 大小,一般有度量衡单位。如:身高(cm)、体重(kg)、血压(pa)、 坐高/身高。
12000
• K.Pearson
24000
出现“正面”次数 1 0 2 3 3 2 4 2048 6019 12012
频率 1.0000 0.0000 0.6667 0.7500 0.6000 0.4000 0.5714 0.5069 0.5016 0.5005
二、统计学中的几个基本概念
可见,在相同条件下重复试验,试验结果 为“正面”或“反面”虽不能事先断定, 但我们知道试验的所有可能结果只有两 种。 在重复多次后,出现“正面” 或“反 面”这个结果的比例称之为频率。
(measurement data) 3.无序分类变量(unordered categories variable )
和计数资料 (enumeration data) 4.有序分类变量(ordinal categories variable)和等
级资料(ranked data)
三、统计资料的类型
1. 概述
第十一章 多因素试验资料的方差分析 第十二章 重复测量设计资料的方差分析 第十五章 多元线性回归分析 第十六章 logistic回归分析 第十七章 生存分析 第十八章 判别分析 第十九章 聚类分析 第二十三章 常用综合评价方法 第二十四章 量表研制与量表资料的统计分析方法
“非常痛心地看到,因为数据分析的缺陷和错误,那么多 好的生物研究工作面临着被葬送的危险” 。
错单位等,亦称过失误差(gross error) • 这类误差应当通过认真检查核对予以清除,否
则将会影响研究结果的准确性。
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100
•
N=5万 → X =118.6cm
(variable)、变量值(value of variable)
(1)、 研究单位(unit) :研究中的个体 (individual),是根据研究目的确定的。
二、统计学中的几个基本概念
例如:研究7岁男孩身高的正常值范围 研究大学生视力 研究水污染情况 研究细胞变性 研究肝癌的地区分布
一个人 一只眼睛 一毫升水 一个细胞 一个地区
• 同质:同长沙市、同7岁、同男孩、同无 影响身高的疾病。
二、统计学中的几个基本概念
• (2)、变异 (variation)
• 变异 (variation):同质研究单位中变 量值间的差异。
• 例如:1)长沙市2004年7岁男孩身高有 高有矮
•
2)相同的药方治疗相同的疾病的
病人,疗效有好有坏
二、统计学中的几个基本概念
二、统计学中的几个基本概念
• (1)、系统误差(systematic error):由于仪 器未校正、测量者感官的某种障碍、医生掌握 疗效标准偏高或偏低等原因,使观察值不是分 散在真值两侧,而是有方向性、系统性或周期 性地偏离真值。
• 例如:测量血糖,有斑氏法和葡萄糖氧 化法, 斑氏法的测量结果偏高←易受体内还原性物质 的影响。
验结果,每次都有如此好的吻合的概率约10万分之4。
绪论 Introduction
讲授内容: 一、医学统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、医学统计工作的基本步骤 五、学习医学统计学应注意的问题
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
医学统计学 Medical Statistics
医学统计学讲授内容
第一章 绪论 第二章 计量资料的统计描述 第三章 总体均数的估计与假设检验 第四章 多个样本均数比较的方差分析 第五章 计数资料的统计描述 第六章 几种离散型变量的分布及其应用
第七章 2 检验
第八章 秩转换的非参数检验 第九章 双变量回归与相关 第十章 统计表与统计图
• 4、参数(parameter)和统计量(statistic) • (1)参数(parameter):根据总体个体 值统
计计算出来的描述总体的特征量。 • 一般用希腊字母表示 • (2)、统计量(statistic):根据样本个体值统
计计算出来的描述样本的特征量。 • 一般用拉丁字母表示
二、统计学中的几个基本概念
同正常。 总体:1)某地所有的正常成年男子
2)某地所有的正常成年男子的 红细胞数
二、统计学中的几个基本概念
• 1)有限总体(finite population):研究 单位数是有限的
• 例如:调查某地2002年正常成年男子的 红细胞数的正常值范围
• 2)无限总体(infinite population):研 究单位数是无限的
二、统计学中的几个基本概念
.(2)、概率(probability) 概率是度量随 机事件发生可能性大小的一个数值。
设在相同条件下,独立地重复n次试验, 随机事件A出现 次,f 则称 为f 随n 机事 件A出现的频率。当n逐渐增大时, 频率 趋向于f 一n 个常数,则称该常数为随机事 件A的概率,可记为 P(A) ,简记为 。 0≤ P(A)≤1
为 Mendel的豌豆杂交试验:
什 么
父本
母本
要 第一代
YG
YG
学
医
学 第二代
Y/Y Y/G G/Y G/G
统
计 学 ?
杂交试验结果:绿色种子的频率2001/8023 期望值=8023 0.25=2006, 标准差=39
Prop(2001.5~2011.5)=0.11, 结合Mendel历次报告的其它实
P( A) 0.05或 P( A) 0.01称为小概率事件,我
们认为小概率事件在一次试验中不可能发生。
二、统计学中的几个基本概念
• 湖南风采: • 中奖概率大约为: 1/671万 • 交通事故: • 发生概率为:1/20万
三、统计资料的类型
变量与统计资料的分类方法 1.概述 2.数值变量(numerical variable)和计量资料
• 特点:1)不可避免性
•Hale Waihona Puke Baidu
2)有统计规律性
二、统计学中的几个基本概念
• 产生原因: • 个体差异(生物变异)
二、统计学中的几个基本概念
• 6、频率(relative frequency)、概率 (probability)、小概率事件
.(1)、频率(relative freguency): 一次随机试 验有几种可能结果,在重复进行试验时,个别 结果看来是偶然发生的,但当重复试验次数相 当多时,将显现某种规律性。例如,投掷一枚 硬币,结果不外乎出现“正面”与“反面”两 种,现在,我们看一掷币模拟试验:
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
二、统计学中的几个基本概念
(2)变量(variable): 研究单位的研究特征。
例如:研究7岁 男孩身高的正常值范围
变量:
身高
(3)变量值(value of variable)
二、统计学中的几个基本概念
变量值(value of variable) : 变量的观察结果。 例如:研究7岁男孩身高 变量值:测得的身高值
• 总体参数一般是不知道的
• 统计学抽样研究的目的就是:
•
样本统计量→总体参数
二、统计学中的几个基本概念
• 5、系统误差(systematic error) 、非系 统误差(nonsystematic error) 、抽样误 差(sampling error)
• 误差(error)是指实际观察值与观察真 值之差、样本指标与总体指标之差。
计 11.7%
学
1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据
? 分析方法误用达55.7%。
2001年《中华预防医学杂志》:中华医学会系列杂志误用约54% (1995)。
英国统计学家R.A.Fisher(1890-1962)对遗传学家 Mendel(1822-1884)杂交试验结果的评价:
………….
一、医学统计学的意义
• (2)用群体归纳个体
• 请同学们回答: • 2002年长沙市7岁男孩有多高?
•1) 7岁男孩身高有高有矮
•2)n=100 , 平均身高 =119.5cm
•
95%的长沙市7岁男孩的身高在
110.20cm~129.20cm之间
二、统计学中的几个基本概念
1、研究单位(观察单位、unit)和 变量
为 还可能导致严重的伦理学问题。 什
么
60年代到80年代,国外医学杂志调查表明:20%~72%的论文有统
要 计错误。
学
1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂
医 志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结
学 果为:
统
相对数误用占 11.2%,抽样方法误用占15.9%,统计图表误用占