医学实验数据的收集与处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
疗效可分为:治愈、显效、好转、无效 尿蛋白化验结果分为:一、±、 + 、++、
+++
2020/5/5
29
各类变量间的互相转化
➢ 有序分类变量转化为数值变量: 如: 治愈3、显效2、好转l、无效0
➢ 数值变量也可转化为分类变量: 如:按血压测量值大小将血压分为:
低血压、正常、高血压 或正常、异常
2020/5/5
36
三、整理资料(data sorting)
使原始数据条理化,便于进一步的计 算和分析。 ➢对资料进行检查、核对 ➢设计分组:质量分组、数量分组 ➢按分组要求设计整理表。
2020/5/5
37
四、分析资料(data analysis)
按设计的要求,根据研究目的和资 料的类型,对整理出的基础数据作进 一步的计算分析和统计处理,并用适 当的统计图表表达出来,最后结合专 业做出结论。
▪ 分类变量资料的分析:一般先按类别汇总,然 后清点各类的观察单位数,列出分类变量资料 的频数表。
▪ 分类变量资料称为
分类资料,categorical data;或
定性资料,qualitative data 。
2020/5/5
27
分类变量—续
➢无序分类(计数资料) unordered categories 变量值间没有大小、强弱、好坏等程度之分。
如:调查某地1999年正常成年男子的红细胞数。
观察对象:该地1999年的正常成年男子; 观察单位:每个人; 同质:同一地区、同一年份、同一性别、同为正常
人、同为男性 。 观察值(变量值):每个人测得的红细胞数; 总体:该地1999年的正常成年男子的红细胞数。
又如 :暨南大学大学生近视发病率
系统误差:由于仪器、试剂未经校正,使观察结果
倾向性的偏大或偏小所产生的误差。
随机测量误差:各种偶然因素(电压、环境温度等)
的影响造成同一对象多次测定的结果不完全一样。或 同一样品不同观察者之间的差异。该误差不可避免, 但要控制在容许范围内。
过失误差:由于观察过程中不仔细造成的错 误判断或记录。
抽样误差:在排除了系统误差,控制了随机 测量误差后,由于抽样过程造成的样本指标
2020/5/5
16
无限总体infinite population
▪ 无时间和空间范围限制的总体,此总体 是抽象的,观察单位数是无限的。
如:研究用某药治疗缺铁性贫血的疗效。
同质:贫血患者、同时使用某药治疗; 总体:使用该药治疗的所有贫血患者的治疗
效果,无时间和空间的限制。
2020/5/5
17
抽样:从总体中抽取样本的过程。
2020/5/5
30
第四节 统计工作的基本步骤
➢设计 ➢搜集资料 ➢整理资料 ➢分析资料
2020/5/5
31
一、设计(design)
▪ 医学科研设计按是否对 研究对象施加 干预分为:实验设计和调查设计。
▪ 所谓设计就是关于研究计划方案的制定, 任一项研究,除专业设计之外,还应包 括统计设计,如果设计出现错误,那么, 不论用什么统计分析方法进行数据处理 都无法得到正确的结论。
2
第一章 绪论
➢ 医学统计学的定义与内容 ➢ 统计方法的几个基本概念 ➢ 统计工作的基本步骤 ➢ 学习中应注意的问题
2020/5/5
3
第一节 医学统计学的 定义与内容
1.统计的基本含义
统计是对客观事物的数量方面进行核 算和分析,是人们对客观事物的数量表 现、数量关系和数量变化进行描述和分 析的一种计量活动。
➢医学研究的对象是人或生物体,具有较大 的生物变异性,并受许多社会心理因素的 影响。借助统计分析,可透过偶然现象认 识其内在的规律性。
➢一个科学结论,除了理论机制的阐述外, 还要有一定数量的重复观察结果和合理的 对照等。
2020/5/5
6
为什么要学习医学统计学?
甲药是否比乙药有效?
表 1 甲、乙两疗法对小儿单纯性消化不良治愈率比较
2020/5/5
32
实验设计必须遵循的基本原则:
▪ 随机化原则(randomization) ▪ 对照原则(control) ▪ 重复原则 (replication)
2020/5/5
33
二、搜集资料(data collection)
(一)统计数据来源渠道
1.统计数据的直接来源
(1)来源于为管理和研究需要而专门组织调查
虽然如脉搏、白细胞计数等测量值只能是正 整数,但为研究方便习惯上也视为连续变量。
▪ 数值变量资料也称作 计量资料,measurement data;
定量资料,quantitative data。
2020/5/5
26
分类变量:categorical variable
▪ 表现为互不相容的类别或属性,各类别之 间无程度上的差别,分类变量的可能取值是 离散的。如:性别、血型、有效和无效。
2020/5/5
11
第二节 医学统计的基本概念
同质与变异 总体与样本 抽样 误差及种类 变量及其分类 概率与频率
2020/5/5
12
一、同质和变异
(homogeneity, variation)
▪ 观察单位: observation unit。
ຫໍສະໝຸດ Baidu根据研究目的而确定,是统计研究中最基 本的单位。
与总体指标之间的差异。该误差不可避免,
但又规律可循。原因:个体差异的存在。
2020/5/5
21
五、概率与频率
概率 probability: 描述随机事件(可能发
生也可能不发生的事件)发生可能大小的 量。
➢数值介于0与1之间波动,用P表示。 ➢将P≤0.05,或P≤0.01,称为小概率事
件。表示在一次实验或观察中该事件发 生的可能性很小,可视为很可能不发生。
❖二项分类:如性别分为男、女;虫卵化验结果分为 阴性、阳性等。
❖多项分类:如人群血型的A、B、O、AB等。
➢将无序变量的类别用数字表示,如性别: 1:男性 2:女性 称为指示变量
2020/5/5
28
等级资料(有序分类) ordinal categories
▪ 变量值间有大小、强弱、好坏等程度之 分。如:
研究1999年某农村地区14岁女孩身高 研究糖尿病人的血压测量值
▪ 样本:根据随机化原则从总体中抽出有
代表性的一部分观察单位。
➢ 样本含量:样本包含的观察单位数 ➢ 统计推断:用样本推断总体的特征
2020/5/5
15
有限总体 finite population
▪ 在确定的时间、空间范围内有限个观察 单位的总体。
2020/5/5
35
(三)数据资料的收集方法
1.直接观察法 2.报告法 3.采访法 4.邮寄法 5.电话访问 6.网上调查:
➢ 电子邮件法 ➢ 视讯会议法 ➢ 站点法
7.计算机辅助调查(Computer Assisted Interviewing):
➢ 计算机辅助的电话调查(CATI) ➢ 计算机辅助的个人访问调查(CAPI) ➢ 计算机辅助的填报调查(CASI)
➢等级资料
2020/5/5
24
变量的类型
▪ 数值变量(numerical variable):变量值
表现为数值的大小, 通常有度量衡单位。身 高(cm)、脉搏(次/分)、血红蛋白(g%)
• 分类变量(categorical variable):
表现为互不相容的类别或属性。各类别之间无 程度上的差别。如:性别、血型、有效和无效。
者也会自愈。
✓要求设立具有可比性的对照 组
2020/5/5
8
样本例数问题
▪ 用某药治疗某病,治疗2例均有效, 能说100%有效吗?
▪ 用某药治疗某病,治疗10例,其中9 人有效,能说90%有效吗?
2020/5/5
9
相对数的问题
▪ 某项调查显示:在1000名肇事司机 中,有800名是男性,占了80%,而 女性司机只占20%。因此,女性司 机开车相对安全。
2020/5/5
18
三、参数与统计量
▪ 参数 parameter :总体的指标 ▪ 统计量 statistic :根据样本变量值计算出
来的指标
2020/5/5
19
四、误差:观察值与真实值之差
随机测量误差:
随机误差: 抽样误差
系统误差 非随机误差:
过失误差(非系统误差)
2020/5/5
20
各类误差含义:
▪ 同质:是指被研究指标的可控制影响因 素相同或基本相同。
例:研究儿童的身高:易控制的因素(性 别、年龄、身高、地区,等) 、不易控制
的因素(遗传、营养,等)
▪ 变异:同质的基础上的个体差异。
如某年某地7岁男孩的身高。
2020/5/5
13
医学研究中同质的重要性
▪ 组间具有可比性是指对比组之间除对比 因素外,其他特征基本相同,即所谓组 间均衡。
频率 frequency :重复作N次试验,M是N
次试验中事件A发生的次数,则频率为: M/N。
2020/5/5
22
频率与概率的关系:
抛掷硬币的历史试验记录
实验者 抛掷次数 正面次数 频率( %) 德摩尔根 2048 1061 0.5181
蒲丰 4040 2048 0.5069 皮尔逊 12000 6019 0.5016 皮尔逊 24000 12012 0.5005
• 等级资料:测量值不能准确定量,仅能大致分
为几个等级。各等级之间有程度上的差别。如: 化验结果按-,+,++,+++等级分组。
变量间的转化:血红蛋白等。
2020/5/5
25
数值变量:numerical variable
▪ 数值变量均可通过对观察单位测量取得 数值,其值一般有度量衡单位。
如身长(cm)、体重(kg)、脉搏( 次/ 分)、 血压(kPa)。
▪ 组间均衡,则差异有统计学意义的结果 可解释为对比因素的作用;
▪ 否则,差异有统计学意义的结果不能解 释为对比因素的作用,因为其他因素也 可能造成组间差异。
2020/5/5
14
二、总体与样本(population and sample)
▪ 总体:根据研究目的确定全部同质个体,
这些个体的某项变量值。
(2)来源于科学实验方法
2.统计数据的间接来源
(1)内部资料的收集
➢ 业务资料: ➢ 统计资料:疾病分类报表 ➢ 财务资料: ➢ 内部积累的其他资料:如病历,X光片
(2)外部资料的收集:年鉴,政府报告等
2020/5/5
34
(二)统计数据的收集组织形式
1. 统计报表制度 2. 普查 3. 典型调查 4. 重点调查 5. 抽样调查
2.统计的基本特点:数量性
3.统计的目的:探索客观事物的数量规律 性,以便达到对客观事物的认识。
2020/5/5
4
统计学:是研究如何收集准 确可靠的资料和选择正确方法 进行整理分析的科学。
医学统计学:根据统计学的原 理和方法,研究医学数据的收集、 表达和分析的一门应用学科。
2020/5/5
5
为什么要学习医学统计学?
2020/5/5
10
学习医学统计学的用途
▪ 累计和表达经验:将积累的经验从感性 认识上升到理性认识(如阑尾根部化脓 及穿孔手术50例分析)。
▪ 完成科研工作:如何分组?分组是否有 可比性?样本含量是否足够?实验结果 的误差有多大?研究结果是否可推广? 研究报告如何撰写?
▪ 阅读医学书刊:继续教育的需要;识别 他人研究结果的可靠性。
疗法
痊愈数 未痊愈数 合计 治愈率(%)
甲
27
3
30
90.00
乙
28
9
37
75.68
合计
55
12
67
82.09
2020/5/5
7
▪ 某文献报道:用某种中草药治疗玫瑰糠 疹,有效率为78%,平均疗程为3周左右。 问此药治疗玫瑰糠疹的确有效吗?
玫瑰糠疹具有自然治愈的情况,一
般不服药,多喝水,到3周左右有些患
➢当样本含量较大时,可将频率作为概
率的估计值
2020/5/5
23
第三节 统计资料的类型
➢ 变量 variable :观察单位的某项特征 ➢ 变量值 value of variable:变量的观察结果。
如:研究某市某年7岁男孩的身高
统计资料的类型分为三种
➢数值变量资料 ➢分类变量资料
❖二项分类 ❖多项分类
▪ 代表性:样本中的每一个个体必须符合总 体的规定。如研究1999年某农村地区14 岁女孩身高。
▪ 随机性:保证总体中的每个个体有相同的 机会被抽作样本。方法有:抽签、机械抽 样、分层抽样、随机数字表。
▪ 可靠性:实验的结果要具有可重复性。由 于个体之间存在差异,只有观察一定数量 的个体才能揭示客观规律性。
医学实验数据的 收集与处理
1
据统计:我国的医学期刊大约有 1000 多种,其中绝大多数论文都要用到统 计学知识,统计学知识应用得正确与 否关系到论文的科学性与严谨性。
▪ 但有研究表明:在我国医学期刊论文 中,统计学应用错误率平均约为60%, 这一严峻的现象值得广大科研工作者 深思。
2020/5/5
+++
2020/5/5
29
各类变量间的互相转化
➢ 有序分类变量转化为数值变量: 如: 治愈3、显效2、好转l、无效0
➢ 数值变量也可转化为分类变量: 如:按血压测量值大小将血压分为:
低血压、正常、高血压 或正常、异常
2020/5/5
36
三、整理资料(data sorting)
使原始数据条理化,便于进一步的计 算和分析。 ➢对资料进行检查、核对 ➢设计分组:质量分组、数量分组 ➢按分组要求设计整理表。
2020/5/5
37
四、分析资料(data analysis)
按设计的要求,根据研究目的和资 料的类型,对整理出的基础数据作进 一步的计算分析和统计处理,并用适 当的统计图表表达出来,最后结合专 业做出结论。
▪ 分类变量资料的分析:一般先按类别汇总,然 后清点各类的观察单位数,列出分类变量资料 的频数表。
▪ 分类变量资料称为
分类资料,categorical data;或
定性资料,qualitative data 。
2020/5/5
27
分类变量—续
➢无序分类(计数资料) unordered categories 变量值间没有大小、强弱、好坏等程度之分。
如:调查某地1999年正常成年男子的红细胞数。
观察对象:该地1999年的正常成年男子; 观察单位:每个人; 同质:同一地区、同一年份、同一性别、同为正常
人、同为男性 。 观察值(变量值):每个人测得的红细胞数; 总体:该地1999年的正常成年男子的红细胞数。
又如 :暨南大学大学生近视发病率
系统误差:由于仪器、试剂未经校正,使观察结果
倾向性的偏大或偏小所产生的误差。
随机测量误差:各种偶然因素(电压、环境温度等)
的影响造成同一对象多次测定的结果不完全一样。或 同一样品不同观察者之间的差异。该误差不可避免, 但要控制在容许范围内。
过失误差:由于观察过程中不仔细造成的错 误判断或记录。
抽样误差:在排除了系统误差,控制了随机 测量误差后,由于抽样过程造成的样本指标
2020/5/5
16
无限总体infinite population
▪ 无时间和空间范围限制的总体,此总体 是抽象的,观察单位数是无限的。
如:研究用某药治疗缺铁性贫血的疗效。
同质:贫血患者、同时使用某药治疗; 总体:使用该药治疗的所有贫血患者的治疗
效果,无时间和空间的限制。
2020/5/5
17
抽样:从总体中抽取样本的过程。
2020/5/5
30
第四节 统计工作的基本步骤
➢设计 ➢搜集资料 ➢整理资料 ➢分析资料
2020/5/5
31
一、设计(design)
▪ 医学科研设计按是否对 研究对象施加 干预分为:实验设计和调查设计。
▪ 所谓设计就是关于研究计划方案的制定, 任一项研究,除专业设计之外,还应包 括统计设计,如果设计出现错误,那么, 不论用什么统计分析方法进行数据处理 都无法得到正确的结论。
2
第一章 绪论
➢ 医学统计学的定义与内容 ➢ 统计方法的几个基本概念 ➢ 统计工作的基本步骤 ➢ 学习中应注意的问题
2020/5/5
3
第一节 医学统计学的 定义与内容
1.统计的基本含义
统计是对客观事物的数量方面进行核 算和分析,是人们对客观事物的数量表 现、数量关系和数量变化进行描述和分 析的一种计量活动。
➢医学研究的对象是人或生物体,具有较大 的生物变异性,并受许多社会心理因素的 影响。借助统计分析,可透过偶然现象认 识其内在的规律性。
➢一个科学结论,除了理论机制的阐述外, 还要有一定数量的重复观察结果和合理的 对照等。
2020/5/5
6
为什么要学习医学统计学?
甲药是否比乙药有效?
表 1 甲、乙两疗法对小儿单纯性消化不良治愈率比较
2020/5/5
32
实验设计必须遵循的基本原则:
▪ 随机化原则(randomization) ▪ 对照原则(control) ▪ 重复原则 (replication)
2020/5/5
33
二、搜集资料(data collection)
(一)统计数据来源渠道
1.统计数据的直接来源
(1)来源于为管理和研究需要而专门组织调查
虽然如脉搏、白细胞计数等测量值只能是正 整数,但为研究方便习惯上也视为连续变量。
▪ 数值变量资料也称作 计量资料,measurement data;
定量资料,quantitative data。
2020/5/5
26
分类变量:categorical variable
▪ 表现为互不相容的类别或属性,各类别之 间无程度上的差别,分类变量的可能取值是 离散的。如:性别、血型、有效和无效。
2020/5/5
11
第二节 医学统计的基本概念
同质与变异 总体与样本 抽样 误差及种类 变量及其分类 概率与频率
2020/5/5
12
一、同质和变异
(homogeneity, variation)
▪ 观察单位: observation unit。
ຫໍສະໝຸດ Baidu根据研究目的而确定,是统计研究中最基 本的单位。
与总体指标之间的差异。该误差不可避免,
但又规律可循。原因:个体差异的存在。
2020/5/5
21
五、概率与频率
概率 probability: 描述随机事件(可能发
生也可能不发生的事件)发生可能大小的 量。
➢数值介于0与1之间波动,用P表示。 ➢将P≤0.05,或P≤0.01,称为小概率事
件。表示在一次实验或观察中该事件发 生的可能性很小,可视为很可能不发生。
❖二项分类:如性别分为男、女;虫卵化验结果分为 阴性、阳性等。
❖多项分类:如人群血型的A、B、O、AB等。
➢将无序变量的类别用数字表示,如性别: 1:男性 2:女性 称为指示变量
2020/5/5
28
等级资料(有序分类) ordinal categories
▪ 变量值间有大小、强弱、好坏等程度之 分。如:
研究1999年某农村地区14岁女孩身高 研究糖尿病人的血压测量值
▪ 样本:根据随机化原则从总体中抽出有
代表性的一部分观察单位。
➢ 样本含量:样本包含的观察单位数 ➢ 统计推断:用样本推断总体的特征
2020/5/5
15
有限总体 finite population
▪ 在确定的时间、空间范围内有限个观察 单位的总体。
2020/5/5
35
(三)数据资料的收集方法
1.直接观察法 2.报告法 3.采访法 4.邮寄法 5.电话访问 6.网上调查:
➢ 电子邮件法 ➢ 视讯会议法 ➢ 站点法
7.计算机辅助调查(Computer Assisted Interviewing):
➢ 计算机辅助的电话调查(CATI) ➢ 计算机辅助的个人访问调查(CAPI) ➢ 计算机辅助的填报调查(CASI)
➢等级资料
2020/5/5
24
变量的类型
▪ 数值变量(numerical variable):变量值
表现为数值的大小, 通常有度量衡单位。身 高(cm)、脉搏(次/分)、血红蛋白(g%)
• 分类变量(categorical variable):
表现为互不相容的类别或属性。各类别之间无 程度上的差别。如:性别、血型、有效和无效。
者也会自愈。
✓要求设立具有可比性的对照 组
2020/5/5
8
样本例数问题
▪ 用某药治疗某病,治疗2例均有效, 能说100%有效吗?
▪ 用某药治疗某病,治疗10例,其中9 人有效,能说90%有效吗?
2020/5/5
9
相对数的问题
▪ 某项调查显示:在1000名肇事司机 中,有800名是男性,占了80%,而 女性司机只占20%。因此,女性司 机开车相对安全。
2020/5/5
18
三、参数与统计量
▪ 参数 parameter :总体的指标 ▪ 统计量 statistic :根据样本变量值计算出
来的指标
2020/5/5
19
四、误差:观察值与真实值之差
随机测量误差:
随机误差: 抽样误差
系统误差 非随机误差:
过失误差(非系统误差)
2020/5/5
20
各类误差含义:
▪ 同质:是指被研究指标的可控制影响因 素相同或基本相同。
例:研究儿童的身高:易控制的因素(性 别、年龄、身高、地区,等) 、不易控制
的因素(遗传、营养,等)
▪ 变异:同质的基础上的个体差异。
如某年某地7岁男孩的身高。
2020/5/5
13
医学研究中同质的重要性
▪ 组间具有可比性是指对比组之间除对比 因素外,其他特征基本相同,即所谓组 间均衡。
频率 frequency :重复作N次试验,M是N
次试验中事件A发生的次数,则频率为: M/N。
2020/5/5
22
频率与概率的关系:
抛掷硬币的历史试验记录
实验者 抛掷次数 正面次数 频率( %) 德摩尔根 2048 1061 0.5181
蒲丰 4040 2048 0.5069 皮尔逊 12000 6019 0.5016 皮尔逊 24000 12012 0.5005
• 等级资料:测量值不能准确定量,仅能大致分
为几个等级。各等级之间有程度上的差别。如: 化验结果按-,+,++,+++等级分组。
变量间的转化:血红蛋白等。
2020/5/5
25
数值变量:numerical variable
▪ 数值变量均可通过对观察单位测量取得 数值,其值一般有度量衡单位。
如身长(cm)、体重(kg)、脉搏( 次/ 分)、 血压(kPa)。
▪ 组间均衡,则差异有统计学意义的结果 可解释为对比因素的作用;
▪ 否则,差异有统计学意义的结果不能解 释为对比因素的作用,因为其他因素也 可能造成组间差异。
2020/5/5
14
二、总体与样本(population and sample)
▪ 总体:根据研究目的确定全部同质个体,
这些个体的某项变量值。
(2)来源于科学实验方法
2.统计数据的间接来源
(1)内部资料的收集
➢ 业务资料: ➢ 统计资料:疾病分类报表 ➢ 财务资料: ➢ 内部积累的其他资料:如病历,X光片
(2)外部资料的收集:年鉴,政府报告等
2020/5/5
34
(二)统计数据的收集组织形式
1. 统计报表制度 2. 普查 3. 典型调查 4. 重点调查 5. 抽样调查
2.统计的基本特点:数量性
3.统计的目的:探索客观事物的数量规律 性,以便达到对客观事物的认识。
2020/5/5
4
统计学:是研究如何收集准 确可靠的资料和选择正确方法 进行整理分析的科学。
医学统计学:根据统计学的原 理和方法,研究医学数据的收集、 表达和分析的一门应用学科。
2020/5/5
5
为什么要学习医学统计学?
2020/5/5
10
学习医学统计学的用途
▪ 累计和表达经验:将积累的经验从感性 认识上升到理性认识(如阑尾根部化脓 及穿孔手术50例分析)。
▪ 完成科研工作:如何分组?分组是否有 可比性?样本含量是否足够?实验结果 的误差有多大?研究结果是否可推广? 研究报告如何撰写?
▪ 阅读医学书刊:继续教育的需要;识别 他人研究结果的可靠性。
疗法
痊愈数 未痊愈数 合计 治愈率(%)
甲
27
3
30
90.00
乙
28
9
37
75.68
合计
55
12
67
82.09
2020/5/5
7
▪ 某文献报道:用某种中草药治疗玫瑰糠 疹,有效率为78%,平均疗程为3周左右。 问此药治疗玫瑰糠疹的确有效吗?
玫瑰糠疹具有自然治愈的情况,一
般不服药,多喝水,到3周左右有些患
➢当样本含量较大时,可将频率作为概
率的估计值
2020/5/5
23
第三节 统计资料的类型
➢ 变量 variable :观察单位的某项特征 ➢ 变量值 value of variable:变量的观察结果。
如:研究某市某年7岁男孩的身高
统计资料的类型分为三种
➢数值变量资料 ➢分类变量资料
❖二项分类 ❖多项分类
▪ 代表性:样本中的每一个个体必须符合总 体的规定。如研究1999年某农村地区14 岁女孩身高。
▪ 随机性:保证总体中的每个个体有相同的 机会被抽作样本。方法有:抽签、机械抽 样、分层抽样、随机数字表。
▪ 可靠性:实验的结果要具有可重复性。由 于个体之间存在差异,只有观察一定数量 的个体才能揭示客观规律性。
医学实验数据的 收集与处理
1
据统计:我国的医学期刊大约有 1000 多种,其中绝大多数论文都要用到统 计学知识,统计学知识应用得正确与 否关系到论文的科学性与严谨性。
▪ 但有研究表明:在我国医学期刊论文 中,统计学应用错误率平均约为60%, 这一严峻的现象值得广大科研工作者 深思。
2020/5/5