资料类型医学统计学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
福建中医药大学
医学统计学
第二章资料收集与整理
主要内容资料类型资料收集与整理
第一节
第二节
第一节
资料类型
•统计学中需要处理的数据统称为资料(data)。
•资料由变量及其变量值组成。
•变量(variable)表示随机现象的某种特征或属性,即研究的项目或指标。
•变量值(value of variable)又称观察值(observed value),是指变量的测定结果。
一、变量类型
●变量类型的划分方法有多种
●不同的划分方法产生不同的变量类型
一、变量类型
按取值结果分连续型变量
(continuous variable)
离散型变量
(discrete variable)
该变量的可取值为某个区间的任何数值。
数字的特点:可取小数
该变量的可取值为有限个或可列无穷个。
数字的特点:正整数
一、变量类型----连续型变量
正常人血清铜含量(pg/L)
20.216.519.923.420.021.315.516.818.917.0
16.119.218.116.818.414.721.917.413.018.3
17.422.815.617.119.918.519.523.023.217.4 19.122.421.019.516.517.817.212.415.021.1 17.718.414.915.914.916.014.221.014.218.5
身高、体重、血常规、肝功能、肾功能等,各种生理生化检测指标
一、变量类型----离散型变量
某年甲、乙两县人口资料(人)细胞数、人口数、治疗有效例数等
一、变量类型
按在统计分析中
所起的作用分标识变量
分析变量
自变量因变量协变量
如编号、住院号,用于对数据进行管理
一、变量类型
按观察指标的
性质分类定量变量
分类变量
无序变量,名义变量数值变量,尺度变量需用一定的仪器或尺度测量的变量
有序变量,名义变量
二、资料类型
对应于变量按观察指标性质的分类。
计量资料(定量资料)
计数资料
等级资料由定量变量及其观测值组成由无序变量及其观测值组成由有序变量及其观测值组成
分类资料
二、资料类型
资料类型特点
变量类型实例
计量资料(定量资料) 每个个体都能观察到一个观察指标的数值,有度量衡单位
连续型或离散型,数值变量身高(cm),体重(kg),细胞数(个),人口数(人)分类资料(定
性
资
料)
无序分类资料(计数资料) 每个个体观察结果的属性或分类间无大小顺序之分。
二分类时为对立的两类属性,多分类时为不相容的多类属性,类与类之间界限清楚。
离散型名义变量
性别(男,女)为二分类;
血型(A 、B 、O 、AB )为多分类有序分类资料(等级资料)多分类,按程度、挡次等级顺序分别计数,各等级之间有程度的差别,按大小顺序排列。
每个观察单位无确切定量。
离散型顺序变量
疗效(痊愈,好转,有效,无效)
二、资料类型
二分类资料一定属于计数资料,不是等级资料。
等级资料的前提是多分类变量,事物属性或变量类别必须
大于或等于三分类或以上。
疗效:分为“有效”、“无效”时,是计数资料;如果按“痊愈”、“好转”、“有效”、“无效”分的话,就属于等级资料了。
二、资料类型
一个研究可以包含多种资料类型。
任何一项研究,一般都
含有不止一个变量,将组成多种类型的资料。
资料类型不是固定不变的。
一个变量整理分析的方式不同
形成的资料类型也是不同的。
二、资料类型
编号
组别
性别
年龄
低密度脂蛋白
(mmol/L)血糖(mmol/L)
收缩压(mmHg )
收缩压等级1对照组男49 4.5312.317222对照组男527.32 3.116323对照组女56 6.95 3.418434
对照组男62 5.88 4.61411
5对照组女51 4.05 3.516626实验组男42 1.42 3.615417实验组女5312.615.215418实验组女55 6.75 2.914819实验组男5416.28 4.1167210
实验组
女
52
6.59
14.1
182
3
标识变量分析变量计数资料
计量资料
计量资料等级资料计数资料
二、资料类型
不同的资料类型采用不同的统计方法,正确认识和区分资料类型是正确应用统计方法的前提。
如在分析两样本之间是否有差异时,
对于符合正态分布的计量资料可以采用t检验,
不符合正态分布的计量资料采用秩和检验;
计数资料采用卡方检验,
等级资料采用秩和检验。
二、资料类型
在统计分析时,应分别判断每个变量的资料类型,结合研究目的选择相应的统计方法,采用不同的统计方法来分析处理。
在对具体的研究数据进行统计分析时应综合各种资料类型,应用多种统计方法来分析处理。
二、资料类型
圆分布资料(呈周期性变化规律或表现在圆周位置上的资料)随访资料(随访观察对象远期效果常用未达到预定观察终点的不完全数据的资料)等。
第二节
资料收集与整理
主要内容
资料收集
资料整理和保管
数据管理
资料收集
•是指根据研究目的,按照研究设计去收集原始资料的过程。
•资料收集实际上是具体调查或实验实施的过程,应坚持科学的态度和实事求是的精神。
•原始资料的完整、准确和及时的收集,是获得正确的统计结论的前提与基础。
资料收集
•资料的收集可以是一次性的,可以是持续一段时间的,也可以是周期性的。
•收集的资料主要来源于调查、实验(临床实验、动物实验、细胞实验等)、文献,以及日常的医疗卫生工作记录和报告单(如病案、病历、各种诊疗记录等)。
资料整理
•资料整理是把收集到的原始资料,有目的、有计划地进行科学的加工整理,使其系统化、条理化,以便更好地揭示研究事物的规律性,便于统计分析。
•资料整理的过程包括资料审核、分组、整理、归纳和汇总等。
•整理好的资料应妥善保管,根据研究的实际情况确定资料的保管期限。
数据管理
•数据管理是利用计算机硬件和软件技术对数据进行有效的存储、处理和应用的过程。
•数据管理经历了人工管理、文件系统、数据库系统等发展阶段。
数据管理
EpiData是数据录入管理最常用的软件。
免费软件
有汉化版
双人录入,自核查功能
数据管理
EpiData 软件界面介绍
资料收集与整理
完成收集资料后,应首先对原始数据的结构、观测数、变量名称与数量、各变量的取值范围、最小值、最大值等进行检查与核对,以及时发现异常值(outlier)。
如有错误或遗漏的研究变量取值,应及时采取补救措施,如修正、再次询问、查阅档案、重新检测等。
资料收集与整理
统计学本身只是一种工具,原始资料的完整、准确,是正确做出统计分析的前提与基础
在数据分析之前,首先应对原始数据进行审核,以确保原始数据准确无误。
•资料分几种类型?请结合自身专业和研究方向,思考题
举例说明相应的资料类型。
•数据管理常用的软件是什么?数据管理软件在资
料收集与整理中有什么好处?
Thank For You Attention!。