EpiData简介2016
EpiData使用介绍PPT课件
1. 建立调查表文件
(4)定义变量类型-日期型变量
通常10个字符 <yyyy/mm/dd> 2009年9月10日
<年/月/日 > 日期的录入2009/09/10
20090910 090910 0910 10
1. 建立调查表文件
(5)创建数据库前预览
4. 录入数据
4. 录入数据
(1)记录间转换
移到第一条记录
移到前一条记录(或Ctrl+PgUp,或F7) 移到下一条记录(或Ctrl+PgDn,或F8) 移到最后一条记录
开始录入新记录(或Ctrl+N) 删除记录或恢复一条删除的记录(或Shift+Delete),需 要说明的是,记录只是被标记为删除,实际上,这条记录仍 然存在于数据库中,是可恢复的。在菜单Tools 中选择命令 可以永远的删除所有标记为删除的记录。
5. 数据库管理
数据库的追加/合并
新库中包括A库和B库中的所有变量
5. 数据库管理
数据库的追加/合并
两个数据库都 有的变量
必须是唯一、 不重复的
5. 数据库管理
数据库的追加/合并
只合并标识变量在两个数据库中完全匹配的记录
5. 数据库管理
数据库的追加/合并
合并两个数据库中的所有记录
3. 2. 1.
1. 建立调查表文件
(5)创建数据库前预览
2. 创建数据库
2. 1.
2. 创建数据库
QES和REC可同名、可不同名 可同路径、可不同路径
建议:同名、同路径
2. 创建数据库
可输、可不输 建议:不输
EpiData 软件简介分析
三、使用EpiData建立临床数据录入表
(二)建立数据文件
建立.REC文件。点击“生成数据文件”按钮,选择“生成数据文件”, 生成 “脑血管病人血脂调查表.REC”文件(图15-6)。
图15-6
脑血管病人血脂调查表.REC
三、使用EpiData建立临床数据录入表
(三)数据录入
点击“输入数据”按钮,打开“脑血管病人血脂调查表.REC”文件, 将数据输入表格,录入完整后,软件会自动提醒进行保存(图 157),确认保存之后就可以输入下一张表格的数据了。
EpiData 软件简介
一、EpiData的基础知识
EpiData由三种基本文件组成:
• 用EpiData软件进行数据录入和管理,将产生三种基本的 文件; • 每种文件具有固定的后缀,在数据录入和管理中发挥不同 作用。 (1)调查表文件:后缀为.QES。通过建立调查表文件,系 统根据特定规则自动定义数据文件的结构,包括变量名、 变量类型和长度等,用于数据录入。 (2)数据文件:后缀为.REC。数据文件包含录入的数据信 息以及已经定义好的编码,用于数据的统计分析。 (3)核对文件:后缀为.CHK。通过建立核对文件,系统将 定义数据录入的有效性规则。
二、EpiData运行界面介绍
运行EpiData.exe会出现程序运行界面(图15-1)
图15-1 EpiData3.02软件主界面
二、EpiData运行界面介绍
第一行:EpiData菜单栏
1.文件;2.数据核对;3.数据输入/输出;4.其他功能;
5.工具; 6.窗口设置; 7.帮助。
第二行:EpiData工作过程工具栏
(二)字段类型和长度
第一种方法:直接按CTRL-Q键。
第二种方法:在编辑器工具条上点击字段编辑器图标。
EpiData简介
复旦大学流行病学教研室 付朝伟
23
更改变量名
在第三列中不需要改名的字段保持空格即可。 原始的文件自动的保存为文件名为:原文件
名.old.rec. 如果同时有核对文件,则核对文件中的变量
名也相应的改变,但是变量的一些注释,必 须手工完成,比如GOTO命令后的变量名、 COMMENT LEGAL USE后的变量名等。
EpiData
建立调查表之前的准备工作 •解决调查表文件出现乱码的问题
复旦大学流行病学教研室 付朝伟
14
设置变量名
格式:变量 标{变量名} 变量编码
EpiData
复旦大学流行病学教研室 付朝伟
15
EpiData
•变量名第一个字符一定为字母(A-Z) •之后可含字母(A-Z)和数字(0-9) •变量名最多10个字符 •变量名不能是中文
37
隔位符
@
在根据.QES文件创建.REC文件时,字段的 位置由.QES文件中问题的位置决定,问题在 数据录入框的的左侧。但这会引起字段不能 对齐,隔位符可以应用在.QES文件中来解决 这一问题。
请注意这个隔位符在EpiInfo系列软件中不存 在,所以它会被认为是其他字符。隔位符除 了影响字段的位置外对.REC 文件毫无影响。
5
和EpiInfo的兼容性
在EpiData中使用EpiInfo数据时EpiData不支 持电话号码型
在EpiInfo中使用EpiData数据时EpiInfo不支 持 <Today-dmy> 、Soundex型 、@符号
字段的背景、颜色等设置无效
复旦大学流行病学教研室 付朝伟在录入完成后计算机会对录入的日期进行核对,以 保证录入的日期值是合法的日期值。在EpiData中 只认四位数年份。
Epidata数据库使用方法详细介绍
安装Epidata软件
下载Epidata软件安装包
01
从官方网站或授权下载站点下载最新版本的Epidata软件安装包
。
安装Epidata软件
02
双击安装包,按照安装向导的指示完成软件的安装过程。
启动Epidata软件
03
安装完成后,在桌面或开始菜单中找到Epidata软件图标,双击
05
Epidata在科研中的应用
科研数据管理
数据录入与整理
Epidata支持多种数据录入方 式,如手动输入、文件导入 等,并提供数据整理功能, 如排序、筛选等,方便用户 对数据进行初步处理。
数据质量控制
Epidata提供数据质量检查功 能,可以设定规则对数据进 行自动核查,确保数据的准 确性和完整性。
分析等。
公共卫生管理
EpiData可用于公共卫生管理中的数 据收集、整理和分析,如健康调查、
卫生资源配置等。
临床医学研究
EpiData可用于临床医学研究中的数 据管理和数据分析,如临床试验、病 例对照研究等。
其他领域
EpiData还可应用于社会学、心理学 、教育学等领域的数据管理和数据分 析。
02
03
自定义可视化
Epidata允许用户自定义可视化样式 和布局,以满足个性化的展示需求。 同时,还支持将可视化结果导出为图 片或PDF文件,方便分享和交流。
06
Epidata数据库使用技巧与注意事项
提高数据录入效率
批量导入数据
利用Epidata的数据导入功能,可以一次性导入大量 数据,避免手动逐条录入的繁琐。
按照一个或多个字段对数据进行排 序,升序或降序均可。
epidata简介
产生数据文件资料
编码册(codebook):给出数据文件中 的关键字段及对数据的基本描述,包括 记录数,作了删除记录的记录数。对数 据文件的每一个变量显示变量标记、字 段类型、核查条件及缺失值记录数,对 于数字字段将显示数值范围、均值、标 准差或频数表,这取决于字段类型
36
产生数据文件资料
13
准备分析数据集
数据清理
新变量的生成和转换
有关决定应留有 文件记录
14
数据备份,档案保存
数据复制备份,建立档案,安全保存
----所有项目计划、表格、调查表、错误清单以及
其它文件都应有复制件,原始的调查表和作为证
明等用的其它材料均应留档保存一定时间
目的是能从最后的数据库中追查到原
始观察对象每一变量的每一个数值
是关键性的工作 在EpiData表现为建成QES文件
20
QES文件字段定义
• • • • 字符型:用下划线 数字型:用#号,每位一#,##.# 逻辑型:用Y或N,<Y>、<N> 日期型:<mm/dd/yyyy> <dd/mm/yyyy> • 字段名框在{ }之中
21
QES文件字段定义—举例
id (automatic id number) V1 Sex V2 Heighy (meter) V3 Weight (kilo) bmi Body Mass Index V4 Date of birth V5 Age today V6 Country of Residnece <idnum> # #.## ###.# ##.## <dd/mm/yyyy> ## ____________
附录1-2 EpiData简介
2. EpiData简介EpiData 是一个免费的数据录入和数据管理软件,全称为Epidata Entry。
由丹麦学者Lauritsen JM等人1999年发起, Bruus M编写程序而完成。
目前为最新版本为 3.1版(27jan2008),有多种语言版本,包括中文,可在http://www.epidata.dk/下载。
它主要用于数据录入、数据核对、数据管理和数据报告。
该软件的功能建立数字化的调查表格,使收集的资料信息录入计算机更加准确和高效,可在数据录入过程中对数据中的错误进行核对,而且可以在数据录入后对数据进行核对。
EpiData 的安装、运行不受计算机设置的影响,也不会在系统文件夹中安装或替代任何DLL 文件。
使用者可以通过setup.exe 在计算机中安装,目前只有基于微软windows系统的安装版。
理论上,该程序对录入的记录数没有限制,但一般记录数限制20万条左右,整个录入界面不能超过999行。
Epidata工作流程的完整步骤为:建立调查表文件→生成数据库(rec文件)→建立核查文件→数据录入→数据处理→数据导出,见图1。
简要步骤为:建立调查表文件→生成数据库(rec文件)→数据录入→数据导出。
图1 Epidata工作界面一、Epidata工作流程1. 建立调查表文件建立调查表文件是建立数据库、实现数据录入和管理的第一步,即QES文件的编写。
可以点击菜单中的文件→生成调查表文件,或者在工作流程栏上点击,这时窗口中会自动显示一个空白的文档,在这里键入调查表,即数据录入表格的框架。
编辑完成后,将此调查表文件保存,文件的扩展名统一为.QES。
EpiData 中允许的变量类型主要有以下几类:•字符型:用下划线表示。
•数字型:用#号表示,#,##.#表示•逻辑型:用Y或N,<Y>、<N>表示•日期型: <yyyy/mm/dd>、<mm/dd/yyyy>或<dd/mm/yyyy>形式表示据变量类型进行编辑;也可用shift+相应键键入相应的符号。
EpiData软件介绍
跟crackman学SAS编程
有条件地跳转到其它变量上。JUMPS 是一 个块命令,必须以END 结束。在JUMPS 和 END 之间,你需要指定:1) 当前变量某个 可能录入的数值;2) 与指定数值对应的、跳 转的目标变量名
JUMPS 1 V2 2 V8 3 END 4 WRITE END
跟crackman学SAS编程
调查表文件(.QES文件)的建立
跟crackman学SAS编程 调查问卷
跟crackman学SAS编程 调查问卷---QES文件
问卷中的问题如何转化为合适的变量 问题1:总体来讲,您的健康状况是: ①非常好 ②很好 ③好 ④一般 ⑤差 分析:问题是单选题,选项可以通过数字来表示,所以设置为1个长度的数值型变量 如果选项时通过ABCD来表示,也可以设置为数值型变量 问卷编号 每一个问卷对应的唯一编号
பைடு நூலகம்
跟crackman学SAS编程 EpiData3.1变量规则-----生成变量名
调查人员姓名{name}
变量名:NAME
{my} teacher {mother}
What did you do? 姓名 3人
变量名:MYMONTHER
变量名:YOUDO 变量名:FIELD1 变量名:N3
标签 变量类型 变量名
跟crackman学SAS编程
RANGE:为变量定义一组允许录入的数值 RANGE –5 5 允许录入-5 到5 间的数值, 包括-5 和5 RANGE –INFINITY 99 允许值为<100 RANGE 100 INFINITY 允许值为≥100 RANGE 1/3/2001 31/3/2001 允许录入 2001 年3 月份中的日期 LEGAL:设置变量允许录入的数值。 它是一个块命令,必须以END 结束。 V1 LEGAL 5 7 9 END END
EpiData软件简介解析
一、EpiData的基础知识
EpiData由三种基本文件组成:
• 用EpiData软件进行数据录入和管理,将产生三种基本的 文件;
• 每种文件具有固定的后缀,在数据录入和管理中发挥不同 作用。
(1)调查表文件:后缀为.QES。通过建立调查表文件,系 统根据特定规则自动定义数据文件的结构,包括变量名、 变量类型和长度等,用于数据录入。
三、使用EpiData建立临床数据录入表
例如,我们对“职业”这个 字段进行设置(图15-13)。
当录入职业时,按F9键,这时会 弹出一张转换表,如下(图1514)。
图15-13 编辑数据标签窗口
图15-14 选择数值窗口
三、使用EpiData建立临床数据录入表
(六)如何核查数据文件
为了保证数据录入的可靠性,我们可以让两个人分别输入同样的一 组调查表数据,Epidata提供了对两个相同数据文件的检查功能。
→
图15-15 数据核查结果
三、使用EpiData建立临床数据录入表
④自动ID号型字段:<IDNUM>;这是一种专用字段,用作记录识别 号,文件的第一个记录为1,以后记录自动赋值顺次较前增加1,并自 动保证编号的唯一性。输入数据时光标跳过此字段。如需使第一个记 录号大于1,则可在“文件”菜单“选择项”中的“高级设置”中设 置。
三、使用EpiData建立临床数据录入表
(二)字段类型和长度
字段编辑器
第一种方法:直接按CTRL-Q键。 第二种方法:在编辑器工具条上点击字段编辑器图标。
三、使用EpiData建立临床数据录入表
字段类型介绍
①数值型字段:##,###.##… ;仅接受数字和空格,不输按空格处 理,分析时作缺失值处理,以“.”显示。数字位数由“#”个数决定, 小数位数由小数点右边的“#”个数确定。最长可达14位,小数点按 1个字符计算。
Epidata 和SPSS 软件简介
2015/10/26
1
研究设计
设计“问卷”
实施调查 分析资料
结果解释
收集数据 分析数据
数据录入 数据整理
……
撰写论文
2015/10/26
2
数据录入和管理
Epi Info EpiData
Microsoft Excel
Microsoft Access
SPSS, SAS, ……
布尔逻辑型字段
逻辑字段
<Y> 只允许录入Y,N,1,0
1个字符
2015/10/26 30
字段符号编辑器
#:数值字段 —:文本字段 <A:大写文本字段 <d:欧式日期 <m:美式日期 <y:布尔字段 <I:自动ID号
2015/10/26 31
CTRL+W
4、 其他功能
跳格符@
2015/10/26
数值型字段
数值型字段
######.####
只允许输入数字或 空格
2015/10/26
最长允许14个字符
23
数值型字段
数值型字段 ##########.####
2015/10/26
24
文本型字段
常用文本型字段
下划线 ___ 允许输入任何字符 1个中文=2个字符
2015/10/26
最长允许80个字符
程序设计者:Jens M. Lauritsen, Michael Bruus和
Mark Myatt
2015/10/26 5
EpiData源自DOS版本的Epi Info 6.0,其工作界
面为Windows版,与Epi Info 具有很强的兼容性。
Epidata的使用(周荣军)
个人编码(附件5、6):001-999 学校编码(附件7、8):小学1、初中2、高中3 学生编码(附件8) :01-99 场所调查机构类型编码(附件9):医疗卫生机构1、 机关2、事业单位3、企业4 单位编码(附件9):1-9
九、数据录入要求
(一)、单选题 录入调查对象所选择的选项数字1-5。如果调查对象 没有选择,录入0。 (二)、多选题 1、每一个选项均需要完成数据录入。如果调查对象 选了相应选项则录入1,没选则录入2。 2、如果该题没有回答,所有选项均录入0。
横向连接主要两种方式: ① 只有两个文件中都存在的记录连接起来。 ② 如两个数据文件中的记录不匹配,可导致连接后变量值的缺失。为 此,两个文件中必须有相同字段。
(五)查看和删除记录
菜单
录入界面
移到第一条记录
移到最后一条记录 移到前一条记录 移到后一条记录 开始录入新记录 删除记录或恢复删除的记录
一、 Epidata 简介
Epidata 是什么? Epidata软件是用于数据录入、数据核 对、数据管理、数据报告的自由软件。 为什么使用Epidata? 识别错误(数据录入质控、数据双录入 后的一致性检验)是该软件区别于其它 软件最大的一个功能。
一、 Epidata 简介
EpiData的三种基本文件类型:
一致性 检验结 果界面
(六)数据处理—数据一览表
点 击
(七)数据导出
点击
选 择 文 件 类 型
八、健康促进县(区)基线调查问 卷录入规则
(一)问卷编码规则 省(附件4-9):45 县(附件4-9):右江区1、鹿寨县2、荔浦县6 村(附件4):1、2,如果抽中的村大于2个的则依次 编号3、4 成人问卷类型编码(附件5、6):居民1、教师2、 医务人员3、机关公务员4、事业单位职工5、企业职 工6
实习七流行病学常用软件.
实习七流行病学常用软件一、EpiData软件EpiData 是一个用于数据输入及相关信息的计算机程序,当你已经将数据收集在纸上,并且要对数据进行分析或制表时,需要使用EpiData这个软件,利用它可以产生简单的频数和变量清单,但EpiData软件主要是用于数据输入。
EpiData软件是一个免费的数据录入和数据管理软件,开发者是丹麦欧登塞(Odense, Denmark)的一个非盈利组织,即The EpiData Association,程序设计者为Jens M. Lauritsen, Michael Bruus 和Mark Myatt。
其特点为直观方便、简单易学、实用性强、对计算机硬件要求不高、数据录入功能强等。
其当前最高版本为3.02;菜单语言有丹麦语、挪威语、荷兰语、意大利语、中文、法语、西班牙语、俄语、斯洛文尼亚语、塞尔维亚语、波兰语、葡萄牙语、阿拉伯语、英语;其操作手册有英文、中文等。
软件使用的基本过程为建立调查表文件、创建数据库、建立核查文件、录入数据、数据库管理、输出数据6个步骤。
EpiData既适合应用于简单的数据集即只有一个问卷或一个实验室数据表,也可应用与很多问卷,数据集,很多实验室部门的数据。
这里只介绍最简单的情况。
它的基本原理是基于DOS环境下工作的Epi Info v6。
你可以先书写一些简单的文本行,然后将它转换成数据输入格式,然后再添加数据控制功能,条件跳转和字段的计算功能。
EpiData 是一个免费软件,你可以从www.epidata.dk网站下载这个软件,然后按照给出的指令去做即可完成安装工作,EpiData的安装过程对于你的计算机没有任何影响,EpiData 是由一个程序文件和帮助文件组成。
记录数(观察值)原则上没有限制,(已经实验过,记录数可以超过十万条),对于八万条记录的查询在使用Pentium Ⅰ200Mhz处理器是不超过1秒,数据文件结构不能超过999文本行。
EpiData-简介 PPT课件
建立核查文件
在创建完数据库(*.rec)后,创建CHECK 文件。
1. 点击菜单中的数据检查→添加或删除检查(最基本) 2. 工作流程栏上点击3. 建立chk文件。 3. 使用编辑器手动编写或修改所有CHECK 命令。
(复杂) 注意:CHECK 的文件名必须与数据库的文件名相同, 唯一不同的就是扩展名(*.chk, *.rec)
简单的实例
建立关于学生体重与身高的调查表 编号 姓名 出生日期 身高 体重 调查日期
建立调查表文件
点击菜单中的文件→新建调查表文件; 在工作流程栏上点击“1. 建立调查表”; 点击编辑器工作栏(常用工具条)上 的 。 窗口中会自动显示一个空白的文档,键入 你的调查表,实际上也就是数据录入表格 的框架。编辑完成后,将此调查表文件保 存,文件的扩展名统一为.QES
定义变量名
如果编码前无任何解释性文字,则延续上一 个变量名,同时在末尾加数字 例如:myfield ,下一个变量名:myfield1 v31, 下一个变量名: v32 如果可生成变量名的第一个单词是一个数字, 程序会自动在数字前插入字母N 例如:”3 little mice” 变量名:N3littlemi
变量类型设置
编辑→字段编辑器 Ctrl+Q 工具栏
定义变量名
一个数据库中录入变量的名称可以根据QES 文 件的内容自动创建。 (1)将第一个单词作为变量名 (2)根据Epi Info 的规则自动定义变量名
设置: “文件”→ “选项”
定义变量名
(1)将第一个单词作为变量名 程序会自动将变量编码左侧解释性文字中的第一个单 词作为变量名(前10个字符)。 例如: V1 Enter age of patient ### 注意:姓名 ___ 姓名name or title ___ 姓名 name or title 结论:软件是以注释语句中,第一个空格前的字符串 为第一个单词,如字符串中有英文,将其作为 变量名,如全是中文,用field1来命名变量 名。
epidata课件
*.REC
check
*.CHK
4、录入数据
*.QES
*.REC
*.CHK
EpiData 要求
EpiData记录数最好不要超过200,000~300,000。 设计录入界面时整个录入界面不能超过999行。 对数值或字符串编码进行解释的文字长度最多80 个 字符 编码长度最多为30 个字符。
EpiData 软件简介
EpiData 特点
简单易学、实用性强 对计算机硬件要求不高 调查表设计便捷
与调查表形式一致的可视数据录入界面
数据核查功能强大且实现简便
数据转换功能强大
EpiData 组成
Epidata软件分为两个模块 EpiData Entry用于数据录入与数据管理(最 新版本为3.1 Build: ( 12Jan2006 ),有汉化 版本; EpiData Analysis(目前版本为 1.1 Rel. 1 (Build 62 ) )用于基本的统计描述/分析与 制图,目前尚无汉化版本。 http://www.epidata.dk/download.php
数据库的追加(Append)
数据库的追加(Append)
n追加的方式有两种:(1)在A
的末记录后追加两者公用字段 的记录,即有相同的变量。数 据库B中的数据,只有与数据 库A相同的变量才会被追加到 新的数据库中,数据库A中没 有的变量会被忽略。(2)在A的 末记录后追加B中所有的字段 和记录
数据库的合并(Merge)
EpiData 组成
EpiData
Entry由3 种基本文件组成:
调查表文件(.QES文件),它的作用是定义调查 表(问卷)的结构,即录入界面格式。 数据文件(.REC文件),所有录入的数据就存在 这个文件之中。 数据录入核查文件(.CHK文件),定义字段输入 数据的有效性。
EPI-DATA简介
数据录入窗口示意图
保存与退出
一条记录中所有数据录入完毕,程序会提示 录入员,是否保存该条记录。如果要终止录 入、关闭数据库,请选择菜单File→Close Form 或按Ctrl+F4 键,或点击窗口右上角 的×。
录入数据的注意事项
在数据录入过程中,如果你使用鼠标实现在变量间 的跳转,则CHECK 文件中设置的录入规则通常无 效。 激活下一个变量,你可以使用Enter、Tab、↓键、 或用鼠标直接点击目标变量。如果变量允许录入的 字符数全部录满,则光标会自动移到下一个变量。 如果想回到上一个变量,可以按Shift+Tab 键,或 ↑键。按Ctrl+Home 键可以直接回到数据录入表格 的第一个变量。选择Ctrl+End 则可以直接跳转到最 后一个变量。
数据检查界面
常见的CHECK 设置
Range,Legal、 Jumps、 Must enter、 Repeat、
Value label。
数值允许范围及允许值 (Range,Legal)
在Range,Legal 的定义框中键入允许录入的最小值和 最大值,并用连字符“-”连接。例如,键入“1-9”, 表示当前变量只允许录入1~9 之间的数值。 如果只对最大值有限制,则用“-INF”(负无穷大) 表示最小值。如果只对最小值有限制,则可以用 “INF”(无穷大)表示最大值。例如,键入“-INF-9” 表示当前变量录入的数值必须≤9。键入“0-INF”表 示录入的数值必须≥0。 允许值(legal)是在Range,Legal 的定义框中键入所 有允许输入的数值,数值之间以逗号或空格间隔。如 果使用空格作间隔,程序也会自动将其转换为逗号间 隔。例如,键入“1,2,9”表示当前变量只允许录入1、 2、9 三个数。
epidata介绍
30
3.建立数据核查文件(可选)
调查表 *.QES
数据库 *.REC
核查 *.CHK
核查文件的文件名(*.chk)必须与数据库的文 件名(*.rec)一致,唯一不同的就是扩展名。 核查文件必须与数据库文件在同一个文件夹下。
31
3.建立数据核查文件(可选)
*.QES
*.REC
*.CHK
5.5 双录入及核查 两种方式 • 在两个独立的数据库中录入相同的数据,然 后对两个库进行比较 • 在双录入模式下,录入第二遍数据的同时与 第一遍录入的数据进行比较
53
5.数据库管理
5.5 双录入及核查 独立双录
54
5.数据库管理
5.5 双录入及核查 独立双录
55
5.数据库管理
5.5 双录入及核查 独立双录
62
6.输出数据
6.1 输出到SPSS
63
6.输出数据
6.2 输出到Excel
64
总结
1.Options四项基本设置 2.数据录入和管理流程
调查表 *.QES
数据库 *.REC
核查 *.CHK
3.调查表文件 变量标签{变量名}变量编码 4.Check设置(难点)
65
总结
•
• •
资料核查
真实性:有无伪造或失真 准确性:问卷前后是否一致,有无逻辑问题 完整性:问卷是否填答完全 标准性:是否按要求填答 编码
尤其注意对缺失数据进行编码,如“9”
12
程序使用前四步曲!
1.程序菜单语言 Options→Advanced →Language:English 2.编辑器中调查表的文字设置 Options→Editor→Select font:宋体 3.“生成变量名”选项 Options→Create data file →How to ….:Automatic filed names 4.文件关联 Options→File associations:check all
EpiData使用方法简介和死亡调查表的应用
更多的check设置
忽略缺失值(IGNOREMISSING)
V4 BEFORE ENTRY IGNOREMISSING V4=V1+V2+V3 END
使用运算符号和函数
Let 命令: 例1: V1 let field5=field2/field3 end 例2:birth <mm/dd/yyyy> today <today-mdy> let age=round((today-birth)/365.25)
双录入和核查
注意!!
数据的输出
数据库的输出/输入 输出选项:可选择部分变量和记录 变量个数的限制
输出到dBaseIII,最多128个变量,且 变量标签、数值标签无法同时转出 Excel不同版本的行、列数均有限制, 且变量标签、数值标签无法同时转出 Spss文件syntax语句要删除注释部分 输出到epidata:可创建一个新库,含部 分记录或部分变量
谢谢
数据管理流程
直观方便
二、. Qes文件的建立
1.建立途径
2.直接复制、粘贴word调查表
操作步骤-1
编码书写器:
方便实现对变量类型和长度的定义
按shift键+#
操作步骤-2
使用制表符@,只会改变变量录入框在表格中的位置, 而不会对变量或REC数据库产生其它不良影响。 在变量编码前插入@,可以将这个变量对齐到下一个 制表位置。 注意:
. Qes文件的保存
保存路径
数据库的追加、合并
Append / Merge
横向连接(Merge)可使两个数 据库结构不同的文件横向连接, 前提是两个文件中有相同的关键 变量 如:基本情况库,实验室信息 库,流调数据库的合并
用EpiData快速建立数据管理程序课件
数据校验规则
用户可以根据需要自定义 数据校验规则,对数据进 行有效性检验,确保数据
的准确性。
核查与校验流程
在数据录入过程中,可以 通过设置核查与校验流程,
对数据进行实时监控,及 时发现并纠正错误。
数据导出与导入
01
02
03
数据导出格式
EpiData支持多种数据导 出格式,如Excel、CSV、 SPSS等,方便用户进行数 据分析和共享。
数据导入功能
EpiData还具备数据导入 功能,用户可以从外部数 据源导入数据,实现数据 的整合和共享。
数据转换工具
EpiData提供数据转换工 具,方便用户对数据进行 清洗、整理和转换,提高 数据质量。
自定义数据管理程序
自定义查询
自定义数据管理流程
用户可以根据需要自定义查询语句, 对数据进行筛选、排序和分组等操作。
在下拉菜单中选择“新建”,然 后选择“项目”。
03
输入项目名称和保存路径,然后 点击“保存”按钮。
04
在弹出的对话框中,选择所需的 选项,如数据集类型、数据集名 称等,然后点击“确定”按钮。
打开已有项目
9字
9字
打开EpiData软件,点击菜单栏中 的“文件”选项。
1
3
在弹出的对话框中,浏览并选择 要打开的项目文件,然后点击“
根据需要选择合适的导出格式, 如Excel、CSV等。
优化导出设置
在EpiData的导出设置中进行优 化,确保数据的完整性和准确性。
提高计算机性能
对于大量数据的导出,提高计 算机的性能可以加快导出速度。
06
EpiData案例分享
案例一:某地区传染病发病率调查
数据管理及EpiData软件应用
EpiData 安装
EpiData 安装
EpiData 安装
以后不再显示此提示框
EpiData 主要特点
直观方便、对计算机硬件要求不高 简单易学、实用性强 设计便捷、与调查表形式一致的可视数据录 入界面 数据录入、核查功能强 数据转换功能强
数据录入和管理流程
1 建立/修改调查表 文件*.qes
说明
选择“ + ” 按钮后打 开编辑器;直接填写 编码表;编写完成后 选择“确定并关闭” 菜单退出。
x2
x3 y1 y2 y3 y4
年级
学号 性别 出生日期 身高 体重
y5
肺活量
Legal Repeat Range Must enter Legal Must enter Range Range Legal Range Legal Range Legal
2、数据库的追加、合并
以A库结构为准,B库中多余 的变量将被忽略 两库中相同名称的变量,则 新创建数据库对应的变量类 型将以数据库A为准
新库中包括A库和B库中的所 有变量
四、数据库的管理
2、数据库的追加、合并
以A库结构为准,只合并标 识变量在两个数据库中完 全匹配的记录
•两库共有的标识变量,唯一不重复 •可同时选择1-3个变量 •不一定要设置KEY或key unique
四、数据库的管理
4. 数据库的输入/输出
*.QES
统计分析软件
*.txt
*.REC *.CHK
*.dbf *.xls
输出选项:可选择部分变量和记录 变量个数的限制
◦ 输出到dBaseIII,最多128个变量,且变量标签、 数值标签无法同时转出 ◦ Excel不同版本的行、列数均有限制,且变量标签、 数值标签无法同时转出 ◦ Spss文件中syntax语句:要删除注释部分
EpiData简介2016
字符型字段
• ___ _________ • 下画线定义字符型变量的位数。字符型变 量内可以输入任何字符。该类型变量的最 大长度为80个字符。
复旦大学流行病学教研室 付朝伟
23
大写型字符字段
• <A>, <A >
复旦大学流行病学教研室 付朝伟
24
逻辑型字段
• <Y> • 是否变量内只可以存放Y, N, 1, 0 和空格。 当输入 "1" 时计算机自动将其转换为"Y"。 同样,当录入"0"时则自动转换成"N"。是 否型变量的长度仅为1位。这意味着在.QES 文件中编码 <Y >是错误的。
复旦大学流行病学教研室 付朝伟
21
数值型字段
• ### ###.## • 数值型变量中只能用来接受从0到9的数字, 数值可以是整数也可以是小数。一个#号代 表一位数,用户可以根据需要定义所需的 数值位数,但包括小数点在内最大为14位。 在数据录入过程中和.QES文件中小数点 “ . ” 和逗号“,”都可以作为分隔符。但 是在一个字段中只能有一个分隔符,也就 是说逗号不能作为分位数。
复旦大学流行病学教研室 付朝伟
4
EpiData简介
数据库建立
复旦大学流行病学教研室 付朝伟
5
EpiData
数据录入 • 建立调查表文件(*.qes questionnaire ) • 创建数据库(*.rec record) • 建立核查文件(*.chk check ) • 数据备忘文件(*.not note)
•@ • 在根据.QES文件创建.REC文件时,字段的 位置由.QES文件中问题的位置决定,问题 在数据录入框的的左侧。但这会引起字段 不能对齐,隔位符可以应用在.QES文件中 来解决这一问题。 • 请注意这个隔位符在EpiInfo系列软件中不 存在,所以它会被认为是其他字符。隔位 符除了影响字段的位置外对.REC 文件毫无 影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
字段改变规则
• 所有字段可以改为字符型或大写字符型 • 数值型可以改为相同位数或更高位数数值型,否则提 示数据丢失 • 整数: 浮点型、加密字符型 • 浮点型:浮点型、加密字符型 • 自动编码:整数、 浮点型、加密字符型 • 字符型:加密字符型 • 大写字符型:加密字符型 • Soundex:加密字符型 • 日期型:加密字符型
复旦大学流行病学教研室 付朝伟
15
更改变量名
• 通过更改变量名可以改变计算机自动生成的变 量名。“更改变量名”功能可以在“工具”菜 单下找到。选择需要更改变量名的数据文件。 一个当前数据中有关所有变量情况的列表就会 出现。其中第一列为原来的变量名,第二列为 变量标签,第三列为你所希望更改的变量名。 • 改变量名时将光标放到第三列你所希望更改变 量名的变量对应的行上,然后键入新的变量名。
加密型字段
• <E > • 加密型字段在屏幕上显示为可读的文字, 但在保存时加密。 • 在数据文件保存时,EpiData会提示设置密 码,则只有在输入密码的情况下,才能打 开该数据文件。 • 在编写核对程序时,对加密字段没有特殊 要求,与普通字符型相同。
复旦大学流行病学教研室 付朝伟 30
隔位符
复旦大学流行病学教研室 付朝伟 34
预览
• 展示数据录入时的真实情况 • 不生成数据文件 • Check文件不起作用 • 不能自动更新已经修改的调查表文件,需 要重新点击预览 • [Ctrl] + [T]
复旦大学流行病学教研室 付朝伟
35
创建数据文件
• 根据qes文件创立 • 直接打开 • 默认与qes文件同名,但是不是必须的 • 数据文件标签,最多50个字符,转出到 Stata时作为数据的一部分。 • 部分Epiinfo格式分析工具不能读带标签的 文件。
• <S> <S > • Soundex 型变量可以输入任何字符,但只 有录入的最后一个词用来创建Soundex码。 • 在需要匿名时需要使用Soundex型变量。 • Soundex型变量编码总是用A-999格式,其 中包括一个大写字母,一个连字符和一个3 位数值。
复旦大学流行病学教研室 付朝伟
29
复旦大学流行病学教研室 付朝伟
16
更改变量名
• 在第三列中不需要改名的字段保持空格即 可。 • 原始的文件自动的保存为文件名为:原文 件名.old.rec. • 如果同时有核对文件,则核对文件中的变 量名也相应的改变,但是变量的一些注释, 必须手工完成,比如GOTO命令后的变量名、 COMMENT LEGAL USE后的变量名等。
复旦大学流行病学教研室 付朝伟 26
日期型字段
• 此外在数据录入过程中,用户不必录入所有的10 个数,如果在欧洲型字符字段中录入040599 , 则计算机自动转变为04/05/1999。如果录入的两 位数的年份在50到99之间的话,则被默认为20世 纪,前面加“19”。如果年份值在00和49.之间的 话则被默认为21世纪,前面加“20”。如果只录 入0405的话,则计算机系统年份自动加入到字段 中。 • 在录入完成后计算机会对录入的日期进行核对, 以保证录入的日期值是合法的日期值。在EpiData 中只认四位数年份。
•@ • 在根据.QES文件创建.REC文件时,字段的 位置由.QES文件中问题的位置决定,问题 在数据录入框的的左侧。但这会引起字段 不能对齐,隔位符可以应用在.QES文件中 来解决这一问题。 • 请注意这个隔位符在EpiInfo系列软件中不 存在,所以它会被认为是其他字符。隔位 符除了影响字段的位置外对.REC 文件毫无 影响。
复旦大学流行病学教研室 付朝伟 22
字符型字段
• ___ _________ • 下画线定义字符型变量的位数。字符型变 量内可以输入任何字符。该类型变量的最 大长度为80个字符。
复旦大学流行病学教研室 付朝伟
23
大写型字符字段
• <A>, <A >
复旦大学流行病学教研室 付朝伟
24
逻辑型字段
• <Y> • 是否变量内只可以存放Y, N, 1, 0 和空格。 当输入 "1" 时计算机自动将其转换为"Y"。 同样,当录入"0"时则自动转换成"N"。是 否型变量的长度仅为1位。这意味着在.QES 文件中编码 <Y >是错误的。
复旦大学流行病学教研室 付朝伟
6
EpiData
复旦大学流行病学教研室 付朝伟
7
EpiData
建立调查表之前的准备工作 •解决调查表文件出现乱码的问题
复旦大学流行病学教研室 付朝伟
8
EpiData
设置变量名 格式:变量 标{变量名} 变量编码
复旦大学流行病学教研室 付朝伟
9
EpiData
•变量名第一个字符一定为字母(A-Z) •之后可含字母(A-Z)和数字(0-9) •变量名最多10个字符 •变量名不能是中文
复旦大学流行病学教研室 付朝伟
4
EpiData简介
数据库建立
复旦大学流行病学教研室 付朝伟
5
EpiData
数据录入 • 建立调查表文件(*.qes questionnaire ) • 创建数据库(*.rec record) • 建立核查文件(*.chk check ) • 数据备忘文件(*.not note)
复旦大学流行病学教研室 付朝伟 27
今天型日期字段
• <today-dmy> <today-mdy> <today-ymd> • 自动的填入当前计算机的系统日期值。 • 该类型的字段不能编辑,光标也不能移入。 • 记录数据的最后一次修改日期。
复旦大学流行病学教研室 付朝伟
28
Soundex型字段
复旦大学流行病学教研室 付朝伟
36
创建数据文件
•创建同名的数据文件将使已经存在的 数据文件被删除并丢失。
•如果只是修改数据文件,请使用相应 功能。
复旦大学流行病学教研室 付朝伟
37
修改数据文件
• 修改已经录入数据的文件,请使用“根据 修改得qes文件更新rec文件”功能(Revise file) • 修改qes文件后两种方法修改数据文件: • 直接打开数据文件,按照软件提示完成 • 使用“根据修改得qes文件更新rec文件” 功能 注意: • 如果没有qes文件可以根据数据文件生成 • 改变变量或变量名可能丢失数据。
复旦大学流行病学教研室 付朝伟 39
数据录入
• [Shift] + [Delete] 逻辑删除 • 压缩rec文件可永久删除 • 创建压缩文件可以压缩数据大小,如年龄 设置为###.#,实际最大年龄为99.9岁,则 压缩为##.#。
复旦大学流行病学教研室 付朝伟 31
提示
• 在EpiData 中,不同的数据类型应该选择相 应的字段类型,比如调查表中的日期在数 据库中应该使用日期型字段;姓名、地址、 主诉等需要输入文字的问题则需要设置为 文本型字段;身高、体重、血压这样需要 输入数字的问题要设置为数值型字段,同 时这也是为了满足数据分析阶段的需要。
复旦大学流行病学教研室 付朝伟
25
日期型字段
<dd/mm/yyyy><mm/dd/yyyy><yyyy/mm/dd > • 分别为欧洲格式和美国格式。日期型变量 的长度总是10位。在数据录入过程中,能 录入的字符为数字和斜线(/)。如果所有日 月年数值都录入的话则不必录入斜线。比 如1999年5月4日可以在数据录入时直接键 入04051999。在光标移入下一个字段后, 字段内的值自动变为标准的04/05/1999。
EpiData简介
-数据管理软件
复旦大学流行病学教研室 付朝伟
1
数据获得及处理过程
研究设计
资料收集
质量控制 数据录入
数据管理
资料整理
EpiData 质控/核查 数据转换/ 再整理 SPSS
Байду номын сангаас
资料分析
复旦大学流行病学教研室 付朝伟
2
EpiData
• 免费的数据管理软件
• 开发者:丹麦欧登塞(Odense, Denmark)的一个非 盈利组织,即The EpiData Association (http://www.epidata.dk)
复旦大学流行病学教研室 付朝伟 14
变量标签
• 变量标签的作用是用来描述变量名的意义。 在EpiData中,变量标签是根据.QES文件中 的问题(提示符)自动产生的。 如果选择 了将第一个词作为变量名,则这个词不再 包括在变量标签中。中文问题(提示符) 虽然不能作为变量名,但是可以自动的作 为变量标签。
复旦大学流行病学教研室 付朝伟
21
数值型字段
• ### ###.## • 数值型变量中只能用来接受从0到9的数字, 数值可以是整数也可以是小数。一个#号代 表一位数,用户可以根据需要定义所需的 数值位数,但包括小数点在内最大为14位。 在数据录入过程中和.QES文件中小数点 “ . ” 和逗号“,”都可以作为分隔符。但 是在一个字段中只能有一个分隔符,也就 是说逗号不能作为分位数。
复旦大学流行病学教研室 付朝伟
10
变量命名规则
EpiData中使用两种变量命名方法: • 问题(提示符)中的第一个词作为变量名。 • • 根据软件命名变量名的规则来自动命名变 量名。
复旦大学流行病学教研室 付朝伟
11
变量命名规则
生成变量名的一些规则: • 大括号中的字符被作为变量名。比如一个 提示符为{my} first {name}?则变量名为 MYNAME。 • 常用词会被跳过,比如that,he,and等。 如提示符为did you do?则变量名为YOUDO。