第二十四章 数据管理及EPIDATA-liu
调查数据的录入软件(EpiData)
5、移动光标命令
6、条件命令
条件命令的结构是: IF <逻辑表达式> THEN <如果逻辑表达式为真执行的命令> ENDIF 或者是: IF <逻辑表达式> THEN <如果逻辑表达式为真执行的命令> ELSE <如果逻辑表达式不真执行的命令> ENDIF
例如1:
IF field>1o then GOTO field10 ENDIF 例如2: IF (Cos(field1)*Sin(field1)<0.3 AND (field2<>0) THEN IF field2<field3 THEN HELP "Something is wrong." GOTO ENDIF ELSE Field4=Tan(field1) GOTO field23 ENDIF 例如3: IF field10=. THEN Field11=. Field12=0 Date1=”12/03/2001” ENDIF
调查数据录入技术 (调查数据输入软件EpiData)
成都信息工程学院 统计学院 刘 全
第一节、EpiData软件简介
EpiData是丹麦的一个非盈利组织编写的用以数据输入的免费 软件,要获得该软件,需要通过Internet网登录 http://www.epidata.dk主页,根据相应的提示可下载。 EpiData最早的版本Version 1.01发布于2000年10月,目前运用 得较多的是EpiData version 3.0版,发布于2003年8月。下面简 单介绍如何用EpiData3.0输入数据,并转换成SPSS能够分析的 数据。 简单、方便、功能强大、适用面广,非常适合于基层调查队和 各类调查咨询公司使用。
epidata使用方法
EpiData由数据库结构文件(.qes),来决定数据库 结构,然后根据该数据库结构文件生成数据文件 (.rec)。
2021/5/17
epidata 软件使用
4
一个最简单的创建数据库的工作至少要包括以下两步:
1、建立调查表文件——根据调查表制作数据库结构文 件即调查表文件(.qes)
1)如果输入:A1 Enter number #### 程序会创建 一个变量名为“A1”的4位整数变量。
2)如果输入:Enter number #### 程序会创建一个 变量名为“Enter”的4位整数变量。此时也可选择 自动定义变量名(Automatic field names)的方式。
3)A1 编号 #### 则变量名为A1 ,注意A1与编号间 要由一空格。
单击工具栏上的“新记录”按钮 这时窗口中会自动显示一个空白的文档,你可以在这
里输入调查表,也可以把WORD中建立的调查表复 制/粘贴过来再进行编辑。调查表实际上就是数 据录入表格的框架。 编辑完成后,将此调查表文件保存,文件的扩展名统 一为.QES。
2021/5/17
epidata 软件使用
8
2、编辑器(Editor)主要功能是创建和编 辑调查表(.QES文件)。这个调查表定义 了数据库结构。编辑器的使用和其它字处
据库创建过程:
2021/5/17
epidata 软件使用
5
2.1建立数据库结构文件(Create Questionnaire File)
表 1 工资调查表 A1 编号 A2 姓名 A3 性别(1)男 (2)女 A4 出生日期年 月 日 B1 基本工资 B2 奖金
2021/5/17
epidata 软件使用
Epidata软件使用简介
CHENLI
24
数据库追加
2021/3/7
CHENLI
25
数据库追加
2021/3/7
CHENLI
26
双录入比较
2021/3/7
CHENLI
27
双录入比较
2021/3/7
CHENLI
28
双录入比较
2021/3/7
CHENLI
29
数据库的输出—到SPSS
2021/3/7
CHENLI
30
数据库的输出—到SPSS
2021/3/7
变量标签{变量名}变量编码
CHENLI
12
定义变量名
• 变量名第一个字符一定为字母(A-Z) • 之后可含字母(A-Z)和数字(0-9) • 变量名最多10个字符 • 变量名不能是中文
选择Automatic field names, 将大括号 { }间的内容作为变量名,
这种方式更容易控制变量名。
*.chk
6 数据导入/导出
2021/3/7
5 双录入比较
CHENLI
4 录入数据
5
程序使用前基本设置
• 程序菜单语言 • 解决编辑器中调查表文件乱码的问题 • “生成变量名”选项 • 设置相关文件默认打开程序
2021/3/7
CHENLI
6
程序菜单语言
2021/3/7
CHENLI
7
解决编辑器中调查表文件乱码
2021/3/7
CHENLI
8
“生成变量名”选项
2021/3/7
CHENLI
9
设置相关文件默认打开程序
2021/3/7
CHENLI
10
Epidata数据库使用方法详细介绍
安装Epidata软件
下载Epidata软件安装包
01
从官方网站或授权下载站点下载最新版本的Epidata软件安装包
。
安装Epidata软件
02
双击安装包,按照安装向导的指示完成软件的安装过程。
启动Epidata软件
03
安装完成后,在桌面或开始菜单中找到Epidata软件图标,双击
05
Epidata在科研中的应用
科研数据管理
数据录入与整理
Epidata支持多种数据录入方 式,如手动输入、文件导入 等,并提供数据整理功能, 如排序、筛选等,方便用户 对数据进行初步处理。
数据质量控制
Epidata提供数据质量检查功 能,可以设定规则对数据进 行自动核查,确保数据的准 确性和完整性。
分析等。
公共卫生管理
EpiData可用于公共卫生管理中的数 据收集、整理和分析,如健康调查、
卫生资源配置等。
临床医学研究
EpiData可用于临床医学研究中的数 据管理和数据分析,如临床试验、病 例对照研究等。
其他领域
EpiData还可应用于社会学、心理学 、教育学等领域的数据管理和数据分 析。
02
03
自定义可视化
Epidata允许用户自定义可视化样式 和布局,以满足个性化的展示需求。 同时,还支持将可视化结果导出为图 片或PDF文件,方便分享和交流。
06
Epidata数据库使用技巧与注意事项
提高数据录入效率
批量导入数据
利用Epidata的数据导入功能,可以一次性导入大量 数据,避免手动逐条录入的繁琐。
按照一个或多个字段对数据进行排 序,升序或降序均可。
简单实用数据录入、管理软件EpiData软件使用简介
“工作过程工具条”可以指导用户从“1.定义数据” 到“6.数据导出”
Epidata使用前四步曲 程序使用前基本设置
程序菜单语言 解决编辑器中调查表文件乱码的问题 “生成变量名”选项 设置相关文件默认打开程序
程序菜单语言
解决编辑器中调查表文件乱码
“生成变量名”选项
设置相关文件默认打开程序
变量名的要求: 第一个字符一定为字母(A-Z) 之后可含有字母和数字 变量名最多10个字符 变量名不能是中文
2. 变量的设定:变量编码-变量类型
QES文件字段定义
变量类型
字符型:用下划线,_____,最长允许80个 字符,一个中文字占2个字符
数字型:用#号,每位一个#,如##.#,最 长允许14个字符
简单实用数据录入、管理软件
EpiData 软件使用简介
保选
证择
数合
据适
质的
量
数 据
的管
重理
要软
方件
面是
……
统计软件录入数据的弊端
操作不方便 易发生误操作 存在版权的问题
EpiData——免费、易用、够用
主要内容
EpiData基本情况介绍 EpiData使用流程
建立调查表及数据文件生成 添加字段控制 输入数据和数据转出
EpiData数据管理和输入流程
1 建立调查表文件
2 创建数据库
3 建立核查文件
6 输出数据
5 数据库管理
4 录入数据
0 设计“问卷”
一、建立调查表
数据定义是基础性工作,也是关键 性的工作;
在EpiData中表现为建成QES文件
1.建立途径
2. 变量的设定
epidata使用方法汇总
建立调查表文件是建立数据库、实现数据 录入和管理的第一步。 调查表结构文件在编辑器窗口建立
2019/2/26
epidata 软件使用
7
编辑器窗口的使用
1、打开EPDATA 软件,可以单击菜单中的“文 件→生成调查表文件”, 在工作流程栏(Work Process Toolbar)上点击 “建立新的QES文件”, 单击工具栏上的“新记录”按钮 这时窗口中会自动显示一个空白的文档,你可以在这 里输入调查表,也可以把WORD中建立的调查表复 制/粘贴过来再进行编辑。调查表实际上就是数 据录入表格的框架。 编辑完成后,将此调查表文件保存,文件的扩展名统 一为.QES。
2019/2/26 epidata 软件使用 20
2 数值型字段(Numeric Fields)
数值型变量######.##中只能用来接受从0 到9的数字,数值可以是整数也可以是小数。 一个#号代表一位数,用户可以根据需要定 义所需的数值位数,但包括小数点在内最 大为14位。在数据录入过程中和.QES文件 中你可以用圆点(.)或逗号(,)来表示小 数点。一个变量中只允许输入一个小数点, 这意味着,你不能用逗号作为千位的分隔 符(例如:1,000,000)。字符“#”的数目表 示变量的长度,小数点占一位字符。
2019/2/26 epidata 软件使用 8
2、编辑器(Editor)主要功能是创建和编 辑调查表(.QES文件)。这个调查表定义 了数据库结构。编辑器的使用和其它字处 理软件基本一致,由菜单栏,工作流程栏、 工具栏和文本编辑区组成。也可以使用编 辑器处理程序输出的报表,以及编辑 CHECK文件。
2019/2/26 epidata 软件使用 10
EpiData数据管理软件应用教程
第43张
首先选择需定义的变量:
Range,Legal:定义变量输入的合法值
如:输入“1,2” 表示只能输入1或者2; 输入“1-6” 表示可以输入1至6的任何一个 数值; 输入“1-6,99” 表示可以输入1到6的数值或者99; 输入“-inf-5”表示小于等于5;
输入“0-inf”表示大于等于0 。
2013年12月20日5时17分
第18张
7.1.2 记录文件
显示录入界面,存储记录.
2013年12月20日5时17分
第19张
7.1.3 核对文件
建立变量的输入规则, 设置跳转.
2013年12月20日5时17分
第20张
制作数据表文件(1)
1.新建调查表文件 (文件——生成qes文件) qes文件是由一定格式组成的文本文件, 记录了所有需要输入的问题和格式, 类似于电子调查表。
EpiData软件应用
武宁县疾控中心计算机网络技术兴趣小组
2013年12月20日5时17分
第1张
一、 EpiData简介
EpiData是一个免费的数据录入和数据管理软件。 软件具有多种语言版本,如丹麦语、汉语、荷兰语、意大利语、法语、 英语等。 开发者是丹麦欧登塞(Odense,denmark)的一个非盈利性组织。 EpiData的研发工作最早由丹麦的Jens uritsen发起。最初是作为 Funen县开展的“预防意外伤害行动”中的一部分。 1999年末,Jens uritsen、Mark Myatt和Michael 三人组成研发小 组。工作小组希望将EpiData开发成一个简单、易用、独立的应用程序。 这个程序不需要任何专门的数据库系统驱动。他们从社会团体、个人以 及其他捐助者那里得到资金支持,以免费的形式发布这个软件。 软件下载网址:http://www.epidata.dk 或者找度娘索要。
EPIDATA教程
EPIDATA教程EPIDATA使用方法简介一、建立新QES文件第一种:在菜单中,点击“文件”(File)→“生成调查表文件QES文件”。
第二种:在工作栏的工作流程中,点击“1. 打开文件”(1.Define Data)→“建立新QES文件”。
第三种:在按钮栏中,点击,这时窗口中会在工作区显示一个空白的文档,你可以在此文档中键入调查表内容和框架,编辑完成后,将调查表文件保存,文件的扩展名统一为.QES。
二、调查表书写生成1.“文件”(File)→“选项”(Option)→“生成REC文件”(Create data file)→ 在“如何生成字段名”(How to generate field names)中选择字段的命名方式。
2.1 如果选择:以调查表第一个词命名、更新问题为实际文件名效果。
2 如果只选择:以调查表第一个词命名,字段名为汉字显示。
3 如果只选择:使用{ }内的内容自动添加字段名,则显示{ }的内容。
【①在普通文本中优先选择“{ }”括进的文本。
如果问题是{my}first{field}?那末字段名将为MYFIELD;如果问题是“姓名{name}?”,产生的字段名为name。
4 ②通用常见单词不予考虑(即What?Who?If?etc.)。
What did you do?产生的字段名为YOUDO。
5 ③如果字段前没有“问题”文本,字段名就取前一个字段名再加上一个数字。
如果前一个字段名是dMY字段,那末下一个字段(如果没有“问题”文本)就是dMY1。
如果前一个字段是dV31,则下一个字段名就是dV32。
如果不存在前一个字段名则使用隐含字段名FIELD1。
6 ④如果第一个字符是数字则在第一个字符前插入一个字母N。
例如3 little mice?产生的字段名为N3LITTLE。
】3. 数值型字段:##,###.##… ;仅接受数字和空格,不输按空格处理,分析时作缺失值处理,以“.”显示。
epidata使用教程
epidata使用教程Epidata 是一种开源的电子数据收集工具,可用于设计和管理数据输入表格,并在移动设备上进行数据收集。
以下是Epidata 使用教程的步骤。
1. 下载和安装 Epidata:首先,打开 Epidata 官方网站并下载适用于您操作系统的版本。
安装程序后,打开 Epidata 软件。
2. 创建新项目:在Epidata 的主界面上,选择“新建项目”选项。
给项目命名,并选择所需的表格和字段设置。
您可以自定义表格的名称、列的数量、类型和其他属性。
3. 设计数据输入表格:在创建的项目中,您可以使用 Epidata提供的设计工具来自定义数据输入表格。
通过拖动和放置字段,您可以设置每个字段的属性,例如:文本、日期、数字等。
4. 添加逻辑和验证规则:对于每个字段,您可以添加逻辑约束和验证规则,以确保数据的准确性和一致性。
例如,您可以设置某个字段的取值范围、数据格式要求等。
5. 导入现有数据:如果您已经有现有的数据,可以使用Epidata 的导入功能将其导入到项目中。
确保数据符合表格和字段的规范。
6. 设置移动设备:在移动设备上安装 Epidata Mobile 应用程序,并使用项目的二维码或链接进行登录。
确保设备已与相应的项目成功同步。
7. 进行数据收集:使用移动设备上的 Epidata Mobile 应用程序,输入和记录数据。
根据字段的类型,可以使用键盘、滑块、选择框等不同的输入方式。
8. 数据导出和分析:完成数据收集后,可以将数据导出到Epidata 软件中进行分析和报告。
Epidata 提供了各种数据分析和统计工具,可帮助您有效地了解数据。
请注意,以上步骤仅为Epidata 的基本使用教程。
实际使用中,您可能需要深入了解 Epidata 的更高级功能和设置。
建议参考Epidata 的官方文档和教程以获取更详细的指导和支持。
Epidata_使用方法简介
三、.chk文件的建立和常用语法
3.更多的check设置 设置关键变量:保证每个数值只能录入一次 (唯一标识) 例V1 Key Unique end
四、数据库的管理
1、修改数据库 2)修改变量类型:通过.qes文件修改
所有变量类型都可以修改为字符型变量 数值型变量可修改为有相同或更多小数位数的数值型 变量; 若小数位数变少,则可能丢失数据
3)重新定义变量名:
工具-字段重命名 注意修改.chk
四、数据库的管理
2、数据库的追加、合并
Append/Merge
直观方便 简单易学 实用性强 对计算机要求不高 数据录入功能强(有良好的逻辑检错功能)
一、Epidata的特点和数据管理流程
数据管理流程:直观方便
二、.Qes文件的建立和注意事项
1.建立途径
二、. Qes文件的建立和注意事项
2. 变量的设定 基本格式为:变量标签{变量名}变量编码
例如:姓名{name}______
四、数据库的管理
1、修改数据库
增加、删除变量, 改变变量类型,变量名字
2、数据库的追加、合并 3、双录入和核查 4、数据的输出和输入
四、数据库的管理
1、修改数据库
1)增加、删除变量
在.qes .qes文件中增加或删除变量,保存 .qes 工具:根据修改的qes qes文件修改rec rec文件 qes rec •原始文件:保存为.old.rec •应仔细核查新生的数据文件
epidata 使用手册
epidata 使用手册Epidata是一种用于设定、存储和操作流行病数据的计算机软件。
在进行疾病防控、疾病监测等工作时,对于流行病数据的收集和分析具有至关重要的作用。
在使用Epidata软件时,需要一定的操作技能和基本的操作步骤。
下面将对Epidata的使用手册进行介绍,帮助用户更加高效地进行数据分析和处理。
第一步,打开Epidata的主界面。
在计算机上双击Epidata的图标,即可启动该软件。
进入主界面后,可以看到菜单栏、工具栏和数据列表等各个操作组件。
在菜单栏中可以实现数据输入、数据清理、数据管理、数据分析等多种操作。
第二步,建立研究对象。
在Epidata软件中,研究对象通常指流行病学调查中研究的人群或物品等研究单位。
在进行数据录入前,需要先建立研究对象,设置相关的信息,如研究对象编号、名称、地址、联系人信息等。
第三步,设置变量。
在进行数据录入时,需要根据研究对象的不同特点,设置相应的变量。
Epidata软件中,可以使用多种不同的数据类型,包括数字、文本、日期、时间、逻辑等,可根据需要灵活设置。
在设置变量后,还需要设置相应的编辑规则,如数据类型、数据检验、缺失值和超界等,以保证数据录入的准确性和完整性。
第四步,进行数据录入。
在设置好变量后,可以通过Epidata的数据录入功能,开始对研究对象进行数据记录。
在进行数据录入过程中,需要按照事先设定的编辑规则进行数据录入,确保数据的质量和可信度。
第五步,进行数据清理。
数据清理是数据分析的前提,Epidata软件提供了多种数据清理功能,如去除重复值、数据对比、数据修正、数据转换等,以保证数据的准确性和一致性。
第六步,进行数据分析。
在数据清理完成后,可以使用Epidata的数据分析功能,对所采集的数据进行统计分析、比较分析、相关分析、因素分析等,从而得出一些有意义的结论和见解,为研究和预防疾病提供科学依据。
在进行Epidata操作时,还需要注意以下几点:一是备份数据,以防数据丢失或损坏;二是对数据进行正确的分类和命名,以便于数据管理和归档;三是进行操作前先了解相关的操作文档和教程,保证操作准确和高效。
用EpiData快速建立数据管理程序课件
数据校验规则
用户可以根据需要自定义 数据校验规则,对数据进 行有效性检验,确保数据
的准确性。
核查与校验流程
在数据录入过程中,可以 通过设置核查与校验流程,
对数据进行实时监控,及 时发现并纠正错误。
数据导出与导入
01
02
03
数据导出格式
EpiData支持多种数据导 出格式,如Excel、CSV、 SPSS等,方便用户进行数 据分析和共享。
数据导入功能
EpiData还具备数据导入 功能,用户可以从外部数 据源导入数据,实现数据 的整合和共享。
数据转换工具
EpiData提供数据转换工 具,方便用户对数据进行 清洗、整理和转换,提高 数据质量。
自定义数据管理程序
自定义查询
自定义数据管理流程
用户可以根据需要自定义查询语句, 对数据进行筛选、排序和分组等操作。
在下拉菜单中选择“新建”,然 后选择“项目”。
03
输入项目名称和保存路径,然后 点击“保存”按钮。
04
在弹出的对话框中,选择所需的 选项,如数据集类型、数据集名 称等,然后点击“确定”按钮。
打开已有项目
9字
9字
打开EpiData软件,点击菜单栏中 的“文件”选项。
1
3
在弹出的对话框中,浏览并选择 要打开的项目文件,然后点击“
根据需要选择合适的导出格式, 如Excel、CSV等。
优化导出设置
在EpiData的导出设置中进行优 化,确保数据的完整性和准确性。
提高计算机性能
对于大量数据的导出,提高计 算机的性能可以加快导出速度。
06
EpiData案例分享
案例一:某地区传染病发病率调查
epidata数据库建立与录入
数据备份 转出为文本文件 数据转成dBase III格式 数据转成Excel格式
转出成Stata、SPSS、SAS所用的数据
数据文件生成----建立REC文件
在EpiData表现为生成REC文件 本文件基于QES文件而生成 产生REC文件前可提问输入文件标记
添加字段控制----生成CHK文件
添加输入控制的指令以文件形式单独保存,即CHK 文件;
程序运行时,自动寻找与扩展名REC相同文件的 CHK文件 ;
添加字段控制----生成CHK文件
C
A
B
数据库的追加与合并
合并:两个数据结构不同,但有1-3个相同变量(如 序号,姓名等)的数据库合并,即边对边连接。
例如,一项调查问卷,共400份问卷,张三只录入400份问卷的前面病 例的基本情况。李四只录入400份问卷临床症状和体征,王五要分析 整个数据,得把两个人整合起来。
C
A
B
数据导出
标签:给出各数字对应的描述性文本 限定特定值(数值范围,合法值) 指定输入的顺序(跳转) 某些字段不得缺项,必须输入 重复上一条记录的某字段值
命令解释
Range,Legal 定义允许输入的数据 Jumps 在输入数据后决定是否跳转(本例数据为1 时
跳转到 v10题目去) Must enter 必须给出数值 Repeat 重复上个记录的数据,即如果不改变,仍然维
持前一个记录的数值,但这个数据也是可以改变的 Value label 对于分类变量,可以给他进行数据定义,
如:1=男, 2 =女
数据库录入
选中“输入数据”,给定数据文件,即显示数据录 入界面
用EpiData快速建立数据管理程序课件
强大的数据校验功能
总结词
灵活的数据导入导出功能
详细描述
EpiData支持多种数据导入导出格式,如Excel、CSV、 SPSS等,方便用户在不同软件之间进行数据交换和共享 。这为用户提供了更大的灵活性,可以根据需要选择合适 的数据处理软件。
案例二
总结词
适用于多种流行病学调查
详细描述
流行病学调查是公共卫生领域中非常重要的一项工作,而 EpiData正是为此类调查设计的软件。通过EpiData,调 查人员可以快速地设计调查问卷、收集数据、进行数据校 验和整理,大大提高了流行病学调查的效率和准确性。
数据导出功能介绍
数据导出
EpiData支持多种导出格式,如 Excel、CSV等,方便用户将数据 用于其他软件或平台进行分析。
导出设置
用户可以根据需要自定义导出字 段和格式,确保导出的数据符合
自己的需求。
导出速度
EpiData优化了导出性能,能够 快速导出大量数据,提高了工作
效率。
数据整理功能介绍
数据格式不统一
在录入数据前,应统一规定数据的格式和标准,如日期格式、数字 的千分位分隔等,以确保数据的一致性。
数据丢失或重复
为避免数据丢失或重复,建议在录入过程中采用校验功能,如数据 唯一性校验、范围校验等,确保数据的准确性和完整性。
数据核查常见问题与解决方案
数据核查繁琐
EpiData提供了多种核查功能,如简单核查、复杂核查和自定义核 查等,可根据实际情况选择合适的核查方式,简化核查流程。
核查规则定制
用户可以根据需要定制核 查规则,提高数据质量。
数据导出与整理
导出格式
数据转换
EpiData支持多种导出格式,如Excel 、CSV等,方便用户进行数据整理和 分析。
[工学]epidata的数据管理
录入数据时注意问题
应注意及时保存(如录入完的当天)数据! 以保证数据被破坏时减少到最小程度。 应小心修改数据库,特别是删除字段或改 变字段名,数据会丢失! CHK文件与REC文件名称一致且放在同一 个路径下。否则REC文件不起作用!
EPIDATA
birth = 1965/03/02
| birth =
EPIDATA
核对的步骤
(1)在窗口中同时打开”高test.rec”与”高血压 new.rec”两个文件。
(2)先从病例观察表中查找何者为错。如“高血 压new.rec”idnumber = T0001的birth = 1965/03/02 ;
EPIDATA
数据导出
EpiData 软 件 产 生 的 数 据 文 件 以 “REC”作为扩展名,一般不能被其它软 件程序所调用 数据备份 转出为文本文件 数据转成dBase III格式 数据转成Excel格式 转出成Stata、SPSS、SAS所用的数据
EPIDATA
EPIDATA
EPIDATA
以文件形式记录 有关决定
数据备份,档案保存
数据复制备份,建立档案,安全保存
----所有项目计划、表格、调查表、错误清单以及
其它文件都应有复制件。 建议: 1 每天录入的数据必须重新备份。 2 数据的备份除了录入电脑外,在其它电 脑或U盘上再保存一份。 3 数据应及时传递给我们。
EPIDATA
EPIDATA
主要内容
1 Epidata基本情况 2 数据管理过程 3 Epidata使用流程
EPIDATA
EPIDATA
1 EpiData开发
选择合适的数据管理软件是保证数据质量 的重要方面。 开发者:1999年丹麦欧登塞(Odense)的一 个非盈利组织,即The EpiData Association (http://www.epidata.dk)。目前为3.1版。 在Windows 95/98/NT/2000/XP环境下使用
EpiData(数据库管理)
16
5. 数据库管理
5.5 数据库的追加/合并
追加 (Append) 将两个数据结构完全一样或基本上一样的数据 库连起来。两个数据库是端对端 (end-to-end), 又称串联。
17
数据库1 数据库2
18
5. 数据库管理
5.5 数据库的追加/合并
追加 (Append) 以A库结构为准,B库中多余的变量将被忽略
19
数据库A 数据库B
20
合并库
21
数据库A 数据库B
22
合并库
23
5. 数据库管理
5.5 数据库的追加/合并
追加 (Append) 新库中包括A库和B库中的所有变量
24
数据库A 数据库B
25
合并库
26
5. 数据库管理
5.5 数据库的追加/合并
追加 (Append)
27
5. 数据库管理
30
5. 数据库管理
5.5 数据库的追加/合并
合并 (Merge) 只合并标识变量在两个数据库中完全匹配的记 录
31
数据库A
数据库B
ID:1-4,6-9,11-19 1,11,15-19
ID:2-10,12-14,20 5,10,20
32
合并库
ID:1-4,6-9,11-19 5,10,20
增加、删除变量,修改变量类型 定义变量名的方式要前后一致!(四部曲之一, 自动生成变量名)
6
5. 数据库管理
5.1 数据库结构的修改
增加、删除变量,修改变量类型 不要修改变量名!
7
பைடு நூலகம்
5. 数据库管理
5.1 数据库结构的修改
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据归档压缩操作顺序如下:
工具——创建文档——选择需压缩的数据库文 件——输入将要保存的压缩文件名及储存地址— —确定
图24.10
数据压缩备份对话框
数据双录
实时双录:
第二次输入数据时立即与第一次输入的数据比 对,即时检查、更正。
独立双录
分别两次独立完成所有数据的录入,然后进行 数据库比对,最后根据比对结果,纠正不一致 的输入错误。
从本质上看,无论是数据核查还是数据清理其基本原 理和处理过程是相似的。
(一)重复记录检查
检查重复记录必须有关键字段,并以关 键字段值是否重复作为衡量记录是否重 复的标准,即如果出现两个及以上记录 的关键字段值相同,则相应的记录为重 复记录。
重复记录检查的操作顺序
选择“其他功能” ——“计算记录数”,则:
为保证数据录入的质量,常采用双人双录入的方法 进行数据录入。在准备双录入时,你可以选择菜单 “工具——拷贝数据文件结构”,此操作就可将一 个已经建好的数据结构,另存为一个新的数据库
数据核查
数据录入完成后,必须进行数据录入后 核查,以发现和纠正录入错误。 核查过程与数据清理相同,具体内容见 第二节数据核查与清理。
数据归档备份
数据库归档:纸质归档和电子归档 数据库归档:包含数据库本身外,还应包含数 据库结构、文件大小、最后修改日期、编码表 和相关文件如问卷文件、检查文件名称和内容 等。
EpiData数据库相关的文件形式和类型多样,不便于归 档管理,将所有文件压缩成一个文件保存会极大地方 便归档保存和数据传递,所以可以对数据进行压缩归 档。
(2)常用核查命令
1) 合法值列LEGAL/COMMENT LEGAL 值1 … 值n END COMMENT LEGAL 编码值1 含义1 … 编码值n 含义n END
Comment Legal:不仅能指定单个合法值列表,而且能指 定其值的含义,它实际上就是列出本字段编码表。
8) 确定输入 CONFIRM,格式如下: BEFORE FILE 光标不会自动移到下一个 录入字段,必须按回车键. CONFIRM END
(五)数据输入
文件——打开EpiData文件——选择(*.REC)文件类型 — —选择相应的数据库文件名——打开
图24.9 数据库数据输入窗口
数据库一致性检查
选择“数据处理”—— 选择“ 一致性检验”, 得到如下:
分别选择两次录入的数据库——确定
选择匹配字段—— 选中“选项中”所 需选项——确定
第二节 数据核查与清理
数据核查:数据录入完成后,对已录入的数据 进行合理性检查,以发现和纠正填写和录入错 误的过程。 数据清理:在进行统计分析前对数据进行检查 以发现和剔除不合理数据的过程
具有多国语言版本; 应用于公共卫生领域和临床医学; EpiData的安装、运行不会依赖系统文件夹中 的任何文件,可以通过setup.exe在计算机中安 装这个程序;也可以直接拷贝EpiData.exe文件 到计算机中,同样可以运行。
EpiData特点
直观方便 简单易学
实用性强
设臵跳转功能时,请依次键入跳转值、大于 号(>)、跳转的目标变量名。跳转语句间 用逗号分隔。例如,1>V23, 2>V40 表示输 入1 时,跳转到变量V23;输入2 时,跳转到 变量V40。
除了可以指定跳转的目标变量外,还可以使用 另外两种跳转方式,即END和WRITE。 END 表示“跳转到数据录入表格的最后一个 变量”,WRITE 表示“将当前记录存盘”。 例如,设臵跳转为 “1>V30,2>END,3>WRITE”表示:当输入1 时,跳转到变量V30;如果输入2,直接跳转 到最后一个变量;如果输入3,将当前记录存 盘。
数值允许范围及允许值 ( Range,Legal ) 允许值(legal)是在Range,Legal 的定义框中键
入所有允许输入的数值,数值之间以逗号或空 格间隔。如果使用空格作间隔,程序也会自动 将其转换为逗号间隔。例如,键入“4,6,8,10” 表示当前变量只允许录入4、6、8、10 四个数 值。 如果你的设臵中既有允许的范围,又有允许值, 那么范围值必须放在前面,允许值放在后面。 例如,键入“2-6,8”表示允许录入的数值包括2、 3、4、5、6 和8。键入“8,2-6”,程序会提示 错误。
7) 关键字段 KEY 指定某字段是数据库关键字段,并作为识别数 据记录的标志,要求EpiData建立对应的索引文 件以帮助数据查询,格式如下: KEY UNIQUE 或者 KEY
当使用KEY UNIQUE命令时,关键字段的输入值在数 据库内是唯一的,从而保证该记录是数据库内唯一记 录,防止数据重复输入。
选择菜单“文件——建立新QES文件”,得 到问卷编辑窗口如下:
输入问卷内容前,选择菜单“文件——选 择项”,弹出如下对话框:
上面对话框主要用于一些基本的设臵,例 如:字体、背景等。
单击上图中的“生成数据文件”,则出现下面的 对话框:
选定“如何自动添加文件名, 由输入决定” 这两个选项
变量类型 变量编码
直接编写核查文件
(1)核查文件结构和内容 关键字1 核查命令…… END ……. 关键字n 核查命令……. END
以某个字段名作为命令块的开始是最常见的情况, 基本形式如下: 字段名1 核查命令… END … 字段名m 核查命令… END
使用核查命令对话框编写核查文件
选择“数据录入质控”——“添加/修改录入质控程 序”——选择“相应数据库文件”——打开——选 择“需要进行输入限制的字段”——选择“限制方 法”——填写限制内容——存盘——关闭
数值允许范围及允许值 (Range,Legal)
在“Range,Legal ”的定义框中键入允许录入 的最小值和最大值,并用连字符“-”连接。 例如,键入“2-5”,表示当前变量只允许录 入2、3、4、5 四个数值。 如果只对最大值有限制,则用“-INF”(负无 穷大)表示最大值。如果只对最小值有限制, 则可以用“INF”(无穷大)表示最小值。例 如,键入“-INF-5”表示当前变量录入的数值 必须≤5。键入“0-INF”表示录入的数值必 须≥0。
图24.1 某地区学校一、二年级7岁儿童体检监测表
表24.1 例24.1儿童体检监测表的编码表
EpiData的进入
选择菜单“开始——程序—— EpiData——
EpiData数据录入和管理流程
建立调查表文件 创建数据库 建立核查文件 录入数据 数据库管理 输出数据
建立调查表
数据录入和管理软件
Epi Info
EpiData
Microsoft Excel Microsoft Access Visual FoxPro Other: SPSS,SAS,STATA…..
EpiData
免费的数据录入和数据管理软件 由丹麦EpiData协会开发,可直接从 www.epidata.dk 下载,版本不断更新 EpiData3.0 3.1 ……
对计算机硬件要求不高
数据录入功能强
EpiData数据库文件
调查表文件(*.qes):建立数据录入表格的 框架 数据文件(*.rec):即数据录入表格
核查文件(*.check):设臵数据录入过程中 某些选项的跳答、必须录入、重复录入 等
EpiData基本步骤
建立编码表
例24.1 为监测某地区四个学校一、二年 级7岁儿童的生长发育情况,拟定了如图 24.1的体检监测表,体检时间是2007年1 月1日。已知学生的学号范围是011001— 042047。拟用EpiData建立数据库,请编 写编码表。
生成数据文件
产生数据文件
选择“是”——命名 文件——保存,得 到如下
数据库的打开
进入EpiData界面后,选择“ 文件——打开文 件”,选择要打开的数据库(*.rec)
建立数据核查文件(.chk)
数据输入核查的方法 字段强制输入限制
字段输入值限制
字段输入条件限制
逻辑检查
数据管理及EpiData软件简介
刘巧兰
研究设计 实施调查/干预
设计问卷 收集数据 分析数据 数据录入 数据管理
分析资料
结果解释 撰写报告
数据管理
指统计信息用数据表示,并按数据类别 组织保存并提供的过程。 包括: 数据的组织和保存 数据维护 数据提供 数据备份、数据归档等
数据录入
浏览上面各个字段的分析结果可发现 错误数据和异常数据
第三节 数据预处理
数据预处理:完成数据录入并清理后的数据在进 行统计分析前,按规范对数据进行集中和整理、 统一汇总、统一指标计算的过程。 包括: 数据规范、合并和汇总 计算新字段 数据类型转换 数据变换 重新分类、汇总
(一)数据合并
如身高y3
② y3:“输入y3:厘米——选择编辑菜单——字段 清单,“选择数字——输入需要的数字长度——单 击插入”,就可以在光标处地方插入“###.##”,
图中的3就表示可输3个数字, 2表示小数位数为2位
如出生日期y2
y2:出生日期:年/月/日——选择编辑菜单— —字段清单”,“选择日期— <yyyy/mm/dd>——单击插入”,就可以在光 标处地方插入“<yyyy/mm/dd>”