Epidata软件使用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

临床研究数据库的建立与数据录入

——EpiData软件的使用

一、 常见数据库软件简介

1.E xcel

大多数临床大夫和研究生常用的一种数据库软件,

优点:简单易得,界面熟悉。

缺点:数据库用简单表格列出,录入时易串行,发生录入错误;变量类型不清,允许一列内同时存在不同类型的内容(如:字符和数值),影响分析;无法进行双录入核对。

2.S PSS

常见的一种数据统计分析软件,也可利用此软件进行录入。

优点:数据库录入完成后即可统计,无需进行格式转换;可指定变量类型、长度、并设置标签。

缺点:数据库用简单表格列出,录入时易录入错误;无法进行双录入核对。

3.E piData

因大型流行病学调查需要而产生的一个数据库建立、录入、管理软件。

优点:绿色,自由软件,录入界面简单友好,可指定变量的类型、长度,可简单完成数据库双录入核查,可进行数据库追加、合并操作,数据库可转化各种数据分析软件格式。

缺点:查询功能弱,不带数据分析功能。

由丹麦欧登塞(Odense, Denmark)的一个非盈利组织,即The EpiData Association (http://www.epidata.dk)开发。EpiData 的工作原理源自DOS 版本的Epi Info 6,但是工作界面为Windows版。

翻译成各国语言:英语、中文、丹麦语、德语、西班牙语、法语、意大利语、荷兰语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、塞尔维亚语、斯洛文尼亚语、阿拉伯语

中文最高版本:v3.1 (2008.01更新)

EpiData数据库录入、管理步骤

1. 建立调查表(QES)

2. 创建数据库(REC)

3. 建立录入规范文件(CHK)

4. 录入数据

5. 输出数据(output)

理论上,该程序对录入的记录数没有限制。而实际应用中,记录数最好不要超过200,000~300,000(曾经用250,000 测试过)。整个录入界面不能超过999行。对数值或字符串编码进行解释的文字长度最多80个字符,变量名建议控制在8个字符以内,否则可能转出到统计软件时可能出错。

五、变量类型及其在Epi Data中的表达形式

常见变量类型有:数值型、字符型、日期型

1.数值型变量(Numeric Fields)

###

###.###

########

##.####

在QES 文件中和数据录入过程中,你可以用圆点(.)来表示小数点。一个变量中只允许输入一个小数点,且小数点计算字符位数。变量最长允许14个字符。如果人为将变量长度加到最多18 位字符也是允许的,录入的最后1 位(或2 位)会自动更改,无法满足录入要求。因此一般要求小于14个字符位数。

2.字符型变量(Text Fields)

_____

__________

______________

下划线字符的数目表示变量的长度。字符型变量允许输入所有字符。变量最长允许80 个字符。如果输入中文,请注意,一个中文字需占用2个字符;也就是说,每个变量最多录入40个中文字。

3.日期变量(Date Fields)

:欧式日期(日/月/年)

:美式日期(月/日/年)

:我们习惯的日期格式(年/月/日)

日期变量的长度通常是10个字符。在数据录入过程中,允许录入的字符包括数字和斜线(/)。如果你可以把日期数字按完整的格式输入,中间可以不加“/”。

六、数据库结构——编制录入界面(QES文件)

新建一个qes文件

1、文件→生成调查表文件(QES文件)

2、点击新记录按钮

3、1打开文件→建立新QES文件

把设计好的调查表根据变量类型、长度等编制入录入界面。如果有调查表的电子版则可以复制粘贴然后再进行编辑。

七、数据库的形成和录入(rec文件)

根据QES文件生成REC文件

1、数据导入/导出→根据QES文件生成REC文件

2、2生成REC文件

出现上述对话框,上面选择保存的QES文件及其路径,下面选择要生成的REC文件及其路径,建议REC的文件名和QES相同,并保存在同一文件夹下。从而生成一个空的数据库文件。以后录入的数据可复制一个新的REC文件(需要重新命名),并把信息将保存在这个REC文件中。

数据录入时,每完成一个病例或者记录的录入,Epidata会提示是否保存这个记录,应选择保存,此时左下角会显示增添了一条记录。

建议:

1、REC的文件名和QES相同,并保存在同一文件夹下,作为空数据库;

2、每20到50个病例建立一个REC文件(分库),最后合并总库;

3、REC文件名应有一定的命名原则或标准。例如可以根据录入日期而变化,例如Hp081208、Hp081209……Hp090115。

4、录入过程应该建立数据管理记录,记录每天录入调查表号码范围,以及保存的REC文件名及路径。

八、制定录入规范(chk文件)

目的:1、对录入行为进行规范;

2、方便录入的进行。

建立REC文件后,可选择“3建立CHK文件”或点击“数据录入质控→建立/修改质控程序”则可选择需要编写录入规范文件的REC文件并对其进行一系列的录入规定。

移动光标到不同的变量数据录入格子,会出现一个对话框,可在其中对该变量的录入建立规范。主要命令如下:

Rang:规定变量的可能范围,定义框中键入允许录入的最小值和最大值,并用连字符“-”连接。如成人的身高,一般是从1—3米,这时可以填入1-3则可规定可录入的范围,如果录入时录一个超出这个范围的数据,系统会报错并让录入员重新录入。如果只对最大值有限制,则用“-INF”(负无穷大)表示最小值。如果只对最小值有限制,则可以用“INF”(无穷大)表示最大值。

Legal:合法值。规定某变量的合法值,如性别,1=男,2=女,则可在性别这个变量里规定,Legal 1,2;则在录入时只能录入1或2,录入其它数值Epidata会报错的。

Jump:跳转,自动跳转和条件跳转。用得最多的是条件跳转,在某个变量符合某种条件后,录入的光标跳转到指定的变量。如当吸烟(smoke1)为否(=2)时,则应该跳过吸烟量(smoke2)而直接录入下一个变量(drink1)。要规定这个跳转则应该在smoke1的变量里写入:2>drink1;当smoke1里录入2时,可跳过smoke2变量而直接跳转到drink1。

Must enter:必须录入。这个命令要求必须给当前变量输入数值,否则无法进入下一个变量。例如病例编号(ID)一般都应设为must enter。

Repeat:重复录入。如果选择“Yes”(是),则前一条记录在当前变量上录入的数据将在接下来的新记录上重复显示。在数据录入过程中,重复显示的数据可以修改。如果某些录入内容在不同记录间改动很少(例如,调查员姓名、调查者所属地区等),这项重复功能可以省去很多重复键入的工作。

Value label:数值标签。数值标签是一组数值加上对应的文字注释,可以解释每个数值代表的涵义。例如,创建一个性别变量,用1 表示男性,2 表示女性。如果设置了这个数值标签,在数据录入过程中,当你按F9,或数字键盘上的+时,程序会自动弹出一张表,告诉你1 和2 各自对应的涵义。

相关文档
最新文档