医学统计学PPT:STATA软件的应用(1)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
STATA数据库的删除操作
删除变量或记录
drop x1 x2
/* 删除变量x1和x2
drop x1-x5
/* 删除数据库中介于x1和x5间的
所有变量(包括x1和x5)
drop if x<0
/* 删去x<0的所有记录
drop in 10/12
/* 删去第10~12个记录
drop if x==.
数据库的维护
数据库的排序 删除变量或记录 保留变量或记录 替换变量值 变量更名 展开和压缩数据 数据结构转换
数据库的排序
sort 变量清单 gsort +/-变量清单
sort x gsort x gsort -x
对变量x中数值从小到大进行排列 对变量x中数值从小到大进行排列 对变量x中数值从大到小进行排列
rmax(),rfirst(),rlast() 例:set obs 12 /*先产生一个空数据库,记录数为12
egen a=seq() /*产生1~_n的自然数 egen b=seq(),from(1) to(3) block(3) /*重复3次 egen c=fill(2 5) /*产生等差数列 egen d=rsum(a b c)/*多个变量对应观察值的计算
与表格式文件交互粘贴
与Excel,Word的表格等直接通过复制-粘贴 的方式交互数据。 在数据量不大时,这种方 式操作极为方便。
STATA的数据输入与储存
数据存储
save命令
➢ save “文件路径” [ , replace ] ➢ 文件后缀是“.dta” ➢ save c:\mydata\data1 [,replace]
1. 1 2 ........
6. 8 7 7. end
. input x z x already defined r(110);
使用数据编辑窗口输入
进入数据编辑窗口
直接输入“edit” 在工具条上点击 双击每一列的标题可以更改变量名
每一列代表一个 变量
每一行代表一条 记录
打开已有数据文件
用generate产生新变量 (gen)
gen 新变量=表达式
gen a=_n 编号赋给变量a。
/* 将数据库的内部
gen y=log(x) if x>0
/* 产生新变量y,
其值为所有x>0的对数值log(x),当x<=0时,用
缺失n(参数)[,选择项] fcn是功能项:seq(),fill(),rsum(),rmean(),rmin(),
STATA的运算
Stata的加、减、乘、除及乘方运算符依次 是+、-、*、/ 和^ 。
Stata的关系运算符有:==(等于)、>(大于)、 >=(大于等于)、<(小于)、<=(小于等于)、 ~=(不等于)
Stata的逻辑运算符有: &(“与”)、| (“或”)、 ~ (“非”)
STATA的变量赋值
FileSave As
菜单方式
命令方式
STATA的数据打开
数据打开
use命令
➢ use “文件路径” ➢ 文件后缀是“.dta” ➢ use c:\data1
Fileopen
STATA的最基本操作
list (缩写:l)
变量列表,列出内存中数据的内容
display 表达式 (缩写:di)
直接输出表达式的计算结果计算 di 2+3 di sqrt(25)
/* 删去x为缺失值的所有记录
drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录
drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录
drop _all
/* 删掉数据库中所有变量和数据
STATA数据库的保留维护
保留变量或记录
keep in 10/20
/* 保留第10~20
个记录,其余记录删除
keep x1-x5
/* 保留数据库中介
于x1和x5间的所有变量(包括x1和x5),其
余变量删除
keep if x>0 /* 保留x>0的所有记录, 其余记录删除
STATA数据库的替换
替换已存在的变量值
replace 变量=表达式
replace bolck=6 if block==0 /* 将block=0 的数全部替换为6。
replace z=. if z<0 用缺失值代替。
/* 将所有小于0的z值
replace age = 25 in 17
/* 将第
17条记录中的变量age替换为25。
STATA数据库的更名
变量更名
rename 原变量名 新变量名 rename var1 x /*把var1 更名为 x
展开和压缩数据
STATA的变量
STATA的变量名可以由英文字母,数字,下 划线组成。
大小写有区别 A≠a 关键字或系统变量不得用作变量名。 系统变量 _N(样本量)
_n(内部编号) _pi(圆周率)
STATA的数据输入与储存
数据输入
直接从键盘输入; 使用数据编辑窗口输入; 打开已有数据文件和拷贝; 粘贴方式交互数据 。
医学统计学实习课
STATA软件的应用(1)
1.Stata简介
由美国计算机资源中心(Computer Resource Center)研制;
现在为Stata公司的产品; 目前最高版本13.0; 操作灵活、简单、易学易用,同时具有
数据管理软件、统计分析软件、绘图软 件、矩阵计算软件和程序语言的特点 。
STATA的用户界面
菜单及工具栏
命令回顾 窗口
变量名窗口
结果窗口 命令窗口
STATA语法格式
命令是由关键词 参数 选项等构成的字符串 *所有命令、函数、变量名等都区分大小写
[特殊选项] 关键词 命令参数 [,命令选项]
1.关键词:指明执行什么命令,一条命令中必须出 现。如排序,sort
2.命令参数: 指明对哪个变量进行操作。
直接从键盘输入
命令:input 变量名列表
数据输入以“end”结束
不可重复输入变量
input x x
1. 1 2. 2 3. 3 4. . 5. 6 6. end
. input x y xy
1. 1 2 2. 3 4 3. 5 6 4. 4 . 5. . 8 6. 8 7 7. end
. input x y xy