统计软件sas试题及答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

精品文档
滨州医学院2009~2010学年第一学期
《统计软件》试题(A 卷)
(考试时间:120分钟,满分:100分)
用题班级:2007级统计学专业
一、 综合分析(每题 分 共60分)
(1)假设我们对某校学生的个人信息、学习成绩等十余个问题进行调查,得到调查表,该如何用Epidata 数据管理软件进行数据管理?5分
假设我们随机抽取其中18名同学的部分信息,如下所示,为纯文本格式,含义分别为姓名nanme 、性别gender 、语文成绩chin 、数学成绩math ,存放在‘d:\sas\’文件夹内,文件名为chengji.txt 。

[(2)-(13)均用SAS 编程处理]。

Zhangyu m 89 88 xuzhi m 87 86 lixiao f 88 89 xiaohan f 90 89 minghui f 93 91 huizheng m 84 86 guolei m 99 95 yuqiang m 90 91 mazheng m
93 96
yuanhua f 79 80 xiuqiang f 87 85 daolu m 82 83 wanger m 84 86 sungao m 83 82 zhangqi f 94 91 shifang f 86 89 xingming f 87 85 weiwei f 85 87
(2) 请将该纯文本文件转换成SAS 数据集,并在’d:\sas\score ’ 下建立名为ww 的永久性数据集. 4分
libname dw 'd:\sas\score'; data dw.ww;
infile 'd:\sas\chengji.txt';
input nanme $.8 gender $ chin math @@; proc print ; run ; data aa;
input nanme $ gender $ chin math @@; cards;
Zhangyu m 89 88 xuzhi m 87 86 lixiao f 88 89 xiaohan f 90 89 minghui f 93 91
huizheng m 84 86 guolei m 99 95 yuqiang m 90 91 mazheng m 93 96 yuanhua f 79 80 xiuqiang f 87 85 daolu m 82 83 wanger m 84 86 sungao m 83 82 zhangqi f 94 91 shifang f 86 89 xingming f 87 85 weiwei f 85 87
libname dw 'd:\sas\score';
data dw.ww;
set aa;
proc print;
run;
(3)从ww数据集中将男生(m)信息资料取出建立数据集male;取出女生信息资料建立数据集female; 4分
data male female;
set dw.ww;
if gender= 'm' then output male ;
else output female;
run;
(4) 请分别从数据集ww中将数学成绩变量去除,建立语文成绩数据集chin;保留数学成绩变量建立数据集math。

4分
data chin ;
set dw.ww;
keep nanme gender chin;
proc print;
run;
data math;
set dw.ww;
drop chin;
proc print;
run;
(5) 由数据集ww产生总成绩(英语和数学之和) ,并根据总成绩由高到低排序。

4分data b;
set dw.ww;
sum= (chin + math);
proc sort;
by decending sun;
run;
proc print;
run;(6)请将总成绩≧180者定义为成绩评价(变量eval)为A,总成绩≦150者定义为成绩评价(eval)为C,二者之间者定义为B. 4分
data b1;
set b;
if sum >= 180 then eval='A';
else if sum <= 150 then eval='C';
else eval='B';
proc print;
run;
(7) 假设还有这18名同学的英语成绩表数据,数据集名为QQ,结构与上表相同。

请将ww和QQ合并起来。

4分
data b2;
merge dw.ww qq;
proc print ;
run;
(8)假设还有另外18名同学的信息, 数据集名为pp,格式与ww相同,请将ww和pp连接起来。

4分
data b3;
set dw.ww pp;
run;
(9)对男女同学的数学成绩进行比较,检验有无统计学差异。

5分
data c;
set dw.ww;
proc univariate normal;
class gender;
var math;
run;
proc ttest;
class gender;
var math;
run;
proc npar1way wilcoxon;
class gender;
var math;
run;
(10)请分析数学与语文成绩有无差异?5分
data c1;
set dw.ww;
d=chin-math;
proc univariate normal;
var d;
run;
(11) 请分析ww数据集中18名学生的语文和数学成绩有无相关和数量关系。

7分
data c4;
set dw.ww;
Proc plot;
Plot math*chin;
Run;
proc corr;
var math chin;
run;
proc reg;
model math=chin;
run;
(12)若得到36名学生的成绩等级A、B、C如下表所示,问他们男女之间有无差异?
5 分
性别 A B C 合计
男8 7 3 18
女 5 8 5 18
data c5;
do a=1 to 2;
do b=1 to 3;
input f@@;
output;
end;end;
cards;
8 7 3
5 8 5 ;
proc freq;
tables a*b/cmh;
weight f;
run;
(13)对于(12)若仅考虑他们的优秀率A有无差异该如何处理?5分
data good;
do a= 1 to 2;
do b= 1 to 2;
input f@@;
output;
end;end;
cards;
8 10
5 13
;
proc freq;
tables a*b/chisq;
weight f;
run;
二、SAS编程(共40 分)
1.某人研究北京机关工作人员血脂水平,随机抽取不同年龄男性各10名受试者,检测他们的总胆固醇(TC)的含量(mmol/L),其结果如下:
青年组 5.00 4.85 4.93 5.18 4.95 4.78 5.18 4.89 5.07 5.21
中年组 5.12 5.13 4.89 5.20 4.99 5.14 5.16 4.98 5.16 5.25
老年组 5.24 5.26 5.23 5.10 5.31 5.23 5.21 4.98 5.15 5.19
请问:三个年龄组的总胆固醇平均含量之间的差别是否具有统计学意义?(15分)
要求用SAS实现:(1)、请用3种方法输入数据;(2)试用完整严格地分析。

data a;
do c=1 to 3;
do j=1 to 10;
input x@@;
output;
end;end;
cards;
5.00 4.85 4.93 5.18 4.95 4.78 5.18 4.89 5.07 5.21
5.12 5.13 4.89 5.20 4.99 5.14 5.16 4.98 5.16 5.25
5.24 5.26 5.23 5.10 5.31 5.23 5.21 4.98 5.15 5.19
;
proc univariate normal;
class c;
var x;
run;
proc anova;
class c;
model x=c;
means c/hovtest=levene;
means c/lsd;
run;
proc npar1way wilcoxon;
class c;
var x;
run;
data a;
input x@@;
if _n_<11 then c=1;
else if _n_>20 then c=3;
else c=2;
cards;
5.00 4.85 4.93 5.18 4.95 4.78 5.18 4.89 5.07 5.21
5.12 5.13 4.89 5.20 4.99 5.14 5.16 4.98 5.16 5.25
5.24 5.26 5.23 5.10 5.31 5.23 5.21 4.98 5.15 5.19
;
2. 表1是一个研究吸烟、饮酒与食道癌关系的病例-对照资料,试作logistic
回归分析。

(5分)
表1 吸烟与食道癌关系的病例-对照调查资料
分层吸烟饮酒观察例数阳性数阴性数
g X1X2n g d g n g- d g
1 0 0 199 63 136
2 0 1 170 6
3 107
3 1 0 101 4
4 57
4 1 1 416 26
5 151
确定各变量编码



=
1
1不吸烟
吸烟
X



=
1
2不饮酒
饮酒
X



=
1
对照
病例
Y
data a;
input x1 x2 f y @@;
cards;
0 0 63 1
0 1 63 1
1 0 44 1
1 1 265 1
0 0 136 0
0 1 107 0
1 0 57 0
1 1 151 0
;
proc logistic descending;
model y=x1 x2;
freq f;
run;
3.为探讨某恶性肿瘤的预后,收集了63例病人的生存时间、结局及影响因素。

原始
资料及变量的意义如见表2和表3。

(14 分)
表2 某恶性肿瘤的影响因素及量化值
变量
意义
量化值
X 1 病人的年龄 岁
X 2
性别
男 1 女0
X 3 组织学类型 高分化 1 低分化 0 X 4 治疗方式
传统治疗方式 1 新治疗方式 0 X 5 淋巴节是否转移 是 1 否 0
X 6 肿瘤的浸润程度 突破浆膜层 1 未突破浆膜层 0 T 病人的生存时间 月
Y
病人的结局
死亡 0 截尾 1
proc lifetest plots=(s); time t*y(1); strata x2; run ;
proc phreg data=a;
model t*y(1)=x1-x6; run ; data a;
input i X1 X2 X3 X4 X5 X6 t Y @@; cards; 1 54 0 0 0 1 0 52 1 2 57 0 1 1 0 0 51 1 3 43 1 0 0 1 0 120 1 4 44 1 0 0 1 2 120 1 5 62 0 0 1 1 2 120 1
4.设有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲、乙
两种白喉杆菌培养基上,观察白喉杆菌的生长情况,结果如表2。

问两种培养基上白喉杆菌的生长概率有无差别?要求用SAS实现(6分)
表4 两种培养基白喉杆菌生长情况
乙培养基
甲培养基
阳性阴性合计
阳性22 18 40
阴性 2 14 16
合计24 32 56
注:“阳性”表示生长,“阴性”表示不生长
data a;
do a=1 to 2;
do b=1 to 2;
input f@@;
output;
end;
end;
cards;
22 18
2 14
;
proc freq;
weight f;
tables a*b/agree;
run;
欢迎您的下载,
资料仅供参考!
致力为企业和个人提供合同协议,策划案计划书,学习资料等等
打造全网一站式需求。

相关文档
最新文档