列联表分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
列联表分析
【例1】性别与所喜爱颜色的调查表。
双向列联表:性别×颜色
【程序】
proc freq data=SASUSER.data9_01;
tables SEX*COLOR / CHISQ NOPERCENT NOROW;
weight F; run;
【例3】下面数据是某个“统计入门”课程的数据,记录了该课程中所有学生的性别和专业
(“是”为统计专业,“非”为其他专业)。
对数据进行整理生成列联表并分析。
【操作:解决方案-分析-分析家调入数据统计-表分析】
【程序】
*** Table Analysis ***;
proc freq data=SASUSER.data9_03;
tables SEX*MAJOR;
run;
【例5】雇员情况数据集Employee变量有:性别(gender)、工种(jobcat)、薪水(salary)
/薪水等级(salaryrank,分高(=1)100人,中(=2)200人,低(=3)其他人)、初薪(begsalary)
/薪水等级(begsalaryrank,分高(=1)100人,中(=2)200人,低(=3)其他人)和受教
育年限。
试作三向、四向、五向列联表。
【程序prog9_05_1】三向表:对性别、薪水等级和工种的情况进行统计(生成2张表)
*** Table Analysis ***;
proc freq data=SASUSER.data9_05;
tables GENDER*SALARYRANK*JOBCAT; run;
【程序prog9_05_3】五向表:对性别、薪水等级、初薪等级、受教育年限和工种的情况进
行统计(生成18张表)
*** Table Analysis ***;
proc freq data=SASUSER.data9_05;
tables GENDER*SALARYRANK*BEGSALARYRANK*EDUCATION*JOBCAT; run;
【例6】下表是一个由220名饮酒者组成的随机样本,对饮酒者进行酒类型偏好的调查。
检
验性别与饮酒偏好是否有关?(α=0.05)
【程序】
data sasuser.data9_06;
input sex wine people;
datalines;
1 1 60
2 1 40
1 2 50
2 2 70
;
proc freq;
weight people;
tables sex*wine/chisq;
run;
【例7】某企业出台了一套改革方案,向不同工龄的职工进行调查得到下面的列联表,根据
【程序】
data sasuser.data9_07;
do jobtime=1to3;
do opinion=1to3;
input people@@;
output;
end;
end;
datalines;
21 16 12 9 10 9 10 14 19
;
run;
proc freq;
tables opinion*jobtime/chisq;
weight people;
run;
【例8】为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,结果如下表:
两种工艺下产品质量的抽查结果
【程序prog9_08】
proc freq data=SASUSER.data9_08;
tables method*quality /chisq noprint;
weight F;
run;
非参数检验
【例1】下表为来自两个样本A 、B 的测量数据,经检验知两样本方差不齐,试做非参数检验比较两组数据的差别。
两独立样本A 、B 测量数据
【程序】
data sasuser.data10_01; do g=1 to 2; input x@@; output ; end ; datalines ;
7 3 14 5 22 6 36 10 40 17 48 18 63 20 98 39 ;
proc npar1way wilcoxon ; class g; var x; run ;
【例2】为了鉴别新旧两种生产方法对生产效率的影响,随机抽取了22人用旧生产方法生产,25人用新生产方法生产,每人平均日产量(件)资料如下:
旧方法:20 31 27 18 10 26 39 45 41 24 22 23 14 11 32 37 40 46 49 55 54 19 新方法:36 39 31 25 26 28 20 21 24 21 58 55 56 41 37 49 44 40 12 16 15 24 23 28 11 问两种方法对日产量影响有无显著差异(05.0=α)? 【程序】
proc npar1way data =sasuser.data10_02 wilcoxom; class g; var x; run ;
【例3】用某药治疗不同病情的老年慢性支气管炎病人, 疗效见下表,比较该药对两种病情的疗效。
某药对两种不同病情的支气管炎疗效
疗效单纯型单纯型合并肺气肿
控制65 42
显效18 6
有效30 23
近控13 11
data sasuser.data10_03;
do x=1to4;
do g=1to2;
input f@@;
output;
end;
end;
datalines;
65 42 18 6 30 23 13 11
;
proc npar1way wilcoxon;
class g;
var x;
freq f;
run;
【例5】有两家公司设计了他们自已的智商测验方法,一位心理学家随机地选取13个人同时接受这两种测验方法,结果如下表所示。
试在0.05的显著水平下,检验是否可宣称这两种方法无显著差异。
【数据摆放】
【程序】
proc univariate data=sasuser.data10_05 loccount;
var d;
run;
【例7】假设有个地区的领导想要比较该地区四个村的各户的人均年收入水平,于是在这四
个村中随机抽取样本,计算各户的人均收入,得到下表中的24个数据。
分析这四个村的年
收入是否存在显著差异。
(α=0.05)
四个村六户人家的年收入水平
【程序】
proc npar1way data=sasuser.data10_07 wilcoxon;
class g;
var income;
run;
【例题10_11】某瓶装纯净水厂商生产的产品标称净含量为600ml,现质量监督管理部门对
该产品是否合格进行抽检,得到27个抽检数据(详见Water.sas7bdat)。
试根据抽检结果对
该产品质量进行评价。
【程序】
proc univariate data=sasuser.water mu0=600;
var Net;
run;
【例题10_12】某调查公司在某项调查中收集到76个观测值的样本数据(详见KS.sas7bdat)。
试分析该数据的总体分布是何种分布。
【程序】
proc univariate data=sasuser.KS noprint;
var Observed;
histogram /noplot/*使用histogram语句,设置不显示直方图*/
normal(mu=est sigma=est) /* 指定H0是正态分布,参数使用估计值*/
lognormal(zeta=est sigma=est theta=est) /* 指定H0是对数正态分布,参数使用估计值*/ exponential(sigma=est theta=est) /* 指定H0是指数分布,参数使用估计值*/
weibull(sigma=est c=est theta=est); /* 指定H0是韦伯分布,参数使用估计值*/
run;。