SAS期末试题及答案解析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5月31日上机作业:

《统计分析系统SAS》模拟练习,结果不用上传

保险公司为了解车险投保人对保险公司工作的满意程度Y和投保人的年龄X1、事故的严重程度X2

将数据作变换:将X2与Y数据上加上你学号的后1位,如学号的最后一位数据为2,则第1位报险人的X2=51+2,Y=48+2,其余数据依此类推。

一、数据集的建立

1. 简述建立数据集时,SAS逻辑库的作用

2. 若在D盘根目录建立了一个名字为“AA”的逻辑库,,上述数据集名字为temp,在windows 环境下数据集全名为_ ,SAS环境下,数据集名字的完整表示为_ 。

二、基本统计分析

1.INSIGHT中,得到变量X2的均值为_ ,标准差为_ ,变异系数为_ _,方差为为__ 2.变量Y的的均值为_ ,标准差为_ ,变异系数为_ _,方差为为_ _。

三、正态性检验

对数据进行正态性检验,以0.1为显著性水平进行检验,得到的结果中,变量为正态分布,为非正态分布;变量Y的中位数为,数据中有25%的值小于。

四、相关分析

1.变量X1和Y的相关系数为R= ,X2和Y的相关系数R=,X3和Y的相关系数R =,X2和X3的相关系数R= 。

2. 写出用相关系数说明问题时,要注意的几点,至少写出3点。(答案供参考)

答:1)相关系数很强并不表示变量间一定有因果关系,也可能是两个变量同时受第三个变量的影响而使他们有很强的相关;

2)相关系数是说明线性联系程度的。相关系数接近于0的变量间可能存在非线性联系(可能是曲线关系);

3)有时个别极端数据可能影响相关系数;

4)强相关并不表示一定存在因果关系;

5)弱相关并不表示变量间不存在关系。

五、假设检验

1.简述假设检验的基本思想。在假设检验中,P值的含义是什么?(答案供参考)

答:首先给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设H1,H0与H1有且仅有一个成立;经过一次抽样,若发生了小概率事件(通常把概率小于0.05的事件称为小概率事件),可以依据“小概率事件在一次实验中几乎不可能发生”的理由,怀疑原假设不真,作出拒绝原假设H0,接受H1的决定;反之,若小概率事件没有发生,就没有理由拒绝H0,从而应作出拒绝H1的决定。

2、将上述数据,按年龄分为两组,40岁及以下的报险人为一组,40岁以上的报险人为一组,用假设检验分析方法,分析两组不同年龄的报险人,对保险公司工作的满意度有无差别。结果显示t统计量的p值= ,说明组不同年龄的报险人,对保险公司工作的满意度是(相同/不同)的。如果对数据保留一位小数,40岁以下的报险人对保险公司工作的平均满意度为,40岁及以上的报险人对保险公司工作的平均满意度为。

六、回归分析(答案供参考)31

1.进入SAS/INSIGHT环境下,进行回归拟合,选择y为因变量,选择X1-X3为自变量,不将截距选入模型中,单击确定,在0.05的显著性水平下检验,构建模型:Y=a*X1+b*X2+c*X3,得到的回归方程为:

Y= -1.2353 *X1+3.2550 *X2+ (-24.4599) *X3

2. 共线性诊断结果中,条件指数的最大值为 30.5728 ,且这一行的数据中,自变量X2和X3的方差比例分别为 0.9482 和 0.9538 ,表明X2和X3两个变量之间存在线性关系,依据数据分析的需要,舍弃变量X3。

3. 舍弃变量X3后,再次构建新模型:Y=a*X1+b*X3,结果显示,变量X1、X2均对方程有显著影响,此时,X1检验的概率为 0.0124 ,只包含变量X1和X2的回归方程为:

Y= -1.3856 *X1+ 2.2650 *X2 。

4. 拟合优度检验:R平方为0.9279 ,校正的R平方为 0.9211 。说明Y的变异有92.11 %可以归因报险人的年龄X1和事故的严重程度X2。

5. 假设事故的严重程度都为60,年龄为40岁的报险人,对保险公司工作的满意度为80.4784,年龄为50岁的报险人,对保险公司工作的满意度为6

6.6227。

相关文档
最新文档