数据分析实验报告 1

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

广西大学
数据分析实验报告
学生姓名:谢丁丁
学号:1111100227
班级:信科111班
完成时间:2014年6月8日
实验内容:
对数据集advert.sav作回归分析。

这是一个虚拟数据集,目的是研究广告费用和销售量之间的关系。

题意分析:变量之间的关系要么相关、要么不相关。

从学过的知识可知,定量数据的度量方法包括散点图和相关系数。

所以可从这里入手。

实验过程与结果:
1、画出散点图:
选择菜单“Graph”—散点图……”,出现如下选项卡
点击“定义”,出现界面如下,按如下选择:
点击确定,即可得所需的散点图。

如下所示:
散点图分析:
从散点图可看出所画的点大致成一条从左下到右上的直线,由此可初步判断销售量和广告费用成正相关关系。

2、做相关系数分析
选择菜单“Analyze”--“Correlate”--“Bivariate”,出现两变量相关分析选项卡。

讲“advert”与“sales”选入Variables列表。

选择相关系数,点击OK,过程和结果如下所示:
Person相关系数:
相关性
Detrended sales Advertising spending
Detrended sales Pearson 相关性 1 .916**
显著性(双侧).000
N 24 24 Advertising spending Pearson 相关性.916** 1
显著性(双侧).000
N 24 24 **. 在.01 水平(双侧)上显著相关。

图1
Kendall相关系数与Spearman相关系数:
相关系数
Detrended sales Advertising spending
Kendall 的tau_b Detrended sales 相关系数 1.000 .717**
Sig.(双侧). .000
N 24 24 Advertising spending 相关系数.717** 1.000
Sig.(双侧).000 .
N 24 24 Spearman 的rho Detrended sales 相关系数 1.000 .889**
Sig.(双侧). .000
N 24 24 Advertising spending 相关系数.889** 1.000
Sig.(双侧).000 .
N 24 24 **. 在置信度(双测)为0.01 时,相关性是显著的。

图2
结果分析:由图1和图2可见,销售额与广告费用的Person相关系数为0.916,Kendall相关系数为0.717,Spearman相关系数为0.889,三类相关系数在1%的置信水平上都很显著,结果同样证明了两变量之间显著的高度正相关关系。

3、进一步分析
由1、2知销售量和广告费用是相关的,那么能否用具体的关系式表示。

因为相关又分线性相关和非线性相关,所以在这里先做个假设。

(1)假设两变量间成线性关系:
模型汇总b
模型R R 方调整R 方标准估计的误差
1 .916a.839 .83
2 .73875
a. 预测变量: (常量), Advertising spending。

b. 因变量: Detrended sales
图3.1
Anova b
模型平方和df 均方 F Sig.
1 回归62.514 1 62.514 114.548 .000a
残差12.006 22 .546
总计74.520 23
a. 预测变量: (常量), Advertising spending。

b. 因变量: Detrended sales
图3.2
系数a
模型
非标准化系数标准系数
t Sig.
B 标准误差试用版
1 (常量) 6.584 .40
2 16.391 .000
Advertising spending 1.071 .100 .916 10.703 .000 a. 因变量: Detrended sales
图3.3
图3.4
结果分析:由图3.1-3.4可知,R^2达到0.839,知方程的拟合效果很好。

从方程的显著性的分差分析中可知,F统计量为114.548,显著性水平为0.000,说明方程非常显著,自变量作为一个整体对因变量有显著影响。

(2)假设两变量是非线性关系
图4
模型汇总和参数估计值因变量:Detrended sales
方程
模型汇总参数估计值
R 方 F df1 df2 Sig. 常数b1 b2 b3
对数.901 199.831 1 22 .000 6.274 3.539
二次.908 104.213 2 21 .000 3.903 2.854 -.245
三次.909 66.684 3 20 .000 3.283 3.471 -.422 .015 自变量为Advertising spending。

表1
由图四观察,其对数、二次、三次拟合效果都很好。

从表1参数估计值可知,其R方值分别
为0.901、0.908、0.909,而显著性水平均为0,证实方程也是非常显著的。

从表1中的参数可
非别写出两变量间的关系式。

相关文档
最新文档