数据分析实验报告p
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一次试验报告
习题1.3
1建立数据集,定义变量并输入数据并保存。
2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:
3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出:
全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788 2.00 1 . 03
数据分析实验报告
【最新资料,WORD 文档,可编辑修改】
1.00 1 . 7
1.00 2 . 3
3.00 2 . 689
1.00 3 . 1
Stem width: 1000
Each leaf: 1 case(s)
分析—描述统计—QQ图,选择如下:
输出:
习题1.1
4数据正态性的检验:K—S检验,W检验
数据:
取显着性水平为0.05
分析—描述统计—探索,选择如下:
(1)K—S检验
单样本 Kolmogorov-Smirnov 检验
身高
N 60
正态参数a,,b均值139.00
标准差7.064
最极端差别绝对值.089
正.045
负-.089
Kolmogorov-Smirnov Z .686
渐近显着性(双侧) .735
a. 检验分布为正态分布。
b. 根据数据计算得到。
结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验
正态性检验
结果:在Shapiro-Wilk 检验结果972.00=w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5
5多维正态数据的统计量
均值向量为:)767.33,505.4,836.27,219.18(=-
X
结果:x4与其他数据无相关性,其他三组数据线性相关
结果:由Spearman相关矩阵的输出结果看,取显着性水平0.1,p值皆小于0.1,所以数据相关性显着
习题2.4
6线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐步回归。
7残差分析
分析—回归—线性,选择如下:
输出:
逐步回归结果:
两变量的系数p值均小于0.05均有统计学意义。
结果:由残差统计量表看出,数据无偏离值,标准差比较小,认为模型健康。
概率论课本习题7.5
8一个正态总体独立样本均值的t检验与区间估计
分析—比较均值—独立样本T检验:
输出:
结果:样本均值为2833.50与总体均值2820比较接近
结果:
t值为1.218小于临界值2.26,且P值为0.254大于显着性水平0.05,接受原假设,即认为样本均值与总体均值之差可能是抽样误差所导致
概率论课本习题7.7
9两个正态总体均值差异比较的t检验与配对检验
分析—均值比较—独立样本T检验,选择如下:
输出:
结果:P值为1大于显着性水平0.05,认为方差相等。此时,p值(Sig. (2-tailed))
为0.229大于显着性水平0.05,认为样本均值是相等的,即电阻均值没有显着性差异。
分析—比较均值—配对样本T检验,选择如下:
输出:
结果同上:认为样本均值是相等的,即电阻均值没有显着性差异。