统计分析与SPSS的应用学生复习题-推荐下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、 SPSS的数据编写窗口分为Data wiew 和 Vairable view 两个视图子窗口。
2、 SPSS最基本的变量种类有数值型、字符型和日期型。
3、 SPSS有两类缺失值:系统缺失值和用户缺失值。
4、 SPSS的丈量尺度主要有标度丈量、有序丈量和名义丈量。
5、 SPSS有四种创立数据文件的方法:
6、从其余数据文件导入数据主要三种方法:
7、假如只要保留部分变量可使用选择性保留功能。
8、姓名、性别、年纪、身高、体重分别是那种变量?
9、 SPSS有两种定义缺失值的方式:和。
1)能够定义 3 个独自的缺失值。
2)能够定义一个缺失值范围和一个独自的缺失值。
10、数据进行排序时,选择菜单下的命令。
Data 菜单下 sort case
11、 spss 进行数据的队列交换时,选择菜单下的命令。
Data 菜单下transpose.
12、数据文件的归并有两种方式:和。
13、 SPSS的系统运转管理方式有哪三种?
答:1)批办理方式; 2)完整窗口菜单运转方式;3)程序运转方式。
14、 SPSS数据文件的扩展名是。
.sav
15、 SPSS的输出结果编写窗口分红左右两部分:
16、输入变量名,为了防止与老版本及其余软件出现不兼容问题,变量名一般控制在8 位之内且尽量防止采纳中文。
17、下边是每周去图书室学习次数的编码方案:1=每周去 1 次; 2=每周去 2 次或 2 次以上;3=每周去 3 次或 3 次以上; 4=每周去 4 次或 4 次以上。
问: 1)这样编码有无错误?2)请写出正确的编码方案。
19、数据一旦拆分以后,假如没有撤消拆分,在此后的统计剖析过程中拆分向来存在。
20、数据一旦加权以后,假如没有撤消加权,在此后的统计剖析过程中加权向来存在。
21、关于缺失值,怎样利用SPSS进行科学代替。
(见课件)
22、 SPSS数据文件的特色及监理SPSS数据文件时应达成的两项任务是什么?P16-17
23、简述 SPSS数据文件的基本组织形式。
24、统计学依数据的计量尺度将数据分为哪三类
CH5 参数查验(均值比较与t 查验)
1、什么是 t 查验,简述t 查验的一般步骤。
2、在统计学中,往常将t 查验分为 4 类:样本均值与整体均值比较的t 查验、独立两样本
均值比较 t 查验、配对设计的差数均值与整体均值0 的 t 查验以及独立两样本几何均值比较的 t 查验。
3、简述单样本t 查验的一般步骤。
T 查验4、两独立样本T 查验的零假定H 0是两整体均值之间不存在明显差异。
两配对样本
的零假定H 0是两整体均值之间不存在明显差异
5、面是学生数学成绩的单样本查验。
One-sample statistics
N Mean Std Std Error
Deviation Mean
数学 1
1
t
df Sig.(2-tailed)
One Sample Test
Test Value=70
Mean
Difference
95% Confidence interval of the
difference
Lower Upper
数学成10
绩
试成立明显性查验的零假定和备择假定,并说明查验的结果是什么?(α=0.05 )
答:零假定:μ=70;备择假定:μ70.
从数据看, 11 个学生的数学均匀值为,标准差为,均值偏差为, t 值
=0.566 ,相伴概率值 =0.584>0.05 ,不可以拒绝零假定,以为均值与70 无明显性差异。
样本均值与查验值差为4,其 95%的置信区间是(-11.7496 ,)。
6、这是取自71 个不一样的学生的学习成绩,相互之间是独立的。
按性别分组进行独立样本
的 T 查验,写出明显性查验的零假定和备择假定,并说明查验的结果是什么?
(α =0.05 )
Group Statistics
学生性别N Mean Std Std Error Mean Deviation
目前成绩男生48
女生24
Independent Sample Test
Levene ’ s Test for
Equality t-test for Equality of Means
Of Variances
F Sig. t df Sig.
(2-tailed) 目前成绩
assumed
Equal variances
not assumed
CH6 方差剖析
1、简述单要素方差剖析的基本思想。
2、简述多要素方差剖析的基本思想。
3、简述方差剖析的合用条件。
答:( 1)样原来自的整体要听从正态散布。
( 2)样本方差一定是齐次的。
(3)各种本之间互相独立。
4、在多要素方差剖析中,变量的总离差平方和分解为哪三部分?
答:在多要素方差剖析中,变量的总离差平方和SST 分解为 3 个部分: 1)多个控制变量独自作用惹起的平方和; 2)多个控制变量交互作用惹起的离差平方和; 3)其余随机要素惹起的离差平方和。
5、简述单要素方差剖析的基本步骤。
P142-143
6、研究一个班 3 组同学(分别接受了析结果,写出零假定和备择假定,并议论3 种不一样的教课方法)在数学成绩。
剖析下边方差分
3 组同学在数学成绩上能否有明显的差异?
( α =0.05 )
Levene Statistic Test of Homogeneity of Variances
df1df2
215
sig.
Between Groups(Combined)
Linear Term
Contrast
Deviation
Within Groups
Total
答:由表 Test of Homogeneity of Variances ANOVA
Sum of df Mean F
Squares Square
2
1
1
15
17
剖析:零假定是不一样分组均值方差同样。
Sig.
Levene
Statistic=3.862 ,相伴概率值=0.044<0.05 ,拒绝零假定,起码一组和其余两组均值方差有显
著性的不一样,所以,这组数据不合适进行单要素方差剖析。
7、多重比较。
8、课本事例及练习题1、 2、3
CH8 有关剖析
1、什么是有关剖析?常用的方法有哪些?
答:描绘变量之间线性有关程度的强弱,并用合适的统计指标表示出来的过程为有关剖析。
可
依据研究的目的不一样,或变量的种类不一样,采纳不一样的有关剖析方法。
常用的有关剖析
方法:二元定距变量的有关剖析、二元定序变量的有关剖析、偏有关剖析和距离有关剖析。
2、利用有关系数r 说明变量之间线性有关程度时,依据经验可将有关程度分为以下几种情
况:当时,视为高度有关;当时,视为中度有关;当时,视为低度有关;当时,说明变量之间的有关程度极弱,可视为不有关。
r 0.8 ;r 0.8 ;r 0.5 ;r
3、简述线性有关剖析的基本步骤。
4、用的有关系数有哪些?(试写出
5、课本事例及练习题1、 2
3 种)
CH9 回归剖析
1、试述回归剖析的基本步骤.
2、一元线性回归的数学模型是什么?此中
3、多元线性回归的数学模型是什么?
知足的两个前提是什么?
4、常用的回归方程的统计查验有:回归方程的拟合优度查验、回归方程的明显性查验、
回归系数的明显性查验及残差剖析。
5、在多元回归剖析中,解说变量的挑选一般有哪三种基本策略?
6、 在线性回归剖析中, SST 称为离差平方和, SSR 称为回归平方和, SSE 称为残差平方
和,三者之间的关系是
SST=SSR+SSE,决定系数 R 2
=
SSR。
SST
7、为了研究高等数学成绩与概率成绩的关系,今采集到 20 名学生的高等数学、概率成绩。
采纳 SPSS 统计剖析进行线性回归剖析,得出以下输出结果:
ANOVA (b )
Model
Sum of Squares df
Mean Square F Sig 1
Regression 1
Residual 18
Total
19
Cofficients(a)
Model
Unstandardized Standardize t
Sig.
Coefficients
d
Coefficients
1
B
Beta
r
Constant
高等数学
1) 据 ANOVA ( b )表计算出裁决系数,成立明显性查验的零假定和备择假定,并说明检
验的结果是什么?(α =0.05 )
2) 据 Cofficients(a) 表写出预计回归方程,成立明显性查验的零假定和备择假定,并说明检
验的结果是什么?(α =0.05 )
8、下边给出中公民航客运量的回归模型。
为了研究我公民航客运量的变化趋向及其成因,
以民航客运量作为因变量 Y ,以公民收入( X1 ),花费额( X2 ),铁路客运量( X3 ),民航航线里程( X4 ),来华旅行入境人数( X5 )为主要影响要素。
结果输出以下:
ANOVA (b )
Model
Sum of Squares df
Mean Square F Sig 1
Regression 13818877
5
3
Residual
10 Total
13843372 15
Cofficients(a)
Model
Unstandardized Standardize t
Sig.
Coefficients
d
Coefficients
1
B
Beta
r
Constant
X1 X2 X3
X4
X5
1)据 ANOVA (b )表计算出裁决系数,成立明显性查验的零假定和备择假定,并说明检
验的结果是什么?(α =0.05 )
2)据 Cofficients(a) 表写出预计回归方程,成立明显性查验的零假定和备择假定,并说明查
验的结果是什么?(α =0.05 )
9、下边给出了 1978 — 2006年间我国社会花费品零售总数之间的关系的线性回归剖析模型。
以社会花费品零售总数 Y 为因变量,以时间 T 为自变量,下边给出了四种模型输出。
Model Summary and Parameter Estimates
Dependent Variable:Y
Equation Model Summary Parameter Estimates
R F df1 df2 Sig. Constant b1 b2 b3 Square
Linear 1 27
Cubic 3 25
Power 1 27
Exponential 1 27
1) 写出 Linear 、 Cubic、 Power、 Exponential4 种曲线方程。
2) 查验三种曲线关系能否明显?(写出假定,0.05 )
3)试剖析最后采纳哪一种曲线,为何?
5、
向前挑选策略、向后挑选策略、逐渐挑选策略.
10、下边利用若干年粮食总产量以及农业劳动者人数(百万人 )(x1) , 总播种面积 (万公顷 )
( x2 ) , 风灾面积比率 (%) (x3) , 粮食播种面积 ( 万公顷 ) (x4) , 施用化肥量 (kg/ 公顷 )
( x5)的数据,进行多元线性回归所得的部分剖析结果以下:
Model Summary
Adjusted R Std. Error of the
Model R R Square Square Estimate
1 .993 a .986 .984
ANOVA b
Model Sum of Squares df Mean Square F Sig.
1 Regression 5 .000 a
Residual 29
Total 34
Coefficients a
Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) .001
粮食播种面积 (万公顷 ) .765 .852
总播种面积 ( 万公顷 ) .675 .140 .001 施用化肥量 (kg/ 公顷 ) .708 .000 风灾面积比率 (%) .000 农业劳动者人数 ( 百万人 ) .350 .000 1)将ANOVA表的所缺数值补齐。
2)写出线性回归方程,并解说回归系数的意义。
3)查验方程的线性关系能否明显?(写出假定,0.05 )
4)查验各回归系数能否明显?
练习题 6、事例 9-2、事例 9-1
CH10 聚类剖析
1、什么是聚类剖析?
2、常有的聚类方法有两种:层次聚类和K-Means 聚类。
3、层次聚类的两种种类和两种方法分别是什么?
4、什么是 Q 型聚类?什么是R 型聚类?
5、聚类剖析时应注意所选择的变量能否存在数目级上的差异。
假如一个样本包括不一样数
量级的变量,则应先对变量进行标准化办理,而后再进行聚类。
6、析下边的垂直冰柱图,并将样安分红 3 类。
并画出树形图。
7、析凝集状态图,写出聚类过程。
画出树形图
8、为研究不一样企业的营运特色,检查了15 个企业的组织文化、组织气氛、领导角色和员
工发展 4 方面的内容。
现要将这 15 个企业依据其各自的特色分红 4 种种类,利用方差剖析方法剖
析各种在那些方面存在差异。
7、什么是 K-Means 聚类?试称述K-Means 聚类剖析的中心步骤。
8、事例 10-1、 2、 3练习题1、2
CH11 SPSS 的因子剖析
1、简述因子剖析的特色。
2、简述因子剖析的基本步骤。
3、因子剖析的的前提条件是什么?常用的查验方法是什么?(写出 3 种查验方法)
4、课本事例及练习题。
5、。