数据处理统计分析

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

二、参数估计
1、点估计
依次选择【分析（A）】→【描述统计】→【探索（E）】→选中“统计量”子对话框中的“描述性”和 “M-估计量”选项。
2、区间估计
依次选择【分析（A）】→【描述统计】→【描述（D）】 →单击【Bootstrap(B)】按钮。注意： “频率(F)”、“描述(D)”、“探索（E）”、 “均值（M）”等过程均可进行参数区间估计。
一、随机抽样
1、依次选择【数据（D）】→【选择个案】 … 2、选择“随机个案样本（D）”选项，并单击【样本（S）】按钮。 3、在样本尺寸框中，选择【大约（A）】选项，并在其后的活动框内输入抽样比例，单击【继续】按钮 4、在主对话的“输出”栏中指定对未选中个案的处理方式。 5、单击【确定】按钮。
第七节SPSS的相关回归分析功能
一、相关分析
1、绘制散点图

依次选择【图形（G）】→【旧对话框（L）】→【散点/点状(S)】 …
2、计算相关系数
依次选择【分析（A）】→【相关（C）】→【双变量(B)】 →选择【 Pearson】复选框…
3、计算偏相关系数
依次选择【分析（A）】→【相关（C）】→【偏相关 (R)】…
3、建立变量集合
选择菜单【实用程序（U）】→【定义变量集（E）】
Spss函数

根据函数功能和处理的变量类型，SPSS函数大致可分为：算术函数、统计函数、分布函数、逻辑函数、字符串函数、缺失值函数、日期函数和其它函数。
第五节数据整理的SPSS应用
SPSS的基本数据整理

品质数据整理单一变量次数分布表依次选择：【分析（A）】→【描述统计（D）】→
2、数据文件分组
依次选择【数据(D)】→【拆分文件(F)】
3、加权处理
选择【数据（D）】→【加权个案（W）】
数据文件的处理（续）
4、数据文件的结构重组
依次选择【数据（D）】→【重组（R）】
二、变量处理
1、计算变量
依次选择【转换（T）】→【计算变量（C）】
2、变量值重新编码
依次选择【转换（T）】→【重新编码为不同变量（R）】
Spss变量名的定义规则

变量名中不能有空格；变量名允许有64字节长，首写必须是文字母或以下符号之一：@、#、$，除首写自字符外其他可以是字母、数字、小数点或其他任意非标点符号的字符；避免“.”、“-”作为变量名结尾。
Spss的变量类型
数值型：标准数值型、带逗号的数值型、圆点数值型、科学计数法、带美元符号的数值型、自定义类型。字符型：字符串可以包括数字、字母、特殊字符，最长为32767个字符。日期型：16种。
【频率（F）】
双变量交互次数分布表依次选择：依次选择【分析（A）】→【描述统计
（D）】→【交叉表（C）】

数值型数据整理单项式次数分布表（同品质数据整理）组距式次数分布表首先：依次选择【转换（T）】→【重新编码为不同变
其次：对分组结果的取值范围进行定义
量（R）】
SPSS的调查数据整理功能
因子分析的一般数学模型
设有n个样品，p个指标。X ( X 1 , X 2 , X 3 X p )T 为可观测的随机变量，要寻找的公因子为 f ( f1 , f 2 , f 3 f q ),则模型： X 1 1 a11 f1 a1q f q e1 X 2 2 a21 f1 a2 q f qe2 为因子分析模型 X p p a p1 f1 a pq f q e p
第五节SPSS的基本统计分析功能
一、描述性分析

计算描述性统计量
【频率（F）】 …
方法1：依次选择【分析（A）】→【描述统计】→
方法2：依次选择【分析（A）】→【描述统计】→
【描述（D）】 …

分类平均数的计算：
依次选择【分析（A）】→【比较均值（M）】→【均值（M）】…
描述性统计分析（续）
一、Spss软件的特点
Spss Statistical Package for the Social Science 即 “社会科学统计软件包 ” 特点：除数据输入需要键盘以外，其余操作大多是通过“菜单”、“图形按钮”、 “对话框”等来完成。

二、SPSS的常用界面

数据编辑窗口、结果观察窗口、对象编辑窗口、草稿输出窗口、命令语句窗口和脚本编写窗口。其中最常用的是数据编辑窗口、结果观察窗口、对象编辑窗口三个窗口。
SPSS图形制作（续）
2、线图（Line Chart）（1）单线图（2）双线图（3）垂线图（4）线图的特殊编辑（添加参考线和特别显
示）
3、面积图（Area Chart）
SPSS图形制作（续）

4、饼图（Pie Chart） 5、散点图（Scattre Plot）（1）简单散点图（2）相关阵图（3）三维旋转图（4）散点图的特殊编辑添加均值参考线、拟合回归线、预测区间设置等。
二、因子分析

因子分析的基本思想：根据相关性大小
把原始变量分组，使的同组内的变量之间相关性较高，而不同组变量间的相关性较低。每组变量代表一个基本结构，并用一个不可观测的综合变量来表示，这个基本结构称为公共因子。因子分析的目的是寻求变量的基本结构，简化观测系统，减少变量维数，用少数的变量解释所研究的复杂问题。
对象编辑（SPSS Object）窗口简介

窗口进入:右键方式、双击方式；枢纽表（Pivoting Trays)窗口、图形编辑（Chart Editor）窗口。 Interactive graph编辑状态。
第二节SPSS数据文件的建立与操作
一、建立spss数据文件

打开spss，进入数据输入（Data View）界面；定义变量与数据编码，其中“name”、 “label”、“ values”三个选择比较重要；在数据输入模式下，用键盘将数据直接输入，输入前点击View→Value Labels；保存数据文件，待分析使用。
三、相对数性分析
1、依次选择【分析(A)】→【描述统计】→【比率(R)】 2、选入“分子”和“分母”变量； 3、单击【统计量（S）】按钮，选中“均值（M）”、 “AAD（D）”和“均值居中COV”选项。单击【继续】按钮，返回主对话框。 4、单击【确定】按钮。
ቤተ መጻሕፍቲ ባይዱ
第六节SPSS的抽样与参数估计功能
第三部分 SPSS与数据处理与分析
第一节SPSS软件概述
关于SPSS

SPSS的英文原名为：Statistical Package for Social Sciences，译为社会科学统计软件包。 2002年将英文全称更改为：Statistical Product and Service Solutions，译为统计产品与服务解决方案。 2009年，SPSS公司宣布重新包装旗下的 SPSS产品线，定位为预测统计分析软件 (Predictive Analytics Software)PASW
2.绘制数据分布图（1）茎叶图的绘制（2）箱线图的绘制
探索分析（续）
茎叶图与箱线图的绘制过程基本相似，只是在图形选择上有差异。其过程如下：第一步，选择【分析（A）】→【描述统计】→【探索（E）】；第二步，选择“输出”框内的“图”选项。；第三步选择[Plots]子对话框，确定需要输出的图形。
3005 3100 1980 3600 1900
二、数据文件的编辑与管理

插入变量与删除变量；插入记录与删除记录；数据的剪贴、复制和粘贴；撤销操作。查看文件和变量信息
依次单击【文件（F）】→【显示数据文件信息（I）】→【工作文件（W）】

数据文件的打开与保存；数据库文件的转换。数据的审核与修改
聚类分析（续）
聚类分析的方法：层次聚类法、K-Means聚类、模糊聚类等层次聚类法：Q型聚类、R型聚类。聚类方式有：凝聚方式、分解方式两种。Spss层次聚类采用的是凝聚方式。个体与小类、小类与小类间“亲疏程度”的度量方法：最近邻居（Nearest Neighbor)距离最远邻居（Furthest Neighbor)距离组内平均连锁（Within-groups-linkage）距离重心（Centroid clustering）距离
计算加权平均数（1）选择菜单【数据（D）】→【加权个案（W）】； (2)选择“加权个案（W）”选项，并将权重变量选到

“频率变量（F）。
（D）】 …
(3)依次选择【分析（A）】→【描述统计】→【描述
二、探索性分析
1.“探索（E）”分析的描述性统计分析功能
依次选择【分析（A）】→【描述统计】→ 【探索（E）】 →选择“输出”框内的“统计量” 选项。

单选题整理：依次选择【分析（A）】→【描述统计
（D）】→【频率（F）】，进入“频率（F）”主对话框。

多项选择题的整理（多重响应分析） 1、将多选题的各选项定义为一个数据集。
依次选择【分析（A）】→【多重响应(U)】→【定义变量集（D）】 ….
2、重新点击:依次选择【分析（A）】→【多重响应 (U)】→【频率（F）】 ….

变量标签与值标签

变量标签与值标签，用于变量名和变量值的辅助说明。 Variable Labels（变量标签）在统计分析结果中，可以在与变量名相对应的位置显示该变量的标签，或直接以变量标签代替变量名显示，有助于理解和分析输出结果。 Value Labels（变量值标签），分类变量经常需要定义值的标签。由于提高数据录入效率非常有用。
数据输入错误的类型：数值定义范围内的错误、数值定义范围外的错误、逻辑错误。第二类错误的检查：数据排序：第三类错误，逻辑错误的检查与纠正：编制频数分布表。
数据的审核与修改

数据的合并（复制、粘贴）
第三节数据预处理的 SPSS应用
一、数据文件的处理
1、数据的合并
选择【数据（D）】→【合并文件(G)】→【添加变量(V)】
SPSS图形制作（续）

6、帕累托图（Pareto Chart） 7、直方图（Histogram）
第九节SPSS高级统计分析功能
一、聚类分析
方法依据：“物以类聚，人以群分 ” 方法特征：聚类分析是一种建立分类的多元统计方法，它能够将一批样本（或变量）根据其诸多数据特征，按照在性质上的亲疏程度在没有先知知识的情况下进行自动分类，产生多个分类结果。类内部的个体在特征上具有相似性，不同类间个体特征的差异性较大。聚类过程中亲疏程度的度量：计算个体间的距离，计算方法因变量类型不同而不同。定距型变量个体间距离的计算：有7种方法，其中最常用的是欧氏距离（Euclidean distance)；计数变量个体间距离的计算：卡方（Chi-Square measure)距离、 Phi方（ Phi-Square measure)距离；二值变量个体间距离的计算：简单匹配系数（Simple Matching）、雅科比系数（Jaccard)
二、回归分析
1、线性回归分析
依次选择【分析（A）】→【回归（R）】→【线性 (L)】 ….
2、曲线回归分析
依次选择【分析（A）】→【回归（R）】→【曲线估计 (C)】 ….
第八节SPSS图形制作与应用
一、SPSS图形制作
基本图形制作： 1、条形图（Bar Chart）（1）简单条形图（2）复式条形图（3）堆积条形图（4）多变量汇总条形图（5）个体观察值条形图
聚类分析（续）
聚类分析的SPSS操作步骤：
1、依次选择【分析（A）】→【分类(F)】→【系统聚类(H)】； 2、单击【统计量(S) 】按钮，选择输出“相似性矩阵(P)”； 3、单击【绘制(T) 】按钮，选择“树状图(D)”； 4、单击【方法(M) 】按钮，聚类方法； 5、单击【确定】按钮，完成操作。
输入数据

输入数据的方法直接录入复制粘贴直接打开
数据文件建立举例
企业职工情况模拟资料职工序号 1 性别男婚姻状况 1 年龄 30 基本工资 2100
2 3
4 5 6 7 8
女女
女男女男女
1 1
1 1 2 1 2
28 35
40 44 21 50 19
2250 2900
数据编辑窗口（Data Editor）用法简介

数据编辑窗口进入：三种方式；数据编辑窗口的组成:标题栏、工具栏、编辑栏、编辑区及状态栏等数据编辑窗口工具栏介绍冻结数据表中的列
结果观察（SPSS Viewer）窗口简介

窗口进入；窗口的组成:标题栏、工具栏、导航栏、分析结果区。结果观察窗口工具栏介绍