数据处理统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、参数估计
1、点估计
依次选择【分析(A)】→【描述统计】→【探索 (E)】→选中“统计量”子对话框中的“描述性”和 “M-估计量”选项。
2、区间估计
依次选择【分析(A)】→【描述统计】→【描述(D)】 →单击【Bootstrap(B)】按钮。 注意: “频率(F)”、“描述(D)”、“探索(E)”、 “均值(M)”等过程均可进行参数区间估计。
一、随机抽样
1、依次选择【数据(D)】→【选择个案】 … 2、选择“随机个案样本(D)”选项,并单击【样本 (S)】按钮。 3、在样本尺寸框中,选择【大约(A)】选项,并在其 后的活动框内输入抽样比例,单击【继续】按钮 4、在主对话的“输出”栏中指定对未选中个案的处理方 式。 5、单击【确定】按钮。
第七节SPSS的相关回归 分析功能
一、相关分析
1、绘制散点图
依次选择【图形(G)】→【旧对话框(L)】→【散 点/点状(S)】 …
2、计算相关系数
依次选择【分析(A)】→【相关(C)】→【双变量(B)】 →选择【 Pearson】复选框…
3、计算偏相关系数
依次选择【分析(A)】→【相关(C)】→【偏相关 (R)】…
3、建立变量集合
选择菜单【实用程序(U)】→【定义变量集 (E)】
Spss函数
根据函数功能和处理的变量类型,SPSS函数大 致可分为:算术函数、统计函数、分布函数、 逻辑函数、字符串函数、缺失值函数、日期函 数和其它函数。
第五节数据整理的SPSS应用
SPSS的基本数据整理
品质数据整理 单一变量次数分布表 依次选择:【分析(A)】→【描述统计(D)】→
2、数据文件分组
依次选择【数据(D)】→【拆分文件(F)】
3、加权处理
选择【数据(D)】→【加权个案(W)】
数据文件的处理(续)
4、数据文件的结构重组
依次选择【数据(D)】→【重组(R)】
二、变量处理
1、计算变量
依次选择【转换(T)】→【计算变量(C)】
2、变量值重新编码
依次选择【转换(T)】→【重新编码为不同 变量(R)】
Spss变量名的定义规则
变量名中不能有空格; 变量名允许有64字节长,首写必须是文 字母或以下符号之一:@、#、$,除首 写自字符外其他可以是字母、数字、小 数点或其他任意非标点符号的字符; 避免“.”、“-”作为变量名结尾。
Spss的变量类型
数值型:标准数值型、带逗号的数值型 、圆点数值型、科学计数法、带美元符号 的数值型、自定义类型。 字符型:字符串可以包括数字、字母、 特殊字符,最长为32767个字符。 日期型:16种。
【频率(F)】
双变量交互次数分布表 依次选择:依次选择【分析(A)】→【描述统计
(D)】→【交叉表(C)】
数值型数据整理 单项式次数分布表(同品质数据整理) 组距式次数分布表 首先: 依次选择【转换(T)】→【重新编码为不同变
其次:对分组结果的取值范围进行定义
量(R)】
SPSS的调查数据整理功能
因子分析的一般数学模型
设有n个样品,p个指标。X ( X 1 , X 2 , X 3 X p )T 为可观测的随机变量, 要寻找的公因子为 f ( f1 , f 2 , f 3 f q ),则模型: X 1 1 a11 f1 a1q f q e1 X 2 2 a21 f1 a2 q f qe2 为因子分析模型 X p p a p1 f1 a pq f q e p
第五节SPSS的基本统计 分析功能
一、描述性分析
计算描述性统计量
【频率(F)】 …
方法1:依次选择【分析(A)】→【描述统计】→
方法2:依次选择【分析(A)】→【描述统计】→
【描述(D)】 …
分类平均数的计算:
依次选择【分析(A)】→【比较均值(M)】→【均值 (M)】…
描述性统计分析(续)
一、Spss软件的特点
Spss Statistical Package for the Social Science 即 “社会科学统计软件包 ” 特点:除数据输入需要键盘以外,其余操 作大多是通过“菜单”、“图形按钮”、 “对话框”等来完成。
二、SPSS的常用界面
数据编辑窗口、结果观察窗口、对 象编辑窗口、草稿输出窗口、命令语 句窗口和脚本编写窗口。 其中最常用的是数据编辑窗口、 结果观察窗口、对象编辑窗口三个窗 口。
SPSS图形制作(续)
2、线图(Line Chart) (1)单线图 (2)双线图 (3)垂线图 (4)线图的特殊编辑(添加参考线和特别显
示)
3、面积图(Area Chart)
SPSS图形制作(续)
4、饼图(Pie Chart) 5、散点图(Scattre Plot) (1)简单散点图 (2)相关阵图 (3)三维旋转图 (4)散点图的特殊编辑 添加均值参考线、拟合回归线、预测区间设 置等。
二、因子分析
因子分析的基本思想:根据相关性大小
把原始变量分组,使的同组内的变量之间相关 性较高,而不同组变量间的相关性较低。每组 变量代表一个基本结构,并用一个不可观测的 综合变量来表示,这个基本结构称为公共因子 。因子分析的目的是寻求变量的基本结构,简 化观测系统,减少变量维数,用少数的变量解 释所研究的复杂问题。
对象编辑(SPSS Object)窗口简介
窗口进入:右键方式、双击方式; 枢纽表(Pivoting Trays)窗口、图形编辑 (Chart Editor)窗口。 Interactive graph编辑状态。
第二节SPSS数据文件的建 立与操作
一、建立spss数据文件
打开spss,进入数据输入(Data View) 界面; 定义变量与数据编码,其中“name”、 “label”、“ values”三个选择比较重要; 在数据输入模式下,用键盘将数据直接 输入,输入前点击View→Value Labels; 保存数据文件,待分析使用。
三、相对数性分析
1、依次选择【分析(A)】→【描述统计】→【比率(R)】 2、 选入“分子”和“分母”变量; 3、单击【统计量(S)】按钮,选中“均值(M)”、 “AAD(D)”和“均值居中COV”选项。单击【继续】按 钮,返回主对话框。 4、单击【确定】按钮。
ቤተ መጻሕፍቲ ባይዱ
第六节SPSS的抽样与参数 估计功能
第三部分 SPSS与数据处理与分析
第一节SPSS软件概述
关于SPSS
SPSS的英文原名为:Statistical Package for Social Sciences,译为社会科学统计软件包。 2002年将英文全称更改为:Statistical Product and Service Solutions,译为统计产 品与服务解决方案。 2009年,SPSS公司宣布重新包装旗下的 SPSS产品线,定位为预测统计分析软件 (Predictive Analytics Software)PASW
2.绘制数据分布图 (1)茎叶图的绘制 (2)箱线图的绘制
探索分析(续)
茎叶图与箱线图的绘制过程基本相似,只是在图形 选择上有差异。其过程如下: 第一步,选择【分析(A)】→【描述统计】→【探索 (E)】 ; 第二步, 选择“输出”框内的“图”选项。 ; 第三步选择[Plots]子对话框,确定需要输出的图形。
3005 3100 1980 3600 1900
二、数据文件的编辑与管理
插入变量与删除变量; 插入记录与删除记录; 数据的剪贴、复制和粘贴; 撤销操作。 查看文件和变量信息
依次单击【文件(F)】→【显示数据文件 信息(I)】→【工作文件(W)】
数据文件的打开与保存; 数据库文件的转换。 数据的审核与修改
聚类分析(续)
聚类分析的方法:层次聚类法、K-Means聚类、模 糊聚类等 层次聚类法:Q型聚类、R型聚类。 聚类方式有:凝聚方式、分解方式两种。Spss层次 聚类采用的是凝聚方式。 个体与小类、小类与小类间“亲疏程度”的度量 方法: 最近邻居(Nearest Neighbor)距离 最远邻居(Furthest Neighbor)距离 组内平均连锁(Within-groups-linkage)距离 重心(Centroid clustering)距离
计算加权平均数 (1)选择菜单【数据(D)】→【加权个案(W)】; (2)选择“加权个案(W)”选项,并将权重变量选到
“频率变量(F) 。
(D)】 …
(3)依次选择【分析(A)】→【描述统计】→【描述
二、探索性分析
1.“探索(E)”分析的描述性统计分析功能
依次选择【分析(A)】→【描述统计】→ 【探索(E)】 →选择“输出”框内的“统计量” 选项。
单选题整理:依次选择【分析(A)】→【描述统计
(D)】→【频率(F)】,进入“频率(F)”主对话 框。
多项选择题的整理(多重响应分析) 1、将多选题的各选项定义为一个数据集。
依次选择【分析(A)】→【多重响应(U)】→【定义变 量集(D)】 ….
2、重新点击:依次选择【分析(A)】→【多重响应 (U)】→【频率(F)】 ….
变量标签与值标签
变量标签与值标签,用于变量名和变量值的辅 助说明。 Variable Labels(变量标签)在统计分析结果 中,可以在与变量名相对应的位置显示该变量 的标签,或直接以变量标签代替变量名显示, 有助于理解和分析输出结果。 Value Labels(变量值标签),分类变量经常 需要定义值的标签。由于提高数据录入效率非 常有用。
数据输入错误的类型:数值定义范围内的 错误、数值定义范围外的错误、逻辑错误。 第二类错误的检查:数据排序: 第三类错误,逻辑错误的检查与纠正:编制 频数分布表。
数据的审核与修改
数据的合并 (复制、粘贴)
第三节数据预处理的 SPSS应用
一、数据文件的处理
1、数据的合并
选择【数据(D)】→【合并文件(G)】→【 添加变量(V)】
SPSS图形制作(续)
6、帕累托图(Pareto Chart) 7、直方图(Histogram)
第九节SPSS高级统计 分析功能
一、聚类分析
方法依据:“物以类聚,人以群分 ” 方法特征:聚类分析是一种建立分类的多元统计方法,它能够将一 批样本(或变量)根据其诸多数据特征,按照在性质上的亲疏程度 在没有先知知识的情况下进行自动分类,产生多个分类结果。类内 部的个体在特征上具有相似性,不同类间个体特征的差异性较大。 聚类过程中亲疏程度的度量:计算个体间的距离,计算方法因变量 类型不同而不同。 定距型变量个体间距离的计算:有7种方法,其中最常用的是欧氏 距离(Euclidean distance); 计数变量个体间距离的计算:卡方(Chi-Square measure)距离、 Phi方( Phi-Square measure)距离; 二值变量个体间距离的计算:简单匹配系数(Simple Matching)、 雅科比系数(Jaccard)
二、回归分析
1、线性回归分析
依次选择【分析(A)】→【回归(R)】→【线性 (L)】 ….
2、曲线回归分析
依次选择【分析(A)】→【回归(R)】→【曲线估计 (C)】 ….
第八节SPSS图形制作与应用
一、SPSS图形制作
基本图形制作: 1、条形图(Bar Chart) (1)简单条形图 (2)复式条形图 (3)堆积条形图 (4)多变量汇总条形图 (5)个体观察值条形图
聚类分析(续)
聚类分析的SPSS操作步骤:
1、依次选择【分析(A)】→【分类(F)】→【系 统聚类(H)】; 2、单击【统计量(S) 】按钮,选择输出“相似性矩 阵(P)”; 3、单击【绘制(T) 】按钮,选择“树状图(D)”; 4、单击【方法(M) 】按钮,聚类方法; 5、单击【确定】按钮,完成操作。
输入数据
输入数据的方法 直接录入 复制粘贴 直接打开
数据文件建立举例
企业职工情况模拟资料 职工序号 1 性别 男 婚姻状况 1 年龄 30 基本工资 2100
2 3
4 5 6 7 8
女 女
女 男 女 男 女
1 1
1 1 2 1 2
28 35
40 44 21 50 19
2250 2900
数据编辑窗口(Data Editor)用法简介
数据编辑窗口进入:三种方式; 数据编辑窗口的组成:标题栏、工具栏、 编辑栏、编辑区及状态栏等 数据编辑窗口工具栏介绍 冻结数据表中的列
结果观察(SPSS Viewer)窗口简介
窗口进入; 窗口的组成:标题栏、工具栏、导航栏、 分析结果区。 结果观察窗口工具栏介绍