2.spss软件使用方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、SPSS概述
1、SPSS简介 2、SPSS窗口
1 SPSS简介
SAS和SPSS SAS:为专业统计分析人员设计,功能强大,灵活多样。 SPSS:非专业人士,操作简便,好学易懂,简单实用。
“易学易用易普及”
大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。 无需掌握统计分析的各种复杂的数学运算过程,只需掌握各种方法的应用,分析结果 的解释。
(2)绘制统计图
1.1 频数分析
频数分析的基本操作
(1)分析—描述统计—频率 (2)将频数分析变量选择到变量框中 (3)单击表格按钮选择绘制统计图形 ,选择饼图
1.1频数分析
1.1频数分析
输出结果
1.2 描述分析
描述分析目的:获取数据的均值、标准差、峰度等数据,进一步把 握数据的集中趋势、离散程度和分布形状。 基本描述统计量 刻画集中趋势的统计量 刻画离散程度的统计量 刻画分布形态的统计量
SSA:组间差异(组间离差平方和),主要是由控制变量的不同水平造 成的差异; SSE:组内差异(组内离差平方和),主要是由随机变量引起的差异。 SSA+SSE=SST SST:总差异(总离差平方和)
方差分析任务:判定SSA相对于SST(或SSE)的大小。SSA相对较大,则表明 控制变量起到了显著影响,若相对较小,则表明控制变量没有显著影响。
在制定广告宣传策略时,不同方案所获得的广告效果可能是不一样 的。广告效果可能会受到广告形式、地区规模、播放时间段、播放 频率等因素的影响。需要研究在影响广告效果的众多因素中,哪些 因素是主要的,哪些是次要的,哪些因素水平是最合理的。
对这种类似问题的研究可以通过方差分析来实现。
2.1 方差分析概述
2.1.2 方差分析相关概念
常用统计量:全距、方差、标准差
全距:也称极差,是数据的最大值与最小值之间的绝对离差。
1.2 描述分析
刻画分布形态的描述统计量
数据分布形态主要指数据分布是否对称,偏斜程度如何,分布陡峭程度等。
常用统计量:偏度、峰度
偏度:描述变量取值分布形态对称性的统计量。
当分布为对称分布时,正负总偏差相等,偏度值等于0;当分布为不对称分布时,正 负总偏差不相等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,称为正偏或 右偏;偏度值小于0表示负偏差值大,称为负偏或左偏。偏度绝对值越大,表示数据 分布形态的偏斜程度越大。
空缺数据,首先填一个特定标记数据 (如99999,区别于该变量其他非缺失数据)
2、统计分析时对缺失数据进行一定处理
选择缺失数据处理方法
2.SPSS数据创建
直接录入
1、定义数据属性;2、输入数据
打开现有数据(sav、excel、SAS、txt)
2.SPSS数据创建
直接录入
1、定义数据属性;2、输入数据
2.1 方差分析概述
2.1.3 单因素方差分析统计学原理
假设控制变量会对观测值不会产生显著影响,将总离差(SST)分解为组间离差平方和( SSA)和组内离差平方和(SSE)。 比较SSA与SST的相对大小。 SSA与SST的相对大小要受到样本规模、控制变量水平数的影响,为消除这些因素的影响 对SSA、SST要进行一定的处理(分别除以自由度),用统计量F来表示SSA的相对大小
打开现有数据(sav、excel、SAS、txt)
2.SPSS数据创建
3.案例:SPSS数据创建
1、定义变量属性 2、读取excel数据文件
三、SPSS统计分析
SPSS基本统计分析
方差分析
相关分析 线性回归分析 聚类分析
1、基本统计分析
基本统计分析,描述性统计分析是统计分析的第一步,做好这第一步是下面 进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但 专门为该目的而设计的几个模块则集中在描述菜单中,包括:
1.2 描述分析
2、方差分析
方差分析概述
背景案例
统计学原理 相关统计量
SPSS操作 SPSS结果解读 方差分析案例
2.1方差分析概述
2.1.1背景案例 影响农作物产量的因素可能有多个,如品种、施肥量、地域特征等 。在众多的因素中,有些因素会对产量有明显的影响,有些因素的 影响不大。因此,找到中影响因素中起重要的和关键作用的因素是 非常重要的。进一步,在掌握了关键因素后,如品种、施肥量等, 还需要对不同品种、不同施肥量的产量进行比较,研究究竟哪个品 种的产量高,施肥量究竟多少最为合适。
2.1方差分析概述
2.1.4 单因素方差分析基本假设:
对总体分布的假设:
总体服从正态分布 各处理组总体方差相等(方差齐性或方差同质性)
正态分布检验:根据大数定律和中心极限定理原理 ,假设满足。 方差齐性检验:
对控制变量不同水平下观测变量总体的方差是否相等进行假设检验,在 SPSS中可以通过方差同质性检验进行。
功能强大
完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函 数。提供从简单的统计描述到复杂的多因素统计分析方法。
能非常方便地与其他软件的数据进行转换 图表功能强大,输出结果美观漂亮
2 SPSS窗口
标题栏
工具栏 菜单栏
编辑栏
变量名栏 观 测 序 号
窗 口 切 换 标 签
2 SPSS窗口
3、相关分析可以比较两个变量的变化趋势的异同,方差分析不能。 4、相关分析的两个变量一般都有众多的不同取值,回归分析的控制 变量只有几种可能的取值,可以根据控制变量的不同水平将观测对 象进行分组。
1.2 描述分析
刻画集中趋势的统计量
集中趋势指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的统计量 正是要寻找能够反应数据一般水平的“代表值”或“中心值”。
常用统计量:均值、中位数、众数
均值:即算术平均数,是反映某变量所有取值的集中趋势或平均水 平的指标。如某企业职工的平均月收入。 中位数:即一组数据按升序排序后,处于中间位置上的数据值。 众数:即一组数据中出现次数最多的数据值。
峰度:描述变量取值分布形态陡峭程度的统计量。
当数据分布与标准正态分布的陡峭程度相同时,峰度值等于0;峰度大于0表示数据的 分布比标准正态分布更陡峭,为尖峰分布;峰度小于0表示数据的分布比标准正态分 布平缓,为平峰分布。
1.2 描述分析
计算基本描述统计量的操作
(1)分析—描述统计—描述 (2)将分析变量选择到变量框中 (3)单击选项按钮指定基本统计量
1.1变量名(名称)
数 据 视 图
不超过8个字符、4个汉字 变量名必须唯一,并且不区 分大小写 如不指定变量名,则系统默 认变量名以VAR开头后面跟 5个数字。如VAR00001、
VAR0002等
变 量 视 图
1.2变量类型
变量取值的类型 数值型、字符型(不能进行算术运算)、日期型
1.3标签
标签是对变量名的进一步解释
函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应 统计关系:非一一对应,当一个变量x取一定值时,另一变量y无法依确定的函 数取唯一确定的值。 相关分析:研究两个变量相互关系的密切程度和变化趋势,并用适当的统计指 标描述。
3.1 相关分析概述
相关分析与方差分析的比较
相同点:分析两个变量之间是否有关系 不同点: 1、相关分析的两个变量都是随机变量(不能人为精确控制取值大小 ); 回归分析的控制变量是非随机变量(其取值可以固定),观测 变量是随机变量。 2、相关分析的两个变量都可以量化,可以用数值比较同一变量的不 同取值的大小;回归分析的观测变量可以比较观测值的大小,但是 某些控制变量不能比较数值大小,如农作物品种。
缺Байду номын сангаас值处理
2.3 SPSS方差分析结果解读
P值(显著性)=0.515,远大 于基准值0.05,说明假设“方 差齐性”正确,即控制变量不 同水平下各组的方差相同。 满足方差分析的前提。
P值(显著性)=0. 000,远小于基 准值0.05,说明假设“控制变量对 观
结论:广告形式对销售额有显著影响。
控
测变量没有显著影响,即广告形式 制变量不同水平下各组的方差相 对销售额没有显著影响”正确,即 同。
2.2 SPSS方差分析操作
2.2.1 方差分析数据形式 离差分解时仅仅是对观测水平这一列的数值进行分析,但是也要有 存放控制变量的列。正确的数据格式是统计分析的前提。
观测变量
控制变量
2.2 SPSS方差分析操作
2.2.2 SPSS操作步骤
打开的数据格式 分析——比较均值——单因素方差分析 选择观测变量(因子)、控制变量(因变量)(只能选择一个因子) 选项,选择“方差同质性检验”
统计分析软件SPSS应用方法
SPSS
一、SPSS概述 二、SPSS数据创建 三、SPSS统计分析
1、基本统计分析
2、方差分析 3、相关分析
4、聚类分析
1 SPSS简介
SPSS
Statistical Package for the Social Sciences 社会科学统计软件包 Statistical Product and Service Solutions 统计产品与服务解决方案 68年开发,75年成立SPSS公司,2009年IBM收购,目前到IBM SPSS20.0版 本次讲解应用IBM SPSS for Windows 19.0
名称限制字符不超过8个,标签可达120个字符
1.4值
值是对变量取值含义的进一步解释
1.5缺失值
缺失值两种情况:
数据中存在漏填数据 数据中存在明显错误或明显不合理的数据(如年龄130) 如果直接进行数据分析,SPSS将把缺失数据作为正常数据,造成非常大的误差
缺失数据处理步骤: 1、指定缺失数据,指明哪些数据属于缺失数据
2.3 SPSS方差分析结果解读
结论:广告形式用报纸获得的销售额最高,宣传品的效果最不好
3 相关分析
相关分析概述 SPSS相关分析操作
SPSS相关分析结果解读
SPSS相关分析案例
3.1 相关分析概述
家庭收入和支出、子女身高和父母身高的关系、一个人的身高和体重的关系?
客观事物之间关系:函数关系、统计关系
SSA /自由度 组件均方差 F= = SSE /自由度 总均方差
方差分析-从观测变量的部分取值推测观测变量总体取值与随机变量的关系。 部分是否能够代表总体情况? 由于存在随机抽样和样本数量较少等原因,通过分析样本的出的结论不能直接用于总体 。要进行假设检验。 F是随机变量,服从一定的分布,其取值会因为具体的样本的不同而不同。计算研究样 本的F值,即F的观测值,并计算该F观测值对应概率p值,如果p值很小(一般是小于 0.05),说明F取到该观测值的概率很小,是不可能发生的。则认为假设“控制变量对观 测值没有显著影响”是不对的,也就是,控制变量会对观测变量产生显著影响。
观测变量:农作物产量、广告效果 因素(控制变量):品种、施肥量、播放时间段等
因素水平:因素的不同类别,如甲品种、乙品种就是品种这一变量 的两个水平。
单因素方差分析、多因素方差分析
2.1 方差分析概述
2.1.3 方差分析统计学原理 观测变量取值变化原因:1、控制变量; 2、随机变量
如果相对于随机变量引起的观测值差异,控制变量引起的观测值差异较大,则说明控制变 量对观测变量有显著影响。在统计学中,控制变量和随机变量引起的差异可以分别用一个 统计量来表示。单因素方差分析中,分别用SSA、SSE来表示。
1.2 描述分析
刻画离散程度的统计量
离散程度是指一组数据远离其“中心值”的程度。
如果数据都紧密地集中在“中心值”的周围,数据的离散程度较小,说明这 个“中心值”对数据的代表性好;相反,如果数据仅是比较松散地分布在“中 心值”的周围,数据的离散程度较大,则此“中心值”说明数据特征是不具有 代表性的。
1.1频数分析
频数分析目的:基本统计分析往往从频数分析开始。通过频数分析 能够了解变量取值的状况,对把握数据的分布特征是非常有用的。
基本任务 (1)编制频数分布表
频数:即变量值落在某个区间(或某个类别)中的次数 百分比:即各频数占总样本数的百分比 有效百分比:即各频数占有效样本数的百分比,有效样本数=总样本-缺失样本数 累计百分比:即各百分比逐级累加起来的结果。最终取值为100。
变量序号 名称可变
变量属性名称 变量序号
观测序号
2 SPSS窗口
导 航 窗 口
结果输出窗口
二、统计数据创建
数据属性及定义、编辑 SPSS数据创建 案例:SPSS数据创建
1数据属性及定义编辑
SPSS数据特点:结构化(数据内容、数据结构)
变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据 的显示属性(显示宽度、列宽度、对齐方式)