SPSS统计软件的操作与应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
求某班级学生身高的中位数,数据如表1-2所示。
身高(cm) 174 168 164 174 176 150 183 162 171 146 189 167
四分位数:将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等
份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)百度文库Q2(第二 四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差, 记为Q。四分位差越小,说明中间的数据越集中;四分位差越大,则意味着中间部分的 数据越分散。
数据编辑窗口
菜单栏 标题栏 编辑栏 变量名栏
工具栏
内容区
窗口切 换标签
页
状态栏
1、菜单介绍 File:“文件”菜单用于新建SPSS 各种类型文件,打开一个已存在的 文件,从文本文件或其它数据源读入数据。 Edit:“编辑”菜单用于撤消操作、剪切、复制、粘贴、查找、改变 SPSS 默认设置等。 View:运用“视图”菜单显示或隐藏状态行、工具栏、网络线、值标 签和改变字体。 Data:运用“数据”菜单对SPSS 数据文件进行全局变化,例如定义 变量,合并文件,转置变量和记录,或产生分析的观测值子集等。 Transform:“转换”菜单在数据文件中对所选择的变量进行变换, 并在已有变量值的基础上计算新的变量。
Analyze:“分析”菜单在以前版本中为“统计(Statistics)”, 可进行各种统计分析,包括各种统计过程(Procedure),如回归分 析、相关分析、因子分析等等。 Graphs:“图表”菜单产生条形图、饼图、直方图、散点图和其 它全颜色、高分辨率的图形,以及动态的交互式图形。有些统计 过程也产生图形,所有的图形都可以编辑。 Utilities:“工具”菜单可以显示数据文件和变量的信息,定义子 集,运行脚本程序,自定义SPSS 菜单等。 Window:“窗口”菜单用于选择不同窗口和最小化所有窗口。 Help:“帮助”菜单包含SPSS 帮助主题、SPSS 教程、SPSS 公 司主页、统计教练等菜单项。
小结
本节主要介绍平均数、中位数、众数、方差、百分位、频数、峰度、偏度 等统计学相关基本知识,基本统计知识是进行SPSS统计分析的基础和前提。 通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握, 从而有助于选择其他更为深入的统计分析方法。
希望大家课后多查阅相关资料书籍,以更好的运用SPSS社会学统计软件!
SPSS社会统计软件学习
MARKETING INVESTIGATION
李彬彬 王亮
SPSS课程安排
统计学基本知识
SPSS软件简介
数据的输入与整理
常用数据分析方法
统计学基本知识
一 基本概念
统计学定义:它是关于收集﹑分析﹑表述和解释统计数据的方法论科学 统计的功能:主要是信息﹑咨询和监督 现代统计学分科:描述统计学与推断统计学(统计方法构成) 理论统计学与应用统计学(方法研究与应用) 基本概念 统计总体:是指客观存在的,在同一性质基础上结合起来的许多个别单位 的整体,如上海地区的人口总数 样本总体:在统计总体里,按照一定抽样方法抽取的部分个体,这些个体客 观地反映总体的特征,如合理抽样100个学生样本进行相关统计 指 标 :反映现象总体数量特征的概念,如样本平均数 变 量: 统计总体个单位所具有的共同特征。如年龄,性别
该窗口下方有两个标签:“Data View”(数据视图)和“Variable View”(变量视图)。
(1) 一个列对应一个变量,即每一列代表一个变量 (Variable)或一个被观测量的特征。例如问卷上的每一项 就是一个变量。
(2) 行是观测,即每一行代表一个个体、一个观测、一个 样品,在SPSS中称为事件(Case)。例如,问卷上的每一个 人就是一个观测。
离散系数:适用于比较不同现象或不同水平数据的变异程度的情况。
峰度:指分布图形的尖峭程度或峰凸程度。峰度是分布集中趋势高峰的形状。用β 表示 当β =0时,频率分布的峰度为正态分布的峰度 当β >0时,频率分布的峰度比正态分布的峰度要高—尖态峰,表明集中趋势显著, 离中趋势低 当β <0时,频率分布的峰度比正态分布的峰度要低—平坦峰,表明离中趋势显著, 集中趋势低
欢迎你进入SPSS学习
SPSS简介
一SPSS的产生、发展和应用领域
二SPSS13.0的安装、启动和退出
三SPSS的窗口简介 四SPSS13.0的Help系统
一 SPSS的产生、发展和应用领域
社会科学统计软件包(Statistical Package for the Social Science,SPSS)是 世界著名的统计分析软件之一。 1968年,3位美国斯坦福大学的学生开发了最早的SPSS系统,并基于这一系 统于1975年在芝加哥合伙成立了SPSS公司。 SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。 经近40年的发展,在全球已拥有大量的用户, SPSS主要应用于农业、工业、 商业、医学、交通运输、公检法、社会学、市场分析、股市行情、军事地理、 旅游业等多个领域和行业,是世界上应用最广泛的专业统计软件。 SPSS的最新版本为19.0,主要开发为vista使用系统,SPSS13.0的经典版, 稳定性比较高。
总之,可以这么说,有需要数据分析的地方,就可以用到SPSS,同学们要认 真学。
二 SPSS13.0的安装、启动和退出
请见演示
三 SPSS的窗口简介
SPSS主界面主要有两个,一个是SPSS数据编辑窗口,另一个是SPSS输出窗 口。 数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名栏、内容区、窗 口切换标签页和状态栏组成,见下图。
SPSS结果输出窗口
SPSS结果输出窗口名为Viewer,它是显示和管理SPSS统计分析结果、报表 及图形的窗口。
图形编辑窗口
用鼠标双击结果输出窗口中的图形,进入图形编辑窗口,可以对图形进行定义编 辑
四 SPSS13.0的Help系统
在运行SPSS的任何时候,单击“Help”菜单中的“topics”命令,会弹出帮 助主题窗口。在其中选择相关的命令,即可得到所需的各种帮助。
下面让我们进入主题吧!
数据输入和整理
一 定义变量
SPSS对数据的处理是以变量为前提的,因此本节主要介绍定义 变量、输入数据和数据整理。
输入数据前首先要定义变量。定义变量即要定义变量名、变量类 型、变量长度(小数位数)、变量标签(或值标签)和变量的格 式。 单击数据编辑窗口左下方的“Variable View”标签或双击列的题 头(Var),进入如下图所示的变量定义视图窗口,在此窗口中 即可定义变量。
在上图所示的窗口中每一行表示一个变量的定义信息,包括 Name、Type、Width、Decimal、Label、Values、Missing、 Columns、Align、Measure等。
二 统计数据分布特征的描述
1 统计变量集中趋势的测定 2 统计变量离散程度的测定 3 变量分布偏度与峰度的描述
1 统计变量集中趋势的测定
定义:统计数据的集中趋势是指数据向其中心值靠近或集中的趋势 测定集中趋势的作用 1)反映总体各单位变量分布的集中趋势和一般水平 2)比较同类现象在不同单位的发展水平 3)比较同类现象在不同时期的发展变化趋势或规律 4)分析现象之间的依存关系 测量集中趋势的度量:位置平均数和数值平均数
三个常用描述性度量比较
2 统计变量离散程度的测定
集中趋势是统计总体数据特征之一,但由于个体的差异性,总体中的各数据还呈现相分散的离中 趋势,因此对数据的统计分析,除了要反映其分布的集中趋势外,还要反映数据的离散程度,以到达 对数据变动规律的全面描述。
定义:离散程度是度量统计分布离中趋势的指标,同时反映了总体中各个单位标志值的变异
四分位差(quartile deviation): 分位差是极差的一种改进,四分位差是在数列中 剔除最大和最小各四分之一的数据,是第一和第三个分位数之间距离的二分之 一,表明中位数到这两个四分位数的平均距离,是说明中位数代表性高低的测 量值。 平均差(mean absolute deviation): 是分配数列中各单位标志值与其计算平均数 之间离差绝对值的平均数。
中位数(Median):将总体中的数据按顺序排列后,处于数列中点位置上 的那个数据或变量值。它是一种位置代表值,所以不会受到极端数值的 影响,具有较高的稳健性。
N 1 如果N为奇数,那么该数列的中位数就是位置 2 上的数; N N 如果N为偶数,中位数则是该数列中第 与第 2 +1位置上两个数值的 2 平均数
方差(variance):所有变量值与平均数偏差平方的平均值,它是测定离散程
度最常用的指标,离散程度最灵敏的指标。
标准差(standard deviation): 它是方差的平方根。它表示了一组数据关于
平均数的平均离散程度。
方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的
离散趋势越大。
程度和平均数的代表水平。
测定变量离散程度的作用
1)反映现象总体中变量分布的离中趋势
2)衡量均值的代表性 3)测定现象变动的均匀性或稳定性程度 测量离中趋势的度量:极差﹑平均差﹑四分位差﹑方差﹑标准差﹑离散系数等
极差(range):又称全距,离散程度的最简单测度值,是最大和最小变量值
之间的距离在相同样本容量情况下的两组数据,全距大的一组数据要比全距小 的一组数据更为分散。 例子,某地农民人均年收入最高是8000元,最地是2600元一年,则该地区农民 收入的极差是8000-2600等于5400元 。
门课程上的频数分布。
姓 名 hxh yaju yu shizg hah lisa watet jess wish
数 学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 75.00 89.00
语 文 98.00 89.00 80.00 78.00 78.00 89.00 87.00 76.00 56.00
位置平均数
众数(Mode):总体中出现次数最多的那个变量值,众数在描述数据集中趋势方 面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生 产。 求某医院当天出生新生儿的体重的众数,数据如表1-1所示。 体重(斤)
8 7 6 7 5 4 5 6 8
7 5 6 4 7 6 5.5 7 4
Help系统可以为不同级别的用户提供不同阶段的指导,有如入门级用户的 tutorial”命令,实例学习“Case studies”过程,还有手把手的“Statistics Coach”的过程
小结
SPSS是在当前社会经济分析中应用最广泛的软件之一。继SPSS13.0之后, SPSS公司推出了最新的SPSS19.0,这是一个功能强大、设计人性化的统计 学软件。 SPSS的主界面有两个,一个是SPSS数据编辑窗口,一个是SPSS结果输 出窗口,例外还有一个图形编辑窗口。
化 学 100.00 45.00 56.00 67.00 78.00 87.00 89.00 97.00 76.00
iiakii
80.00
76.00
100.00
数值平均数 算术平均数(mean):是表现数据的集中趋势和代表性水品,基本形式为总体 标志总量比上总体单位总数。例如,学生某门学科的平均成绩、公司员工的平 均收入、某班级学生的平均身高等。 加权算术平均数(weighted mean):主要用于数据已经分组,并编制出次数分 布的条件下,这时必须先将各组标志值乘以相应的次数,得到各组的标志总量, 然后再相加得到总体标志总量。
频数(Frequency):一个变量在各个变量值上取值的个案数。如要了解学生某次 考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个 人,这就需要用到频数分析。 变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地 了解变量取值的分布情况。 例子 10个学生在某次数学、语文、化学考试中成绩如表1-3所示,试求学生在3
身高(cm) 174 168 164 174 176 150 183 162 171 146 189 167
四分位数:将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等
份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)百度文库Q2(第二 四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差, 记为Q。四分位差越小,说明中间的数据越集中;四分位差越大,则意味着中间部分的 数据越分散。
数据编辑窗口
菜单栏 标题栏 编辑栏 变量名栏
工具栏
内容区
窗口切 换标签
页
状态栏
1、菜单介绍 File:“文件”菜单用于新建SPSS 各种类型文件,打开一个已存在的 文件,从文本文件或其它数据源读入数据。 Edit:“编辑”菜单用于撤消操作、剪切、复制、粘贴、查找、改变 SPSS 默认设置等。 View:运用“视图”菜单显示或隐藏状态行、工具栏、网络线、值标 签和改变字体。 Data:运用“数据”菜单对SPSS 数据文件进行全局变化,例如定义 变量,合并文件,转置变量和记录,或产生分析的观测值子集等。 Transform:“转换”菜单在数据文件中对所选择的变量进行变换, 并在已有变量值的基础上计算新的变量。
Analyze:“分析”菜单在以前版本中为“统计(Statistics)”, 可进行各种统计分析,包括各种统计过程(Procedure),如回归分 析、相关分析、因子分析等等。 Graphs:“图表”菜单产生条形图、饼图、直方图、散点图和其 它全颜色、高分辨率的图形,以及动态的交互式图形。有些统计 过程也产生图形,所有的图形都可以编辑。 Utilities:“工具”菜单可以显示数据文件和变量的信息,定义子 集,运行脚本程序,自定义SPSS 菜单等。 Window:“窗口”菜单用于选择不同窗口和最小化所有窗口。 Help:“帮助”菜单包含SPSS 帮助主题、SPSS 教程、SPSS 公 司主页、统计教练等菜单项。
小结
本节主要介绍平均数、中位数、众数、方差、百分位、频数、峰度、偏度 等统计学相关基本知识,基本统计知识是进行SPSS统计分析的基础和前提。 通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握, 从而有助于选择其他更为深入的统计分析方法。
希望大家课后多查阅相关资料书籍,以更好的运用SPSS社会学统计软件!
SPSS社会统计软件学习
MARKETING INVESTIGATION
李彬彬 王亮
SPSS课程安排
统计学基本知识
SPSS软件简介
数据的输入与整理
常用数据分析方法
统计学基本知识
一 基本概念
统计学定义:它是关于收集﹑分析﹑表述和解释统计数据的方法论科学 统计的功能:主要是信息﹑咨询和监督 现代统计学分科:描述统计学与推断统计学(统计方法构成) 理论统计学与应用统计学(方法研究与应用) 基本概念 统计总体:是指客观存在的,在同一性质基础上结合起来的许多个别单位 的整体,如上海地区的人口总数 样本总体:在统计总体里,按照一定抽样方法抽取的部分个体,这些个体客 观地反映总体的特征,如合理抽样100个学生样本进行相关统计 指 标 :反映现象总体数量特征的概念,如样本平均数 变 量: 统计总体个单位所具有的共同特征。如年龄,性别
该窗口下方有两个标签:“Data View”(数据视图)和“Variable View”(变量视图)。
(1) 一个列对应一个变量,即每一列代表一个变量 (Variable)或一个被观测量的特征。例如问卷上的每一项 就是一个变量。
(2) 行是观测,即每一行代表一个个体、一个观测、一个 样品,在SPSS中称为事件(Case)。例如,问卷上的每一个 人就是一个观测。
离散系数:适用于比较不同现象或不同水平数据的变异程度的情况。
峰度:指分布图形的尖峭程度或峰凸程度。峰度是分布集中趋势高峰的形状。用β 表示 当β =0时,频率分布的峰度为正态分布的峰度 当β >0时,频率分布的峰度比正态分布的峰度要高—尖态峰,表明集中趋势显著, 离中趋势低 当β <0时,频率分布的峰度比正态分布的峰度要低—平坦峰,表明离中趋势显著, 集中趋势低
欢迎你进入SPSS学习
SPSS简介
一SPSS的产生、发展和应用领域
二SPSS13.0的安装、启动和退出
三SPSS的窗口简介 四SPSS13.0的Help系统
一 SPSS的产生、发展和应用领域
社会科学统计软件包(Statistical Package for the Social Science,SPSS)是 世界著名的统计分析软件之一。 1968年,3位美国斯坦福大学的学生开发了最早的SPSS系统,并基于这一系 统于1975年在芝加哥合伙成立了SPSS公司。 SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等。 经近40年的发展,在全球已拥有大量的用户, SPSS主要应用于农业、工业、 商业、医学、交通运输、公检法、社会学、市场分析、股市行情、军事地理、 旅游业等多个领域和行业,是世界上应用最广泛的专业统计软件。 SPSS的最新版本为19.0,主要开发为vista使用系统,SPSS13.0的经典版, 稳定性比较高。
总之,可以这么说,有需要数据分析的地方,就可以用到SPSS,同学们要认 真学。
二 SPSS13.0的安装、启动和退出
请见演示
三 SPSS的窗口简介
SPSS主界面主要有两个,一个是SPSS数据编辑窗口,另一个是SPSS输出窗 口。 数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名栏、内容区、窗 口切换标签页和状态栏组成,见下图。
SPSS结果输出窗口
SPSS结果输出窗口名为Viewer,它是显示和管理SPSS统计分析结果、报表 及图形的窗口。
图形编辑窗口
用鼠标双击结果输出窗口中的图形,进入图形编辑窗口,可以对图形进行定义编 辑
四 SPSS13.0的Help系统
在运行SPSS的任何时候,单击“Help”菜单中的“topics”命令,会弹出帮 助主题窗口。在其中选择相关的命令,即可得到所需的各种帮助。
下面让我们进入主题吧!
数据输入和整理
一 定义变量
SPSS对数据的处理是以变量为前提的,因此本节主要介绍定义 变量、输入数据和数据整理。
输入数据前首先要定义变量。定义变量即要定义变量名、变量类 型、变量长度(小数位数)、变量标签(或值标签)和变量的格 式。 单击数据编辑窗口左下方的“Variable View”标签或双击列的题 头(Var),进入如下图所示的变量定义视图窗口,在此窗口中 即可定义变量。
在上图所示的窗口中每一行表示一个变量的定义信息,包括 Name、Type、Width、Decimal、Label、Values、Missing、 Columns、Align、Measure等。
二 统计数据分布特征的描述
1 统计变量集中趋势的测定 2 统计变量离散程度的测定 3 变量分布偏度与峰度的描述
1 统计变量集中趋势的测定
定义:统计数据的集中趋势是指数据向其中心值靠近或集中的趋势 测定集中趋势的作用 1)反映总体各单位变量分布的集中趋势和一般水平 2)比较同类现象在不同单位的发展水平 3)比较同类现象在不同时期的发展变化趋势或规律 4)分析现象之间的依存关系 测量集中趋势的度量:位置平均数和数值平均数
三个常用描述性度量比较
2 统计变量离散程度的测定
集中趋势是统计总体数据特征之一,但由于个体的差异性,总体中的各数据还呈现相分散的离中 趋势,因此对数据的统计分析,除了要反映其分布的集中趋势外,还要反映数据的离散程度,以到达 对数据变动规律的全面描述。
定义:离散程度是度量统计分布离中趋势的指标,同时反映了总体中各个单位标志值的变异
四分位差(quartile deviation): 分位差是极差的一种改进,四分位差是在数列中 剔除最大和最小各四分之一的数据,是第一和第三个分位数之间距离的二分之 一,表明中位数到这两个四分位数的平均距离,是说明中位数代表性高低的测 量值。 平均差(mean absolute deviation): 是分配数列中各单位标志值与其计算平均数 之间离差绝对值的平均数。
中位数(Median):将总体中的数据按顺序排列后,处于数列中点位置上 的那个数据或变量值。它是一种位置代表值,所以不会受到极端数值的 影响,具有较高的稳健性。
N 1 如果N为奇数,那么该数列的中位数就是位置 2 上的数; N N 如果N为偶数,中位数则是该数列中第 与第 2 +1位置上两个数值的 2 平均数
方差(variance):所有变量值与平均数偏差平方的平均值,它是测定离散程
度最常用的指标,离散程度最灵敏的指标。
标准差(standard deviation): 它是方差的平方根。它表示了一组数据关于
平均数的平均离散程度。
方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的
离散趋势越大。
程度和平均数的代表水平。
测定变量离散程度的作用
1)反映现象总体中变量分布的离中趋势
2)衡量均值的代表性 3)测定现象变动的均匀性或稳定性程度 测量离中趋势的度量:极差﹑平均差﹑四分位差﹑方差﹑标准差﹑离散系数等
极差(range):又称全距,离散程度的最简单测度值,是最大和最小变量值
之间的距离在相同样本容量情况下的两组数据,全距大的一组数据要比全距小 的一组数据更为分散。 例子,某地农民人均年收入最高是8000元,最地是2600元一年,则该地区农民 收入的极差是8000-2600等于5400元 。
门课程上的频数分布。
姓 名 hxh yaju yu shizg hah lisa watet jess wish
数 学 99.00 88.00 99.00 89.00 94.00 90.00 79.00 75.00 89.00
语 文 98.00 89.00 80.00 78.00 78.00 89.00 87.00 76.00 56.00
位置平均数
众数(Mode):总体中出现次数最多的那个变量值,众数在描述数据集中趋势方 面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生 产。 求某医院当天出生新生儿的体重的众数,数据如表1-1所示。 体重(斤)
8 7 6 7 5 4 5 6 8
7 5 6 4 7 6 5.5 7 4
Help系统可以为不同级别的用户提供不同阶段的指导,有如入门级用户的 tutorial”命令,实例学习“Case studies”过程,还有手把手的“Statistics Coach”的过程
小结
SPSS是在当前社会经济分析中应用最广泛的软件之一。继SPSS13.0之后, SPSS公司推出了最新的SPSS19.0,这是一个功能强大、设计人性化的统计 学软件。 SPSS的主界面有两个,一个是SPSS数据编辑窗口,一个是SPSS结果输 出窗口,例外还有一个图形编辑窗口。
化 学 100.00 45.00 56.00 67.00 78.00 87.00 89.00 97.00 76.00
iiakii
80.00
76.00
100.00
数值平均数 算术平均数(mean):是表现数据的集中趋势和代表性水品,基本形式为总体 标志总量比上总体单位总数。例如,学生某门学科的平均成绩、公司员工的平 均收入、某班级学生的平均身高等。 加权算术平均数(weighted mean):主要用于数据已经分组,并编制出次数分 布的条件下,这时必须先将各组标志值乘以相应的次数,得到各组的标志总量, 然后再相加得到总体标志总量。
频数(Frequency):一个变量在各个变量值上取值的个案数。如要了解学生某次 考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个 人,这就需要用到频数分析。 变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地 了解变量取值的分布情况。 例子 10个学生在某次数学、语文、化学考试中成绩如表1-3所示,试求学生在3