SPSS学习资料
第一章 spss基础知识
目录一、spss软件基础 (2)1.spss的发展和特点 (2)2.spsss安装、启动与退出 (2)2.1安装: (2)2.2启动 (2)2.3退出 (3)3.spss基本操作环境 (3)3.1 spss数据编辑窗口 (3)3.2 spss数据输出窗口 (4)4.spss的三种基本使用方式 (5)4.1 完全窗口菜单方式 (5)4.2程序运行方式 (5)4.3混合运行方式 (5)二、spss数据分析的基本步骤 (5)1.数据分析的一般步骤 (5)2.spss数据分析的一般步骤 (6)三、spss数据文件的建立和管理 (6)1.spss数据文件及其特点 (6)2.spss数据的结构和定义方法 (7)2.1 变量名 (7)2.2 数据类型、宽度、列宽度 (7)2.3 变量名标签 (8)2.4 变量值标签 (9)2.5 缺失数据 (9)2.6 变量对齐格式(Align) (11)2.7 度量尺度 (11)3.spss的录入、编辑与保存 (12)3.1 spss的录入 (12)3.2 spss的编辑 (12)4.spss数据文件的合并 (15)4.1纵向合并数据 (15)4.2 横向合并数据 (21)5.读取其他格式的文件 (23)一、spss软件基础1.spss的发展和特点Spss全称Statistical Package for Social Science——社会科学统计软件,斯坦福大学三名研究生制作。
与常用的stata,SAS等统计软件相比,具有“易学易用易普及”的竞争优势。
大量成熟的统计方法,完善的数据定义操作管理,开放的数据接口以及灵活的统计表格和统计图形是spss盛久不衰的法宝。
2.spsss安装、启动与退出2.1安装:请在网盘中下载spss19.0软件,双击SPSS19crack20100825.exe就可以安装了。
(如果有异常,把两个安装包都安装上)2.2启动安装完成后,可能桌面没有快捷方式,点击,点按键盘“win”键——所有程序,找到spss程序,把快捷方式发送到桌面上。
spss培训资料
通常我们会遇到,数据文件格式是Excel工作表或TXT文 件。SPSS提供了读取其他文件格式的功能。
1. 导入Excel的基本操作步骤
① 选择菜单File→Open →Data ② 选择数据文件的类型,并输入文件名。
2. 导入Txt的基本步骤
① 选择菜单File→Read Text Data
① 然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。
例如增加subtotal或 者新变量
点击Apply,添加成功
选择菜单Analyze →Multiple Response→Define variable sets
选择菜单Analyze →Multiple Response→Crosstab
1. 选择菜单Data→Select case
SPSS数据文件的建立与管理
1. SPSS数据的结构与定义方法 2. SPSS数据的录入与编辑 3. 读取其他格式的数据文件
SPSS数据的预处理
1. 变量的计算 2. 数据的选择
SPSS基本统计分析
基本操作步骤 1. 选择菜单Analyze →Descriptive Statistics →Frequencies
更改变量名
SPSS数据文件的建立与管理
1. SPSS数据的结构与定义方法 2. SPSS数据的录入与编辑 3. 读取其他格式的数据文件
SPSS数据的预处理
1. 变量的计算 2. 数据的选择
SPSS基本统计分析
基本操作步骤
1. 选择菜单Transform→Compute
基本操作步骤
变量名
变量名 变量类型
SPSS学习系列07. 计算与计数
07. 计算与计数(一)计算对数据变量做四则运算,并将计算结果存为新变量。
有数据文件:用【计算】功能,求“数学”、“英文”两科的平均成绩。
1. 【转换】——【计算变量】,打开“计算变量”窗口;2. 【目标变量】框输入“平均成绩”作为存放计算结果的新变量,【类型和标签】可选填,3.【数字表达式】框,输入计算表达式:“(数学+英文) / 2”,也可以选用【函数组】中的函数——统计量:“MEAN(数学,英文)”注:使用“自定义表达式”和“函数”的计算结果可能不同,因为二者处理缺失值的方式不同。
例如,自定义加和时,有一个缺失值则和为缺失值;而SUM函数只有全是缺失值时和才为缺失值。
另外,变量可从左侧框中选入。
注:“**”表示次幂;若需要只选择满足某条件的个案进行计算,可以点【如果】,打开“计算变量:If个案”子窗口,设置筛选条件,例如只计算1班学生的平均成绩:4.点【确定】,得到(二)计数统计指定变量“取某个值”或“落入某区间”的出现次数。
例如,统计不及格的学生人数。
有数据文件:一、标记“语文”不及格的学生1.【转换】——【对个案内的值计数】,打开“计算个案内值的出现次数窗口;2.【目标变量】框输入新变量名“语文不及格”,【目标标签】可选填,将左侧变量“语文”选入右侧变量框,3.点【定义值】,打开“要统计的值”子窗口,勾选【范围,从最低到值】,填入59,点【添加】右侧窗口出现“Lowest thru 59”,表示语文成绩最低分到59分的观察值,新变量计数为1,否则计数为0;注:【如果】可选择只满足某条件的个案进行上述计数操作。
4. 点【继续】回到原窗口,点【确定】,得到二、统计每个学生五科中有几科不及格还是数据文件:1.【转换】——【对个案内的值计数】,打开“计算个案内值的出现次数窗口;2.【目标变量】框输入新变量名“不及格科目数”,【目标标签】可选填,把左侧变量“语文”“英语”“数学”“物理”“化学”都选入右侧变量框3.点【定义值】,打开“要统计的值”子窗口,勾选【范围,从最低到值】,填入59,点【添加】右侧窗口出现“Lowest thru 59”,表示五个科目成绩有多少是“最低分到59分”,新变量计数为该值;4. 点【继续】回到原窗口,点【确定】,得到注:若要统计“变量=某值”的个数,第3步“要统计的值”窗口勾选【值】,输入“某值”,点【添加】即可。
SPSS复习资料
第一章SPSS统计分析系统软件简介1)SPSS的几种基本运行方式:①菜单操作方式:这种方法图形用户界面友好、操作简单、形象直观,能够一步步引导用户完成对数据的描述和模型的建立。
②程序运用方式:是在Syntax编辑窗口输入程序。
也可以用任何文本编辑器中输入,也可以在相应菜单操作的对话框中,用“Paste”按钮可以把相应的操作转化为Syntax语言。
选择所有的语法命令行,单击“Run”运行程序。
或者在SPSS的语法编辑器窗口输入语法。
③ Include运行方式:在编写Syntax命令中,如果要调用其他语法文件时,除了复制粘贴现有的资源外,还可以用Include的命令。
④ Production Facility方式:Production Facility生产作业方式提供了以自动化方式运行SPSS Statistics 的功能。
2)SPSS界面提供的五个窗口:①数据编辑窗口:这个窗口主要用来处理数据和定义数据字典,它分为两个视图。
一个是用来显示数据的数据视图(数据视图用来显示数据集中的记录或个案),另外一个是变量视图(变量视图的功能是定义数据集的数据字典)。
②结果管理窗口:也称为结果视图或者结果浏览器,该窗口用于存放SPSS软件的分析结果。
分为左边目录区,是SPSS分析结果的目录;右边是内容区,显示与目录相应的内容。
③结果编辑窗口:是编辑分析结果的窗口。
选中要编辑的内容,双击或者点击右键选择“编辑内容”,选中的图形就会出现在“图表编辑器”中,可以开始编辑。
④语法编辑窗口:语法编程方式,能够完成窗口操作所能完成的所有任务,还可以完成许多窗口操作所不能完成的其他工作。
在这个窗口中,还可以调用开源软件R中的任何程序。
⑤脚本窗口:是用Sax Basic 语言编写的程序。
脚本可以使SPSS内部操作自动化,可以自定义结果格式,可以连接VB和VBA应用程序。
第二章数据文件的建立和管理1)数据管理的特点:数据编辑器的每一行数据称为一个个案,每一列数据代表个体属性,即变量。
《SPSS培训教程》课件
01
02
03
宏观经济分析
对国民生产总值、财政收 支、货币供应量等宏观经 济指标进行分析,了解经 济运行的基本情况。
产业经济分析
对各产业的发展状况、产 业结构、产业政策等进行 分析,评估产业发展的趋 势和存在的问题。
微观经济分析
对企业经营状况、市场供 需、消费者行为等进行分 析,了解微观经济的运行 情况。
可视化与交互性
增强数据可视化的效果和交互性,提供更加直观 和易用的界面设计,提升用户体验。
THANKS
感谢观看
总结词
通过SPSS分析品牌形象数据,评估品牌形象对消费者选择的影响。
详细描述
本案例将介绍如何使用SPSS软件对品牌形象调查数据进行统计分析,包括描述性 统计、因子分析和回归分析等,以评估品牌形象对消费者选择的影响,为品牌管 理和营销策略提供指导。
案例三:市场细分研究
总结词
通过SPSS分析市场细分数据,识别不同消费群体的特征和需求。
支持多种数据格式导入,如Excel 、CSV、数据库等。
数据整理
对数据进行清洗、筛选、排序等 操作,确保数据质量。
变量处理与数据转换
变量转换
支持变量类型转换、变量计算、变量 重新编码等功能。
数据转换
对数据进行拆分、合并、重塑等操作 ,满足数据分析需求。
描述性统计分析
频数统计
统计各变量的频数、频率、百分比等。
04
SPSS在社会科学研究中的应用
问卷调查数据分析
描述性统计分析
因子分析
对问卷调查数据进行描述性统计分析 ,如求平均值、标准差、频数等,以 了解数据的基本特征和分布情况。
通过因子分析找出问卷中潜在的结构 ,简化数据,便于后续的深入分析。
spss复习资料
SPSS复习资料一.名词解释(1)有效百分比:总数是剔除可缺失值等过滤因素的百分比.无效假设:是指没有处理效应的假设。
统计量:从样本中计算所得的数值称为统计量。
准确性:指在调查或试验中某一实验指标或性状的重复观测值与真值的接近程度。
方差:各个数据分别与其平均数之差的平方的和的平均数。
相关系数:用以反映变量之间相关关系密切程度的统计指标自由度:自由度指的是计算某一统计量时,取值不受限制的变量个数。
标准差:是方差的算术平方根,反应一个数据集的离散程度。
似然比:反映真实性的一种指标,属于同时反映灵敏度和特异度的复合指标。
卡平方定义:相互独立的多个正态离差平方值的总和。
无效假设:是指没有处理效应的假设。
个案加权:是指对变量,特别是频数变量赋以权重,常用于计数频数表资料,加权后的变量被说明为频数卡方统计量:是指数据的分布与所选择的预期或假设分布之间的差异的度量。
相关分析:相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法非参数分析:非参数检验是在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法回归分析:指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
卡方检验:非参数检验检验的一种方法,来检验变量的几个取值所占百分比是否和期望的比例有统计学差异。
统计描述:对统计数据集的结构和总体情况进行描述,并不能深入了解统计数据的内部规律。
卡方测验的基本步骤:1.提出假设2.计算卡平方值3.确定显著水平4.确定最后结果单因素方差分析:单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显着差异和变动聚类分析:根据事物本身的特征研究个体分类的方法,聚类分析的原则是同一类中的个体有较大的相似性,不同类中的个体差异很大两个相关样本检验:同一个被测对象上测试两个或多个观测值的情况,这样的数据间就不再是相对独立的了,而是彼此相关,这种情况采用两个相关样本检验Ks,检验:检验样本来自正态分布均匀分布或泊松分布,总体的假设游程检验:根据由陈述所做的两分变量的随机性检验简答题1在SPPS中可以使用哪些方法输入数据?(1)通过手工录入数据;(2)可以将其他电子表格软件中的数据整列(行)的复制,然后粘贴到SPSS中;(3)通过读入其他格式文件数据的方式输入数据。
spss实操知识点总结
spss实操知识点总结●2.数据管理●数据——转置——变量(列),名称(行)●变量类型:●连续:年龄(17.3)(其取值范围在理论上是连续不断的)●离散变量:人口(3)●等级:满意程度●分类:学历,性别,血型●3.描述性统计分析●判断数据●定量资料:连续型,离散型●统计图或统计表●定性资料:二分类,多分类●频率分布图和统计图●分析——描述统计——●频率(F):有四分位数等●描述(D):有标准差等●交叉表(C):●4.绘制图表●5.正态/方差齐检验●正态检验●直方图●分析——描述统计——探索——图——正态检验(N>50看右边,<50看左边)(p>0.1符合正态)●方差齐性检验●分析——描述统计——探索——图——含来文检验——未转换(p>0.1满足方差齐性)●看第一行●6.t检验●●单样本t检验●病人和正常人有无差别●H。
:μ=μ。
●分析——比较平均值——单样本t●(sig<0.001,拒绝H0:μ=u。
,病人跟正常人不相符)●配对t检验●H。
:μd=o●(两种药物对小鼠的影响)●1.分析——比较均值——成对样本t●(sig<0.05,拒绝H0,两组差异有统计学意义)●2.差值法:转换——计算变量——新增变量d(两者差值)——使用单样本法●两独立样本t检验●Ho:μ1=μ2●分析——比较均值——独立样本t——分组变量——自定义组——指定值●结果分析●(sig<0.05,差异有统计学意义)●第一行,t检验/第二行,t'检验●方差齐性检验F值,sig>0.1方差齐,使用t检验;否则,使用t'检验●7.秩和检验●●对变量进行正态检验,若不符合正态,则使用秩和检验●配对符号秩和检验●H。
:差值的总体中位数Md=o●(判断两种方法有无差别)●转换——计算变量——新增差值变量d(对d正态检验)(非正态——秩和检验)——分析——非参数——2个相关样本(p<0.05,有显著差异)●两独立样本●H。
:A与B……总体分布位置相同●分析——非参数检验——2独立样本——自定义组(1.2)(p<0.05,两组有差异)●多独立样本●H。
spss期末复习资料
spss期末复习资料SPSS期末复习资料SPSS(Statistical Package for the Social Sciences)是一款广泛应用于社会科学领域的统计分析软件,其强大的功能和易于使用的界面使其成为许多研究人员和学生的首选工具。
在期末考试前夕,为了帮助大家更好地复习SPSS相关知识,本文将提供一些有关SPSS的复习资料和技巧。
1. SPSS的基本操作在使用SPSS进行数据分析之前,我们首先需要了解SPSS的基本操作。
首先,我们需要学会如何导入数据,可以通过直接输入数据或者导入外部文件的方式。
其次,我们需要了解如何对数据进行整理和清洗,包括删除重复数据、处理缺失值等。
最后,我们需要掌握如何进行基本的统计分析,例如描述性统计、频数分析等。
2. SPSS的数据处理与转换SPSS提供了丰富的数据处理和转换功能,可以帮助我们更好地分析数据。
例如,我们可以使用SPSS进行数据的排序和筛选,以便更好地理解数据的分布情况。
此外,我们还可以使用SPSS进行数据的变量转换,例如创建新变量、计算变量等,以满足我们的分析需求。
3. SPSS的统计分析SPSS作为一款统计分析软件,提供了丰富的统计分析方法,可以帮助我们深入挖掘数据背后的规律。
例如,我们可以使用SPSS进行相关分析,以了解变量之间的相关性。
另外,我们还可以使用SPSS进行回归分析,以探究变量之间的因果关系。
此外,SPSS还支持多种假设检验方法,例如t检验、方差分析等,以帮助我们进行统计推断。
4. SPSS的数据可视化数据可视化是数据分析的重要环节,它可以帮助我们更好地理解数据的分布和趋势。
SPSS提供了丰富的数据可视化方法,例如直方图、散点图、折线图等。
通过使用这些图表,我们可以直观地展示数据的特征,并发现其中的规律和异常情况。
5. SPSS的报告输出在完成数据分析后,我们需要将结果整理成报告,以便向他人展示我们的研究成果。
SPSS提供了报告输出的功能,可以将分析结果导出为Word、Excel等格式。
spss复习资料整理1
spss复习资料整理1第⼀章1.SPSS是软件英⽂名称的⾸字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。
2.SPSS系统运⾏管理⽅式(SPSS的⼏种基本运⾏⽅式)有:(1)完全窗⼝菜单运⾏⽅式(2)程序运⾏管理⽅式(3)混合运⾏管理⽅式3.SPSS的界⾯提供的五个窗⼝:数据编辑窗⼝、结果管理窗⼝、结果编辑窗⼝、语法编辑窗⼝、脚本窗⼝。
第⼆章1.SPSS的⽂件类型:语法⽂件(*.sps)、数据⽂件(*.sav)、结果输出⽂件(*.spv)。
2.SPSS数据编辑器的每⼀⾏数据称为⼀个个案(Case),每⼀个数据代表个体的属性,即变量(V ariable)。
3.SPSS变量名的命名规则:1)必须以英⽂字母开头,其他部分可以含有字母、数字、下划线(即“-”);2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等;3)SPSS13及以后版本⽀持变量名最长为64Byte,即变量名最长为64个英⽂字符,或者32个中⽂字符;4)SPSS变量名不区分⼤⼩写,即SPSS认为Name、name、nAme这三个变量名没有区别。
4.变量度量类型:定量(个数、⾼度、温度等)、定序(“⼗分重要”、“重要”、“⼀般”、“不重要”)、定类(名字、地址、电话等)。
5.列和宽度的区别:变量宽度:对字符型变量,该数值决定了你能输⼊的字符串的长度;列:设定该变量数据视图中列的宽度。
6.变量的值标签:即对数值含义的解释。
例如:值标签1 2 男⼥7.默认的缺失值类型:数值型类型(.)、字符串类型(空格)。
8.数据⽂件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括⼀对⼀合并和⼀对多合并。
9.SPSS⽤“(*)”表⽰变量来⾃于当前活动数据⽂件中的变量,⽽⽤“(+)”表⽰将要和当前数据⽂件进⾏合并的数据⽂件中的变量。
SPSS复习知识点及题目只是分享
SPSS复习知识点及题⽬只是分享教育统计与测量(SPSS)复习第⼀章:概述1.什么是信息?简单地讲,通过信息,可以告诉我们某件事情,可以使我们增加⼀定的知识。
英语中的信息是“information”,表⽰信息可以让受者产⽣某种形式的变化,这种变化可以让受者从认识上的不完全、不理解、不确定变为完全、理解和确定。
信息论的奠基者⾹农将信息定义为熵的减少,即信息可以消除⼈们对事物认识的不确定性,并将消除不确定程度的多少作为信息量的量度。
信息的价值因⼈⽽异。
所谓有⽤的信息,因⼈⽽异。
是否是信息,不是由传者,⽽是由受者所决定。
2.教育信息数量化的特点表⽰教育信息的数量与各种物理测量的数量有着明显的不同,在教育信息的统计处理中,应根据教育信息数量化的⽅法、特点不同,决定对这种信息进⾏统计处理的具体⽅法。
这是进⾏教育信息处理的重要关键。
3.教育信息数量化的尺度(1)名义尺度(nominal scale) :名义尺度的数值仅具符号的意义。
名义尺度的数字多⽤于表⽰不同的数别,它为教育信息的表⽰,存贮带来了很⼤的⽅便。
(2)序数尺度(ordinal scale) :序数尺度的数字多⽤于表⽰某些现象的排列顺序,可⽐较其⼤⼩,但不能进⾏四则运算,所以对这类数字的数值群的处理较多。
(3)距离尺度(interval scale,equal unit scale):距离尺度⼜称间隔尺度,是指数值间的距离(间隔),具有加法性。
距离尺度要求具有等价的单位,但不要求确定的零点位置。
对距离尺度的数字可以计算算术平均值、计算标准差,求相关系数等各种统计处理。
(4)⽐例尺度(ratio scale) :⽐例尺度是⼀种具有绝对零度的距离尺度值。
表⽰⾝长、体重的数值是⽐例尺度值。
对⽐例尺度的数字可进⾏各种统计处理。
4.数据的类型(1)定类数据(也称名义级数据),是数据的最低级。
(性别、编号)(2)定序数据(也称序次级数据),是数据的中间级。
(名次、优秀良好及格、有顺序的)(3)定距数据(也称间距级数据),是具有⼀定单位的实际测量值。
spss学习第12章
45.1% 18.2%
图12-10 性别和年龄条图
2. 问题二输出结果详解 一、性别因素对购买顾虑的差异性影响。 (1)方差齐性检验 SPSS的结果报告中首先列出了方差齐性检验结果表 12-6。由于这里采用的是Levene检验法,故表格首先显 示Levene统计量等于0.006。由于概率P值0.937明显大于 显著性水平,故认为不同性别下的购买顾虑值的方差是 相同的,满足方差分析的前提条件。
图12-9 年龄变量直方图
(3)列联表分析 表12-5是“性别”变量和“年龄”变量的列联表。 行变量是“年龄”变量,列变量是“性别”变量。可以 看到,总共178位男性调查者中,年龄在“20岁以下”的 共有27人,“21-30岁”的有88人,依次类推。对比行分 比、列百分比和合计百分比看到,男性中约一半的调查 者年龄都介于21-30岁之间,而对于女性调查者来说, “20岁以下”和“21-30岁”所占比例最高,达到了 30.8%和39.2%。 最后,从图12-10的条图也可以明显看到不同性别下 各个年龄阶段的被调查人总数。
Levene统计量
df1
4
df2
280
显著性
2.495
0.043
表12-8 方差齐性检验结果表
收
入
N 47 117
86 26
秩均值 157.71 137.53
123.94 178.54
(2)秩统计表 表12-9是多独立样 本非参数检验的秩统计 表。“800元以下”的平 均秩为157.71,依次类 推。比较平均秩大小看 到,这五种收入水平的 购买顾虑值差异较大。
第三步:绘制直方图 单击【图表】按钮, 弹出【频率:图表】对话 框。在图形类型【图表类 型】中,点选直方图【直 方图】单选钮,并勾选其 下的【显示正态曲线】复 选框。再单击【继续】按 钮,返回主菜单。最后单 击【频率】对话框中的【 确定】按钮,完成本部分 操作。
SPSS知识学习记录文本
Spss 学习笔记(1)在spss中,数据文件的管理功能基本上都集中在data和transform菜单上,其中transform主要实现变量级别的数据管理,如计算新变量、变量取值重新编码等,data的功能主要是实现文件级别的数据管理,如变量排序,文件合并、拆分等。
Transform菜单说明:计算新变量:compute变量转换:recode,visual bander,count,rank cases,automatic recode五个过程,可以看成是compute再某一方面的强化和打包。
专用过程:建立时间序列、缺失值代替和设定随机种子三个过程,前两个专用于时间序列模型。
设定随机种子的功能主要影响伪随机函数的使用。
数据分析中,将连续变量转换为等级变量,或将分类变量不同的变量等级进行合并是常见的工作。
而recode可以很好的完成这个任务。
Recode提供了精确的分组功能,但是如果希望进行的分组是有规律的,比如等距分组或者等样本量分组,使用recode过程进行操作就显得非常麻烦,而且可视化程度不高,可以使用visual bander过程进行可视化分段。
在数据分析中,将字符变量转换为数值变量是非常实用的一个功能,除了使用recode过程手工设定转换规则外,还可以使用automatic recode过程自动按照原变量的大小或者字母排序生成新变量,而变量值就是原值的大小次序。
Automatic recode的排序功能和rank cases类似,不同在于,automatic recode可以用于字符型变量。
所谓变量的秩序,就是对记录按照某个变量值得大小来排序。
Rank cases就是用来排序的专用过程。
Count:该过程用来表示某个变量的取值中是否出现某个值,可以使单个数值,也可以指定区间,并且可以仅给出条件,而不必对整个数据集进行操作。
该过程可以直接使用recode过程来实现。
Random number seed:默认情况下,随机种子随时间不停改变,这样计算出的随机数值无法重复,可以用该过程人为指定一个种子,以后所有的伪随机函数在计算时都会以该种子开始计算,即结果可以重现。
spss经典学习(简单易懂太好的)
大家现在都要写论文的数据分析了……很多同学都一点不会……所以把我知道的跟大家分享一下……下面以PASW18.0为例,也就是SPSS18.0…………什么?不是18.0,好吧……差不多的,凑合着看吧……要不去装个……= =……下面图片看不清的请右键查看图片……首先,要把问卷中的答案都输进SPSS中,强烈建议直接在SPSS中输入,不要在EXCEL中输入,再导入SPSS,这样可能会出问题……在输数据之前先要到变量视图中定义变量……如下图所有类型都是数值,宽度默认,小数点看个人喜好,标签自定,其他默认……除了值……讲讲值的设定……点一下有三点的蓝色小框框……会跳出一个对话框,如果你的变量是性别,学历,那么就如下图如果是五点维度的量表,那么就是记住,每一题都是一个变量,可以取名Q1,Q2……设定好所有问卷上有的变量之后,就可以到数据视图中输入数据啦……如下图都输完后……还有要做的就是计算你的每个维度的平均得分……如果你的问卷Q1-Q8是一个维度,那么就把Q1-Q8的得分加起来除以题目数8……那么得到的维度1分数会显示在数据视图中的最后……具体操作如下……转换——计算变量点确定,就会在数据视图的最后一列出现计算后的变量……如果你的满意度有3个维度,那么就要计算3个维度,外加满意度这个总维度,满意度=3个维度的平均分=满意度量表的所有题目的平均分…………把你所有的维度变量都计算好之后就可以分析数据啦……1.描述性统计将你要统计的变量都放到变量栏中,直接点确定……如果你要统计男女的人数比例,各个学历或者各个年级的比例,就要用描述统计中的频率……如果要统计男女中的年级分布,比如大一男的有几个,大二女的有几个,就用交叉表……不细说了……地球人都懂的…………2.差异性分析差异性分析主要做的就是人口学变量的差异影响,男女是否有差异,年级是否有差异,不做的就跳过……对于性别来说,差异分析采用独立样本T检验,也可以采用单因素ANOVA分析,下面以T 检验为例……将性别放进下面的分组变量中,接着定义组……按确定看Sig(双侧)得分,小于0.05就表明有显著差异,上图可见男女在组织承诺上是有显著差异的,在变革型领导行为的认同上没有显著差异……而对于学历,年级,年龄,工作年限等因素,我们可以采用单因素ANOVA分析,如下……按确定……由上图可知,在KY工作年限不同,在感情承诺、规范承诺、机会承诺上都有显著差异……显著性小于0.05……如果做出来没有差异,可以在下图中选择两两比较……选中LSD(最小显著方差法)……继续……确定……就会出来多重比较的图……再找有没上标为小星星的……有就可以说明二者有差异,没就没办法了……你改数据吧……= =……上图说明1年和3年、5年的在感情承诺上有明显差异……我去……4年的怎么没差异……= =0……别的也就这么做……不重复说了……3.相关分析相关分析主要就是分析你两个大变量中各个维度是否存在相关性和两大变量是否存在相关性……下例为两大变量的相关分析……分析——相关——双变量确定后……可见变革型领导行为和组织承诺在0.01水平上显著相关……上标两颗星……相关性比较好……其他维度也是一样的做法…………4.回归分析相关分析只能说明二者的相关性,并不能表明是否是由于A的变化引起B的变化,要想证明因果关系就要用回归分析……在做回归之前,首先要做一下自变量之间的相关性,如果相关系数超过0.75就不能做回归……会有比较大的偏差……这里不说了,不会的看3.相关分析回归如下如果你想用ABC变量预测D,就把D放因变量中,ABC放自变量中,方法选择进入……直接确定,如下图上图的结果表明德行垂范和愿景激励被踢出回归方程,因为Sig大于0.05……所以只有个性化关怀和领导魅力可以显著预测组织承诺……5.问卷信度和效度信度=分析——度量——可靠性分析把你同一份量表的题目全部放进去,比如变革型领导量表有26题……直接确定……结果表明Cronbach's值为0.939,量表信度很好……超过0.7才行效度分析一般采用结构效度分析,就是因子分析……分析——降维——因子分析把你同一量表的题目都放进去……点描述……选KMO***…………再点旋转,选择最大方差法……其他都默认,最后确定……0.839大于0.5,表示可以进行因子分析……累积解释变异66.974%,比较好可见上图1-8是一个维度,9-14是一个,15-20是一个,21-26是一个……表中同一行不能出现2个大于0.5的值……如果出现,你要么就把该题目踢出问卷,要么就把该题目的答案改得和同一维度中其他题目答案相近……比如A维度的答案是4,4,4,5,4, 1,你想把第6题也分到A中,就把第6题的答案1改成4…………多改几份差距大的问卷,再试试因子分析,看看值的变化就可以知道改的效果怎么样,不好就不要改……好啦……就讲到这里……应该都会了吧……其实最重要的还是数据的造假……不造假真是做不出的……其实也不是我们想造假……只能说被试者的随便填写造成了我们数据分析的极大困难……老师应该也知道的……= =……大家就这样改着吧……我也不是专业的,以上分析只作参考,答辩不过别找我……= =0……。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS(社会科学统计软件)学习资料参考书:SPSS for Windows:Base System User’ s Guide. Marija J. Norusis. SPSS Inc.卢纹岱等编著:SPSS for Windows 从入门到精通。
电子工业出版社,1996年.SPSS for Windows made Simple. 3rd ed. Paul R. Kinnear & Colin D. GrayPsychological Press,Ltd.,1999Electronic Statistical Textbook (from StatSoft) .statsoft./textbook/stathome.html作业:必须在次周周一前用电子邮件,磁盘或打印形式交给主讲教师和辅导上机的助教。
讲义:课前在网上下载或接收电子邮件。
成绩评定方法:期末考试, 期中考试,和作业,出勤。
期末考试40%期中考试30%作业,出勤30%总成绩100第一章数据和文件1准备分析用数据1.1数据收集主要是通过测量方法收集必需的数据。
测量方法可以是实验、测验、问卷调查等等。
应尽可能包括自己所需要的所有变量,因为从分析中排除不必要的变量比收集附加变量要容易得多。
1.2数据编码当我们通过问卷或测验收集了很多的数据回来后,接下来的工作就是把这些数据录入到计算机里。
为了输入数据简单,一种方法是在录入前用数据或符号表述被试的回答,这就是数据编码。
下面是一个编码表:些特殊信息的Case。
(编码示例)不管你自己对SPSS使用多么熟悉,在数据录入前对数据进行系统的编码是非常必要的,它可以使你避免混乱,清楚了解数据的意义。
1.3数据文件SPSS有三种文件:SYNTAX 文件(文本文件,以.sps为后缀)、DATA文件(数据文件,以.sav为后缀)、OUTPUT文件(结果文件,以.spo为后缀)。
SYNTAX 文件主要是保存命令及相关的文本资料;DATA文件则是保存供SPSS统计的数据,只有这种文件里的数据才可以直接进行统计使用;OUTPUT文件保存统计的结果。
SPSS所用的数据文件有很多种,主要是根据自己分析数据的量及每一Case 包括变量多少来选择适当的文件形式。
当数据较少及Case不多时,可以直接在SPSS的数据文件里加入数据。
(录入数据示例)当数据较多时,一般习惯用一编辑系统来录入数据(如SPSS中的SYNTAX文件),然后再通过定义命令把数据读入统计用的数据文件里。
这样录入的速度较快,不过可能不容易查找在录入过程中的错误。
这里只介绍用SPSS中的SYNTAX 文件录入数据的方法,并且在以下的其它内容中,也相应只介绍一些习惯的方法。
(录入数据示例)2数据定义与转换2.1数据定义(DATA LIST)在用SPSS中的SYNTAX 文件录入的数据文件中,每一个人的资料都排在一行上(可以多行)。
这样任何一个变量的数据都在相同的列里。
SPSS在使用这些数据时,必须对这些数据进行定义。
即告诉计算机各列数据代表什么。
DATA LIST命令用以给变量命名,并定义它们在Case中的位置和属性,把数据变成能被SPSS命令或过程使用的现用文件。
下面只介绍用固定格式引用外部数据文件的命令:DATA LIST FILE=‘C:\YLX\STRESS.SPS’/num 1-3 sch 4 sex 5 chi 6-7a1 to a10 8-17.FILE子命令指定从外部文件C:\YLX\STRESS.SPS读入数据。
接着是各个变量的名称及所在位置(字符宽)。
(1)当数据里有小数应该怎么表示?如,语文成绩里有85.3分,小数点不用录入,我们只要在程式里告诉电脑哪位是小数就可以了。
如:DATA LIST FILE=‘C:\YLX\STRESS.SPS’/num 1-3 sch 4 sex 5 chi 6-8(1) a1 to a10 9-18....chi 6-8(1)中括号里的1表示有一位小数。
如果是两位小数就用(2)。
(2)当你的数据中每个被试的数据有两行或者多行时应该怎么办?下面的例子是一个case有三行数据的情况:data list file='d:\data\2002\study.sps'records=3/1 school 1 numb 2-3 sex 4 grade 5 chinese 6-7 math 8-9 english 10-11 s1 to s60 12-71/2 s61 to s90 1-30 b1 to b44 31-74/3 a1 to a41 1-41 d1 to d42 42-83.用records=3指明每个被试有三行数据,在定义的时候,用/1 /2 /3 指明是第几行的数据。
(结合学生前面录入的数据示例)2.2变量值的重编码(RECODE)在统计数据处理时,经常需要对数据进行某些变换以适应不同处理的要求。
所谓数据变换是利用现存变量,或改变它们的值,或利用它们产生新的变量。
RECODE可以对现存变量的值作指定的变换。
如我们有一个题目是:“我不能满足学生的期待。
”要求老师在下面五个选择中选一个“1从来没有、2很少、3有时、4经常、5总是”。
我们在录入数据时只是按老师选择的数字录入。
但现在我们想统计“有时+经常+总是”和“从来没有+很少”的人数及比例。
这时我们可以用RECODE命令进行变换。
RECODE ITEM1(1,2=1)(3,4,5=2).这样我们就用1代表“从来没有+很少”,用2 代表“有时+经常+总是”。
另,如年龄这一变量,我们可能在录入时是按实际年龄的数字录入,但如果我们想把它们分老、中、青三组以比较三种年龄的人的差异时,就可以用RECODE 命令对原数据中的年龄变量进行变换。
RECODE AGE(LO THRU 35=1)(36 THRU 45=2)(46 THRU HI=3).把最小到35岁为青年组,用1表示;36到45岁为中年组,用2 表示;46到最老为老年组,用3 表示;这样就对原来变量的值重新进行了编码。
这里大家应该记住:THRU表示“至”。
第一个命令里是确定的值“(1,2=1)”,而第二个命令是一个范围“(LOWEST THRU 35=1)”。
(结合学生前面录入的数据示例)2.3计算变量(COMPUTE)有时我们想对数据进行组合,形成一个新的变量。
如我们用10道题来测量学生对学校的态度,但我们并不想对这10道题进行一一的分析,我们想对它们进行合并来说明该学生对学校的态度情况。
这时我们可以用COMPUTE命令来组合成新的变量。
COMPUTE ATTITUDE=(ITEM1+ITEM2+ITEM3+ITEM4+...+ITEM10)/10.把十个项目的分析的相加的平均分成一个新的变量ATTITUDE。
也可以是其它的运算关系,如减、乘、除、平方、开方等。
当然你可以不除以10,这样得到的是10道题的总分,除以10是项目平均分。
但有时因为可能有几个维度,而这几个维度的项目数不一样多,我们又想比较各维度的水平,这时我们除以项目数,得到项目平均分以利于比较。
又如你用学生的语文、数学、英语三科的总成绩作为学生的学业成绩。
compute total=chinese+math+english.除以3就可以得到平均每科的成绩。
写成:compute total=(chinese+math+english)/3.(结合学生前面录入的数据示例)2.4条件变换(IF)IF命令根据逻辑条件执行类似于recode的变换。
如当我们想把男生且考试分数不合格的作一组,男生且考试分数合格至良好的作一组,男生且考试分数优秀的作一组,以比较三组学生在某一方面的差异时,我们可以用IF命令来形成一个新的变量。
IF(SEX=1 AND SCORE<=60)SEXSC=1.IF(SEX=1 AND SCORE>60 AND SCORE<=80)SEXSC=2.IF(SEX=1 AND SCORE>80)SEXSC=3.这样我们就变换成一个新的变量SEXSC,进而比较SEXSC在某一方面的差异,即上述三组学生的差异。
(结合学生前面录入的数据示例)当然,我们可以IF命令来获得很多种我们想要的变换。
注意和RECODE的差异。
其实RECODE AGE(LO THRU 35=1)(36 THRU 45=2)(46 THRU HI=3).也可以用IF来实现:IF(AGE<=35)AGE1=1.IF(AGE>35 AND AGE<=45)AGE1=2.IF(AGE>45)AGE1=3.不过,这样就会产生了一个新的变量“AGE1”,当然原来的变量“AGE”也保持不变。
(结合学生前面录入的数据示例)2.5缺失数据的定义(MISSING)我们在做调查时,经常遇到一些被试对某一问题漏答的情况。
但由于该被试的其他资料还是可以用的,不想把他剔除。
在编码时,我们用一个答案上没有的数字表示缺失。
一般习惯是用“0”、“9”或“00”、“99”等,但注意这些数字必须是答案中没有的,否则重复了会把原来具有其它意义的变成了缺失。
在用SPSS进行统计,我们就必须告诉计算机,某一变量如果数值是“0”、“9”或“00”、“99”时,就表示缺失。
如某些学生忘记填写性别,我们用9来表示缺失。
MISSING VALUE SEX(9).告诉计算机,当SEX是9时,表明该学生没有填写性别。
在做涉及到该变量的某些计算时,如比较男女学生的差异,可以考虑剔除丢失该变量资料的人。
第二章描述统计过程1频数这是对数据的一般整理,了解样本的分布:离散性、变异性和规律性。
统计学中的分布是指一个变量的各种情况或取值出现的次数或频数,所以又叫做频数分布。
如家长的职业,我们可以用变量名“JOB”,不同的职业我们给予不同的数字表示:1-干部、2-教师、3-研究员等,分布是指被调查的学生中各种职业的家长数。
频数分布反映出落入每一组的观察值个数。
还可以用分数、小数或百分数表示。
1.1命令FREQUENCESFREQUENCES计算单个变量值的频数、百分数和各种描述统计量。
如上述,我们要计算各种职业的父母的人数。
FREQUENCES VARIABLES=JOB. (可以简写成:FRE VAR=JOB.)1.2输出结果的解释Statistics1.3分位点的确定—子命令PERCENTILES和NTILE利用子命令PERCENTILES和NTILE得到所有待分析变量的百分位数。
如果指定多个PERCENTILES和NTILE子命令,显示所有选择的百分位数的一个表。
1.3.1 PERCENTILES子命令PERCENTILES子命令显示落在指定值(或者值列表)的case的百分数。