spss整理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Spss知识点

1.SPSS:①Statistical Package for the Social Sciences,即“社会科学统计软件包”

②Statistical Product and Service Solutions,意为“统计产品与服务解决方案”

2.SPSS两个常用窗口:数据编辑窗口(功能:定义SPSS数据的结构、录入编辑和管理待分析的数据 .sav) 结果输出窗口(功能:显示管理SPSS统计分析结果、报表及图形 .spv)

3.利用SPSS做数据分析的一般步骤:12

①建立SPSS 数据文件(定义数据文件结构、录入修改和编辑待分析的数据)

②分析数据(统计分析之前的数据预处理、统计分析和建模)

③结果的说明和解释④数据和分析结果的保存

4.SPSS数据文件的特点:

①SPSS数据文件的扩展名是:.sav ②SPSS数据文件属于结构性数据文件(数据结构:变量名、数据类型、变量名标签、变量值标签、缺失值的定义、度量尺度以及数据的显示属性;在数据编辑窗口的变量视图Variable View中完成。

数据内容:待分析的具体数据;在数据编辑窗口的数据视图Date View中完成。)

5.SPSS数据的基本组织方式:①原始数据的组织方式(数据编辑窗口中一行称为一个个案,所有个案组成完整的SPSS数据。一列称为一个变量,每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标识。)②计数数据的组织方式(数据编辑窗口中一行为变量的一个分组。所有行囊括了该变量的所有分组情况。一列仍为一个变量,代表某个问题或某个特征方面以及相应的计数结果。)

6.变量名:是变量访问和分析的唯一标志。

7.变量命名原则:

①首字符必须是字母或汉字,后面可以是任意字母、数字或除了“!”、“?”、“*”之外的任意字母或数字②长度应少于64个字符(32个汉字)

③不能用下划线“_”、句号和圆点作为变量名的最后一个字符

④SPSS的变量名不能与SPSS的保留字相同,如ALL、AND、WITH、OR等

⑤同一文件中变量名必须惟一,不区分大小写。

8.数据类型是指每个变量取值的类型。有数值型、字符型和日期型。

9.若字符型数据定义为数值型时,需要定义一个变量值标签。

10.变量值标签是对变量取值含义的解释说明信息,对于定类型和定序性数据尤为重要。如定类(民族、性别)定序(收入的高中低)

11.计量尺度又叫变量层次。定距>定序>定类

12.定类变量(定类尺度 Nominal Variable):

①是最低层次的变量,变量取值只有类别属性之分,而无大小、程度之别。

②根据变量值,只能知道研究对象是相同或是不同。从数学运算特征来看,只具有等于或不等于(=、≠)的性质。例如:性别。

13.定序变量:①变量层次高于定类变量。

②变量取值除了有类别属性之外,还有等级、次序的差别,其数学特性除了(=、≠)之外,还有大于或小于(><)之分。例如:文化程度、职称、态度等

14.定距变量(定距尺度 Interval Variable):①变量层次高于定序变量。

②变量取值除了有类别、次序属性之外,取值之间的距离还可以用标准化的距离去量度。其数学特性除了(=、≠;><)之外,还可以进行加或减(+,-)。

例如:智商、成绩、收入等。

15.高层次的变量包含低层次变量的数学特征。

16.一个变量的层次并不是唯一的。高层次的变量可以作为低层次变量来使用,但是会使资料的信息使用不完全,尽量按其最高层次来统计分析。如:收入

17.Spss支持的数据格式有SPSS文件格式、Excel文件格式、dbf文件格式、文本文件格式。

18.读取Excel文件:SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口中。但也可在【range】后指定读取工作表中某个区域的数据。如果Excel工作表文件第一行或指定区域的第一行上存储了变量名信息,则应选择【read variable name】,即以第一行文字信息作为变量名;否则不选,SPSS的变量名将自动取名为工作表中的单元格。

形成spss文件的方法:数据文件结构自定义输入、读取已经形成的execl文件。

19.纵向合并:(增加个案)应用情况:①两个带合并文件的内容合并起来有实际意义。②在不同数据文件中,数据含义相同的数据项最好取相同的变量名,且数据类型也最好相同,可简化操作过程,有利于自动匹配。含义不同的数据项最好取不同的名字。

20.横向合并:增加变量应用情况:①两个数据文件必须至少有一个名称相同的变量,该变量是两个数据文件横向拼接的依据,称为关键变量。如职工号、商品序号。②两个数据文件都必须事先按关键变量值的升序排序。③不同数据文件中数据含义不同的数据项,变量名不应相同。

21.数据排序:①数据排序是整行数据排序,而不是只对某列变量排序。②多重排序中指定排序变量的次序很关键。排序时先指定的变量优于后制定的变量。③数据排序以后原有数据的排列次序必然被打乱。因此在时间序列的数据中,如果数据中没有标示时间的变量(如年份、月份、季度等),则应注意保留数据的原始排序。

22.变量计算:①变量计算是针对所有个案(或指定的部分个案)的,每条个案都有自己的计算结果。②变量计算的结果应保存到一个指定变量中,该变量的数据类型应与计算结果的数据类型相一致。

23.分类汇总按照某分类变量进行分类计算。

24.数据分组:就是根据统计分析的需要,将数据按照某种标准重新划分为不同的组别。

25.统计分组的原则:(1)完备性原则(穷尽性原则)所有单位在分组后都要各有其所,不能被遗漏。(2)互斥性原则组与组之间有明确的界限,每个单位只能归为一组,不能同时归为两组或两组以上。

26.定类变量(品质分组)定序变量(变量分组)

定距变量:离散变量单项式分组

连续变量(按理论取值)组距式分组

27.单项式分组:以一个具体的变量值作为一组。适用范围:离散变量;变量值变动范围小。如:居民家庭按家庭成员数量分组。

28.组距式分组:以一个区间的变量值为一组。

适用条件:变量值变动范围较大,连续变量、离散变量均可(变量值较多的情况下)

29.数据计数:①变量值相同,可以一块写。②变量值不同,加一个if条件,一个一个的定义变量。

30.加权处理:加权变量的过程本质是数据复制。74 单价为加权变量,销售量为权数。通过加权处理,可以达到将数据编辑窗口中的计数数据还原为原始数据的目的。一旦指定了加权变量,在以后的分析中加权就是一直有效的,知道取消为止。

31.数据拆分与排序的区别:数据拆分不仅是按指定变量对数据进行简单排序,更重要的是根据指定变量对数据进行分组,它将为以后所进行的分组统计分析提供便利。

32.定类变量只能用于条形图或饼图,一般用饼图。

33.定类变量不能计算平均值。

34.若变量以分组做频数分析时应先加权。

35.基本描述统计量:集中趋势、离散程度、分布形态。

36.低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据。

相关文档
最新文档