第八章 定量资料的分析.

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

( X X )(Y Y ) r n X Y
四 、SPSS概述 (一)SPSS简介 SPSS(Statistical Package for the Social Science, 社会科学统计软件包)是由美国SPSS公司自20世纪80年 代开发的大型统计学软件包,自1985年推出V 1.0以来, 版本不断更新,目前已推出V 16.0的最新版本。功能更 加强劲,操作更加简便,并且与其他统计及数据库软件, 如Excel、DaBase、Foxbase、Access等的兼容性不 断增强,因此它是目前世界最流行的统计软件之一,也 是社会科学研究人员首选的统计软件。
(三)SPSS应用 • 1.启动和输入数据 • 启动SPSS即进入主画面新数据窗口,这时可以定义变量, 输入、编辑数据文件。 • (1)定义变量: • 定义变量类型 • 定义变量长度 • (2)录入数据:
z
X X
x
三 、相关系数
平均值、标准差都是对单变量进行描述的特征量。对两 个变量之间的变化关系需要用相关量来描述。 两个变量之间的变化关系从变化方向看,有三种情况: 正相关 两个变量的变化方向一致。一个变量值变大时, 另一个变量值也随之变大。 负相关 两个变量的变化方向相反。一个变量值变大时, 另一个变量值随之变小。 零相关 两个变量值变化方向无一定规律。一个变量值 变大时,另一个变量值可能变大也可能变小,并且变大 变小的机会趋于相等。这样的关系称为零相关,两个变 量之间无相关。
2 x
2 ( X X )
N
• 标准差是方差的平方根。其定义式为:
X
2 ( X X )
N
• 标准分 标准分是以标准差为单位来计量每个分属于平均分之间的 离差。(某个分数的离均差包含几个标准差)反映某个分 数在所有分数中的相对位置。
标准分数
z
XX
x
• 标准分数又称z分数,是以标准差为单位表示一个分数在 全部数据中所处的相对位置。 • 标准分数的定义式是:
• • •
• 相关系数 用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关 系数,一般用 r 表示。 • 相关系数的取值范围是在-1到+1之间。 • +、 -号表示相关关系的方向。+号表示变化方向一致,为正相关。号表示变化方向相反,为负相关。 r 的绝对值表示两个变量之间的 密切程度。绝对值越接近1,表示两个变量之间关系密切,越接近0, 表示两个变量间的关系越不密切。 • 相关系数只能描述两个变量之间的变化方向及密切程度,不能表明二 者之间的本质联系,分析内在的本质联系需要有关的专业知识。相关 关系也不能确定两个变量间的因果关系,两个相关变量间是否存在因 果关系同样需要根据有关知识和经验做进一步的分析。
100
100
90
90
80
80
70
70
VAR00003
VAR00004
60
60
50 0 1 2 3 4 5 6 7
50 0 1 2 3 4 5 6 7 8
8
VAR00001
VAR00001
• 左图数据差异量或离散程度大,数据分布范围广、右图数 据差异量小,数据分布得比较集中。
• 方差和标准差是使用最广泛的差异量。方差是离差平方和 的算术平均数。其定义式为:
第七章 定量资料的分析
第一节 统计的理解
第二节 统计描述与推断 第三节 假设检验 第四节 统计分析
第一节 统计的理解
• • • • 统计是一种语言 统计是一种规律 统计是一种思想 统计是一种工具
描述统计: • 工作:绘制统计图表,计算平均数、标准 差、相关系数等统计量数。 • 工具:Excel表。公式:
(二)SPSS操作基本过程 • SPSS功能强大,操作简单。运用SPSS对数据进行统计 处理的基本过程如下: • 1.建立数据库,录入数据:一是定义变量,二是录入变 量值; • 2.对数据进行预处理:根据需要,对数据进行整理、分 组、合并、排序等; • 3.统计分析:按研究要求的统计分析方法,对数据进行 处理; • 4.数据呈现:生成数据表和可视化图形; • 5.保存和导出结果:可将结果以数据库文件格式存贮, 并能以常见的数据格式输出。
100
90
80
70
60
50 0 2 4 6 8 10 12 14 16
VAR00001
• 数据向平均值集中的趋势
二、 差异量和方差、标准差
集中量可以描述一组数据的平均水平、向某一点集中 的趋势,但没有反映一组数据的全部特征。一组数据, 不仅有 集中的趋势,同时,也有离散的、变异的状态。 比如, 两组学生测验成绩如下: 甲组 54,63,72,74,82,88,99 乙组 67,71,73,76,79,82,84 虽然平均分都是76,但离散的程度却不同。 • 表示一组数据变异程度或离散程度的量称为差异量。 差异量越大表示数据分布范围越广、越不整齐;差异 量越小,表示数据分布得越集中,变动范围越小。
积差相关系数的定义式:
两个变量离差乘积之和除以n 所得之商称为协方差 。离差 积之和的大小,反映两个变量之间的关系。两个离差除以 相应的标准差,变成两个标准分,把协方差变成相对量。 积差相关系数就是两个变量离差除以各自的标准差所得标 准分乘积之和除以 n所得之商。数值范围在-1.00至1.00之 间。
平均数:
X1 X 2 X N X N
X
i 1Hale Waihona Puke Baidu
N
i
N
标准差:
S
( X X ) N
2
推断统计 • 从局部(样本)数据信息推论全局(总 体)情况的方法。 • 作用:排除抽样误差。 • 应用:判断差异是否具有统计意义。 • 常用方法:Z检验、t检验、χ2检验、方 差分析等。工具: SPSS软件、Excel表。
第二节 平均值、标准差和相关系数
统计分析需要处理的是统计数据。表征某一随机现象 的统计数据总是具有一定的特征。描述统计数据特征的是 特征量,常用的特征量有:集中量、差异量和相关量。平 均值、标准差、相关系数分别是最常用的集中量、差异量 和相关量 。
一、 集中量和平均值
集中量是代表一组数据典型水平或集中趋势的 量,反映频数分布中大量数据向某一点集中的情 况。平 均值(算术平均值) 是统计学中最容易理解和最常用的集 中量指标,可以表示为:
相关文档
最新文档