spss统计软件使用教程(精)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方法二: 直接双击桌面上的SPSS图标
2020/3/14
4
SPSS的安装、启动和退出
安装后启动的界面
2020/3/14
5
SPSS的安装、启动和退出
SPSS常用的窗口
2020/3/14
6
SPSS的安装、启动和退出
退出
方法:单击主菜单中的File → 单击Exit
注:退出前要保存新建立的或修改的文件内容。
2020/3/14
21
统计推断
计数资料统计推断
4.2检验
crosstable
双变量直线相关与回归
5.相关系数r的假设检验
Correlation-bivariate
6.回归系数b的假设检验
Regression-linear
多变量相关与回归……
2020/3/14
22
统计推断
1.单样本t检验
数据文件“t-test_1.sav”,根据营养学要求,成年女性每日摄 入食物的推荐平均热量为7725kcal。今随机抽取11名20至30 岁成年女性每日摄入的热量如下:5260,5470,5640,6180, 6390,6515,6805,7515,7515,8230,8770
1ຫໍສະໝຸດ Baidu
治 疗 后 Hb(g /L)
Mean Std. Deviation
5.367
18.142
M ea n 2.342
Lower .680
Upper 10.053
差值均数 d
Sd
S d
2020/3/14
t 2.291
df Sig. (2-tailed)
59
.026
28
统计推断
4.2检验 为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹 患者随机分为两组,临床观察结果见下表,问两组的总体有效 率有无差别?(文件名为“chi2_2.sav)
2020/3/14
2
SPSS统计软件简介
1. 20世纪60年代末,美国斯坦福大学的三位研究生研 制开发了最早的统计分析软件SPSS,同时成立了 SPSS 公司
2. 1975 年在芝加哥组建了SPSS 总部 3. 1984年开发了DOS操作系统下的PC+1.0版本 4. 1992年的DOS版升级为Windows版本,即最初的4.0
问:现今20至30岁成年女性每日摄入食物的平均热量是否足 够?
Analyze → Compare Means → One sample T
test → 使左侧源变量栏变量进入右侧Test栏 →
在右下方Test中输入总体均数→ OK
2020/3/14
23
结果解释
均数
One-Sample Statistics
Analyze → Descriptive statistics→ Frequencies
→ 使左侧源变量栏进入右侧variable(s)栏 → 单 击statistics 选择统计指标 → continue → chat 选 择要输出的图形 → continue → format 选择要输 出的格式 → continue → OK
2020/3/14
16
2020/3/14
17
频数表分析(frequencies)
▪ Quartiles ▪ Mean ▪ Median ▪ Mode ▪ Sum ▪ Std.devation ▪ Variance ▪ Range ▪ S.E.mean
四分位数 均数 中位数 众数 总和
标准差 方差 极差 标准误
量特征及分布规律进行测
统计分析
定和描述
统计判断
指如何抽样以及如何用 样本信息推断总体特征 的问题
2020/3/14
15
统计描述(descriptive statistics 过程)
1.频数表分析(frequencies)
▪ 新建数据库或打开已有数据库(如: diameter_sub.sav
数据库记录了216个人体脊柱椎体的矢状面管径,试对变量 “trueap_mean”(矢状面管径)作描述性分析,并绘制直方图)
年龄
Equal variances assumed
Equal variances not assumed
F 1.588
Si g. .213
Independent Samples Test
t 1.655
1.655
t-test for Equality of Means
M ea n
df
Sig. (2-tailed) Difference
2020/3/14
18
2. 描述性统计分析(descriptives)
操作
建立或打开已有的数据文件
Analyze→Descriptive Statistics→Descriptives →使左侧源变量栏进入右侧variable(s)栏→单击 opions 选择统计量 → OK
该模块的特殊功能:数据标准化
2020/3/14
19
3. 探索性描述(explore)
操作
建立或打开已有的数据文件
Analyze→Descriptive Statistics→Explore→使左侧 源 变量栏 进入右 侧 dependent栏 ,分组 变量进 入 factor栏→单击statistics,plots选择统计量→ OK
10
.018 -971.364
95% Confidence Interval of the Di ffe re nce
Lower -1738.65
Upper -204.07
t值
自由度 双侧检验的P值
2020/3/14
24
统计推断
2.两样本均数比较t检验 以临床试验的数据文件“clinical trial.sav”为例,为了检验随机 分组变量的均衡性,对治疗前两组的“age(年龄)、heigh(身 高)、wt(体重)、SBP(收缩压)、DBP(舒张压)以及 pulse(心率)”做两独立样本的t检验
2020/3/14
25
结果解释
年龄
分组 试验 药
安慰 剂
方差齐性检验
Group Statistics
N 30 30
M ea n 47.50 41.50
Std. Deviation 12.905 15.085
Std. Error M ea n 2.356
2.754
Levene's Test for Equality of Variances
1
治 疗 后 Hb(g /L)
N Correlation
60
.625
Sig. .000
Paired Samples Test
Paired Differences
95% Confidence
Interval of the
Std. Error
Di ffe re nce
Pair 治 疗 前 Hb(g /L) -
M ea n
Pair 治 疗 前 Hb(g /L) 134.98
1
治 疗 后 Hb(g /L) 129.62
N 60 60
Std. Deviation 22.314 19.034
Std. Error M ea n 2.881
2.457
Paired Samples Correlations
Pair 治 疗 前 Hb(g /L) &
2020/3/14
13
学生操作
▪ 建立一个以自己名字为文件名的SPSS数据库 ▪ 调查变量包括:姓名、性别(1=男性,2=女性)、
出生日期(美式)、身高(单位cm,保留2位小数) ▪ 输入自己的数据并保存
2020/3/14
14
二、数据的统计分析
用统计指标、统计表、统
统计描述 计图等方法去对资料的数
标准差
标准误
热 量 (千 卡 )
N 11
Std. Error
Mean Std. Deviation Mean
6753.64
1142.123 344.363
热 量 (千 卡 )
t -2.821
One-Sample Test
Test Value = 7725
M ea n
df
Sig. (2-tailed) Difference
2020/3/14
10
定义变量
例如 在Variable View窗口中
▪ Name—更改变量名称 ▪ Type—选择变量类型(如numeric 、date、string) ▪ Decimals—设定小数显示的位数 ▪ Label—分析输出结果中变量的显示名称 ▪ Values —分析输出结果中变量内容的显示名称
2020/3/14
26
统计推断
3.配对样本t检验
根据数据文件“clinical trial.sav”分别比较试验组和安慰剂组治 疗前后4对血常规检查指标,即变量“hb1和hb2(血红蛋白含 量)、rbc1和rbc2(红细胞记数)、wbc1和wbc2(白细胞记 数)、plt1和plt2(血小板记数),变量名中“1”代表治疗前, “2”代表治疗后
Analyze → Compare Means → Independent Sample T test → 使左侧源变量中的分析变量进 入右侧Test栏 → 左侧源变量中的分组变量进入 Grouping栏 → 单击Define Groups → 输入组的 变量值 → Continue → OK
注:成组设计的两个变量必须一个是检验变量X,另一个是分组变量group。
与SPSS相关文件的后缀名的意义: .SAV SPSS的数据文件 .SPO SPSS在运行中产生的统计分析结果文件 .SPS SPSS语法程序文件
2020/3/14
7
学习SPSS统计软件的目的
➢ 学会应用SPSS统计软件进行数据库的建 立和数据的正确录入
➢ 能够正确地选择适当的统计方法对录入的 数据进行分析
版 5. 1999年升级到10.0版、2001年升级为11 .0版、 2003
年 Windows操作平台下的最新版本为12.0;目前已有 17.0
与著名统计软件SAS相比,更适用于统计初学者或非统计学专业人员
2020/3/14
3
SPSS的安装、启动和退出
安装 启动 方法一:
进入Windows → 开始 → 程序 → SPSS for windows → 单击
2020/3/14
11
数据录入
数据编辑窗口(Data Editor)
2020/3/14
操作演示
12
操作
保存数据
单击File Save(As) 在文件名栏
输入盘符:\路径\文件名 单击保存
SPSS数据转换功能较强:可存取和转换多种数据类型,Spss (*.sav),Excel(*.xls),Text(*.txt) , dBase(*.dbf) 文件等。
该模块的特殊功能:数据的异常值分析以及资料特
征分析:正态性以及方差齐性
2020/3/14
20
统计推断
计量资料统计推断
1.样本均数与总体均数比较t检验
t
One sample t test
检 2.两样本均数比较t检验
验
Independent-samples t Test
3.配对样本均数比较t检验
Paired-samples t Test
公共卫生与全科医学学院
SPSS统计软件简介
▪ SPSS是社会科学统计软件包(Statistics Package For Social Science)的缩写,经过几十年的改进, 该产品发展成为集统计分析、数据挖掘、商业智能、 顾客关系管理等多功能的统计产品和服务解决方案 (Statistics Product For Service Solutions)的 软件。适用于社会学、医学、心理学、经济学等领 域。
58
.103
6.000
Std. Error Di ffe re nce
3.624
56.641
.103
6.000
3.624
95% Confidence Interval of the Di ffe re nce
Lower
Upper
-1.255 13.255
-1.259 13.259
如果方差齐
如果方差不齐
□ display frequency tables 显示频数分布表(是 针对每一个数值,并 非分组段)
□ percentile(s)显示分布分 析:选择P2.5和P97.5 或 P5 和 P95 ( 即 95% 和90%正常值范围)
□ distribution:选择 skewness(偏度系 数),kurtosis(峰度 系数)
➢ 能够对统计结果进行正确的解释
2020/3/14
8
一、分析数据库的建立
指把科研或日常工作中采集的各种 信息、数据,以某种方式存入到计算机 磁盘中,建立可随时存取、修改、统计 分析的数据文件的全过程。
定义变量 数据录入 保存数据
2020/3/14
9
定义变量
变量格式设置窗口(Variable View)
Analyze → Compare Means → Paired Sample T test → 同时使左侧配对的两个变量进入右侧 paired variables栏 → OK
注:配对资料必须成对输入,分别以X1和X2表示,无分组变量
2020/3/14
27
结果解释
Paired Samples Statistics
2020/3/14
4
SPSS的安装、启动和退出
安装后启动的界面
2020/3/14
5
SPSS的安装、启动和退出
SPSS常用的窗口
2020/3/14
6
SPSS的安装、启动和退出
退出
方法:单击主菜单中的File → 单击Exit
注:退出前要保存新建立的或修改的文件内容。
2020/3/14
21
统计推断
计数资料统计推断
4.2检验
crosstable
双变量直线相关与回归
5.相关系数r的假设检验
Correlation-bivariate
6.回归系数b的假设检验
Regression-linear
多变量相关与回归……
2020/3/14
22
统计推断
1.单样本t检验
数据文件“t-test_1.sav”,根据营养学要求,成年女性每日摄 入食物的推荐平均热量为7725kcal。今随机抽取11名20至30 岁成年女性每日摄入的热量如下:5260,5470,5640,6180, 6390,6515,6805,7515,7515,8230,8770
1ຫໍສະໝຸດ Baidu
治 疗 后 Hb(g /L)
Mean Std. Deviation
5.367
18.142
M ea n 2.342
Lower .680
Upper 10.053
差值均数 d
Sd
S d
2020/3/14
t 2.291
df Sig. (2-tailed)
59
.026
28
统计推断
4.2检验 为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹 患者随机分为两组,临床观察结果见下表,问两组的总体有效 率有无差别?(文件名为“chi2_2.sav)
2020/3/14
2
SPSS统计软件简介
1. 20世纪60年代末,美国斯坦福大学的三位研究生研 制开发了最早的统计分析软件SPSS,同时成立了 SPSS 公司
2. 1975 年在芝加哥组建了SPSS 总部 3. 1984年开发了DOS操作系统下的PC+1.0版本 4. 1992年的DOS版升级为Windows版本,即最初的4.0
问:现今20至30岁成年女性每日摄入食物的平均热量是否足 够?
Analyze → Compare Means → One sample T
test → 使左侧源变量栏变量进入右侧Test栏 →
在右下方Test中输入总体均数→ OK
2020/3/14
23
结果解释
均数
One-Sample Statistics
Analyze → Descriptive statistics→ Frequencies
→ 使左侧源变量栏进入右侧variable(s)栏 → 单 击statistics 选择统计指标 → continue → chat 选 择要输出的图形 → continue → format 选择要输 出的格式 → continue → OK
2020/3/14
16
2020/3/14
17
频数表分析(frequencies)
▪ Quartiles ▪ Mean ▪ Median ▪ Mode ▪ Sum ▪ Std.devation ▪ Variance ▪ Range ▪ S.E.mean
四分位数 均数 中位数 众数 总和
标准差 方差 极差 标准误
量特征及分布规律进行测
统计分析
定和描述
统计判断
指如何抽样以及如何用 样本信息推断总体特征 的问题
2020/3/14
15
统计描述(descriptive statistics 过程)
1.频数表分析(frequencies)
▪ 新建数据库或打开已有数据库(如: diameter_sub.sav
数据库记录了216个人体脊柱椎体的矢状面管径,试对变量 “trueap_mean”(矢状面管径)作描述性分析,并绘制直方图)
年龄
Equal variances assumed
Equal variances not assumed
F 1.588
Si g. .213
Independent Samples Test
t 1.655
1.655
t-test for Equality of Means
M ea n
df
Sig. (2-tailed) Difference
2020/3/14
18
2. 描述性统计分析(descriptives)
操作
建立或打开已有的数据文件
Analyze→Descriptive Statistics→Descriptives →使左侧源变量栏进入右侧variable(s)栏→单击 opions 选择统计量 → OK
该模块的特殊功能:数据标准化
2020/3/14
19
3. 探索性描述(explore)
操作
建立或打开已有的数据文件
Analyze→Descriptive Statistics→Explore→使左侧 源 变量栏 进入右 侧 dependent栏 ,分组 变量进 入 factor栏→单击statistics,plots选择统计量→ OK
10
.018 -971.364
95% Confidence Interval of the Di ffe re nce
Lower -1738.65
Upper -204.07
t值
自由度 双侧检验的P值
2020/3/14
24
统计推断
2.两样本均数比较t检验 以临床试验的数据文件“clinical trial.sav”为例,为了检验随机 分组变量的均衡性,对治疗前两组的“age(年龄)、heigh(身 高)、wt(体重)、SBP(收缩压)、DBP(舒张压)以及 pulse(心率)”做两独立样本的t检验
2020/3/14
25
结果解释
年龄
分组 试验 药
安慰 剂
方差齐性检验
Group Statistics
N 30 30
M ea n 47.50 41.50
Std. Deviation 12.905 15.085
Std. Error M ea n 2.356
2.754
Levene's Test for Equality of Variances
1
治 疗 后 Hb(g /L)
N Correlation
60
.625
Sig. .000
Paired Samples Test
Paired Differences
95% Confidence
Interval of the
Std. Error
Di ffe re nce
Pair 治 疗 前 Hb(g /L) -
M ea n
Pair 治 疗 前 Hb(g /L) 134.98
1
治 疗 后 Hb(g /L) 129.62
N 60 60
Std. Deviation 22.314 19.034
Std. Error M ea n 2.881
2.457
Paired Samples Correlations
Pair 治 疗 前 Hb(g /L) &
2020/3/14
13
学生操作
▪ 建立一个以自己名字为文件名的SPSS数据库 ▪ 调查变量包括:姓名、性别(1=男性,2=女性)、
出生日期(美式)、身高(单位cm,保留2位小数) ▪ 输入自己的数据并保存
2020/3/14
14
二、数据的统计分析
用统计指标、统计表、统
统计描述 计图等方法去对资料的数
标准差
标准误
热 量 (千 卡 )
N 11
Std. Error
Mean Std. Deviation Mean
6753.64
1142.123 344.363
热 量 (千 卡 )
t -2.821
One-Sample Test
Test Value = 7725
M ea n
df
Sig. (2-tailed) Difference
2020/3/14
10
定义变量
例如 在Variable View窗口中
▪ Name—更改变量名称 ▪ Type—选择变量类型(如numeric 、date、string) ▪ Decimals—设定小数显示的位数 ▪ Label—分析输出结果中变量的显示名称 ▪ Values —分析输出结果中变量内容的显示名称
2020/3/14
26
统计推断
3.配对样本t检验
根据数据文件“clinical trial.sav”分别比较试验组和安慰剂组治 疗前后4对血常规检查指标,即变量“hb1和hb2(血红蛋白含 量)、rbc1和rbc2(红细胞记数)、wbc1和wbc2(白细胞记 数)、plt1和plt2(血小板记数),变量名中“1”代表治疗前, “2”代表治疗后
Analyze → Compare Means → Independent Sample T test → 使左侧源变量中的分析变量进 入右侧Test栏 → 左侧源变量中的分组变量进入 Grouping栏 → 单击Define Groups → 输入组的 变量值 → Continue → OK
注:成组设计的两个变量必须一个是检验变量X,另一个是分组变量group。
与SPSS相关文件的后缀名的意义: .SAV SPSS的数据文件 .SPO SPSS在运行中产生的统计分析结果文件 .SPS SPSS语法程序文件
2020/3/14
7
学习SPSS统计软件的目的
➢ 学会应用SPSS统计软件进行数据库的建 立和数据的正确录入
➢ 能够正确地选择适当的统计方法对录入的 数据进行分析
版 5. 1999年升级到10.0版、2001年升级为11 .0版、 2003
年 Windows操作平台下的最新版本为12.0;目前已有 17.0
与著名统计软件SAS相比,更适用于统计初学者或非统计学专业人员
2020/3/14
3
SPSS的安装、启动和退出
安装 启动 方法一:
进入Windows → 开始 → 程序 → SPSS for windows → 单击
2020/3/14
11
数据录入
数据编辑窗口(Data Editor)
2020/3/14
操作演示
12
操作
保存数据
单击File Save(As) 在文件名栏
输入盘符:\路径\文件名 单击保存
SPSS数据转换功能较强:可存取和转换多种数据类型,Spss (*.sav),Excel(*.xls),Text(*.txt) , dBase(*.dbf) 文件等。
该模块的特殊功能:数据的异常值分析以及资料特
征分析:正态性以及方差齐性
2020/3/14
20
统计推断
计量资料统计推断
1.样本均数与总体均数比较t检验
t
One sample t test
检 2.两样本均数比较t检验
验
Independent-samples t Test
3.配对样本均数比较t检验
Paired-samples t Test
公共卫生与全科医学学院
SPSS统计软件简介
▪ SPSS是社会科学统计软件包(Statistics Package For Social Science)的缩写,经过几十年的改进, 该产品发展成为集统计分析、数据挖掘、商业智能、 顾客关系管理等多功能的统计产品和服务解决方案 (Statistics Product For Service Solutions)的 软件。适用于社会学、医学、心理学、经济学等领 域。
58
.103
6.000
Std. Error Di ffe re nce
3.624
56.641
.103
6.000
3.624
95% Confidence Interval of the Di ffe re nce
Lower
Upper
-1.255 13.255
-1.259 13.259
如果方差齐
如果方差不齐
□ display frequency tables 显示频数分布表(是 针对每一个数值,并 非分组段)
□ percentile(s)显示分布分 析:选择P2.5和P97.5 或 P5 和 P95 ( 即 95% 和90%正常值范围)
□ distribution:选择 skewness(偏度系 数),kurtosis(峰度 系数)
➢ 能够对统计结果进行正确的解释
2020/3/14
8
一、分析数据库的建立
指把科研或日常工作中采集的各种 信息、数据,以某种方式存入到计算机 磁盘中,建立可随时存取、修改、统计 分析的数据文件的全过程。
定义变量 数据录入 保存数据
2020/3/14
9
定义变量
变量格式设置窗口(Variable View)
Analyze → Compare Means → Paired Sample T test → 同时使左侧配对的两个变量进入右侧 paired variables栏 → OK
注:配对资料必须成对输入,分别以X1和X2表示,无分组变量
2020/3/14
27
结果解释
Paired Samples Statistics