SPSS知识2:统计描述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计描述
符合正态分布或近似正态分布资料的统计描述
统计量:
(一)描述平均水平的常用统计量——算术均数
(二)描述变异水平(离散程度)的常用统计量——离均差平方和(SS)、平均方差(方差:MS)、标准差(SD)
(三)描述抽样误差大小的统计量——标准误(SE)。
SPSS操作:
对某1变量(如time)进行统计描述:
正态性检验:Analyze→nonparametric tests→1-sample K-S→调入某变量和激活Nomal→OK。
正态的统计描述:analyze→descriptive statistics→descriptives→调入某变量,点击option…→点击mean、SE、SD→OK。
分析结果:表descriptive statistics(可看N、min、max、mean、SD);
Z=0.649;P=0.794>0.05.说明time服从近似正态分布。
对某一变量分组进行统计描述(如按男、女分别做time的统计描述):文件分割:data→split file;
注意:计算机有记忆功能,文件分割后需要把它还原,才不会影响后续操作。
统计描述(操作同上):analyze→descriptive statistics→descriptives→调入某变量,点击option…→点击mean、SE、SD→OK。
非正态资料的统计描述
统计量:
(一)描述集中位置——中位数
(二)描述变异水平(离散程度)——四分位数间距=P75-P25。SPSS操作:
对某1变量(红血球体积hct)进行统计描述:
正态性检验(同上):Analyze→nonparametric tests→1-sample K-S→调入某变量和激活Nomal→OK。
非正态的统计描述:analyze→descriptive statistics→frequencies→调入某变量,点击statistics…→点击median和quartiles。
编制频数分布表和绘制频数分布直方图
一、对数据进行重新编码(recod e)
SPSS操作:
统计描述:
Recode:
Transform→recode into different variables…(表示recode后存入新的变量名中,原始数据还在)→调入变量进入“input→output”中,在右侧output框中输入新的变量名,可label→点击change→点击框下的old and new values…→根据手工分组,确定组距后:lowest:1→range→higest:最后一组→OK。
根据手工分组,确定组距:
(1)找出最小值和最大值(统计描述后知道的);
(2)计算全距(range,R) :最大值与最小值之差;
(3)确定组距:相邻两组之间的距离,组距=全距/组段数,通常组段数取8~12组;
(4)确定组段的上、下限:每个组段的起点为下限(lower limit),终点为上限(upper limit)。每个组段均包含组段的下限值,最后一组的组段写出上限值。
(5)列表整理:计算频数、频率、累计频数及累计频率。
(2)Frequencies 过程(制表和制图过程):
Analyze →Descriptive Statistics →Frequencies →调入新的变量→点击Charts→选择Histograms 和With normal curve→Continue →OK→输出结果(frequency table)和(histogram)。如果对图形(histogram)不满意,可双击图形进入图形编辑状态进行调整。
变量间关联和因果关系
常见关联模式
统计学上定量描述两变量的关联时需考虑:
(1)两变量是否真的存在关联。散点图
(2)两变量的关联方向和关联强
度。
相关系数
(3)两变量间的数量依存关系。回归方程和决定系数
(4)两变量的关联关系中是否受到
其他因素的影响和干扰。
慎重考虑
因果关系的确定:
因果确定最直接有效的方法是实验,但是人群研究涉及伦理,实验往往不可行。
运用统计分析方法说明因果关联存在争议,但在满足某些条件时,仍可提示因果关系,如吸烟与肺癌关联的经典例子。
数据关联的探索
例子:
在研究学习努力程度与学习成绩的关联时,这里涉及的两个变量分别为学习努力程度和学习成绩,我们需要考虑几个问题:
(1)学习努力程度与学习成绩是否存在关联,是什么关联方向,关联强度多大。用相关和r定量反映两者之间关系。
SPSS操作
散点图
1. 评价散点图
(1)观察图的总体趋势和明显偏离该趋势的观测单位。
(2)通过散点图的总体趋势来呈现关联的形式、方向和密切程度。
2. 散点图解释
(1)散点呈现线性趋势。
(2)两变量同时增大或减小,即呈正相关。
视觉描述2个定量变量之间关联的形式、方向和密切程度。
正向关联:2变量同增同减,变化趋势相同;
负向关联:2变量一增一减,变化趋势不同;
关联强度:通过散点图中数据点靠近直线趋势的程度来反映。
线性相关(correlation)
定量指标描述2个定量变量关联性的强度和方向。
Pearson直线相关系数:直线相关系数用于衡量2个定量变量之间线性关系的方向和密切程度,通常记作r,对于n个观测单位的x变量和y变量,其均数和标准分别为……,其r=…。
X与y变量各自减去均值再相乘→得2变量关联方向(+/-);
X与y变量各自减去均值再相乘,分母为x与y的标准差相乘→消除x与y各自量纲的影响;
上述值求和再平均→刻画整体趋势,反映整体相关强度。
秩相关系数
rs称为spearman秩相关系数,秩相关系数又称等级相关系数,计算公式表明其含义与直线相关系数完全相同,主要用于描述存在等级变量时或者无法用均数和标准差描述其分布特征时两个变量间关联的程度与方向。
回归直线
描述2个变量之间直线相关强度和方向使用r,描述数量依存关系时使用回归。
回归直线和回归方程
描述反应变量y如何随解释变量x改变而改变的直线称为回归直线(regression line),常用于预测一个给定值条件下的y值大小。刻画