统计方法及案例spss实现

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1)等间隔侧度的变量x与y之 间的相关系数用Pearson:
n
( Xi X )(Yi Y )
R
i 1
n
n
( X i X )2 (Yi Y )2
i 1
i 1
相关分析-概念(2)
(2)对秩数据,Spearman相关系数 为:
n
(Ri R)(Si S)
i1 n (Ri R)2 (Si S)2 i 1
其中R(i)是第I个X值的秩,S(I) 是第I个Y值的秩。
相关系数无量纲,其值在-1到 +1之间。绝对值越大,相关性 越强。
相关分析-相关系数检验
由于抽样误差的存在,样 本中相关系数不为0,不 能说明总体中两个变量的 相关系数不是0。因此, 必须经过检验。
检验的零假设是:总体中 两个变量的相关系数为0。
是肺活量于身高、体重的
因为第三个变量的作用, 使相关系数不能真正反映 两个变量间的线性程度。 偏相关分析的任务是在分 析两个变量间的相关性时,
相关系数均在0.6以上。但 常识告诉我们:肺活量于 身高的关系不大,主要受 体重影响。
尽可能控制其他变量的影 偏相关分析的结果是:肺
响。
活量于身高几乎无关。
受教育水平、工作经验、
离散变量必须使用等级相
职务等级之间是否存在线 性关系(p190)。
关性分析(例2)。
例2:10名学生两门课程 成绩的排列名次(data1003),求等级相关系数,检验 其显著性(p192)。
偏相关性分析
概念:相关分析计算两个 Pearson相关分析的结果
变量的相关系数时,往往
例:29名13岁男生的体重、身高、肺活量数据,分析身 高大于155cm与身高小于155cm的体重、身高有无显著差 异。(data10-04) (连续变量)
检验过程及结论。
均值比较与检验-配对样本T检验
要求两个样本有配对关系,来自正态总体。 用来检验配对变量的均值之间是否有显著差异。 规则:Sig如果小于给定的α,则认为有显著差异。 例题:10个高血压患者在施行体育疗法前后测定的舒张压。
检验过程演示。 结果:P=0.85>0.05,故可认为遵守泊松分布。
非参数检验--两个独立样本检验
用途:检验两个独立的样本是否来自同一个总体。 例题:设有甲、乙两种安眠药,比较它们的治疗
效果。独立观察20个患者,其中10人服用甲药, 10人服用乙药,演唱的岁面时数见data16-06.问 题:两种药物的疗效是否有显著差异? 就是检验这两个独立样本是否具有相同的分布 检验过程演示 结论
非参数检验--多个独立样本检验
检验多个独立样本是否有相同的总体分布。 例题:某车间用4种不同的操作方法个作若干批实
验,实验中优等品率数据见data16-07,试问操作 方法对优等品率是否有显著影响。 检验过程演示(原假设是:没有显著影响)。 结论:Kruskal-Wallis法中,检验的p-值为0.009 小于0.05,拒绝原假设,即认为不同的操作方法对 优等品旅游显著影响。
非参数检验--多个相关样本检验
检验多个相关样本是否有相同的总体分布(test for several related sample).
例题:某商店想了解顾客对几种不同款式的衬衣 的喜爱程度,某日随机地询问了9名顾客,请他们 对3种款式进行排序(最喜爱1,其次2,再次3), 数据data16-09.
常见的统计分析方法完全可以通过“菜单”、“对话框” 的操作完成。用户只要懂得统计分析原理,无需通晓统计 分析的各总算法,就可使用它完成统计分析。
与其它软件有数据转换接口,可直接读取dbf,txt及execl文 件。
分析方法丰富,而且有很强的图表生成、编辑能力。
统计数据测量水平
Steven(1946)提出将数据测量水平分为4个等级. 标称测量或名义测量(Nominal Measurement):其数值仅用
非参数检验--两个相关样本检验
在实际研究工作中,经常会遇到从同一个对象上 测试2个或多个观测值的情况,这样的数据间不再 独立,在此种情况下,检验样本是否具有相同的 分布,要用两个相关样本检验(test for two related sample)。
例题:研究长跑队增强高校学生的新功能的效果, 对某院15名男生进行实验,经过3个月的长跑后, 观察其晨脉是否减少。锻炼前后的数据见data1608,问锻炼前后是否有显著差异?
(1)奇异值 (2)影响点 (3) 错误数据
观察数据的分布特征。
(1)是否为正态分布 (2)方差 齐性
对数据规律的初步观察
假设检验
正态分布检验
(1)Q—Q图 (2)Lillifors 统计量:当Sig<0.05时, 拒绝正态分布假设。
方差齐性检验
(1)Spread vs level图 (2)Levene统计量: 当Sig<0.05时,拒绝方 差齐性的假设。
统计方法及案例
主要介绍统计方法,包括:
▪ 基本统计分析 ▪ 相关分析 ▪ 正态总体的均值的比较检验 ▪ 非参数检验
Spss简介
Spss(statistics Package for Social science) for windows 是在windows系统下运行的社会科学统计软件包,时目前 世界上流行的三大统计分析软件之一。
基本统计分析-描述统计分析
描述统计分析计算样本的平均值、标准差、最大 值、最小值、方差、范围和平均标准误差,可得 到样本的基本情况描述。
例题:1985年美国联邦调查局50个州各种犯罪资 料。数据编号:data09-02(p156)
结果分析
基本统计分析-探索分析(1)
考察数据
检查数据是否有误。
非参数检验--单样本柯尔莫哥洛夫-斯 米诺夫检验
One-sample Kollmogorov-Smirnov test 用来检验 样本是否来自同一个总体的假设。
例题 卢瑟福作了一个著名的试验,观察了每7.5 秒的时间间隔里到达某个计数器的某放射物质发 出的α质点数,共观察了2608次,数据见data-1606,是否源自文库守Poisson分布
例题:身高、体重、肺活 量之间的关系(data10-04)
非参数检验-卡方检验
许多分析都假定总体服从正态分布,但某个随机 变量是否服从特定的分布式需要进行检验的。卡 方检验(Chi-square test)用来检验总体是否为某 种给定分布。
例题1:掷一颗六面体300次,结果见data16-01, 这个六面体是否均匀。
例题
某银行474名雇员数据。 编号:data09-03(p162)
分析过程及结论。
均值的比较与检验-单样本T检验
One-Sample T Test 检验样本的均值与给定值之间是否有 显著差异。
规则:如果统计量T的p值(Sig)小于给定的显著性水平, 则拒绝无差异的假设。
例:已知某地区12岁男孩的平均身高为142.3cm.在某市测 量了120名12岁男孩身高资料,数据编号:data11-02. 该 市男孩的平均身高是否与该地区显著不同(p222)。
统计量是: t
n 2 *r
1 r2
拒绝域:假设成立的p值 小于0.05,即Sig<0.05时, 拒绝零假设,得出两个变 量相关系数不为0的结论。
相关分析-两个变量相关分析
例1:银行雇员数据
注意:等间隔测度的连续
(data09-03),要求分析起始 变量,用Pearson相关分
工资,现工资与雇员年龄、 析(例1),对于完全等级的
要求判断体育疗法对降低血压是否有效。数据编号: data11-03. 例题:12名排球运动员用心方法进行训练,训练前后分别 测定六项技术指标。分析新方法对这六项技术的提高是否 有效。(data11-04). 检验过程及结果。
相关分析-概念
线性相关分析研究两个变量线 性关系的程度。统计量R被称作 相关系数,其公式为:
于命名某些分类或属性。唯一能进行的统计处理就是统计 每个值的频数。定类数据。 次序测量(Ordinal measurement):其数值表示某个分类的 递进性质。个体可以根据该量进行排序。定序数据。 区间测量(Interval Measurement):表示两个数据之间的 距离,但没有绝对的零点。如摄氏20度不是10度的两倍。 定距数据。 比例测量(Ratio Measurement):是测量的最高水平,包括 以绝对零点。定比数据。
检验过程及结论。
均值的比较与检验-独立样本T检验
独立样本的T检验比较两个独立样本的均值之间是否有显 著差异。
规则:如果统计量T的p值(Sig)小于给定的显著性水平, 则拒绝无差异的假设。
例:某银行男女雇员的现工资资料,数据编号:dadt09-03, 检验男女雇员现工资由无显著差异。(分类变量)
检验过程演示。 结论。
非参数检验-列联表分析
列联表分析用来判断两个名义变量是相互独立, 还是相互关联的。
例题1:1991年美国社会调查数据,data0901,p171
例题2:某公司男经理和女经理的薪水是否平等, 共调查了15个经理,不知道他们具体的薪水是多 少,但知道是多还是少。(样本较小,用Fisher 精确检验法)。Data09-04.
相关文档
最新文档