高级心理统计学第1讲
《心理统计学》总复习要点1-7章[4]
《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。
连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。
不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。
是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。
2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。
(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。
这种测量水平的数据特征是有相等单位和绝对零点。
用这种量尺测量得到的数据变量为比率(或等比)变量。
(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。
等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。
但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。
用这种量尺测量得到的数据变量为等距变量。
(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。
用这种量尺对研究对象进行测量,只能给对象排个顺序。
顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。
如有必要的话,只能进行不等式运算。
用这种量尺测量得到的数据变量为顺序变量。
(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。
即无大小之分,也无等级之分。
《心理统计学》课件
介绍心理统计学在不同领域的研究中的实际应用,如认知心理学、社会心理学和发展 心理学。
2
心理统计学在临床研究中的应用
探讨心理统计学在临床心理学研究和评估中的关键应用,如治疗效果评估和抗抑郁药 物疗效分析。
3
心理统计学在教育研究中的应用
讨论心理统计学在教育心理学研究中的应用,如学生表现评估和教育干预效果评估。
《心理统计学》PPT课件
# 心理统计学PPT课件大纲
第一部分:介绍心理统计学
心理统计学是研究心理学数据收集、处理和分析的方法和技术。它是心理学 研究中的重要组成部分,为心理学研究提供了可靠的数据支持。
第二部分:基本概念和方法
变量与数据类型
介绍心理统计学中的变量及其不同的数据类 型,如名义变量、顺序变量和
介绍心理统计学在市场营销调研和消费者行为研究中的关键应用,如市场细分和产品 定价。
第四部分:心理统计学的思考
数据伦理和数据管理
探讨心理统计学中的数据伦理 原则和数据管理措施,确保研 究数据的合理使用和保护。
大数据时代的心理统计学
讨论大数据时代对心理统计学 的影响和挑战,如数据量的增 加和数据分析方法的创新。
心理统计学未来的发展 趋势
展望心理统计学未来的发展方 向,如智能化数据分析和统计 学在人工智能中的应用。
结束语
心理统计学在心理学研究中的重要性不可忽视。建议有兴趣的人学习和研究心理统计学,以提升心理学 研究的质量和可信度。 *字数:243*
参数估计和假设检验
讨论心理统计学中的参数估计和假设检验方 法,包括均值差异检验和相关性检验。
描述性统计分析
解释心理统计学中常用的描述性统计方法, 如平均数、标准差和百分位数。
标准误和置信区间
心理统计学——1绪论讲义.PPT文档共31页
11、用道德的示范来造就一个人,显然比用法律来约束他更有价值。—— 希腊
12、法律是无私的,对谁都一视同仁。在每件事上,她都不徇私情。—— 托马斯
13、公正的法律限制不了好的自由,因为好人不会去做法律不允许的事 情。——弗劳德
14、法律是为了保护无辜而制定的。——爱略特 15、像房子一样,法律和法律都是相互依存的。——伯克
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
31
Байду номын сангаас
▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
心理学高级统计方法 课程
心理学高级统计方法课程心理学高级统计方法是研究心理学领域中各种数据分析技术和方法的课程。
本文将介绍心理学高级统计方法的内容、学习方法和实践应用等方面。
一、课程内容1. 描述性统计1.1 中心趋势测量:均值、中位数和众数1.2 变异程度测量:标准差、方差和范围1.3 分布形态测量:偏度和峰度2. 概率与概率分布2.1 概率的基本概念:样本空间、事件、概率公理等2.2 离散型随机变量与概率分布:二项分布、泊松分布等2.3 连续型随机变量与概率密度函数:正态分布等3. 抽样分布与参数估计3.1 抽样分布的基本概念:中心极限定理等3.2 点估计与区间估计:置信区间、假设检验等4. 假设检验与推断统计4.1 单样本假设检验:均值检验、比例检验等4.2 双样本假设检验:独立样本t检验、配对样本t检验等4.3 方差分析:单因素方差分析、多因素方差分析等5. 相关与回归分析5.1 相关分析:Pearson相关系数、Spearman相关系数等5.2 线性回归分析:简单线性回归、多元线性回归等6. 非参数统计方法6.1 Wilcoxon符号秩检验6.2 Mann-Whitney U检验6.3 Kruskal-Wallis单因素方差分析等二、学习方法1. 系统学习教材和课堂笔记,理解概念和原理。
2. 多做练习题,加深对统计方法的理解和运用能力。
3. 参与讨论和小组活动,与同学们交流心得和疑惑。
4. 利用在线资源或软件进行数据分析实践。
三、实践应用心理学高级统计方法在心理学研究中具有重要的应用价值。
以下是一些实际应用案例:1. 实验设计与数据分析:心理学实验需要合理设计,采集到的数据需要进行适当的统计分析,以验证假设和得出结论。
2. 调查问卷分析:心理学调查研究中,通过统计方法对问卷数据进行分析,了解被试的态度、行为和心理特征等。
3. 临床实践与干预评估:心理学临床实践中,通过统计方法对干预效果进行评估,判断干预措施的有效性。
高级心理统计学教学大纲
《高级心理统计学》课程教学大纲(32学时)
1. 绪论,多元数据的统计描述(3学时)
1.1 高级心理统计概述
1.2 多元数据应用举例
1.3 多元数据的统计描述
1.4 多元数据可视化
2. 多元随机变量与正态分布(3学时)
2.1 多元随机变量
2.2 多元正态分布
2.3 多元数据的t检验
3. 主成分分析(3学时)
3.1 主成分的数学推导
3.2 主成分应用举例
4. 主成分分析进阶(3学时)
4.1 基于核函数的主成分分析
4.2 独立分量分析
4.3 非负矩阵分解
5. 聚类分析(3学时)
5.1 多元距离度量
5.2 层级聚类法
5.3 k均值聚类法
6. 判别分析(3学时)
6.1 距离判别法
6.2 贝叶斯判别法
6.3 Fisher线性判别
7. 典型相关分析(3学时)
7.1 典型相关分析的数学推导
7.2 典型相关分析应用举例
7.3 典型相关与判别分析
8. 多维标度法与对应分析(3学时)
8.1 多维标度法的数学推导
8.2 多维标度法应用距离
8.3 对应分析
9. 多元方差分析与结构方程(4学时)
9.1 多元变量的相互关系
9.2 多元回归模型
9.3 多元方差分析
9.4 结构方程初步
10. 课程总结与学生作业答辩(4学时)。
1-数据清理与准备(高级心理统计PPT刘红云)
(3)诊断数据的缺失机制
对于MCAR缺失机制的诊断方法有:
1. 独立样本t检验 2. Little’s MCAR检验(Little & Rubin, 2002)
上述方法只能证明MCAR假设不成立,却不能证明其成 立。
(4)选择插补方法
如果缺失机制是完全随机缺失(MCAR)
1. 只使用有效数据 2. 使用替换值进行插补
如果异常值不属于总体,就删除 如果异常值可代表总体的一部分,或不确定是否
异常,尽量保留,转换变量降低极端值对分析结 果的影响
3.缺失数据的处理
缺失数据的定义和影响 处理缺失数据的一般步骤
3.1缺失数据的定义及影响
缺失数据是在一个数据集中,由于各种各样 的原因而导致的个案在一个或多个变量上信 息的缺失。
2.1异常值的定义
单变量异常值即在某个变量上的值明显高或者低。 多变量极端值指在两个或多个变量上值的奇怪组
合,使得该观测与其他观测明显不同。
存在一个有影响观测值的散点图
25
20
15
y
10
5
0
0
20
40
60
x
存在一个没有影响观测值的散点图
存在一个没有影响观测值的散点图
2.1异常值的定义
异常值的来源: 1. 过程性错误 2. 异常事件 3. 异常的观测 4. 各变量值正常,组合起来很异常
提纲
1 数据清理和准备的主要目的 2 极端数据的处理 3 缺失数据的处理 4 前提假设条件的检验 5 案例操作
1 数据清理和准备的主要目的
极端值会扭曲分析结果 缺失值在采集数据时很难避免 使用多元统计方法之前,需要确保数据集和前提
01 心理统计学 绪论ppt课件
精品课件
心理与教育统计使我们能以最少的样本 含量,达到我们所需要的精确度,对总体的 有关参数等作出判断,同时又给出发生错误 的可能性大小。它保证了科学研究的精确性、 可靠性和经济性。
精品课件
三、 学习心理与教育统计应注意的事项
注意:
在统计学,测量数据不是绝对精确的,因 此其数值只是表示连续变量的中央点值。也 就是说,一个随机变量是用一个单位的中央 点表示在它以上和以下各有一段距离。
精品课件
3、总体、个体和样本
需要研究的同质对象的全体,称为总体。 每一个具体的研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的 集合称为样本。
精品课件
二次世界大战以后,各种非参 数统计方法、小样本理论都得到发 展和完善,同时多元统计的理论和 方法也得到了广泛的应用,统计学 形成了许多分支应用学科。
精品课件
二、心理与教育统计的产生和发展 心理与教育统计作为数理统计的一门应用 学科,是随着数理统计的发展而发展的。 最初应用统计方法于教育与心理方面研究 的是高尔顿。 对教育统计做出重要贡献的是心理学家斯
R=f(S,O)
[它表示人的心理或行为改变是刺激变量与机 体变量共同作用的结果]
精品课件
1、刺激变量(Stimulus variable) 是来自外部环境的刺激,是研究者感兴趣或
注意到的对被试(subject)心理或行为可能产生影 响的外在条件或因素。
精品课件
2、机体变量(Organism variable)
精品课件
5、统计量和参数
统计指标 统计量 参数
பைடு நூலகம்
平均数
X
心理统计学精髓知识点
第一节正态分布1 正态分布的特点首先,钟形对称分布其次,的概率是95%;的概率是99%;将称为决策水平0。
05上的小概率事件,将称为决策水平0。
01上的小概率事件。
其中,X是总体中的随机抽取的一个数值;μ为总体平均值,第三,曲线两端无限靠近横轴。
2 应用(1)某学校三年级学生的平均智商是100,其标准差为15。
那么,从中随机抽取一个学生,其智商大于等于130的概率是多少?其智商小于等于85的概率是多少?(2)某企业生产的产品重量均值为100,标准差为15。
质检人员从市场上随机抽取一件,发现其重量为115,仅从质量上看,如何用统计学视角来判断此产品是否属于这一企业(决策水平为0。
05).(3)在上题中,如果质检人员从市场上发现一个产品的重量为140,那么,仅从质量上判断,此产品是否属于这一企业(决策水平为0。
01).3 数据处理一让学生报告自己的身高、体重以及自己的肥胖感知(我认为自己很肥胖)、以及自己的性别。
数据处理任务包括:报告三个变量的茎叶图,并大致判断其分布形态;报告三个变量的平均值、中数以及中位数、标准差.第二节标准正态分布将总体的平均值记为μ,标准差记为σ,将其中的数据或个案记为X。
那么,使用公式,就可以将正态分布转化为标准正态分布。
标准正态分布是正态分布的一个特例,因此,第一节的内容皆可以标准正态分布进行直译。
思考题:标准正态分布的标准差是多少?其平均值又是多少?对于标准正态分布而言,为决策水平0.05上的小概率事件,将为决策水平0。
01上的小概率事件思考题:某地三年级学生的身高是一个总体,并且是正态分布,均值为160厘米,标准差为5厘米。
研究者随机抽取一个学生,其身高为170厘米.那么,此生在标准正态分布中的身高数值应该为多少?这次抽到他是一个小概率事件吗?为什么?练习:将“数据处理一”中三个变量转化为标准正态分布,并报告其茎叶图。
第三节样本均值的分布1 存在一个非常数总体,无论其为何种分布.并且此总体平均值μ与标准差σ已知。
浙江大学《高级心理统计课程》概要
学习要求
高级心理统计各种方法的基本原理 高级心理统计各种方法的特征及适用情境 高级心理统计与初等心理统计的差别
➢ 单指标平均数检验与多指标平均数检验 ➢ 方差分析与协方差分析 ➢ 一元线性回归与多元线性回归(检验)
高级心理统计有关方法之间的差别
➢ 多元线性回归与逐步回归、线性回归与曲线回归 ➢ 判别分析与聚类分析 ➢ 主成分分析与因素分析、探索性因素分析与验证性因素分析 ➢ 多元回归分析、路径分析、因素分析与结构方程建模
归、线性回归、聚类分析、因素分析,等) 4、分层线性模型 、logistic回归分析 5、典型相关分析 6、Bayes判别 、多类判别 7、对应分析 8、结构方程模型、AMOS建模与应用
内容提要
第一章:预备知识(1) 第二章:预备知识(2) 第三章:多变量平均数的检验 第四章:协方差分析 第五章:多元线性回归分析 第六章:逐步回归分析
第七章:曲线回归 第八章:路径分析 第九章:判别分析 第十章:聚类分析 第十一章:主成分分析 第十二章:因素分析
作业要求
1、元分析(荟萃分析) 2、调节效应和中介效应) 3、多个多变量(指标)平均数的检验、 SPSS应用(逐步回
《高级心理统计》课程概要
参考书
《高级心里统计》讲义 医学百科全书:医学统计学 于秀林、任雪松:多元统计分析。中国统计出版社 朱建平:应用多元统计分析。科学出版社
目的
了解各种高级心理统计方法的基本原理,掌握它们的 使用特征及适用情境,并能在心理学及相关领域的研 究中熟练应用,为学位论文的研究奠定基础
心理统计学全套课件
答案
组别 组中值 次数(f) 相对 累积 累积相 累积百 次数 次数 对次数 分比
95-99 97
2
.04 50 1.00 100
90-94 92
3
.06 48
.96
96
85-89 87
2
.04 45
.90
90
80-84 82
6
.12 43
.86
86
75-79 77
14 .28 37
.74
74
70-74 72
二项分布的平均数和标准差
• 当二项分布接近于正态分布时,在n次二 项实验中成功事件出现次数的平均数和 标准差分别为: μ=np
•和
npq
做对题数
0 1 2 3 4 5 6 7 8 9 10 总和
二可能项结果分数 布的概应率用
1
0.001
10
0.010
45
0.044
120
0.117
210
0.205
例题
• 某学生从5个试题中任意抽选一题,如 果抽到每一题的概率为1/5,那么抽到 试题1或试题2的概率为多少?
概率的乘法
• A事件出现的概率不影响B事件出现的概 率,这两个事件为独立事件。
• 两个独立事件积的概率,等于这两个事 件概率的乘积。用公式表示为: P(A ·B) = P(A) ·P(B) 其推广形式是 P(A1 ·A2 … An) = P(A1) ·P(A2) … P(An)
四种数据水平
• 称名量表 • 学号、房间号、邮政编码、 号码 • 顺序量表〔等级量表〕 • 名次、等级、五分制得分 • 等距量表 • 温度计读数、百分制得分 • 等比〔比率〕量表 • 长度、时间
心理统计学(一) 第一章 绪论
数,它可以描述一组数据的情况。
参数是指总体的特征值。它是描述一个总
体情况的一些统计指标。
五、参数和统计量
统计指标 统计量
平均数 标准差 相关系数 回归系数
参数
X
μ σ ρ β
S r b
第五节
抽样原理及方法
一、抽样的意义和原则 二、几种重要的随机抽样方法
一、抽样的意义和原则
1.抽样的意义 2.抽样的基本原则
三、心理统计在我国的发展与应用
心理统计学在辛亥革命以后传到我国。当 时心理与教育统计、心理与教育测量都作 为高等、中等师范院校的必修课程,有一 大批专家、学者从事这方面的研究、讲授 工作,出版了不少关于心理与教育统计方 面的译著、专著。
20世纪80年代以后,心理统计学开始复苏。在 二十多年中,我国的心理统计学科在教学、 研究、培养人才等各方面取得了非常丰硕的 成果。 目前,心理统计学的教学和研究进入稳步快 速发展时期。
变量是可以取不同值的量。统计观察的指标 都是具有变异的指标。当我们用一个量表示 这个指标的观察结果时,这个指标是一个变 量。 用来表示随机现象的变量,称为随机变量。 一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随 机变量可以有许多个观测值。
三、总体、样本与个体
需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的 集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本; 而n <30的样本称为小样本。
二、心理科学研究的特点
(一)心理科学研究的目标是通过部分数 据来推测总体特征。 (二)心理科学研究的结果多用数字形式 呈现。 (三)心理科学研究的数据具有随机性、 变异性和规律性。
专题1 高级心理统计概述
学习要求
独学无友 做,然后知不足 将统计方法应用于自己的课题研究中 考核:出勤(20%)+平时练习(20%)+ 考试(60%)
(三)心理统计学的一般概念
1、变量和随机变量 变量:指在数量上或质量上可变的事物 的属性。
随机变量:表示随机现象(在一定条件 下,并不总是出现相同结果的现象称为 随机现象)。
2变量、顺序变量、等距变量、比率变量 因变量、自变量、相关变量、无关变量 连续变量和离散变量
专题1 高级心理统计概述
任课教师:植凤英
统计有用吗?
父亲高儿子一定高
贵阳小孩喜欢吃麦当劳还是肯德基? 一个年薪30万的制片总监,但每天需要加班,
节假日无休息;一个是年薪10万的市场策划, 每天工作8小时,你该如何选择? 赌徒的谬论和仓促的结论 南丁格尔的玫瑰图
赌徒的谬论
甲:我准备可以买车了! 乙:哦,你升职了吗? 甲:没有,但你知道这些年我一直在买彩票。 乙:是的,每次你都买。 甲:但我每次都没有中奖。 乙:那你为什么觉得你这次会中奖呢? 甲:以前都没中过,这次该轮到我了!
3、总体、个体和样本
需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为 样本。
4、统计量与参数 5、常见统计量 集中量数:算术平均数、中数、众数、 加权平均数 差异量数:标准差、方差、全距,四分 位差等
二、高级心理统计学的主要内容
仓促的结论
英格兰的Smith到美国的俄亥俄州某大学 读研究生。他从来没有到过美洲,很多 东西对他来说都很新奇。 有一天,他从 学校礼堂回宿舍时看到了两只松鼠,令 人惊奇的是两只松鼠都是白色的。晚上 email的时候,他把这个发现告诉了他的 父母,他兴奋地写道:“…美国的松鼠 都是白色的…”
心理统计学(全套课件)
心理统计学(全套课件)第一部分:心理统计学导论一、引言心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
二、心理统计学的基本概念1. 变量:在心理学研究中,变量是指可以被测量的特征或属性。
变量可以分为连续变量和离散变量,以及自变量和因变量。
2. 数据:数据是变量的具体值,可以是数值型数据或非数值型数据。
3. 样本与总体:样本是从总体中抽取的一部分个体,而总体是所有可能个体的集合。
4. 随机抽样:随机抽样是从总体中随机抽取样本的过程,以确保样本能够代表总体。
三、描述性统计1. 频数分布:频数分布是描述数据分布情况的一种方法,它显示了每个数值或数值区间出现的次数。
2. 集中趋势:集中趋势是指数据分布的中心位置,常用的指标有均值、中位数和众数。
3. 离散程度:离散程度是指数据分布的分散程度,常用的指标有方差、标准差和变异系数。
四、推断性统计1. 概率与概率分布:概率是描述事件发生可能性大小的数值,概率分布是描述随机变量取值的概率分布情况。
2. 假设检验:假设检验是通过对样本数据进行统计分析,来判断总体参数是否符合某种假设的方法。
3. 参数估计:参数估计是通过对样本数据进行统计分析,来估计总体参数的方法。
五、心理统计学软件1. SPSS:SPSS是一种常用的心理统计学软件,它提供了丰富的数据分析功能,包括描述性统计、推断性统计、数据管理等功能。
2. R语言:R语言是一种开源的统计编程语言,它提供了强大的数据分析功能,包括数据可视化、机器学习等功能。
心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
通过学习本课程,学生将能够掌握心理统计学的基本知识和技能,为今后的心理学研究打下坚实的基础。
心理统计第01章习题解答
1. 名词解释观测值(observation):实验、调查和观测某些个体在某一变量上的具体的数值,即为观测值。
随机变量:某一变量在实验、调查和观测之前,不能预知其数值的变量。
随机变量的特点是:离散性、变异性、规律性。
总体(population)是指具有某一种特征的一类事物的全体;构成总体的每一个基本元素叫个体;在总体中按照一定的规则抽取的部分个体,称为总体的一个样本(sample)。
表示样本的数字特征的量叫统计量。
如描述数据集中趋势的一些统计指标称为平均数;描述一组数据离散程度的统计指标称为标准差。
表示总体的数字特征的量叫参数。
如反应总体集中情况的统计指标称为总体平均数;反应总体离散程度的统计指标称为标准差。
次数:某一随机事件在某一类别中出现的数据多少,亦称频数(frequency)。
频率:某一事件发生的次数与总事件的比率。
概率(probability):某一随机事件在某一总体中出现的比率。
2. 何谓心理与教育统计学?学习它有何意义?心理与教育统计学是专门研究如何搜集、整理、分析在心理教育方面由实验和调查所获得的数据资料,并如何根据这些数字所传递的信息,进行科学推论找出客观规律的一门学科。
它是应用数理统计学的一个分支,是心理与教育研究中的科学工具。
意义:(1)研究心理与教育现象变化的统计规律(2)为心理与教育研究提供科学的依据(3)促进量化研究的发展……3.选用统计方法有哪几个步骤?(1)看实验或调查设计是否合理,即所获的的数据是否适合用统计方法取处理,正确将其数量化;(2)分析实验或调查数据的类型,针对不同的数据类型选用与之相应的统计方法;(3)分析数据的分布规律,看数据是正态分布还是非正态分布以及是大样本数据还是小样本数据。
4.怎样理解总体、样本和个体?总体(population)是指具有某一种特征的一类事物的全体;如研究大学生的心理健康状况,全国的大学生即为总体。
构成总体的每一个基本元素叫个体;如具体的每一个大学生即为个体。
大学优品PPT《高级心理统计》1. SPSS
人口学变量 (Demographic variables) BIRTHY F4.0 出生年份
GENDER
INCOME
A1 性别/ “F” “女” “M” “男“
F6.2 月收入
CLASS F1.0 年级/ 1 ‘一年级’ 2 ‘二年级’ 3 ‘三年级’ 4 ‘四年级’ 自变量 (Independent Variables)
3 倍箱距的点之外的Extreme value需要给予特别注 意,如果是孤立的点,多数情况考虑可以作为缺失 值计算一次,作为有效值计算一次。
数据中不合理取值的认定
涉及对于数据中所有变量取值范围的理解和确定
◦ 如性别只能取值男和女 ◦ 有些心理量表要求答“是”“否”,只能取值0和1 ◦ 如作一个跨文化的大学生被试的研究,在中国样本中年龄 变量中的52取值已经可以认定为不合理取值,而在美国样 本中就应视为有效值。
◦ 只有符合条件时,才会生成新的变量 ◦ 用途:在不同条件时,变量有不同的操作方式
recode
将已有变量重新编码为同一变量或新变量 常见用途:
1. 2.
将反题倒计分 将数据按某一变量大小分为高,中,低组
Recode 命令
Transform Recode Into Same Variables ... Into Different Variables ... 可选择条件性重编码 IF
SPSS9.0 或以下版本可读Excel worksheets, SPSS10.0或以上可读 workbook SPSS9.0或以上可读取 xls4.0 文件
SPSS9.0或以上系统文件可存储成 xls4.0 文件,用Excel 读取。
SPSS Options
Edit -- Options
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高级统计与SPSS应用傅亚强fuyaqiang126@2013年2月前言一、学习本课程的要件1、要有耐心:充分理解课程的复杂性和冗长性,仔细阅读相关书籍;2、要将学习的重点放到:各种统计方法的应用条件(策略性知识-什么数据什么时候用什么方法);3、要将课程学习和自己的课题研究结合起来:只在实际应用中,才能真正领会统计方法与研究方法的内在意义;4、要充分阅读各种参考书;5、要在讨论中发现问题、解决问题。
二、本课程的主要内容简介表1-1 课程框架1兰德尔,J.H.,美国自然主义哲学家,1899-1982。
三、课程学习总目标1、准确掌握各种统计方法的应用条件2、熟练掌握SPSS的各项统计功能,以及数据的分析Excel3、能将上述知识应用到科研实践中去四、心理学研究的特征1.随机性:没有一个人能两次跨进同一条河。
多次测量大样本2.模糊性:短时记忆容量有限;超长儿童比较自信。
3.条件性:早期经验对儿童发展的影响,不会单独起作用。
4.逻辑性:找到现象或特征之间有意义的本质的内在联系。
如压力、期望、能力、自我评价和焦虑之间的关系。
(离散变量连续变量)5.交互性:影响人的行为的因素是十分复杂的,一种因素在影响人的行为时,这种影响力会受到其它因素的影响。
变量之间的关系要考虑清楚6.复杂性:排除其它解释的高难度性质。
多指标考核,控制好额外变量(1)比较A、B、C、D4种飞机降落显示格式的使用效率。
(Ponomarenko, 1998; Bedny, 2004)图1-1 战斗机座舱下视显示画面(2)最初的几次试验中,A最优,BCD较差(3)但是后面的试验中,BCD的成绩显著上升,而A的成绩保持最初水平(4)研究者下结论,A界面不可接受(5)被试访谈中出现意外,他们认为A最好用,BCD使用起来比较困难,但他们认为这项研究的目的在于考察他们在困难任务中的飞行能力。
而且他们认为BDC最难,只有BCD 才能显示他的能力,所以在后面的试验中,他们努力在BCD条件下准确完成任务。
(6)如果以作业绩效为指标,A可能比不过BCD,但是以心理负荷为指标,A就会显示出优势。
(避免自变量发生混淆可以将实验顺序打乱作业绩效过程指标添加生理指标)第一讲高级心理统计学的基本概念一、变量1、变量:指在数量上或质量上可变的事物的属性。
2、变量的水平:变量的取值。
3、实验中的几种变量✧自变量:实验者所操纵的,对被试反应产生影响的变量、原因。
✧因变量:由操纵自变量而引起的被试者的某种特定反应。
✧相关变量:凡是对因变量产生的影响的变量。
✧额外变量:某一实验中不用于研究的那些相关变量。
4、变量的随机性5、中介变量(分析中介变量逻辑分析过程中介变量往往是引发事情的原因)考虑自变量X对因变量Y的影响,如果X通过影响变量M来影响Y,则称M为中介变量。
图1-2 中介变量两例【讨论】●性别和网络成瘾之间是什么中介变量呢?忽视自变量与因变量间潜在变量的影响,可能会扭曲自变量和因变量的关系。
考虑一个学会感判断( judgment of learning,JOL) 的准确性和学习成绩关系的例子。
一般认为元认知监控对学习者的学习具有重要作用,然而很多研究却发现,JOL 的准确性与学习成绩间的关系并不是想象的那么直接明朗,甚至得出了相反的结论,为什么会如此?K. W. Thiede(2003) 在对以往研究进行分析与梳理的基础上,通过实证研究解答了这一疑问:以往研究之所以不能确切描述JOL 准确性和学业成绩关系的原因是因为以往研究没有检视学习者的自我调控学习行为在JOL 准确性和学习效果间的作用,也即忽视了一个重要的潜在变量。
(陈启山, 2006, <心理学研究中应用统计方法应注意的几个问题>)二、心理学研究数据的性质从数学的角度来研究社会和自然现象可以把这些现象分为以下三类:(科学研究的三种)(1)确定现象:事前可预言的现象,即在准确地重复某些条件下,它的结果总是肯定的。
如:在一个标准大气压下给水加热到100℃便会沸腾。
比如质量守恒定律、牛顿定律反映就是这类现象。
研究这类现象的数学工具有数学分析、几何、代数、微分方程等。
(2)随机现象:事前不可预言的现象,即在相同条件下重复进行试验,每次结果未必相同,或知道事物过去的状况,但未来的发展却不能完全肯定。
如:以同样的方式抛置硬币却可能出现正面向上也可能出现反面向上;走到某十字路口时,可能正好是红灯,也可能正好是绿灯。
研究这类现象的数学工具是概率论和统计。
(3)模糊现象:事物本身的含义不确定的现象。
如:“情绪稳定”与“情绪不稳定”,“健康”与“不健康”,“年青”与“年老”。
研究这类现象的数学工具是模糊数学。
确定性现象与随机现象的共同特点是事物本身的含义确定;随机现象与模糊现象的共同特点是不确定性,随机现象中是指事件的结果不确定,而模糊现象中是指事物本身的定义不确定。
概率论与统计学将数学的应用从必然现象扩大到随机现象的领域,模糊数学则将数学的应用范围从清晰确定扩大到模糊现象的领域。
客观世界作用于事物各个个体的因素分为基本因素和次要因素两类,基本因素决定事物的必然规律,次要因素使事物呈现统计规律。
人们所能认识而且能够控制的因素是基本因素,而大量的次要因素未能为人们所认识或未能被人们所控制,但只要存在次要因素的影响,就必然会有所表现。
比如发射炮弹,其基本因素也是人们所能控制的是它的初始条件--初速、发射角等,这些可以通过弹道方程(必然规律)计算出炮弹的落地点,但炮弹在飞行过程中会受到空气的阻力--风速、风向、空气的湿度、温度等的影响,它们使得炮弹不能落在它的准确的目的地。
科学研究的目的,就是要发现反映事物本质的客观规律,即排除偶然性的掩盖与干扰,为此必须首先认识偶然性。
于是统计学应运而生,统计学不是直接研究事物本质的必然规律,而是通过随机现象来发现事物的统计规律,并把它应用于对客观规律的认识和把握。
【讨论】●心理学研究中遇到的变量是确定的、随机的,还是模糊的?●为什么心理学中的现象可以用概率统计方法进行分析?实验中一般会给变量及结果(水平)下操作定义●为了更接近随机数据的要求,心理学研究在采集数据时应特别注意哪些关键点?操作定义信效度实验变量的操纵实验数据是否符合或接近某种概率分布●心理学研究同其他学科一样,都是为了建立现象间的因果关系,那么统计结论在因果关系构建中的作用是怎样的?即如何看待统计结果在构建因果关系中的作用?作用微弱(无法直接验证因果关系提供证据)额外变量的控制效果自变量的操纵是否合理因变量的测量是否合理三、量化研究设计的比较1、主要目的调查法相关法实验法由样本推论总体对于总体的描述与解释探讨变量间关系建立系统知识探讨因果关系建立系统知识2、样本特性调查法相关法实验法大样本总体代表性中型样本分层抽样小样本随机样本、随机分配3、研究工具调查法相关法实验法结构化问卷标准化测验或量表实验设备与软件4、研究程序调查法相关法实验法抽样与调查抽样理论测验理论与技术测验编制与实施实验设计实验操纵5、测量尺度调查法相关法实验法类别变量为主连续变量为主类别自变量连续因变量6、统计分析调查法相关法实验法次数分布卡方检验非参数统计相关分析回归分析因素分析平均数差异检验方差分析协方差分析四、统计学的基本概念(一)随机变量与误差1、随机:事件发生的结果不可预知2、机率:事件发生的可能程度3、误差:测量结果与变量的真值之间、数学函数与测量结果之间均存在一定的差异。
4、统计模型的目的不在消除或减少误差,而是希望对误差函数的行为有所了解,即尽可能地去解释误差发生的原因。
(二)数据的种类1、点计数据:如人数,班级数,男女数等。
2、度量数据:借助于一定的测量工具或一定的测量标准而获得的。
(1)比率数据:有绝对零点和等距单位,如身高、体重,反应时,感觉阈值等,差、倍数有意义。
(从零点定义的角度来理解)(2)等距数据:有等距单位,但无绝对零点,如温度,各种能力测验分数等,倍数无意义,只有差数才有意义。
(3)顺序数据:既无相等单位,也无绝对零点,如评定等级,喜爱等级,品质等级等,成绩名次等。
3、称名数据:反映事物在组别、种类上的不同。
不说明事物之间的数量差异,中按事物的性质不同,将被观测事物加以划分。
如:令男为1、女为0;令实验组为1,控制组为2。
表1-2 称名变量【讨论】常用的统计方法与数据测量水平是否匹配?(三)总体、样本和个体1、总体:具有某种特性的一类研究对象的全体。
2、个体:构成总体的每一个基本元素。
个体不一定是人或物,也可指心理活动,即指某种实验条件下的某一反应,或指每一个实验结果、每一个实验数据等,例如反应时间、推理能力、学习方法等。
故又称为随机事件或样本点,相应地,总体又称为样本空间。
3、样本:从总体中抽取的作为观察对象的一部分个体。
总体的性质是由组成总体的各个体的性质而定,所以要了解总体的性质,必须对每一个个体进行观测,这是最好的办法,但是实际上这是做不到的,也没必要做到。
在心理研究及应用中,一般通过对样本的观察测量来达到对总体进行研究的目的。
4、样本容量:样本中所包含的个体数目,用N或n表示。
样本越大,越能代表总体,因此,样本容量不同,统计方法也不一样。
5、有限总体和无限总体。
总体本身的大小,有限还是无限,这要依据所研究的问题的推理范围而定,同时总体与样本也可以互相转换变化。
【讨论】●抽样调查中得到的样本常常是有偏样本和小样本,是否有问题?●如何减少这些问题对因果推论的负面影响?●中心极限定理对取样的启示。
利用样本统计量对总体参数进行估计时的误差主要是偏差(bias) 和变异(variability) 。
可以采用以下手段以减少这些误差:(1) 尽量使用随机样本。
说来非常简单, 但在现实世界中, 简单随机样本一点也不简单;(2) 样本要足够大。
抽样调查的取样缺陷是任何统计方法也无法事后弥补的,所以,在面对调查结果及相信它之前应该思考以下几个问题:(1) 谁做的调查?(2) 调查的总体是什么?(3) 样本是怎样选取的?(4)样本有多大?(5) 用什么方式联络被试获得的数据?(6) 调查的回应率是多少?七、统计方法选择的基本依据1、研究目的(1)描述性课题:描述统计,因素分析,聚类分析(2)因素型实验:总体平均数差异检验,方差分析,非参数检验(3)函数型实验:相关分析,回归分析,路径分析(4)减少数据维度:因素分析(5)被试或样品分类:聚类分析,判别分析2、数据的测量层次(1)计数数据:百分比,列联相关,χ2检验(2)等级数据:中数,百分位数,等级相关,非参数检验(3)等距变量:算术平均数,标准差,积差相关,t检验,Z检验,F检验,方差分析,回归分析3、概率分布类型图1-3 数据分布(1)正态分布:参数方差分析,回归分析,因素分析(2)非正态分布:非参数分析4、研究设计(1)样本数目●小样本(N<30):非参数检验●大样本(N>30):参数检验(2)自变量水平的数量●2个水平:平均数假设检验●2个水平以上:方差分析(3)自变量的数目●单一自变量:单因素方差分析●多自变量:多因素方差分析,多元回归分析,(4)因变量的数目●单一因变量●多因变量:路径分析(5)研究设计类型●完全随机设计:独立样本t检验●重复测量设计:相关样本t检验八、心理研究的数据统计分析步骤图1-4 假设检验的过程图1-5 方差分析的方法选择过程【参考书目】●王重鸣,心理学研究方法,人民教育出版社。