心理学研究数据类型与统计方法——谈函数型数据分析的引入

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 时间序列数据的分析方法
心理研究常需作追踪研究。比如, 在发展心 理学中研究儿童语言能力的发展, 究竟是哪一个 年龄(岁)的某月份是孩子语言发展最迅速的时间 段, 是否有语言学习年龄期间最优期, 类似的研 究还包括记忆能力、数学能力等。这些都需要心 理研究者在固定的等距月份, 比如, 每个月对儿 童的语言能力发展情况进行测试、记录, 这时在 每个月就可以得到所有被试儿童的一组截面数 据。单一的截面数据并不能反映儿童的发展趋势, 多个截面数据则组成了时间序列数据, 即对同一 对象在一系列按时间序列排列的观测点上所得 到的数据, 时间序列数据也是一维数据。将多个 截面数据反映的心理变化、学习能力等连接在一 起, 进而研究这些心理现象发生发展的内部动力 机制, 找出它们发展的内部规律, 这就是纵向研 究。从心理学应用纵向研究方法的进展来看, 逐 渐由以往的只注重总体平均趋势的发展过渡到 既考虑总体平均趋势又注重个体发展差异的系 统分析的问题。但是时间序列数据收集困难, 更 为考验研究者的毅力及忍耐力。如果严格按照随 机取样的方法及长时间的跟踪分析, 无疑时间序 列数据的分析结果将比截面数据的结果更具说 服力。
摘 要 心理学研究数据大致分为截面数据、时间序列数据和面板数据, 三种数据类型的分析方法及 使用前提因数据属性不同而有所不同。心理学截面数据的统计方法过于依赖模型的线性结构和假设条 件等, 在处理心理学面板数据中难以充分发挥统计方法的功用。函数型数据分析方法主要适用于面板 数据处理, 特别适宜 ERP、fMRI、发展心理等心理实验中存在时间序列的面板数据的统计分析, 为心 理学研究提供了有力的新工具。 关键词 心理研究方法; 截面数据; 时间序列数据; 面板数据; 函数型数据分析 分类号 B841.2
心理研究中的截面数据分析方法基本上都
1314
第 18 卷第 8 期
心理学研究数据类型与统计方法——谈函数型数据分析的引入
-1315-
是采用我们熟知的统计方法:描述统计、推断统 计以及多元统计方法, 这是现阶段心理研究中应 用比较广泛的统计方法。国内有学者通过调查、 分析近 11 年(1998~2008)国内最具代表性的两种 杂志《心理学报》、《心理科学》中应用了统计方 法所发表的论文或研究报告发现, 两种杂志发表 的论文较多地使用了简单的描述及推断统计方 法, 各年份均占总方法数的 80%及以上, 而较为 复杂的多元统计方法的使用比例相对较少(焦璨, 2009)。不同的统计方法有不同的应用假设前提条 件, 当所应用的统计方法前提条件没有得到适当 的满足时, 统计分析的结果可能会被“扭曲”。传 统的描述统计、推断统计方法、多元统计方法虽 然倍受心理研究者的青睐, 但是这些方法在应用 中最主要的问题是:在前提条件不满足的情况下, 由部分推知全体, “显著性差异”的实验结果可能 只限于当前样本有效, 而不具备可重复性。同时, 这些方法应用的前提条件是强假设, 如正态性、 独立性等, 在许多情形下难以全部满足。而未能 满足假设前提时, “显著性差异”可能来自分布的 影响(焦璨, 2009)。心理学文献中, 很多的研究只 是呈现结果是否差异显著, 研究者常常因为“显 著性差异”而欢喜。所以, 该项研究指出《心理科 学》、《心理学报》两种杂志近 11 年来的文章对应 用统计方法的前提条件进行检验的仅占 3%。由 于长期以来的惯性使用, 目前心理学发表的研究 论文, 绝大部分文章都没有向读者提供实验中使 用假设检验方法时应有的其他重要信息(如前提 条件检验、效果量等)。因此, 这些常用的统计分 析方法的应用还有很大的改进空间。 2.2 截面数据分析方法的进展
结构方程模型是回归分析、路径分析的拓展 与延伸, 是在已有的回归分析等理论基础之上, 用线性方程系统表示该理论的一种统计分析方 法。结构方程引入心理学研究中, 使心理研究在
多个因素多个水平的研究中, 不仅可以知道差异 的显著性, 还可以分析得到自变量从哪一个方 向、以何种程度对因变量产生了影响以及测量误 差的大小。结构方程模型属于一种理论驱动模型, 是一种从统计的角度建构理论模型的参数化研 究方法。但理论驱动模型有其局限性, 包括难于 合并交互影响和进行非线性分析, 不能处理定性 数据和缺失数据, 尤其是很难满足其对多元正态 的要求。如果没有量化的变量, 无法应用。但目 前很少有文章对这些问题进行研究和分析(赵海 峰, 万迪窻, 2003)。贾新明和刘亮(2008)亦指出结 构方程模型虽然直接处理测量误差, 但是再优良 的结构方程模型也难以弥补研究设计方面的误 差, 比如调查问卷设计、抽样和调查等方面的误 差。近年来, 结构方程模型在心理学领域的应用, 为许多心理研究提供了实证的方法, 获得了较多 的研究成果。但是任何方法都会有不足之处, 进 一步的发展和完善结构方程在心理研究中的应 用是一个努力的方向。
在总体同质的情形下, 多层线性模型和潜变 量增长曲线模型为解决时间序列数据提供了有 效的方法。但是如果所研究的总体本身不同质, 就需要一种能够描述总体中不同质子总体的不 同发展特点的方法。为了满足这一实际需要, 近 年来一种被称之为潜变量混合增长模型的分析 技术应运而生, 潜变量混合增长模型为分析个体 之间发展变化的差异提供了更加合理有效的工 具, 尤其是在探索总体中是否有不同潜在变化类 别存在的情百度文库下, 具有一般追踪研究方法无法比 拟的优势(刘红云, 2007)。
-1316-
心理科学进展
2010 年
3.1 时间序列数据统计分析方法述评 重复测量方差分析、多元回归分析和时间序
列分析是处理时间序列数据的方法, 主要是解决 总体平均发展趋势的问题。重复测量方差分析和 多元回归分析都是以方差齐性和随机误差独立 性为前提假设, 并且重复测量方差分析不能处理 依时间变化的协变量对因变量的影响(刘红云, 孟庆茂, 2003)。
心理科学进展 2010, Vol. 18, No. 8, 1314–1320 Advances in Psychological Science
心理学研究数据类型与统计方法 ——谈函数型数据分析的引入
焦 璨 1,2 熊敏平 1 张敏强 1
(1 华南师范大学心理应用研究中心, 广州 510631) (2 深圳大学师范学院心理学系, 深圳 518000)
近年发展的多层线性模型、潜变量增长模 型、潜变量混合增长模型是时间序列数据分析常 用的方法。这些方法除了能对总体平均增长趋势 进行分析外, 同时注重个体发展趋势之间的差异 (刘红云, 2007)。
多层线性模型是用于分析具有嵌套结构特 点数据的一种统计分析技术, 近年来在教育、管 理等领域有相当广泛的应用。与传统统计技术相 比, 多层线性模型具有以下优势:不需要方差齐 性和随机误差独立性为前提假设; 允许缺失值的 存在; 允许不同时间间隔; 允许研究者在不同层 面提出不同假设(盖笑松, 张向葵, 2005)。葛建军 (2004)亦 分 析 了 中 国 目 前 对 分 层 数 据 研 究 的 现 状:研究者不能分清问题的数据是不是分层的结 构; 研究中要求样本中的层次分明且要获取每一 层的样本, 增加了心理研究的难度。经费开支增 大, 以致齐全的分层数据不易获得; 多层线性模
心理与教育实验研究的目的是探讨因变量 与自变量之间的关系。在研究变量之间的关系时, 相关、回归分析和路径分析等是常用的统计方法, 但是使用这些方法时, 常难以保证数据的测量误 差很小或者没有误差。因此, 20 世纪 70 年代, 心 理研究方法引入了结构方程模型, 至 20 世纪 90 年代, 该方法在心理学研究中得到了越来越广泛 的应用。
型分析结果与现实大相径庭等。由此可见, 多层 线性模型有优点也有缺点, 心理研究者在纵向研 究中可以充分利用多层线性模型的优势, 提高纵 向研究的质量。同时, 还要注意多层线性模型存 在的不足, 慎重对待其研究结果。
潜变量增长曲线模型适用于在某几个固定 时间点上观测得到的纵向研究数据, 是基于协方 差结构模型的理论。潜变量增长曲线模型需要非 常大的样本容量, 而且要求所有个体的测试时间 间隔相同, 如果个体的变化随时间变化趋势不是 很明显, 则与传统方法相比没有明显趋势(刘红 云等(人), 2003)。
2 截面数据的分析方法
在心理实验中, 实验组的结果往往需要与控 制组或对照组进行比较, 才能揭示自变量的效 果。这种数据在心理学中尤为常见。截面数据也 称 横 截 面 数 据 (Charach, Cao, Schachar, & To, 2006)是指在某一固定时间点上收集到得 N 个不 同对象的数据, 但它是一维数据。 2.1 截面数据分析方法述评
时间序列分析能比较个体间心理特征发生 发展的趋势, 确定动态变化变量间的因果关系, 还可以实现对人类心理和行为的预测和控制。由 于心理学的研究对象是内隐的, 且会随着时间发 生变化, 因此, 基于小样本理论的时间序列分析 在心理学研究中应该有其用武之地。时间序列分 析的方法引入到心理学领域始于 20 世纪末, 主 要用于心理动力学、管理心理学、社会及家庭心 理、心理治疗的时间序列数据分析中。目前, 研 究方法工作者还尝试将其用到神经网络学习过 程、功能磁共振成像、认知心理学等领域。时间 序列分析的方法在心理学研究中的应用所涉及 的领域日趋广泛, 内容也越来越丰富, 推动了心 理学各种理论和研究方法的发展。但是由于时间 序列分析的数学要求较高, 需要长时间坚持不懈 的施测和记录, 对于习惯单个研究或者单个实验 的研究者而言, 操作甚是不便, 也是一种挑战。 3.2 时间序列数据统计分析方法的进展
1 引言
对心理学而言, 研究方法特别是统计技术的 进步, 能够在更深入、更广泛的层面上对心理研 究所获得的数据资料做进一步的挖掘, 从而让研 究者能够更加深入、客观地了解研究对象的本质 及变化过程, 进而起到推动整个学科发展的作 用。心理学的研究对象常常是某一特定的群体、 个体的一些心理特征。显然, 要从群体或个体中 总结或归纳出某些心理特征, 除了要做好实验设 计, 恰当地应用调查、测量方法外, 用不同的方 法对数据作分析, 也会得到不同深度的结果。由 于心理研究中各种数据的获取, 大多数是用间接 测量的方法, 因而, 心理研究的量化水平相对于 数学、物理等自然科学而言较低, 因而凸显了统 计方法在心理研究中的应用的重要性。应该说, 统计理论与方法本身也是在心理学研究需要的 推动下不断发展的, 从传统的推断统计方法到因 素分析、多元回归分析、路径分析, 再到结构方 程模型、多层线性模型、以及本文讨论的函数型 数据分析(Functional Data Analysis, FDA), 其每 一阶段的发展无不反映出心理学研究需要推动 的烙印。
收稿日期:2009-12-28 * 广东省自然科学基金(9151063101000002)、教育部人文
社科基地重点项目(2009JJDXLX006)、广东省哲学社会 科学“十一五”规划课题(09sxlq001)的资助。 通讯作者:张敏强, E-mail:zhangmq1117@yahoo.com.cn
显然, 在计算方法、计算速度已得到充分发 展的今天, 统计方法因为计算繁杂的困难已经不 再是方法应用的障碍。而心理科学的发展, 则对 方法的应用提出了更高的要求, 要求方法应更为 细致地刻画研究事物的本质。比如, 发展心理学 研 究 中 不 同 阶 段 的 各 种 测 试 数 据 、 ERP 、 fMRI 实验中不同刺激或激活的表现或变化等等, 都迫 切需要寻求新一代的数据分析或统计分析方法、 提升或改进传统的统计分析方法, 以满足研究的 需要。本文拟从计量数据类型的分类(白仲林, 2007)为介入点, 将心理学研究数据分为截面数 据 (Cross-sectional Data) 、 时 间 序 列 数 据 (Time-series Data)和面板数据(Panel data), 根据 不同的数据类型分别介绍相对应的数据分析方 法并作出述评, 重点介绍函数型数据分析在心理 研究中的应用、发展的可能性、必要性及其数理 基础。
相关文档
最新文档