心理统计学-课程讲义5

合集下载

《心理统计学》课件

《心理统计学》课件

介绍心理统计学在不同领域的研究中的实际应用,如认知心理学、社会心理学和发展 心理学。
2
心理统计学在临床研究中的应用
探讨心理统计学在临床心理学研究和评估中的关键应用,如治疗效果评估和抗抑郁药 物疗效分析。
3
心理统计学在教育研究中的应用
讨论心理统计学在教育心理学研究中的应用,如学生表现评估和教育干预效果评估。
《心理统计学》PPT课件
# 心理统计学PPT课件大纲
第一部分:介绍心理统计学
心理统计学是研究心理学数据收集、处理和分析的方法和技术。它是心理学 研究中的重要组成部分,为心理学研究提供了可靠的数据支持。
第二部分:基本概念和方法
变量与数据类型
介绍心理统计学中的变量及其不同的数据类 型,如名义变量、顺序变量和
介绍心理统计学在市场营销调研和消费者行为研究中的关键应用,如市场细分和产品 定价。
第四部分:心理统计学的思考
数据伦理和数据管理
探讨心理统计学中的数据伦理 原则和数据管理措施,确保研 究数据的合理使用和保护。
大数据时代的心理统计学
讨论大数据时代对心理统计学 的影响和挑战,如数据量的增 加和数据分析方法的创新。
心理统计学未来的发展 趋势
展望心理统计学未来的发展方 向,如智能化数据分析和统计 学在人工智能中的应用。
结束语
心理统计学在心理学研究中的重要性不可忽视。建议有兴趣的人学习和研究心理统计学,以提升心理学 研究的质量和可信度。 *字数:243*
参数估计和假设检验
讨论心理统计学中的参数估计和假设检验方 法,包括均值差异检验和相关性检验。
描述性统计分析
解释心理统计学中常用的描述性统计方法, 如平均数、标准差和百分位数。
标准误和置信区间

现代心理与教育统计学PPT课件

现代心理与教育统计学PPT课件
• 统计表和统计图是对数据进行初步整理, 以简化形式加以表现的两种最简单的方式。
• 对数据进行统计分类以后,得到的各种数 量结果称为统计指标。
• 把统计指标和被说明的事物之间的关系用 表格的形式表示就称为统计表。
• 统计表具有简明、清晰、准确的特点,表 中的数据易于比较分析。
• 统计图是依据数字资料,应用点、线、画、 面、体、色等描绘制成,简明而又有规律, 并且能显示数量的图形,它是统计数据资 料的可视化显示方式。
• 顺序数据,是按照事物的某种属性,对一 系列事物进行排序后所获得的数据。
• 等距数据,是有相同单位,但是没有绝对 零点的数据。
• 例如,温度、智力分数等。
• 此类数据只可进行加减,不能进行乘除运 算。
• 例如,数学测验中,A得了80分,B得了60 分,可以说A 得分高于B,A比B高了20分, 但是不能说A的数学能力是B的4/3倍。
• 心理与教育统计学是专门研究如何运用统 计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料, 并根据这些数据资料传递的信息,进行科 学推论找出心理与教育活动规律的一门学 科。
心理与教育统计学的内容
心理与教育统计中的基本概念
1 根据数据的观测方法,可分为计数数据和 测量数据
• 一般说来,分组的数目多,则组距小,计算精确。 但它要求总的数据量大,否则会出现有的组距内 无次数分布的现象,那将使整个数据的分布规律 显示不明显,也就不能发挥次数分布表的作用了。
• 如果分组少,组距就大,计算简单,但引进计算 误差较大。
• 因此,要做到既不增加搜集数据的工作量,又能 使分组后的计算精确到最大限度,那么,按上述 公式分组,是一个较好的方法。
• 在制作图表之前,首先要对收集到的数据 资料进行初步的整理,整理的基本方法有 排序和统计分组两种。

心理统计与测量

心理统计与测量

第五章心理统计与测量第一节统计分析•统计学是研究随机现象的数量规律性的一门数学分支•研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法•统计技术能使数据反映出更本质的内容,并由此推出研究的结论•从具体应用角度,可以分成描述统计、推断统计一、描述统计•描述统计是统计分析的最基本内容,是指对数据进行整理和分析,应用统计指标、统计表、统计图等概括性的数据,来描述和分析大量的原始数据分布情况,或反映变量间关系程度•描述统计量包括:集中量、差异量、地位量、相关量1、集中量•原始数据分布有两个基本特征:一是集中趋势,指大量数据向某一点(即某一数值)集中的情况;二是离中趋势,指大量数据彼此离散(差异)的程度•常用集中量:①算数平均数②中位数——在一组按大小顺序排列起来的量数中居中央位置的数值③众数——在一组数据中出现次数最多的一个数值算术平均数的优缺点•反应灵敏•严密确定•适合进一步代数运算•受抽样变动的影响较小•易受极端数值的影响中位数特点•敏感性不如算术平均数,不会受极端值影响•严密确定,计算简便,受抽样变动影响较小•不适合进一步代数运算• 适用于有极端值或个别数据不确切的情况 众数特点• 不受极端值影响• 组距不同,众数值有很大变化 • 不适合进一步代数运算 • 受抽样变动影响大 • 适用范围比较狭窄 2、差异量• 差异量数是测量集中量数能代表研究对象的程度。

集中量数的代表性随差异量数的大小而不同:差异量数小,集中量数代表性大;差异量数增大,则集中量数的代表性变小。

• 常用的差异量:全距、方差、标准差、差异系数 全距• 一组数据中,最大数值与最小数值的差数 • 容易受极端数值影响 方差、标准差● 是用数据偏离平均数的程度来表明数据的离中趋势,是以平均数为依据求得的一种重要差异量数。

● 常用s 表示样本标准差,用δ表示总体标准差S=方差、标准差 • 反应灵敏• 容易受极端值影响 • 适合进一步代数运算• 样本方差是总体差异情况的最好估计量 差异系数• 差异系数是指标准差与其算术平均数的百分比 • 是没有单位的相对数CV= ()nX X ∑-2%100*XS差异系数举例• 某班身高X=137.5cm , S=5.2cm • 体重X=24.1kg,s=1.8kg• 问:该班学生身高和体重哪个差异大? • 身高CV=5.2/137.5*100=3.78 • 体重CV=1.8/24.1*100=7.47 3、地位量• 描述特定观察值在整个次数分布中所占的等级位置 • 常用:百分位数、百分等级 4、相关量• 相关系数表示两个变量之间不精确、不稳定的变化关系 • 相关系数范围-1.00~+1.00之间• 相关系数值既不是等距量表,更不是比率量表,仅是顺序量表 • 只能进行比较,不能直接运算 相关系数使用注意问题• 必须是成对数据,且对数要大于30• 相关系数的正负只表示相关方向,其绝对值表示相关的密切程度 • 两列变量有相关关系,不一定说明有因果关系存在 • 是否有显著意义,还须经统计检验• 相关系数是在某一特定情景中研究得到的,只能在这一情景中使用 正态分布• 标准分数:表示一个原始分数在团体中的相对位置 Z=• 标准分数无实际单位,表明该原始分数在团体分布中的位置,可以使研究者对不同学科或不同测验成绩进行比较。

教育心理统计研究课件Lecture5

教育心理统计研究课件Lecture5

Mode
This final indicator of central tendency is rarely used in research reports, but is often mentioned in textbooks. The mode is simply the value that occurs most frequently in a distribution.
Using SPSS to produce frequency tables and histograms
In order to generate a frequency table for income, we will need to group the data; otherwise we will get a frequency count and percentage for every single income in the sample. We would have separate bars for each income within the sample. To group the data, we will need to use the Recode procedure. In doing this, we will be creating a new variable which will be called incomegp. The aim is to group people into different income groups: &5,000 and below; $6,000-6,999; $7,000-7,999; $8,000-8,999; $9,000 and above. The following sequence will accomplish this:

心理学-统计

心理学-统计

第一章绪论&1.随机现象与统计学确定现象随机现象本人性别生男生女光的速度学习成绩种豆得豆(人的)反应速度随机现象:具有以下三个特性的现象称为随机现象(i)一次试验有多种可能结果,其所有可能结果是已知的。

(ii)试验之前不能预料哪一种结果会出现(iii)在相同条件下可以重复试验随机事件:随机现象的每一种结果叫做一个随机事件。

随机变量:把能表示随机现象各种结果的变量称为随机变量统计学的研究对象是随机现象规律性随机变量的分布:(i)正态分布 eg:学习成绩(ii)双峰分布 eg::汽车拥挤程度(iii)另一种分布 eg:如下&2.总体和样本总体:是我们所研究的具有某种共同特性的个体的总和样本:是从总体中抽取的作为观察对象的一部分个体。

(i) 总体:有限总体:总体所包含的个体数目有限时无限总体:总体所包含的个体数目无限时→参数:总体上的各种数字特征(ii) 总体→抽样→ 样本:大样本:>30 >50小样本:≤30 ≤50(更精神)(样本容量:样本中包含的个体数目)→统计量:样本上的数字特征根据统计量来估计参数&3.心理统计学的内容1.描述统计:对已获得的数据进行整理,概括,显现其分布特征的统计方法。

集中量平均数#描述差异量标准差S: S大:差异大/不稳定对个别S小:差异小/稳定对个别统计相关量:相关系数(表示两件事情的相互关系)r.r↔[-1,1](r表示从无关到完全相关,相关:正相关,相关,负相关)2.推断统计参数估计:#→μs→σ推断r→р统计假设检验:参数检验非参数检验3.实验设计初级的,用平均数,百分比↓后来平均数→ T检验(2个对象)标准差↓中级(2个或2个以上对象)(方差分析)下检验。

↓高级相关回归(用相关系数)↓再高级(研究生学)因素分析(探索性的)两两相关,写相关系数↓更高级协方差结构方程(验证性的)前程:相同符号的一串→非参数检验中的一种第二章数据整理&1.数据种类一.间断变量与连续变量 eg:人数~间断二.四种量表。

心理统计学教案

心理统计学教案

行健文理学院课程教案
2012 年上(春)学期
课程名称心理与心理与教育统计学
开课院系应用心理学
开课教研室心理学教研室
授课教师李金德
职称助教
授课班级 11级应用心理学
学生人数 31人
行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案
行健文理学院教案。

4_心理统计辅导讲义(14页)

4_心理统计辅导讲义(14页)
b)适合顺序型数据,有极端数值、有模糊数据和开放数值的情况。
理 c)在非参数检验中大显身手。
d)特别注意有重复数据和分组数据的情况下,如何求中数。
心 用精确上下限插值法—可能是原数据中不存在的数值。
3.众数——具有最多次数的那个分数或类目。适合命名型数据。
华 皮尔逊经验法:Mo=3Md-2M
比较与应用 算术平均数是一个分布的重心,中数把分布分成相等的两半,众数是分布的最高点。分布对称则三点重合,
官方总站:圣才学习网
中华心理学习网
官方总站:圣才学习网
(四)相对量数
1.百分位数-在某个百分位置上的数。
无论是否分组,均要考虑其精确上限和精确下限,用插值法。例:
2 5 8 9 100 求 20%位置的数是多少?
华 例题:一位研究生调查 n=100 个大学生每周用于体育锻炼的时间和医生对其健康状况的点评,得积差相关 r=0.43。
由此可推: 如果相关值在±0.2 之间是弱相关、在 0.4~0.6 之间是中等强度的相关、在 0.6~0.8 之间有较强的相关、
中0.8 以上为强相关。 比如
1245
2489
成直线相关
官方总站:圣才学习网
1.离差与平均差 0 (1)离差又称离均差,反映一个数据与该组数据中心的距离。
.1 (离差), www (2)平均差,离差绝对值的平均数。可以反映同组数据的分散情况。
2.方差与标准差 (1)总体
网 习
(2)样本

理 样本为什么要用 n-1,自由度的理解:最少要固定的数目个数-确定整组数目的不变。以后还会遇到:t,
网 习 学 理 心 华 中统计分为三部分:
描述统计、推论统计、实验设计

05心理统计学-第五章 相关关系

05心理统计学-第五章 相关关系

③两数据类型均为连续数据(即等距/比率数据)。
④两变量呈直线相关(先用散点图预测) 。
第二节 积差相关
▪ 二、基本计算公式 P113
➢ 1、运用标准差与离均差
xy
r NsX sY
,其中
x X X ,y Y Y
xy
可改写为 r
x2 y2
第二节 积差相关
▪ 二、基本计算公式
➢ 2、运用标准分数(Z分数)
▪ 一、概念与适用资料 (X X )(Y Y )
又称“积矩”相关。
N
[补充]:r2(决定系数/测定系数)具有消减预测误
差比例的含义。 P372
➢ 适用资料 [诸多条件缺一不可!]
①(大样本的)成对数据(表现为两组数据存在一一对
应关系) ,每对数据相互独立。
②正态双变量(即两总体服从正态分布或渐近正态的单 峰分布) [样本咋样就不管了]。
直接做因果判断。(通常难以区分出共变关系/虚假相关)
第一节 相关、相关系数与散点图
▪ 一、什么是相关
➢ 专题讨论:相关分析完全不能得出因果关系吗?
P107、148
回答:从理论和大多数实际操作来讲的确如此。
➢1)单凭相关无法判断何为因、何为果。 ➢2)很有可能存在其他变量共同作用于这两个变量。 ➢但排除了这两种情况的显著高相关可间接得出因果关
系。
第一节 相关、相关系数与散点图
▪ 一、什么是相关
➢ 2、相关的类别:
首先分为直线相关和曲线相关(根据散点图估计)
➢针对直线相关,从变化情况可划分为:正相关(及完 全正相关)、负相关(及完全负相关)、零相关(即两变量 之间无相关)。 (各种相关均可先根据散点图做初步估计)
[结合P110的图5-2、图5-3]

心理统计学.pdf

心理统计学.pdf

心理统计学目录一、描述统计 (3)(一)、统计图表 (3)1.统计图 (3)2.统计表 (3)(二)、集中量数 (3)1.算术平均数 (3)2.中数 (3)3.众数 (4)(三)、差异量数 (4)1.离差与平均差 (4)2.方差与标准差 (4)(四)、相对量数 (5)1.百分位数 (5)2.百分等级 (5)3.标准分数 (6)(五)、分布性状-偏态和峰度 (6)(六)、相关量数 (6)1.积差相关 (6)2.斯皮尔曼等级相关 (7)3.肯德尔等级相关 (8)4.点二列相关 (9)5.二列相关 (9)6.Φ相关 (10)7.相关系数差异的显著性检验 (10)8.数据类型与相关系数类型 (10)二、推断统计 (11)(一)、推断统计的数学基础 (11)1.概率 (11)2.概率分布 (11)3. 样本平均数分布 (14)4. 抽样原理与抽样方法 (14)(二)、参数估计 (14)1.点估计、区间估计与标准误 (14)2.总体平均数的估计 (14)3.标准差与方差的估计 (15)(三)、假设检验 (15)1.假设检验的原理 (15)2.样本与总体平均数差异的检验 (15)3.两样本平均数差异的检验 (16)4.方差齐性的检验 (17)5.卡方检验 (18)6.非参数检验 (20)(四)、方差分析 (21)1.方差分析的原理与基本过程 (21)2.完全随机设计(独立组设计)的方差分析 (22)3.随机区组设计(重复测量设计)的方差分析 (22)4.协方差分析 (24)5.多因素方差分析 (24)6.事后检验 (24)(五) 、统计功效与效果量 (25)(六)、一元线性回归分析 (26)1.一元线性回归方程的建立、检验及应用 (26)2.可化为一元线性回归的曲线方程 (27)(七)、多元统计分析初步 (28)1. 多元线性回归分析 (28)2. 主成分分析 (28)3. 因素分析 (29)一、描述统计(一)、统计图表1.统计图条形图、帕累托图(曲线函数二阶导数正负转折点位于前半段为正偏态,位于后半段则为负偏态)、饼图、环形图、直方图、箱线图、垂线图(将同一样本或类别的多个取值的散点用一条垂线连接起来,用垂线的长度和垂线上的各个点来反映某个样本或类别取值的差异及其分布状况)、误差图(以均值为中心,加减一定倍数的标准差绘制而成,展示多个样本或分类的不同取值的分布状况和离散状况)、散点图、雷达图(可先对数据进行标准化处理)、轮廓图(折线图)。

心理统计学全套课件

心理统计学全套课件

答案
组别 组中值 次数(f) 相对 累积 累积相 累积百 次数 次数 对次数 分比
95-99 97
2
.04 50 1.00 100
90-94 92
3
.06 48
.96
96
85-89 87
2
.04 45
.90
90
80-84 82
6
.12 43
.86
86
75-79 77
14 .28 37
.74
74
70-74 72
二项分布的平均数和标准差
• 当二项分布接近于正态分布时,在n次二 项实验中成功事件出现次数的平均数和 标准差分别为: μ=np
•和
npq
做对题数
0 1 2 3 4 5 6 7 8 9 10 总和
二可能项结果分数 布的概应率用
1
0.001
10
0.010
45
0.044
120
0.117
210
0.205
例题
• 某学生从5个试题中任意抽选一题,如 果抽到每一题的概率为1/5,那么抽到 试题1或试题2的概率为多少?
概率的乘法
• A事件出现的概率不影响B事件出现的概 率,这两个事件为独立事件。
• 两个独立事件积的概率,等于这两个事 件概率的乘积。用公式表示为: P(A ·B) = P(A) ·P(B) 其推广形式是 P(A1 ·A2 … An) = P(A1) ·P(A2) … P(An)
四种数据水平
• 称名量表 • 学号、房间号、邮政编码、 号码 • 顺序量表〔等级量表〕 • 名次、等级、五分制得分 • 等距量表 • 温度计读数、百分制得分 • 等比〔比率〕量表 • 长度、时间

《心理统计学》理论教学大纲(供四年制本科应用心理学使用)

《心理统计学》理论教学大纲(供四年制本科应用心理学使用)

《心理统计学》理论教学大纲(供四年制本科应用心理学使用)Ⅰ前言《心理统计学》是应用心理学专业学生一门重要的专业课程,它是专门为处理实验、调查数据而开设的。

是研究数据分布、抽样、描述统计、及进行统计推断的学科。

主要是通过集中量数、离散量数指标来描述数据特征,并通过假设检验和特定的数学模型来进行统计推断,以得出基于概率的统计结论。

掌握了该门课程的理论和方法,可为实验心理学、心理学研究方法等课程打下良好的基础,同时有助于深入理解普通心理学、心理学史、变态心理学等课程的知识及理论,最后还可以作为毕业论文写作的利器来完成科学性较好的论文。

本大纲适用于四年制本科应用心理学专业学生。

现将大纲使用中有关问题说明如下:一为了使教师和学生更好地掌握教材,大纲每一章节均由教学目的、教学要求和教学内容三部分组成。

教学目的注明教学目标,教学要求分掌握、熟悉和了解三个级别,教学内容与教学要求级别相对应,并统一标示(核心内容即知识点以下划实线,重点内容以下划虚线,一般内容不标示)便于学生重点学习。

二教师在保证大纲核心内容的前提下,可根据不同教学手段,讲授重点内容和介绍一般内容,有的内容可留给学生自学。

三总教学参考学时为78学时, 其中理论54学时,实验24学时;理论与实验学时之比2.25:1。

四教材:《心理统计学》,姚应水,人民卫生出版社,第2版,2013年8月。

II 正文第一章绪论一、教学目的使学生了解学习心理统计学的作用和意义,掌握心理统计学的基本概念、心理统计资料的类型,熟悉心理统计工作的基本步骤,以对心理统计学有初步的认识。

二、教学要求(一)掌握心理统计学的基本概念、心理统计资料的类型。

(二)熟悉心理统计工作的基本步骤。

(三)了解心理统计学的作用和意义。

三、教学内容(一)心理统计学的作用和意义:统计学与心理统计学的概念、心理统计学的主要作用、学习心理统计学的意义。

(二)心理统计学的基本概念:变量和变量值、同质和变异、总体与样本、参数和统计量、误差、概率。

《心理统计学》课件-第5章

《心理统计学》课件-第5章

1、成对(N<30) 2、非正态 3、线性 4、非连续,主要是顺序数据或称名数据。
思考
皮尔逊积差相关 VS 等级相关
1、成对(N≥30) 2、正态(接近正态) 3、线性 4、连续,主要是等距或等比数据。
1、成对(N<30) 2、非正态 3、线性 4、非连续,主要是顺序数据或称名数据。
总之,等级相关的适用范围比积差相关的大,又对总体分布不做要求。但其精确度要差 于积差相关,因此凡是符合积差相关的资料,都不用等级相关计算。
5.1 相关、相关系数与散点图
5.2 积差相关
第五章 相关关系
5.3 等级相关
5.4 质与量相关
5.5 品质相关
5.2 积差相关(Pearson相关)
5.2.1 积差相关的概念与适用条件 选择、简答
积差相关是揭示两个变量线性相关方向和程度最常用和最基本的方法。
5.2 积差相关
概念与适用条件 基本公式 差法公式
)。
A. x数值增大时,y也随之增大 B. x数值减少时,y也随之减少 C. x数值增大(或减少)时,y也随之减少(或增大) D. y的取值,几乎不受x取值的影响
5.1 相关、相关系数与散点图
5.1.2 相关系数 选择
5.1 相关、相关系数与散点图
相关及相关类别 相关系数 散点图
两列变量相关程度的数字表现形式,常用r来表示,描述总体时一般用ρ来表示。
完全负相关 r=-1
完全正相关 r=1
正相关
负相关
零相关
多选题
【统考】散点图的形状为一条直线,它们之间的相关系数可能为(
A. 1 B. 0.5 C. 0 D. -1
)。
多选题
AD 【统考】散点图的形状为一条直线,它们之间的相关系数可能为(

心理统计学(全套课件)

心理统计学(全套课件)

心理统计学(全套课件)第一部分:心理统计学导论一、引言心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。

本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。

二、心理统计学的基本概念1. 变量:在心理学研究中,变量是指可以被测量的特征或属性。

变量可以分为连续变量和离散变量,以及自变量和因变量。

2. 数据:数据是变量的具体值,可以是数值型数据或非数值型数据。

3. 样本与总体:样本是从总体中抽取的一部分个体,而总体是所有可能个体的集合。

4. 随机抽样:随机抽样是从总体中随机抽取样本的过程,以确保样本能够代表总体。

三、描述性统计1. 频数分布:频数分布是描述数据分布情况的一种方法,它显示了每个数值或数值区间出现的次数。

2. 集中趋势:集中趋势是指数据分布的中心位置,常用的指标有均值、中位数和众数。

3. 离散程度:离散程度是指数据分布的分散程度,常用的指标有方差、标准差和变异系数。

四、推断性统计1. 概率与概率分布:概率是描述事件发生可能性大小的数值,概率分布是描述随机变量取值的概率分布情况。

2. 假设检验:假设检验是通过对样本数据进行统计分析,来判断总体参数是否符合某种假设的方法。

3. 参数估计:参数估计是通过对样本数据进行统计分析,来估计总体参数的方法。

五、心理统计学软件1. SPSS:SPSS是一种常用的心理统计学软件,它提供了丰富的数据分析功能,包括描述性统计、推断性统计、数据管理等功能。

2. R语言:R语言是一种开源的统计编程语言,它提供了强大的数据分析功能,包括数据可视化、机器学习等功能。

心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。

本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。

通过学习本课程,学生将能够掌握心理统计学的基本知识和技能,为今后的心理学研究打下坚实的基础。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【课程讲义】第五章相关系数【教学目标】明确相关是描述两个变量之间关系的量数;掌握相关的种类;掌握各种相关系数的计算、适用条件;掌握相关在教学实践中的运用;掌握对相关系数的解释。

【学习方法】了解、理解与掌握。

【重点难点】各种相关系数的使用条件、计算及应用【讲义内容】前面章节中研究的问题,基本上都是属于单变量的数量变化关系。

而教育和心理现象中的数量关系,并不仅仅是单变量的变化关系,在很多方面体现出的是一个变量与另一个变量或多个变量之间的变化关系。

如:学生学习成绩与学生智商的关系;学生学习成绩与学习动机的关系;家庭环境与学生学业成绩之间的关系等等。

本章主要讨论两个变量或两列数据之间相关的数量关系。

第一节相关概述一、相关的含义事物总是相互联系的,它们之间的关系多种多样。

分析起来,大概有以下几种情况:一种是因果关系,即一种现象是另一种现象的因,而另一种现象则是果。

例如学习的努力程度是学习成绩好坏的因(至少是部分的因);在一定刺激强度范围内,刺激强度经常是反应强度的因等等。

第二种是共变关系,即表面看来有联系的两种事物都与第三种现象有关,这时两种事物之间的关系,便是共变关系。

例如春天出生的婴儿与春天栽种的小树,就其高度而言,表面上看来都在增长,好像有关,其实,这二者都是受时间因素影响在发生变化,在它们本身之间并没有直接的关系。

第三种是相关关系,即两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定这两类现象之间哪个是因,哪个是果;也有理由认为这两者并不同时受第三因素的影响,即不存在共变关系。

具有相关关系的两种现象之间,关系是较复杂的,甚至可能包含有暂时尚未认识的因果关系及其共变关系在内。

例如,同一组学生的语文成绩与数学成绩的关系,即属于相关关系。

二、相关的种类统计学中所讲的相关是指具有相关关系的不同现象之间的关系程度。

相关的种类可以从不同角度划分,从其变化方向来看,两个变量之间的相关可以分为:1.正相关。

正相关指的是两列变量变动方向相同,即两个变量中,一种变量增大时,另一种变量也随着增大,一个变量减小时,另外一个变量也随着减小。

如身高与体重的关系,一般讲身长越长体重就越重。

智力和学业成绩之间的关系。

2.负相关。

负相关指的是两列变量变动方向相反,即两个变量中,一种变量增大时,另一种变量就随着减小,一个变量减小时,另外一个变量反而随着增大。

如心理压力与工作绩效的关系等。

初学打字时练习次数与出现错误量之间的关系。

3.零相关。

两变量值的变化方向无规律,即一个变量值增大,另一个变量对应值或增大或减小,且增大会减小的机会基本相同,这种情况下,这两个变量之间的相关称为零相关。

如学习成绩优劣与身高之间的关系,人的相貌和智力的关系等。

若从变量的个数来划分,可以将相关分为:1.简单相关:两个变量之间的相关;2.复相关:一个变量与两个或两个以上变量之间的相关;从变量之间相关关系的程度上划分,可以划分为:1.高相关2.中等程度相关3.低相关三、相关散点图相关散点图是用直角坐标系上点的散布形状,来表示两个事物之间的相关性及练习的模式。

在坐标系中,以X轴表示一个变量,Y轴表示一个变量,在坐标中描出相应的坐标点,由这些坐标散点组成的图形就称为相关散点图。

相关散点图的用途:1.判断相关是直线型的;2.判断相关密切程度高低;3.判断相关变化方向。

四、相关系数相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。

作为样本间相互关系程度的统计特征数,常用r表示,作为总体参数,一般用ρ表示,并且是指线性相关而言。

相关系数的取值介于-1.00至+1.00之间,常用小数形式表示。

它只是一个比率,不代表相关的百分数,更不是相关量的相等单位的度量。

相关系数的正负号,表示相关方向,正值表示正相关,负值表示负相关。

相关系数取值的大小表示相关的程度。

相关系数为0时,称零相关即毫无相关,为1.00时,表示完全正相关,相关系数为-1.00时,为完全负相关。

这二者都是完全相关。

如果相关系数的绝对值在1.00与0之间不同时,则表示关系程度不同。

接近1.00端一般为相关程度密切,接近0值端一般为关系不够密切(注意:若是非线性相关关系,而用直线相关计算r值可能很小,但不能说二变量关系不密切)。

关于这一点如何判定,尚须考虑计算相关系数时样本数目的多少。

如果样本数目较少,受取样偶然因素的影响较大,很有可能本来无关的两类事物,却计算出较大的相关系数来。

例如欲研究身高与学习有无关系,如果只选3、5个人,很可能遇到身材愈高学习愈好这一类偶然现象。

这时虽然计算出的相关系数可能接近1.00,但实际上这两类现象之间并无关系。

究竟如何综合考虑样本数目大小,相关系数取值大小而判定相关是否密切这一问题,一般要经过统计检验后方能确定。

相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,如只能说相关系数r=0.50的两列数值比相关系数r=0.25的两列数值之间的关系程度更密切,而绝不能说前二者的密切程度是后二者密切程度的两倍。

也不能说相关系数从0.25到0.50与从0.50到0.75所提高的程度一样多。

存在相关关系,即相关系数取值较大的两类事物之间,不一定存在因果关系,这一点要从事物的本质方面进行分析,绝不可简单化。

计算相关系数一般要求成对的数据,即若干个体中每个个体要有两种不同的观测值。

例如每个学生(智力相同者)的算术和语文成绩;每个人的视反应时和听反应时;每个学生的智力分数与学习成绩等等。

任意两个个体之间的观测值不能求相关。

计算相关的成对数据的数目,一般以30以上为宜。

小结:相关系数是描述两列或都列数据之间关联程度高低的指标。

可以分为:正相关、负相关和零相关,简单相关和复相关;高相关、中等程度相关和低相关几种类型。

相关散点图是表示两个事物之间的相关性及联系的模式。

可以通过相关散点图的大致了解:1.判断相关是直线型的;2.判断相关密切程度高低;3.判断相关变化方向。

相关程度的大小可用相关系数来描述。

第二节 积差相关系数一、概念及适用条件 (一)概念积差相关,又称积矩相关,是英国统计学家皮尔逊于20世纪初提出的一种计算相关的方法,因而也称皮尔逊相关,是求直线相关的基本方法。

积差相关系数用r 表示yx S NS xyr ∑=(5-1)式中 X X x -=,Y Y y -=,N 为成对数据的数目,x S 为X 变量的标准差,S y 为Y 变量的标准差。

(二)适用条件计算积差相关时,需要变量符合以下几个条件。

首先两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量。

为了判断计算相关的两列变量其总体是否为正态分布,一般要根据已有的研究资料查询,若无资料可查,研究者应取较大样本分别对两变量作正态性检验。

这里只要求保证双变量总体为正态分布,而对要计算相关系数的两样本的观测数据,并不要求一定为正态分布。

其次,两列变量之间的关系应是直线性的,如果是非直线性的双列变量,不能计算线性相关。

如何判断两列变量之间的相关是否直线式,可作相关散布图进行初步分析,也可查阅已有的研究结果论证。

相关散布图是以二列变量中的一列变量为横坐标,以另一列变量为纵坐标,画散点图。

如果所有散点分布呈椭圆型,则说明二变量之间呈线性关系,如果散点呈弯月状(不论弯曲度大小或方向),说明二变量之间呈非线性关系。

画散点图时,如果分别以二变量的Z 分数为横坐标与纵坐标,则相关趋势的考察更清楚,若散点接近相等地散布在四个象限中,则相关系数接近于零。

若1、3象限的散点明显地多于2、4象限,或2、4象限的散点明显地多于1、3象限,都说明二变量呈线性相关。

相关系数的大小,亦可根据散点呈椭圆形状的狭长情况进行粗略分析。

最后,两变量测量到的数据必须是成对的数据,对于不成对的数据无法计算两个变量之间的相关,及时可以计算,得到的相关也没有意义。

二、计算方法(一) 基本公式计算法(1)计算均值和标准差,y x S Y S X ,,,; (2)计算积差))((Y Y X X i i --; (3)计算积差的和)()(Y Y X Xi i--∑(4)代入相关系数的公式计算:yx S NS xyr ∑=例 1 某校为调查学生学习各科目之间能力的迁移问题,随机抽取10名学生的政治与语文成绩见表5-1,请计算其相关程度。

表 5-1 10名学生政治与语文成绩相关系数计算表按表5-1的资料,计算结果为475.0337.44542.41080.91=⨯⨯=⋅⋅⋅∑=y x S S N y x r即10名学生政治科目和语文科目的相关程度为0.475。

(二)原始数据计算上面(5-1)的公式可以转化成:∑∑∑∑∑∑∑-⋅--=NY Y NX X NY X XY r 2222)()(利用上式可以直接用原始数据计算相关系数。

其计算步骤为: (1)计算X 变量的∑X 、∑2X和2)(∑X ;(2)计算Y 变量的∑Y 、∑2Y和2)(∑Y ;(3)计算XY ,∑XY ;(4)将有关数据代入公式(5-2),求得r 。

例2:请用表5-1中的原始数据,计算两科目成绩的相关系数。

计算结果见表5-2。

表5-2 10名学生政治与语文成绩相关系数计算表解:将表中计算结果代入公式(5-2)中,475.010)837(7024510)756(57352108377566336922=-•-⨯-=r即表5-2中10名学生政治与语文成绩相关系数为0.475。

小结 :积差相关是描述两列连续变量之间线性相关程度高低的最重要的统计指标,计算积差相关数据资料应满足:(1)两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量。

(2)两列变量之间的关系应是直线性的;(3)最后,两变量测量到的数据必须是成对的数据。

积差相关系数定义为:yx S NS xyr ∑=,用原始数据计算积差相关系数的公式为:∑∑∑∑∑∑∑-⋅--=NY YNX XN YX XY r 2222)()(。

第三节 其他相关系数一、斯皮尔曼等级相关 1.概念及适用条件 (1)概念两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,计算这样两变量的相关,称为等级相关。

因为等级相关是英国统计学家斯皮尔曼提出来的,所以叫斯皮尔曼等级相关。

(2)适用条件① 两变量的资料为等级测量数据,且具有线性关系;②连续变量的测量数据,按其大小排成等级,也可以用等级相关法计算; ③不要求总体呈正态分布。

2.计算方法等级相关系数的符号以R r 表示,计算公式为:)1(6122--=∑N N D r R (5.3)式中D 为各对等级之差,∑2D是各D 平方之各,N 为等级数目。

计算步骤为:(1)计算两变量等级之差D ; (2)计算2D ; (3)计算2D 之和,即∑2D;(4)将有关数据代入公式(5.3)求得等级相关系数。

相关文档
最新文档