心理统计学-课程讲义4
《心理统计学》课件
介绍心理统计学在不同领域的研究中的实际应用,如认知心理学、社会心理学和发展 心理学。
2
心理统计学在临床研究中的应用
探讨心理统计学在临床心理学研究和评估中的关键应用,如治疗效果评估和抗抑郁药 物疗效分析。
3
心理统计学在教育研究中的应用
讨论心理统计学在教育心理学研究中的应用,如学生表现评估和教育干预效果评估。
《心理统计学》PPT课件
# 心理统计学PPT课件大纲
第一部分:介绍心理统计学
心理统计学是研究心理学数据收集、处理和分析的方法和技术。它是心理学 研究中的重要组成部分,为心理学研究提供了可靠的数据支持。
第二部分:基本概念和方法
变量与数据类型
介绍心理统计学中的变量及其不同的数据类 型,如名义变量、顺序变量和
介绍心理统计学在市场营销调研和消费者行为研究中的关键应用,如市场细分和产品 定价。
第四部分:心理统计学的思考
数据伦理和数据管理
探讨心理统计学中的数据伦理 原则和数据管理措施,确保研 究数据的合理使用和保护。
大数据时代的心理统计学
讨论大数据时代对心理统计学 的影响和挑战,如数据量的增 加和数据分析方法的创新。
心理统计学未来的发展 趋势
展望心理统计学未来的发展方 向,如智能化数据分析和统计 学在人工智能中的应用。
结束语
心理统计学在心理学研究中的重要性不可忽视。建议有兴趣的人学习和研究心理统计学,以提升心理学 研究的质量和可信度。 *字数:243*
参数估计和假设检验
讨论心理统计学中的参数估计和假设检验方 法,包括均值差异检验和相关性检验。
描述性统计分析
解释心理统计学中常用的描述性统计方法, 如平均数、标准差和百分位数。
标准误和置信区间
心理统计串讲资料
心理统计串讲资料第一章绪论第一节心理统计的作用和内容心理统计是统计学的原理和数学方法在心理学领域中的应用(填空)第二节心理统计的内容²心理统计分描述统计和推论统计两大部份²描述统计:是把实验中所得到的数据进行概括性的整理,从中得出实验者可利用的信息。
描述统计还常用表和图将实验数据形象地表示出来。
描述统计的指标有三类:集中量数、差异量数和数据间的相关。
²推论统计:就是从样本的数量特征去推论总体的数量特征。
它包括一系列的统计程序:推论的假设、推论的方法步骤和检验推论的可靠性的各种方法等。
²描述统计和推论统计是两个相互联系的部分。
对样本数据的描述和归纳是进一步推论的基础在描述统计准确无误的基础上的推论才具有科学的价值。
第二章数据的初步整理第一节实验数据的类型²计数数据:是准确数,它是一个一个数出来的。
数据形式为计数数据的变量称为离散型变量。
²测量数据:是近似数。
测量数据是通过测量工具得到的。
数据形式为测量数据的变量,称为连续性变量。
²上限:就是一个数的最末位加上半个单位。
²下限:就是一个数的最末位减去半个单位。
第二节用表整理实验数据²常用的表格有三种:原始数据表、次数分布表、实验结果表²全距:就是数据中最大数值的上限与最小数值下限的差。
²组距:就是某一组数据上限与下限的差。
²中点:符号X’。
假设数据均匀地分布在组距之间,这一组数值的代表点叫中点。
它是这一组数值的上限与下限中间一点的数值。
公式比例:符号小写p。
部份比全部的比值就是比例。
比例是将全部数据作为一个整体。
定总量为1,部份为分量,分量总是总量的几分之几,用小数或分数表示,比例值永远小于1.第三节用图表达实验数据²图分为平面图和立体图。
²横轴称为X轴(横坐标),纵轴称为Y轴(纵坐标)。
X轴与Y轴垂直交于零点,横坐标常用于表示心理实验中的自变量(刺激变量)。
心理统计学-课程讲义4
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
4_心理统计辅导讲义(14页)
理 c)在非参数检验中大显身手。
d)特别注意有重复数据和分组数据的情况下,如何求中数。
心 用精确上下限插值法—可能是原数据中不存在的数值。
3.众数——具有最多次数的那个分数或类目。适合命名型数据。
华 皮尔逊经验法:Mo=3Md-2M
比较与应用 算术平均数是一个分布的重心,中数把分布分成相等的两半,众数是分布的最高点。分布对称则三点重合,
官方总站:圣才学习网
中华心理学习网
官方总站:圣才学习网
(四)相对量数
1.百分位数-在某个百分位置上的数。
无论是否分组,均要考虑其精确上限和精确下限,用插值法。例:
2 5 8 9 100 求 20%位置的数是多少?
华 例题:一位研究生调查 n=100 个大学生每周用于体育锻炼的时间和医生对其健康状况的点评,得积差相关 r=0.43。
由此可推: 如果相关值在±0.2 之间是弱相关、在 0.4~0.6 之间是中等强度的相关、在 0.6~0.8 之间有较强的相关、
中0.8 以上为强相关。 比如
1245
2489
成直线相关
官方总站:圣才学习网
1.离差与平均差 0 (1)离差又称离均差,反映一个数据与该组数据中心的距离。
.1 (离差), www (2)平均差,离差绝对值的平均数。可以反映同组数据的分散情况。
2.方差与标准差 (1)总体
网 习
(2)样本
学
理 样本为什么要用 n-1,自由度的理解:最少要固定的数目个数-确定整组数目的不变。以后还会遇到:t,
网 习 学 理 心 华 中统计分为三部分:
描述统计、推论统计、实验设计
心理统计学
第四章重点知识本章核心概念:1、差异量数分为:绝对差异量数和相对差异量数2、绝对差异量数:标准差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
方差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数四分差:四分差通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
3、相对差异量数:差异系数:差异系数,又称变异系数、相对标准差等,使一组数据标准差与平均数的比率。
通常用符号CV表示。
4、另外,本章还讲到相对地位量数:标准分数,百分等级。
标准分数:它是一个数与平均数之差除以标准差所得的商数,它无实际单位。
百分等级:指任意分数在整个分数分布中所处的百分位置。
本章重点难点:差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
知识要点详情:一、标准差1、概念及计算公式方差的平方根,用s或SD表示,若用σ表示,是指总体的标准差。
方差与标准差是最常用的描述次数分布离散程度的差异量数。
2、标准差的适用条件(1)与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合(2)用算术平均数描述时,其离散程度宜用标准差描述;(3)计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;(4)在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
3、标准差的计算方法(1)基本公式法(2)原始数据法(3)分组资料标准差的计算方法(4)由各部分的标准差合成总标准差的计算方法4、方差和标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。
其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。
它基本具备一个良好的差异量数应具备的条件:①反应灵敏;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小;⑥简单明了。
心理统计学.pdf
心理统计学目录一、描述统计 (3)(一)、统计图表 (3)1.统计图 (3)2.统计表 (3)(二)、集中量数 (3)1.算术平均数 (3)2.中数 (3)3.众数 (4)(三)、差异量数 (4)1.离差与平均差 (4)2.方差与标准差 (4)(四)、相对量数 (5)1.百分位数 (5)2.百分等级 (5)3.标准分数 (6)(五)、分布性状-偏态和峰度 (6)(六)、相关量数 (6)1.积差相关 (6)2.斯皮尔曼等级相关 (7)3.肯德尔等级相关 (8)4.点二列相关 (9)5.二列相关 (9)6.Φ相关 (10)7.相关系数差异的显著性检验 (10)8.数据类型与相关系数类型 (10)二、推断统计 (11)(一)、推断统计的数学基础 (11)1.概率 (11)2.概率分布 (11)3. 样本平均数分布 (14)4. 抽样原理与抽样方法 (14)(二)、参数估计 (14)1.点估计、区间估计与标准误 (14)2.总体平均数的估计 (14)3.标准差与方差的估计 (15)(三)、假设检验 (15)1.假设检验的原理 (15)2.样本与总体平均数差异的检验 (15)3.两样本平均数差异的检验 (16)4.方差齐性的检验 (17)5.卡方检验 (18)6.非参数检验 (20)(四)、方差分析 (21)1.方差分析的原理与基本过程 (21)2.完全随机设计(独立组设计)的方差分析 (22)3.随机区组设计(重复测量设计)的方差分析 (22)4.协方差分析 (24)5.多因素方差分析 (24)6.事后检验 (24)(五) 、统计功效与效果量 (25)(六)、一元线性回归分析 (26)1.一元线性回归方程的建立、检验及应用 (26)2.可化为一元线性回归的曲线方程 (27)(七)、多元统计分析初步 (28)1. 多元线性回归分析 (28)2. 主成分分析 (28)3. 因素分析 (29)一、描述统计(一)、统计图表1.统计图条形图、帕累托图(曲线函数二阶导数正负转折点位于前半段为正偏态,位于后半段则为负偏态)、饼图、环形图、直方图、箱线图、垂线图(将同一样本或类别的多个取值的散点用一条垂线连接起来,用垂线的长度和垂线上的各个点来反映某个样本或类别取值的差异及其分布状况)、误差图(以均值为中心,加减一定倍数的标准差绘制而成,展示多个样本或分类的不同取值的分布状况和离散状况)、散点图、雷达图(可先对数据进行标准化处理)、轮廓图(折线图)。
心理统计学全套课件
答案
组别 组中值 次数(f) 相对 累积 累积相 累积百 次数 次数 对次数 分比
95-99 97
2
.04 50 1.00 100
90-94 92
3
.06 48
.96
96
85-89 87
2
.04 45
.90
90
80-84 82
6
.12 43
.86
86
75-79 77
14 .28 37
.74
74
70-74 72
二项分布的平均数和标准差
• 当二项分布接近于正态分布时,在n次二 项实验中成功事件出现次数的平均数和 标准差分别为: μ=np
•和
npq
做对题数
0 1 2 3 4 5 6 7 8 9 10 总和
二可能项结果分数 布的概应率用
1
0.001
10
0.010
45
0.044
120
0.117
210
0.205
例题
• 某学生从5个试题中任意抽选一题,如 果抽到每一题的概率为1/5,那么抽到 试题1或试题2的概率为多少?
概率的乘法
• A事件出现的概率不影响B事件出现的概 率,这两个事件为独立事件。
• 两个独立事件积的概率,等于这两个事 件概率的乘积。用公式表示为: P(A ·B) = P(A) ·P(B) 其推广形式是 P(A1 ·A2 … An) = P(A1) ·P(A2) … P(An)
四种数据水平
• 称名量表 • 学号、房间号、邮政编码、 号码 • 顺序量表〔等级量表〕 • 名次、等级、五分制得分 • 等距量表 • 温度计读数、百分制得分 • 等比〔比率〕量表 • 长度、时间
心理统计学第四章 差异量数
450
合计
2500
2500
2500
均数
500
500
500
,
甲乙 丙
第四章 差异量数
差异量数: 表示一组数据的差异情况或离散程度的量数; 反映数据分布的离中趋势; 描述事物差异性的表现。 差异量越小,平均数的代表性越好。 差异量越大,平均数的代表性则差。
第一节 全距与百分差 第二节 平均差、方差与标准差 第三节 标准差的应用 第四节 差异量数的选用
人数 42 36 50
平均数 标准差
103
16
110
12
98
17
计算过程
班级 n X
1 42 103
2 36 110
3 50
98
74
—
S
d X X t d 2 X Xt 2
16
0.02 0.000004
12
3.02
9.1204
17
5.02 25.2004
—
—
—
X 42103 36110 5098 103.02 42 36 50
四分位差实质反映中间50%数据的离散程度
四分位差越小中间50% 数据越集中
四分位差越大中间50% 数据越离散
Q1 Q2 Q3
Q1 Q2 Q3
根据百分位数的计算公式,推导Q1Q3的计算 公式
p N Fb
Pp Lb 100
i
f
三、百分等级
1.含义:是指某个数据在整个数据中所处的百分位置。 2.作用:可以表示任何一个分数在该团体中的相对位
向上累加次数
157 156 152 146
138 122 98 64 43 27 16
《心理统计学》理论教学大纲(供四年制本科应用心理学使用)
《心理统计学》理论教学大纲(供四年制本科应用心理学使用)Ⅰ前言《心理统计学》是应用心理学专业学生一门重要的专业课程,它是专门为处理实验、调查数据而开设的。
是研究数据分布、抽样、描述统计、及进行统计推断的学科。
主要是通过集中量数、离散量数指标来描述数据特征,并通过假设检验和特定的数学模型来进行统计推断,以得出基于概率的统计结论。
掌握了该门课程的理论和方法,可为实验心理学、心理学研究方法等课程打下良好的基础,同时有助于深入理解普通心理学、心理学史、变态心理学等课程的知识及理论,最后还可以作为毕业论文写作的利器来完成科学性较好的论文。
本大纲适用于四年制本科应用心理学专业学生。
现将大纲使用中有关问题说明如下:一为了使教师和学生更好地掌握教材,大纲每一章节均由教学目的、教学要求和教学内容三部分组成。
教学目的注明教学目标,教学要求分掌握、熟悉和了解三个级别,教学内容与教学要求级别相对应,并统一标示(核心内容即知识点以下划实线,重点内容以下划虚线,一般内容不标示)便于学生重点学习。
二教师在保证大纲核心内容的前提下,可根据不同教学手段,讲授重点内容和介绍一般内容,有的内容可留给学生自学。
三总教学参考学时为78学时, 其中理论54学时,实验24学时;理论与实验学时之比2.25:1。
四教材:《心理统计学》,姚应水,人民卫生出版社,第2版,2013年8月。
II 正文第一章绪论一、教学目的使学生了解学习心理统计学的作用和意义,掌握心理统计学的基本概念、心理统计资料的类型,熟悉心理统计工作的基本步骤,以对心理统计学有初步的认识。
二、教学要求(一)掌握心理统计学的基本概念、心理统计资料的类型。
(二)熟悉心理统计工作的基本步骤。
(三)了解心理统计学的作用和意义。
三、教学内容(一)心理统计学的作用和意义:统计学与心理统计学的概念、心理统计学的主要作用、学习心理统计学的意义。
(二)心理统计学的基本概念:变量和变量值、同质和变异、总体与样本、参数和统计量、误差、概率。
心理统计学(全套课件)
心理统计学(全套课件)第一部分:心理统计学导论一、引言心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
二、心理统计学的基本概念1. 变量:在心理学研究中,变量是指可以被测量的特征或属性。
变量可以分为连续变量和离散变量,以及自变量和因变量。
2. 数据:数据是变量的具体值,可以是数值型数据或非数值型数据。
3. 样本与总体:样本是从总体中抽取的一部分个体,而总体是所有可能个体的集合。
4. 随机抽样:随机抽样是从总体中随机抽取样本的过程,以确保样本能够代表总体。
三、描述性统计1. 频数分布:频数分布是描述数据分布情况的一种方法,它显示了每个数值或数值区间出现的次数。
2. 集中趋势:集中趋势是指数据分布的中心位置,常用的指标有均值、中位数和众数。
3. 离散程度:离散程度是指数据分布的分散程度,常用的指标有方差、标准差和变异系数。
四、推断性统计1. 概率与概率分布:概率是描述事件发生可能性大小的数值,概率分布是描述随机变量取值的概率分布情况。
2. 假设检验:假设检验是通过对样本数据进行统计分析,来判断总体参数是否符合某种假设的方法。
3. 参数估计:参数估计是通过对样本数据进行统计分析,来估计总体参数的方法。
五、心理统计学软件1. SPSS:SPSS是一种常用的心理统计学软件,它提供了丰富的数据分析功能,包括描述性统计、推断性统计、数据管理等功能。
2. R语言:R语言是一种开源的统计编程语言,它提供了强大的数据分析功能,包括数据可视化、机器学习等功能。
心理统计学是心理学研究中的重要工具,它帮助我们从大量数据中提取有意义的信息,以便更好地理解人类行为和心理过程。
本课程将介绍心理统计学的基本概念、原理和方法,以及如何运用这些工具来分析心理学数据。
通过学习本课程,学生将能够掌握心理统计学的基本知识和技能,为今后的心理学研究打下坚实的基础。
心理统计学-课程讲义3
【课程讲义】第三章集中量数【教学目标】明确一批数据的特征包括两个方面的内容:集中趋势、离散性;明确集中量数是描述数据集中趋势的量数,可以作为一批数据的代表值;明确算术平均数是所有集中量数中运用最广泛、最优的量数;明确各种集中量数的含义、计算方法、使用条件、性质及优缺点。
【学习方法】了解、理解、计算与应用。
【重点难点】算术平均数的概念及适用条件;算术平均数的计算方法;中位数的概念及适用条件;中位数的计算方法。
【讲义内容】前一章所讲的统计分组、统计表、统计图等,只是对研究工作中所获得的数据进行初步整理,其目的是对数据的性质、分布特征、差异情况及数据的一般规律有一直观和形象的认识。
因此说这一步还不是应用统计方法的步骤。
为了进一步发现和表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字——称为统计量或特征数。
对于一组数据来讲,最常用的统计量有两类。
一类是表现数据集中性质或集中程度的,另一类是表现数据分散性质或分散程度的。
数据的集中情况指一组数据的中心位置。
集中趋势的度量,即确定一组数据的代表值。
描述数据集中情况的统计量有多种,包括算术平均数、中数、几何平均数等。
由于这些统计量的作用在于度量数据的集中趋势,因此它们都称为集中量数。
本章主要介绍几种常用的集中量数。
集中量数只描述数据的集中趋势和典型情况,它还不能说明一组数据的全貌。
数据除典型情况之外,还有变异性的特点。
对于数据变异性即离中趋势进行度量的一组统计量,称作差异量数,这些差异量数有方差、标准差、全距、平均差、四分差及各种百分差等等,下一章中将对常用的差异量数进行介绍。
第一节 算术平均数一、算术平均数的概念和适用条件(一)概念算术平均数一般简称为平均数或均数(Mean )。
只有在与其他几种集中量数如几何平均数、加权平均数相区别的时候,才把它叫做算术平均数。
如果平均数是由X 变量计算的,就记为X (读作X 杠),若由Y 变量求得,则记为Y 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
得X =73,从而∑(X —X )2=1786,又由于N=9,所以算得的标准差为09.1491786)(X 2==-∑=N X S 再求四年级二班的平均数和标准差。
得X =73,从而∑(X —X )2=5948,又由于N=9,所以算得的标准差为71.2595984)(X 2==-∑=N X S 以上可知,两班的平均数都为73分,说明两班的平均水平相同。
但由于一班的标准差为14.09, 一班的标准差为25.71,说明两班的差异水平很不同。
一班的差异程度较小,平均分数73分代表性就大些;二班的差异程度较大,平均分数73分代表性就小些。
2.原始数据法222)()(X NX NX NX S ∑∑-=-∑= (4.2)推导过程为:()()NX X X X NX XS i i i∑∑+-=-=22222=NX X X X i i∑∑∑+-222式中NX X i∑=且为定数=∑=22X N X 上式可继续整理:NX N X X X S i i∑∑+-=2222=NN X N X N X Xi i ii∑∑∑∑⋅+⋅⎪⎪⎭⎫ ⎝⎛-22)(2 =()()NNX NX Xiii2222∑∑∑+-=()N N X X ii∑∑-22=22⎪⎪⎭⎫ ⎝⎛-∑∑N X NXi i或()N X X N i i 22∑∑-例2 用原始计算法计算表4-1资料的标准差。
解:原始数据为:92,90,83,80,75,70,62,55,50。
用计算器可直接计算出∑X=657,∑X 2=49747,N=9代入公式(4.2),得09.14)9657(949747)(222=-=∑-∑=N X N X S(二)分组资料标准差的计算方法对于次数分布表中的数据,以组中值作为各组的代表值,计算公式为:NX X f S C 2)(-∑=(4.3)其中,C X 为各组对应的组中值,f 为每个组对应的次数,N 为总次数。
例3 某年级144名学生的语文成绩如下表,求其标准差。
解:将算得的∑2)(X X f C -=3483.16(其中X =52.8),N=144,代入公式(4.3),得92.414416.3483)(2==-∑=N X X f S C用上面的公式求标准差,需要先求出平均数,计算比较麻烦且影响结果的准确性,因此,在实际应用中,往往可以直接通过组中值,而不必计算平均数,来求标准差,对于分组数据,直接计算标准差的公式为:22)(NfX N fX S C C ∑-∑= (4.4)例4 某校初一随机抽取60名学生测验其心理健康知识,成绩如表4-4,求其标准差。
4-4 60名学生心理健康知识成绩表解:将算得的∑C fX =4185,∑f 2CX =298375及N=60代入公式(4.4),得 39.10)604185(60298375)(222=-=∑-∑=N fX N fX S C C(三)由各部分的标准差合成总标准差的计算方法已知总体中各部分的标准差,可以用下面的公式合成总的标准差:tii i t N d S N S )(22+∑= 其中,t S 为总的标准差,t N 为总体中数据的个数,i S 为各部分数据的标准差,i d 为各部分平均数与总平均数的差,即:t X X d i i -=;kkk t N N N X N X N X N X ++++++=ΛΛ212211,k t N N N N +++=Λ21,i X 为各部分数据的平均数。
例 5 某年级四个班的学生人数分别为50人,52人,48人,51人。
期末数学考试各班的平均成绩为90分,85分,88分,92分,标准差分别为6分,5.5分,7分,8.2分。
求四个班 成绩的标准差。
解:设51,48,52,504321====N N N N92,88,85,904321====X X X X 则 432144332211N N N N X N X N X N X N X t ++++++=514852509251884885529050+++⨯+⨯+⨯+⨯==893899218988489851899044332211=-=-=-=-=-=-=-=-==-=-=t X X d t X X d t X X d t X X d因此24.751485250)32.8(51])1(7[48])4(5.5[52)16(50)()()()()(2222222243212424123231222222121122=+++++-++-+++=++++++++++=+∑=N N N N d S N d S N d S N d S N N d S N S t i i i t即:全年级数学成绩的标准差为7.24分四、方差和标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。
其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。
它基本具备一个良好的差异量数应具备的条件:①反应灵敏,每个数据取值的变化,方差或标准差都随之变化;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小,即不同样本的标准差或方差比较稳定;⑥简单明了,这一点与其他差异量数比较稍有不足,但其意义还是较明白的。
除上述之外,方差还具有可加性特点,它是对一组数据中造成各种变异的总和的测量,能利用其可加性分解并确定出属于不同来源的变异性(如组间、组内等)并可进一步说明每种变异对总结果的影响,是以后统计推论部分常用的统计特征数。
在描述统计部分,只需要标准差就足以表明一组数据的离中趋势了。
标准差比其他各种差异量数具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,便可知占一定百分比的数据落在平均数上下各两个标准差,或三个标准差之内。
对于任何一个数据集合,至少有211h-的数据落在平均数的h (大于1的实数)个标准之内(切比雪夫定理)。
例如某组数据的平均数为50,标准差是5,则至少有75%(2211-)的数据落在50±2×5=40—60之间,至少有88.9%(2311-)的数据落在50±3×5=35—65之间(h=2,211h -=2211-=43=75%,h=3,211h -=2311-=98=88.9%)。
如果数据是呈正态分布,则数据将以更大的百分数落在平均数上下两个标准差之内(95%)或三个标准差(99.7%)。
小结:标准差是描述一组数据离散趋势大小的统计指标,定义为一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根,即:n X S 2)(X -∑= 。
对于一组原始数据求标准差的方法有两种:(1)用定义计算,nX S 2)(X -∑=;(2)用原始数据直接计算:22)(NX NXS∑∑-=。
对于分组数据,可以用组中值作为每组数据的代表,用公式:NX X f S C 2)(-∑=或22)(N fX N fX S C C∑-∑=计算标准差;如果已知各部分的观测个数,均值和标准差,总的标准差可以通过公式:ti i i t N d S N S )(22+∑=计算得到。
第二节 四分差一、四分差的概念及适用条件(一)概念四分差通常用符号Q 来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
即:213Q Q Q -=(4.6) 其中,Q 1为四分之一的分位点,即该分数以下的数据个数占总数据个数的四分之一,Q 3为四分之三的分位点,即该分数以下的数据个数占总数据个数的四分之三。
(二)适用条件通常与中位数配合使用。
即一组数据的集中趋势适宜用中位数描述时,差异情况要用四分差描述。
1. 一组数据中有极端数据出现时;2. 一组数据的两端有个别数据模糊不清或分组资料有不确定组限时。
二、四分差的计算不管是为分组的资料还是分组资料,计算四分差的基本公式都是根据定义,即:213Q Q Q -=。
只不过计算Q 1和Q 3的方法对于不同资料稍有不同。
(一)未分组资料Q 1和Q 3的计算方法首先将一组数据从大到小排序,然后用数据个数N 除以4,则第)214(+N 位置对应的数据为第一个四分位点Q 1,第)2143(+N 位置对应的数据为第三个四分位点Q 3。
例6 求下18个数据的四分差:51,60,,58,63,74,88,66,70,71,75,81,86,52,57,61,65,90,77。
解:先将18个数据按从小到大的顺序排列:51,52,57,58,60,61,63,65,66,70,71,74,75,77,81,86,88,90。
然后确定31,Q Q 的值由于N=18,所以,1Q 应为521418=+,即第5个位置所对应的数据60;3Q 为14214318=+⨯,即第14个位置对应的数据为77。