心理统计学 全套课件
合集下载
心理统计学PPT课件3数据整理与特征量.
– 本例将 N=30代入,得i=7.45,将组距调节为 10,即 每10分为一个组。组数:44/10=4.4,应该分5组。
• 决定组限
– 组限就是每一组的起点值和终点值。
• 登记次数
次数分布图
• • • • 简单次(频)数分布图 相对次数分布图 累积次数分布图 累积相对次数分布图
简单次数分布图--直方图 (histogram)
AD
X
i 1
N
i
N
AD
X
i 1
n
i
X
n
方差和标准差
• 方差(variance)指离差平方的算术平均 数 • 定义公式和计算公式:
(Xi ) Xi Xi 2 i 1 i 1 i 1 N N N
加权平均数
• 加权平均数(weighted mean)是不同比 重数据(或平均数)的平均数。计算公 式为:
Xw
W X
i 1 n i
n
i
W
i 1
Xt
n X
i 1 K i
K
i
i
n
i 1
i
几何平均数
• 几何平均数(geometric mean)是N个数 值连乘积的N次方根。计算公式为
中位数
• 中位数( median )是位于依一定顺序排 列的一组数据中央位置的数值,在这一 数值上、下各有一半频数分布着。
• 中位数的原始数值计算方法: 12 14 15 15 17 18 20 23 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5
• 中位数的应用及其优缺点
制作步骤
• 求全距
• 决定组限
– 组限就是每一组的起点值和终点值。
• 登记次数
次数分布图
• • • • 简单次(频)数分布图 相对次数分布图 累积次数分布图 累积相对次数分布图
简单次数分布图--直方图 (histogram)
AD
X
i 1
N
i
N
AD
X
i 1
n
i
X
n
方差和标准差
• 方差(variance)指离差平方的算术平均 数 • 定义公式和计算公式:
(Xi ) Xi Xi 2 i 1 i 1 i 1 N N N
加权平均数
• 加权平均数(weighted mean)是不同比 重数据(或平均数)的平均数。计算公 式为:
Xw
W X
i 1 n i
n
i
W
i 1
Xt
n X
i 1 K i
K
i
i
n
i 1
i
几何平均数
• 几何平均数(geometric mean)是N个数 值连乘积的N次方根。计算公式为
中位数
• 中位数( median )是位于依一定顺序排 列的一组数据中央位置的数值,在这一 数值上、下各有一半频数分布着。
• 中位数的原始数值计算方法: 12 14 15 15 17 18 20 23 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5
• 中位数的应用及其优缺点
制作步骤
• 求全距
心理统计学PPT课件(3):数据整理与特征量
精品文档
常用统计指标
• 集中量 • 算术平均数 • 中位数 • 众数 • 加权平均数 • 几何平均数 • 调和平均数
• 差异量 • 全距 • 平均差 • 方差与标准差 • 相对差异量 • 差异系数 • 偏态量 • 峰态量
精品文档
集中量
• 集中量(measures of central tendency)是 代表一组数据典型水平或集中趋势的量。 它能反映频数分布中大量数据向某一点 集中的情况。
• 也可以将频数分布表中频数最多的组的 组中值作为粗略众数。
精品文档
众数的优缺点
众数虽然简明易懂,但是它并不具 备一个良好的集中量的基本条件。它主 要在以下情况下使用: 当需要快速而粗略地找出一组数据的代表 值时; 当需要利用算术平均数、中位数和众数三 者关系来粗略判断频数分布的形态时; 利用众数帮助分析解释一组频数分布是否 确实具有两个频数最多的集中点时。
计值
精品文档
算术平均数的缺点
• 易受两极端数值(极大或极小)的影响;
•
某村农户收入状况
•
120, 127, 130, 131, 132, 132, 135,
136, 137, 139, 140, 145, 146, 149, 153, 158,
160, 320, 400
• 平均数=162.63
• 一组数据中某个数值的大小不够确切时 就无法计算其算术平均数。
• 中位数的应用及其优缺点
精品文档
中位数的应用及其优缺点
中位数虽然也具备一个良好的集中 量所应具备的某些条件,例如比较严格 确定、简明易懂,计算简便,受抽样变 动影响较小,但是它不适合进一步的代 数运算。它适用于以下几种情况: 一组数据中有特大或特小两极端数值时; 一组数据中有个别数据不确切时; 资料属于等级性质时。
常用统计指标
• 集中量 • 算术平均数 • 中位数 • 众数 • 加权平均数 • 几何平均数 • 调和平均数
• 差异量 • 全距 • 平均差 • 方差与标准差 • 相对差异量 • 差异系数 • 偏态量 • 峰态量
精品文档
集中量
• 集中量(measures of central tendency)是 代表一组数据典型水平或集中趋势的量。 它能反映频数分布中大量数据向某一点 集中的情况。
• 也可以将频数分布表中频数最多的组的 组中值作为粗略众数。
精品文档
众数的优缺点
众数虽然简明易懂,但是它并不具 备一个良好的集中量的基本条件。它主 要在以下情况下使用: 当需要快速而粗略地找出一组数据的代表 值时; 当需要利用算术平均数、中位数和众数三 者关系来粗略判断频数分布的形态时; 利用众数帮助分析解释一组频数分布是否 确实具有两个频数最多的集中点时。
计值
精品文档
算术平均数的缺点
• 易受两极端数值(极大或极小)的影响;
•
某村农户收入状况
•
120, 127, 130, 131, 132, 132, 135,
136, 137, 139, 140, 145, 146, 149, 153, 158,
160, 320, 400
• 平均数=162.63
• 一组数据中某个数值的大小不够确切时 就无法计算其算术平均数。
• 中位数的应用及其优缺点
精品文档
中位数的应用及其优缺点
中位数虽然也具备一个良好的集中 量所应具备的某些条件,例如比较严格 确定、简明易懂,计算简便,受抽样变 动影响较小,但是它不适合进一步的代 数运算。它适用于以下几种情况: 一组数据中有特大或特小两极端数值时; 一组数据中有个别数据不确切时; 资料属于等级性质时。
心理统计ppt03图表呈现
思考:下列数据来自什么变量?
实到学生有36人。 某学生身高为1.61米。 某学生做对14道是非题。 某学生跑400米用了1分30秒。 某学生在用五级记分的体操比赛中获3分。 某学生数学成绩为85分。
第三讲 统计图表
一 、次数分布表
次数分布表是对杂乱无序 的数据进行整理的重要手段, 它能使我们对样本情况有个初 步的了解,为今后进一步分析 和研究问题提供很大方便。
Y
230~
1
1
2
210~
1
1
1
1
4
190~
1
3
2
1
7
170~
1
3
3
1
8
150~
1
2
1
4
130~
110~
2
2
1
5
1
1
X 1 5 9 8 4 3 1 31
二、次数分布图
在编制次数分布表的基础上,可以绘制次 数分布图,使一组数据特征更加直观和概括, 而且还可以对数据的分布情况和变动趋势作粗 略的分析。 绘制次数分布图可以用已有的计算机程序, 如EXCEL,也可以用专门的统计程序。
累积曲线。
图3-8 累积次数分布曲线
累积曲线可用于判断一组数据的大致分布形态。
图3-9 正态分布数据的累积曲线
图3-10 正偏态数据累积曲线 图3-11 负偏态数据累积曲线
二、计算机制作统计图表
在心理与教育研究中常用的基本统计程序主 要有两个:SPSS和SAS。其中以SPSS应用最多。
SPSS是专门用于社会科学研究的统计分析工 具:Statistics Package for Social Science
组中值
实到学生有36人。 某学生身高为1.61米。 某学生做对14道是非题。 某学生跑400米用了1分30秒。 某学生在用五级记分的体操比赛中获3分。 某学生数学成绩为85分。
第三讲 统计图表
一 、次数分布表
次数分布表是对杂乱无序 的数据进行整理的重要手段, 它能使我们对样本情况有个初 步的了解,为今后进一步分析 和研究问题提供很大方便。
Y
230~
1
1
2
210~
1
1
1
1
4
190~
1
3
2
1
7
170~
1
3
3
1
8
150~
1
2
1
4
130~
110~
2
2
1
5
1
1
X 1 5 9 8 4 3 1 31
二、次数分布图
在编制次数分布表的基础上,可以绘制次 数分布图,使一组数据特征更加直观和概括, 而且还可以对数据的分布情况和变动趋势作粗 略的分析。 绘制次数分布图可以用已有的计算机程序, 如EXCEL,也可以用专门的统计程序。
累积曲线。
图3-8 累积次数分布曲线
累积曲线可用于判断一组数据的大致分布形态。
图3-9 正态分布数据的累积曲线
图3-10 正偏态数据累积曲线 图3-11 负偏态数据累积曲线
二、计算机制作统计图表
在心理与教育研究中常用的基本统计程序主 要有两个:SPSS和SAS。其中以SPSS应用最多。
SPSS是专门用于社会科学研究的统计分析工 具:Statistics Package for Social Science
组中值
心理统计学一第二章统计图表ppt课件
第二章 统计图表
各种科学研究的结果大多以 数据的形式出现。这些直接获得 的数据称为原始数据或观测数据, 它们纷乱无章,初看起来难以发 现问题,只有经过整理分析才能 从中提取出有用的信息构成规律 性的知识。
第二章 统计图表
因此,科学工作者在实验或调 查结束后的第一项工作就是依据研 究的目的要求,对原始数据加以初 步整理与分析,制成简单的统计图 或统计表,从中发现这些数据分布 的形式和特点,再选择必要的统计 方法进一步作深入研究。
统计表的结构
表号
标题
表2-1 统计表的格式
顶线
横标目的总标目 纵标目 表线
横标目
数字
注:
表注
标目
底线
统计表的结构和组成要素图示
顶线 表线
标目
表注
表号
标题
表2-1 80名员工对部门主管尽职程度调查结果
80名员工对主管尽职情况评定
人数
①非常不尽职
9
②不尽职
30
③不置可否
10
④尽职
25
⑤非常尽职
6
总计
条形图:用直条的长短来表示统计项目数 值大小的图形,主要是用来比较性质相似 的间断型资料。
圆形图:是用于表示间断型资料比例的图 形。圆形的面积表示一组数据的整体,圆 中扇形的面积表示各组成部分所占的比例。 各部分的比例一般用百分比表示。
单式条形图
60
50
40
人 数
30
20
图形
10
尺度线 0
即总次数。
(6) 抄录新表:新表包括的栏目有:第一列为分组区间,第二列为各分
组区间的组中值,第三列为次数。
分组次数分布表的意义与缺点
《心理统计学》课件-第10~11章
多选题
下列关于卡方配合度检验方法中的自由度,说法正确的( )
A. 配合度检验的自由度与实验的自由度分类的项数有关 B. 通常情况下,配合度检验的自由度为分类的项数减1 C. 配合度检验的自由度一般为理论次数减1 D. 在正态拟合检验时,自由度为分组项目数减3
多选题
下列关于卡方配合度检验方法中的自由度,说法正确的(ABD )
10.1 χ²检验
10.1.1 χ²检验的原理 选择
χ²检验方法能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否 相一致问题,或说有无显著差异问题。
10.1 χ²检验
χ²检验的原理 χ²检验的基本假设 χ²检验的分类 χ²检验的基本公式 期望次数的计算
1、观察频数:又称实际频数,是指在实验或调查中得到的计数资料。 2、理论频数:是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的 次数,又称为期望次数。
10.1.5 期望次数的计算 选择
小期望次数的连续性矫正(即每组里面的理论次数小于5时)
10.1 χ²检验
χ²检验的原理 χ²检验的基本假设 χ²检验的分类 χ²检验的基本公式 期望次数的计算
当单元格人数过少时,处理方法有以下四种: 1、单元格合并法 2、增加样本法 3、去除样本法 4、使用矫正公式:在2×2的列联表检验中,若单元格的期望次数低于10但高于5可 使用耶茨校正公式来加以校正。若期望次数低于5时,或 样本总人数低于20时,则应 使用费舍精确概率检验法。当单元格内容牵涉到重复测量设计时(例如前后测设计), 则可使用麦内玛检验。
A. 配合度检验的自由度与实验的自由度分类的项数有关 B. 通常情况下,配合度检验的自由度为分类的项数减1 C. 配合度检验的自由度一般为理论次数减1 D. 在正态拟合检验时,自由度为分组项目数减3
心理统计学PPT课件2:平均数和标准差
无偏性
当数据量足够大时,平均 数的期望值等于其真实值, 因此平均数具有无偏性。
02
CHAPTER
标准差
定义
01
描述数据分布的离散程度
标准差是用来描述数据分布离散程度的统计量,它表示各数值与其平均
数之间的偏差程度。
02
计算每个数值与平均数的差的平方
标准差的计算方法是将每个数值与平均数之间的差的平方,然后求和,
04
CHAPTER
平均数和标准差的局限性和 注意事项
平均数的局限性
平均数易受极端值影响
01
当数据集中存在极端值时,平均数会受到较大影响,导致结果
偏离实际。
平均数难以反映数据分布
02
平均数只能描述数据集的中心趋势,无法反映数据的离散程度
和分布形态。
不同数据集的平均数难以比较
03
由于不同数据集的单位、量级可能不同,直接比较两个数据集
03
CHAPTER
平均数和标准差在心理统计 中的应用
描述数据分布
平均数
描述数据集中趋势,计算所有数值的 和除以数值的数量,反映数据“中心 ”或“典型值”。
标准差
描述数据离散程度,计算各数值与平 均数之差的平方和的平均数,再取平 方根,反映数据分布的“宽度”或“ 波动范围”。
比较两组数据
平均数差异检验
的平均数可能导致误解。
标准差的注意事项
标准差并非绝对标准
标准差的大小受数据量级和单位的影响,因此需要结合实际情境 进行解释。
标准差并非越小越好
标准差小表示数据离散程度较小,但这并不意味着数据质量就高。
标准差并非适用于所有情况
对于非正态分布的数据,标准差可能无法准确反映数据的离散程度。
心理统计学课件第六章 概率分布
(三)正态分布的特征
正态分布的形式是对称的,它的对称轴是 经过平均数点的垂线。
正态分布的中央点(即平均数点)最高, 然后逐渐向两侧下降。
正态曲线下的面积为1,平均数点的垂线 将面积划分为相等的两部分0.50。
正态分布曲线,标准差与概率有一定的数 量关系。
二、正态分布表的结构与使用
2、已知P值,求Z分数
已知从平均数开始的概率值,求Z值 已知位于两端的概率值,求该概率分界点
上的Z值 已知正态曲线中间部分的概率,特定区间的人数 求考试成绩中某一特定人数比率的分数界
限 按能力分组或等级评定时确定人数 将等级评定结果转化为测量数据
按能力分组或等级评定时确定人数
要把100人在某一能力上分成5个等级, 各等级应该有多少人?
将等级评定结果转化为测量数据
某教师评价全班50人的作文,有8人优, 17人良,20人中,5人及格,求各等级的 标准分数
求考试成绩中特定区间的人数
已知某年级200名学生考试呈正态分布, 平均分为85分,标准差为10分,学生甲 的成绩为70分,问全年级成绩比学生甲低 的学生人数是多少?
求考试成绩中某一特定人数比率的分数界限
某次招生考试,学生成绩符合正态分布, 学生成绩的平均分为80分,标准差为10 分,要择优录取25%的学生进入高一级学 校学习,问最低分数线应是多少?
第六章 概率分布 第三节 正态分布
一、正态分布特征
(一)正态分布的概念 与二项概率分布对比 变量类型 图形
正态分布:
在一个概率分布中,中间频数多,两 端频数对称地减少,成为一种“钟”形对 称的理论概率分布。
(二)正态分布曲线
标准正态分布的密度函数:
心理与教育统计学PPT课件
• 最早将统计方法应用于心理学研究的是高尔顿。
17
第17页/共28页
第三节 心理与教育统计学的发 • 心理与教育统计在我国的发展与应用(p.17): 展 • 统计方法的引入
• 受挫时期 • 复苏和发展
18
第18页/共28页
• 一、数据类型 第四节 心理与教育统计基础概 念 • 不同类型的数据,适用的统计方法不同。
12
第12页/共28页
推论统计
• 主要研究如何通过局部数据所提供的信息,推论总体的情形。 • 具体包括:
• 1、总体参数的估计方法(参数、非参数) • 2、假设检验(计数数据和测量数据)
13
第13页/共28页
实验设计
• 研究如何科学地、经济地以及更有效地进行实验。 • 作为一个严谨的实验研究,在实验以前就要对研究的步骤、被
• 心理与教育科学研究数据与结果多用数字形式呈现; • 研究数据具有随机性和变异性; • 研究数据具有规律性(随观测次数增加,呈现出一定规律); • 心理与教育科学研究的目标是通过部分数据来推测总体特征;
• 举例:测智商
6
第6页/共28页
第一节 统计方法在心理与教育科学研究中的 作• 三用、学习心理与教育统计应注意的事项。
量(variables)。
• 与变量相反的是常数(constant)。
• 观测值
• 变量一但确定了某个值,就称这个值为某一 变量的观测值(observation)。
• 随机变量
• 在测查前不能预料取到什么值的变量,称为
随机变量(random variables)。
23
第23页/Байду номын сангаас28页
数据的精确值问题
9
第9页/共28页
17
第17页/共28页
第三节 心理与教育统计学的发 • 心理与教育统计在我国的发展与应用(p.17): 展 • 统计方法的引入
• 受挫时期 • 复苏和发展
18
第18页/共28页
• 一、数据类型 第四节 心理与教育统计基础概 念 • 不同类型的数据,适用的统计方法不同。
12
第12页/共28页
推论统计
• 主要研究如何通过局部数据所提供的信息,推论总体的情形。 • 具体包括:
• 1、总体参数的估计方法(参数、非参数) • 2、假设检验(计数数据和测量数据)
13
第13页/共28页
实验设计
• 研究如何科学地、经济地以及更有效地进行实验。 • 作为一个严谨的实验研究,在实验以前就要对研究的步骤、被
• 心理与教育科学研究数据与结果多用数字形式呈现; • 研究数据具有随机性和变异性; • 研究数据具有规律性(随观测次数增加,呈现出一定规律); • 心理与教育科学研究的目标是通过部分数据来推测总体特征;
• 举例:测智商
6
第6页/共28页
第一节 统计方法在心理与教育科学研究中的 作• 三用、学习心理与教育统计应注意的事项。
量(variables)。
• 与变量相反的是常数(constant)。
• 观测值
• 变量一但确定了某个值,就称这个值为某一 变量的观测值(observation)。
• 随机变量
• 在测查前不能预料取到什么值的变量,称为
随机变量(random variables)。
23
第23页/Байду номын сангаас28页
数据的精确值问题
9
第9页/共28页
心理与教育统计学课件(张厚粲版)ch2统计图表
40 35 30 25 20 15 10 5 0 一年级 二年级 三年级 四年级 女生 男生
图2-1 某高校教育系各年级男女生人数
资料来源:表2-6
表2-6 某高校教育系各年级男女生人数统计表
一年级 二年级 三年级 四年级
女
人数
男
女
男
女
男
女
男
26
33
26
36
24
37
25
35
(二)统计图的种类
1.条形图(又称直条图) 条形图按图形中被比资料的组数不同,可 分为单式条形图和复式条形图;按条形 图的排列的方向不同,可分为纵条图和 横条图。
二、次数分布图
(一)直方图 (二)次数多边图 (三)累积次数分布图
㈠直方图
25 20 15 10 5 0
图2-7a 初二100名学生数学测验分数的次数直方图
㈡次数多边图
25 20 15 10 5 0 37 42 47 52 57 62 67 72 77 82 87 92 97
图2-7b 初二100名学生数学测验分数的次数多边图
复式横条图
优
良 女生 男生 中
差 0 5 10 15
图2-3b 某校初二.三班男女生学习成绩和人数
2.圆形图
优 良 中 差
图2-4 某校初二.三班学习成绩比较图
3.线形图
7 6 5 4 3 2 1 0 7 8 9 10 11 12 13 14 15 16 17 18 男生 女生
图2-5 我国城市7~18岁学生身高年增长情况
㈢累加次数分布图
120 100 80 60 40 20 0 35 40 45 50 55 60 65 70 75 80 85 90 95
心理统计学 全套课件
答案
组别 组中值 次数(f) 相对 累积 累积相 累积百 次数 次数 对次数 分比
95-99 97
2
.04 50 1.00 100
90-94 92
3
.06 48
.96
96
85-89 87
2
.04 45
.90
90
80-84 82
6
.12 43.86 Nhomakorabea86
75-79 77
14 .28 37
.74
74
70-74 72
P (Xx)C n xpxqn xx!(n n !x)p !xqn x
二项分布图
0.25 0.2
0.15 0.1
0.05 0 0 2 4 6 8 10
二项分布图
• 从二项分布图可以看出,当p = q,不管 n 多大,二项分布呈对称形。
• 当 n 很大时,二项分布接近于正态分布。 当 n 趋近于无限大时,正态分布是二项 分布的极限。
中位数的原始数值计算方法: 12 14 15 15 17 18 20 23 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5
中位数的应用及其优缺点
中位数虽然也具备一个良好的集中 量所应具备的某些条件,例如比较严格 确定、简明易懂,计算简便,受抽样变 动影响较小,但是它不适合进一步的代 数运算。它适用于以下几种情况:
答对1题 2种
答对0题 1种
3道是非题的情况
TTT TTF, TFT, FTT TFF, FTF, FFT
FFF
答对3题 答对2题 答对1题 答对0题
1种
3种
3种
1种
4道是非题的情况
心理统计学统计图表 ppt课件
1.1 数据排序 1.2 统计分组 分组前的准备
数据核对 切忌随心所欲删除不符合自己主观假设的数
据; 以充分的理由剔除过失数据 (平均数加减3
个标准差) 。
心理统计学统计图表
分组的标志
对数据分组时所依据的特性称为标志。 性质类别:反映事物在组别、种类上的不同,
如性别、年龄(老中青) 数量类别:以数值大小进行分组 ,经济收入,
心理统计学统计图表
标目 分类的项目,说明统计数字意义
标目位置
横
标
目
横标目
纵标目
纵标目
心理统计学统计图表
纵标目 横 标 目
心理统计学统计图表
内容
主语:资料性质,指标或指标体系 定语:限制主语,分组或分组体系 谓语:统计资料——数字
横标目纵标目 横︵ 标定 目语
︶
纵标目 (主语)
数字
(谓语)
心理统计学统计图表
研究设计
搜集 数据
统计整理 分析
观测数据或原始数据
图表呈现,生动直观、一目了然、容易理解
心理统计学统计图表
Contents
1 数据的初步整理
2
次数分布表
3
次数分布图
4 其他类型的统计图表
心理统计学统计图表
1 数据的初步整理
统计表
简单、清晰、准确
心理统计学统计图表
❖ 统计图
更具体形象
心理统计学统计图表
P29
心理统计学统计图表
统计图应用实例:正误判断
心理统计学统计图表
心理统计学统计图表
心理统计学统计图表
2 次数分布表
表示数据在各个分组区间内的散布 情况。
简单次数分布表:依据每
《心理统计学》课件-第5章
1、成对(N<30) 2、非正态 3、线性 4、非连续,主要是顺序数据或称名数据。
思考
皮尔逊积差相关 VS 等级相关
1、成对(N≥30) 2、正态(接近正态) 3、线性 4、连续,主要是等距或等比数据。
1、成对(N<30) 2、非正态 3、线性 4、非连续,主要是顺序数据或称名数据。
总之,等级相关的适用范围比积差相关的大,又对总体分布不做要求。但其精确度要差 于积差相关,因此凡是符合积差相关的资料,都不用等级相关计算。
5.1 相关、相关系数与散点图
5.2 积差相关
第五章 相关关系
5.3 等级相关
5.4 质与量相关
5.5 品质相关
5.2 积差相关(Pearson相关)
5.2.1 积差相关的概念与适用条件 选择、简答
积差相关是揭示两个变量线性相关方向和程度最常用和最基本的方法。
5.2 积差相关
概念与适用条件 基本公式 差法公式
)。
A. x数值增大时,y也随之增大 B. x数值减少时,y也随之减少 C. x数值增大(或减少)时,y也随之减少(或增大) D. y的取值,几乎不受x取值的影响
5.1 相关、相关系数与散点图
5.1.2 相关系数 选择
5.1 相关、相关系数与散点图
相关及相关类别 相关系数 散点图
两列变量相关程度的数字表现形式,常用r来表示,描述总体时一般用ρ来表示。
完全负相关 r=-1
完全正相关 r=1
正相关
负相关
零相关
多选题
【统考】散点图的形状为一条直线,它们之间的相关系数可能为(
A. 1 B. 0.5 C. 0 D. -1
)。
多选题
AD 【统考】散点图的形状为一条直线,它们之间的相关系数可能为(
心理统计学数据整理与特征量优秀课件
就无法计算其算术平均数。
中位数
• 中位数(median)是位于依一定顺序排 列的一组数据中央位置的数值,在这一 数值上、下各有一半频数分布着。
• 中位数的原始数值计算方法: 12 14 15 15 17 18 20 23 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5
常用统计指标
• 集中量
– 算术平均数 – 中位数 – 众数 – 加权平均数 – 几何平均数 – 调和平均数
• 差异量
– 全距 – 平均差 – 方差与标准差
• 相对差异量
– 差异系数
• 偏态量 • 峰态量
集中量
• 集中量(measures of central tendency) 是代表一组数据典型水平或集中趋势的 量。它能反映频数分布中大量数据向某 一点集中的情况。
计值
算术平均数的缺点
• 易受两极端数值(极大或极小)的影响; 某村农户收入状况 120, 127, 130, 131, 132, 132, 135, 136,
137, 139, 140, 145, 146, 149, 153, 158, 160, 320, 400
平均数=162.63 • 一组数据中某个数值的大小不够确切时
某班级智商测验结果
学号 1 2 3 4 5 6 7 8 9 10
得分 103 114 129 105 103 97 102 108 102 87
学号 11 12 13 14 15 16 17 18 19 20
得分 107 85 110 94 108 92 113 108 122 107
学号 21 22 23 24 25 26 27 28 29 30
众数的优缺点
中位数
• 中位数(median)是位于依一定顺序排 列的一组数据中央位置的数值,在这一 数值上、下各有一半频数分布着。
• 中位数的原始数值计算方法: 12 14 15 15 17 18 20 23 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5
常用统计指标
• 集中量
– 算术平均数 – 中位数 – 众数 – 加权平均数 – 几何平均数 – 调和平均数
• 差异量
– 全距 – 平均差 – 方差与标准差
• 相对差异量
– 差异系数
• 偏态量 • 峰态量
集中量
• 集中量(measures of central tendency) 是代表一组数据典型水平或集中趋势的 量。它能反映频数分布中大量数据向某 一点集中的情况。
计值
算术平均数的缺点
• 易受两极端数值(极大或极小)的影响; 某村农户收入状况 120, 127, 130, 131, 132, 132, 135, 136,
137, 139, 140, 145, 146, 149, 153, 158, 160, 320, 400
平均数=162.63 • 一组数据中某个数值的大小不够确切时
某班级智商测验结果
学号 1 2 3 4 5 6 7 8 9 10
得分 103 114 129 105 103 97 102 108 102 87
学号 11 12 13 14 15 16 17 18 19 20
得分 107 85 110 94 108 92 113 108 122 107
学号 21 22 23 24 25 26 27 28 29 30
众数的优缺点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
答案
组别 组中值 次数(f) 相对 累积 累积相 累积百 次数 次数 对次数 分比
95-99 97
2
.04 50 1.00 100
90-94 92
3
.06 48
.96
96
85-89 87
2
.04 45
.90
90
80-84 82
6
.12 43
.86
86
75-79 77
14 .28 37
.74
74
70-74 72
二项分布图
0.25 0.2
0.15 0.1
0.05 0 0 2 4 6 8 10
二项分布图
• 从二项分布图可以看出,当p = q,不管 n 多大,二项分布呈对称形。
• 当 n 很大时,二项分布接近于正态分布。 当 n 趋近于无限大时,正态分布是二项 分布的极限。
地位量**
• 百分位数--次数 分布中相对于某个 特定百分点的原始 分数,它表明在分 布中低于该分数的 个案占总次数的百 分比。
• 百分等级--次数 分布中低于特定原
始分数的次数百分 比。
众数
• 众数是集中量的一种指标。 • 对众数有理论众数及粗略众数两种定义
方法
– 理论众数是指与次数分布曲线最高点相对应 的横坐标上的一点。
P(A) limm n n
硬币朝向试验
试验者 德摩根
蒲丰 皮尔逊 皮尔逊
抛掷次数 2048 4040 12000 24000
正面朝上次数 正面朝上比率
1061
.5181
2048
.5069
6019
.5016
12012
.5005
Hale Waihona Puke 概率的古典定义——先验概率• 是通过古典概率模型加以定义的,该模型要 求满足两个条件:(1)试验的所有可能结果 是有限的;(2)每一种可能结果出现的可能 性(概率)相等。若所有可能结果的总数为n, 随机事件A包括m个可能结果,则事件A的概 率计算公式为:
心理统计学 全套课件
第一章 统计学是一种思想方法
• 确定现象与随机现象 • 回归现象 • 数量规律性 • 概率
随机现象
• 学生成绩 • 心理测验得分 • 候车人数 • 作物产量 • 产品质量 • 收入支出
数量规律性
• 平均数 • 方差、标准差 • 比率、百分比 • 相关系数 • 数量分布
正态分布
统计学中的几个基本概念
• 随机变量 • 总体
– 有限总体与无限总体
• 样本
– 大样本与小样本
• 参数与统计量
返回
第二章 数据的搜集与整理
• 数据的水平 • 次数分布表 • 次数分布图
数据的水平
• 间断型随机变量 • 连续型随机变量
• 称名量表 • 顺序量表(等级量表) • 等距量表 • 等比量表
加权平均数
加权平均数是不同比重数据(或平 均数)的平均数。计算公式为:
n
WiX i
Xw
i1 n
Wi
i1
K
niX i
Xt
i1 K
ni
i1
几何平均数
几何平均数是n个数值连乘积的n次 方根。计算公式为
Xg n X1X2Xn
当一个数列的后一个数据是以前一个 数据为基础成比例增长时,要用几何平 均数求其平均增长率。
– 粗略众数是指一组数据中次数出现最多的那 个数。
众数的优缺点
众数虽然简明易懂,但是它并不具 备一个良好的集中量的基本条件。它主 要在以下情况下使用:
• 当需要快速而粗略地找出一组数据的代 表值时;
• 当需要利用算术平均数、中位数和众数 三者关系来粗略判断次数分布的形态时;
• 利用众数帮助分析解释一组次数分布是 否确实具有两个次数最多的集中点时。
中位数的应用及其优缺点
中位数虽然也具备一个良好的集中 量所应具备的某些条件,例如比较严格 确定、简明易懂,计算简便,受抽样变 动影响较小,但是它不适合进一步的代 数运算。它适用于以下几种情况:
(1)一组数据中有特大或特小两极 端数值时;
(2)一组数据中有个别数据不确切 时;
(3)资料属于等级性质时。
11 .22 23
.46
46
65-69 67
7
.14 12
.24
24
60-64 62
4
.08 5
.10
10
55-59 57
1
.02 1
.02
2
总和
50 1.00
次数分布图
• 简单次(频)数分布图 • 相对次数分布图 • 累积次数分布图 • 累积相对次数分布图
简单次数分布图--直方图
简单次数分布图--次数多边图
差异量
差异量用于表示数据的变异程度或 离散程度。常用的差异量有全距、平均 差、方差、标准差和差异系数等。
全距
全距指一组数据中最大值与最小值 之差。
优点:概念清楚,意义明确,计算 简单;
缺点:容易受极端数值的影响,反 应不灵敏。
平均差
平均差就是每 一个数据与该组数 据的中位数(或算 术平均数)离差的 绝对值的算术平均 数。
P( A) m n
概率的性质
• 任何随机事件A的概率都是介于0与1之间 的正数;
• 不可能事件的概率等于0; • 必然事件的概率等于1。
小概率事件
• P < .05 • P < .01
概率的加法
• 在一次试验中不可能同时出现的事件称为互不 相容的事件。
• 两个互不相容事件和的概率,等于这两个事件 概率之和。用公式表示为: P(A + B) = P(A) + P(B) 其推广形式是 P(A1 + A2 + … + An) = P(A1) + P(A2) + … + P(An)
40 35 30 25 20 15 10
5 039 44 49 54 59 64 70 75 80 85 90 95 100
双峰分布
60 50 40 30 20 10
0 6点 8点 10点 12点 14点 16点 18点 20点
其他分布
300 250 200 150 100
50 0 赞成
反对
不置可否
次数多边图的优点
累积次数分布图
累积相对次数分布图
散点图
轮廓图
雷达图
脸谱图
第三章 常用统计指标
• 集中量
– 算术平均数 – 中位数 – 众数 – 加权平均数 – 几何平均数 – 调和平均数
• 差异量
– 全距 – 平均差 – 方差与标准差
• 相对差异量
– 差异系数
• 偏态量 • 峰态量
集中量
例题
• 上例中,如果第一个学生把抽出的试题 还回后,第二个学生再抽,则两个学生 都抽第一题的概率为多少?
基础比率
• 假设癌症患者占总人口的比例为1%,癌 症患者在X光检查中有80%呈阳性,未患 癌症的人在X光检查中有10%呈阳性。现 在有一个人在X光检查中呈阳性,问这个 人患癌症的概率是多大?
基础比率
失败; • 各次试验相互独立,互不影响 • 各次试验中成功的概率相等。
问题
• 一个学生全凭猜测答2道是非题,则答对 0、1、2题的概率是多大?
• 如果是3道题、4道题呢?
2道是非题的情况
答对2题 1种
TT TF, FT
FF
答对1题 2种
答对0题 1种
3道是非题的情况
TTT TTF, TFT, FTT TFF, FTF, FFT
20-39 40-59 60-69 70-79 80-89 90-99 100 总和
人数 10 30 40 51 70 54 40 5 300
百分比 3.33 10.00 13.33 17.00 23.33 18.00 13.33 1.67 100
某班级语文测验结果
99 96 92 90 90 87 86 84 83 83 82 82 80 79 78 78 78 78 77 77 77 76 76 76 76 75 75 74 74 73 72 72 72 71 71 71 70 70 69 69 68 67 67 67 65 64 62 62 61 57
• 反应灵敏; • 严密确定,简明易懂,计算方便; • 适合代数运算; • 受抽样变动的影响较小; • 样本算术平均数是总体平均数的最好估
计值
算术平均数的缺点
• 易受两极端数值(极大或极小)的影响; 某村农户月收入状况
120, 127, 130, 131, 132, 132, 135, 136, 137, 139, 140, 145, 146, 149, 153, 158, 160, 320, 400
平均数=162.63 • 一组数据中某个数值的大小不够确切时
就无法计算其算术平均数。
中位数
中位数是位于依一定顺序排列的一 组数据中央位置的数值,在这一数值上、 下各有一半次数分布着。
中位数的原始数值计算方法: 12 14 15 15 17 18 20 23 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5
例题
• 某学生从5个试题中任意抽选一题,如 果抽到每一题的概率为1/5,则抽到试 题1或试题2的概率为多少?
概率的乘法
• A事件出现的概率不影响B事件出现的概 率,这两个事件为独立事件。
• 两个独立事件积的概率,等于这两个事 件概率的乘积。用公式表示为: P(A ·B) = P(A) ·P(B) 其推广形式是 P(A1 ·A2 … An) = P(A1) ·P(A2) … P(An)
FFF