课题研究数据整理与分析---统计理论部分

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

心理与教育统计学基础知识
1、数据类型
计数数据
测量数据
分类数据 等级数据 等距数据 比率数据
离散型数据
连续型数据
变量、随机变量、观测值
❖ 变量是可以取不同值的量。统计观察的指标都 是具有变异的指标。当我们用一个量表示这个 指标的观察结果时,这个指标是一个变量。
❖ 用来表示随机现象的变量,称为随机变量。一 般用大写的X或Y表示随机变量。
三、方差和标准差
方差(又称为变异数、均方)。是表示一组数
据离散程度的统计指标。一般样本的方差用
表示,总体的方差用 表示。
S2
标准差(stan2dard deviation)是方差的算
术平方根。一般样本的标准差用 S 表示,总
体的标准差用 表示。
标准差 和方差是描述数据离散程度的最常用的
差异量。
成 绩
表5组X-c1中值52名学频生数数f 学F*成Xc绩方差F和*X标C2 准差计算计表算
95 -
90 -
85 -
97.5 92.5 87.5
2 195 19012.5
2 185
S2
f Xc 2
f Xc
2
17112.5
n n
280525
3775 2
3 262.5 22968.75
52 52
80 -
顶线
横标目的总标目
纵标目 表线
横标目
注:
表注
标目
数字
底线
例: 表2-2 北京市四街道智力落后患者分布
街道 甲 乙 丙
检查人数 51841 76030 49508
病人数 患病率(‰)
159
3.1
263
3.5
190
3.8

51788
170
3.3
总计 229168 782
3.4
资料来源:见《心理学报》1979年第1期103页,选部分引用
课题研究数据整理与分析 ---统计理论部分
周海波 湖南师范大学心理系
课程目标、内容
❖ 目标:掌握课题研究的一些基本思路、选取 方法、统计分析方法
❖ 内容
统计概论 Excel与课题研究 SPSS与课题研究
引言--课题研究
❖ 案例1 双手交叉
与性别的关系 与文理科的关系 与性格气质类型的关系 如果描述上述结果?
而n <30的样本称为小样本。
统计量和参数
统计指标 统计量 参数
平均数
μ
X
标准差 S
σ
相关系数 r
ρ
回归系数 b
β
次数、比率、频率与概率
❖ 次数/频数:某一事件在某一类别中出现的数目 ❖ 比率:两个数的比 ❖ 频率:某一事件发生的次数被总的事件数目除 ❖ 概率:某一事件在无限的观测中所能预料的相
❖ 标准分数从分数对平均数的相对地 位、该组分数的离中趋势两个方面来 表示原始分数的地位。
❖ Z分数可以表明原始分数在团体中的 相对位置,因此称为相对位置量数。
❖ 把原始分数转换成Z分数,就把单位 不等距的和缺乏明确参照点的分数转 换成以标准差为单位、以平均数为参 照点的分数。
2.标准分数的性质
初二 12 12 38 40 8 5 0 1 116
初三 10 10 26 31 12 7 10 13 119
高一 4 9 18 15 4 2 3 2 57
高二 17 3 43 24 5 9 7 4 112
高三 1 1 7 3 2 1 0 2 17
合计 62 54 196 167 34 35 22 25 595
82.5
124.5
5 412.5 34031.25
S 124.5
75 -
77.5
8 620 48050
11.16
70 -
72.5
11 797.5 57818.75
5.方差和标准差的意义
❖ 方差与标准差是表示一组数据离散程度的最好 指标,是统计分析中最常用的差异量。
❖ 标准差具备一个良好的差异量应具备的条件, 如:反应灵敏,有公式严密确定,简明易懂, 适合代数运算等等。
❖ 应用方差和标准差表示一组数据的离散程度, 须注意必须是同一类数据(即同一种测量工具 的测量结果),而且被比较样本的水平比较接 近。
1.4 标准分数
❖ 标准分数(standard score),又
称为基分数或Z分数(Z-score),
是以标准差为单位表示一个原始分数 在团体中所处位置的相对位置量数。
❖ 随机变量所取得的值,称为观测值。一个随机 变量可以有许多个观测值。
总体、个体和样本
❖ 需要研究的同质对象的全体,称为总体。 ❖ 每一个具体研究对象,称为一个个体。 ❖ 从总体中抽出的用以推测总体的部分对象
的集合称为样本。 ❖ 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;
年龄组
3岁~ 4岁~ 5岁~ 6岁~
平均用时 (秒)
7.71
7.16 6.04 5.53
资料来源:引自《华东师范大学学报》,1985年第2期第30页
例: 表2-6 中学生心理烦恼调查被试分布



未填
学习成绩
合计
女生 男生 女生 男生 女生 男生 女生 男生
初一 18 19 64 54 3 11 2 3 174
20
10
0 一
视觉记忆 听觉记忆




六 初一 初二 初三
年级
图2-5 有意义的材料再现率比较线形图
1.4 集中量数
❖ 集中趋势:数据分布中大量数据向某方向集 中的程度
❖ 算数平均数 ❖ 中数 ❖ 众数 ❖ 加权平均数 ❖ 几何平均数 ❖ 调和平均数
差异量数
❖ 离中趋势:数据分布中彼此分散的程度,差异量越大,
差别,称为抽样误差。
抽样原理及其方法
❖ 原则:
随机化,在进行抽样中,总体中每一个体是否被 抽取,并不由研究者主观决定,而是每一个体按 照概率原理被抽取的可能性是相等
❖ 抽样方法
简单随机抽样:抽签法,随机数字法 等距抽样:排序,隔若干个抽取一个 分层随机抽样:将总体分层,每层中随机抽样 两阶段随机抽样:分为两阶段
❖ Z分数无实际单位,是以平均数为参照点、 以标准差为单位的相对量。
❖ 一组原始分数得到的Z分数既有正值,也 有负值,所有原始分数的Z分数之和为零。
❖ 一组原始数据中,各个Z分数的标准差为 1。
❖ 标准正态分布的平均值为0,标准差为1。
3.标准分数的优点 ❖ 可比性:标准分数以团体的平均数为基准,
❖ 线形图用来表示连续型资料。它能 表示两个变量之间的函数关系;一 种事物随另一种事物变化的情况; 某种事物随时间推移的发展趋势等。
❖ 基于线形图,既可对有关统计变量 进行数量比较,又可分析发展的趋 势。
例如:对有意义的词汇,小学一年级至初中三年级学 生视觉、听觉记忆再现率的情况。
70
60
50
40 百 分 30 比
❖ 课题研究一般过程
选择课题 实施方案 实验研究 整理结果
一 统计概论
❖ 统计学:是一门关于用科学方法收集、整理、 汇总、描述和分析数据咨询,并在此基础上 进行推断和决策的科学。
❖ 统计
统计资料 统计工作 统计学
❖ 教育统计学
心理与教育统计学的研究内容
心理与教育统计学
描述统计 推论统计 实验设计
统计图的分类
❖ 条形图:用直条的长短来表示统计项目数 值大小的图形,主要是用来比较性质相似 的间断型资料。
❖ 圆形图:是用于表示间断型资料比例的图 形。圆形的面积表示一组数据的整体,圆 中扇形的面积表示各组成部分所占的比例。 各部分的比例一般用百分比表示。
单式条形图
60Biblioteka Baidu
50
40
人 数
30
20
图形
推论统计
❖ 定义:
研究如何通过局部数据所提供的信息,推论总体的情形, 目的在于根据已知的情况,在一定概率的意义上估计、 推测未知的情况。
❖ 内容
假设检验,大样本(Z检验);小样本(t检验);计算资料(百分数 检验,X2 检验),变异数分析(F检验),回归分析方法
总体参数特征值估计方法 非参数的统计方法
1.1 描述统计
❖ 定义:
主要研究如何整理心理与教育科学实验或调查得来的大 量数据,描述一组数据的全貌,表达一件事物的性质.
❖ 内容:
数据如何分组:使用统计图表描述 怎样计算一组数据的特征值,从而描述数据全貌 表示一一事物两种或两种以上属性间相互关系的描述及
各种相关系数的计算及应用条件,描述数据分布特征的峰 度偏度系数的计算方法
圆形图
乙 47%
丙 19%
尺度线
甲 30%
丁 4%
基线
图2-4 某年级操行评定结果圆形图
绘制圆形图的步骤
❖ 求出各组成部分所占的百分比
某一成分数量 总数量
❖ 求出各部分的中心角度
某一成分数量 总数量
360
❖ 以顺时针方向画出扇形
❖ 标出不同颜色及百分比
乙 47%
丙 19%


30%
4%
线形图
❖ 失误:指存在明确差错的数据或答案。
❖ 对于个别极端数据是否该剔除,应遵循三个标准 差法则。
1.2 统计表
❖ 统计表是用来表达研究 变量与被说明的事物之间数 量关系的表格。它可以将大 量数据的分类结果清晰、概 括、一目了然地表达出来, 便于分析、比较和计算。
统计表的构成
表号
标题
表2-1 统计表的格式
❖ 缺失:指数据不全或缺项未填;例如一份资料中 未回答的问题占10%以上,或者缺少关键性资料。
❖ 可疑:指难以辨认或怀疑其真实性的数据;例如, 有的被试填答的问卷全部选同一个选项(如全选A 或全选B);有的被试填答的结果可以看到是一种 规则的排列方式(如A B C D E D B C A B C D E……)。
以表示在团体中的相对位置。
当研究需要合成不同质的数据时,如果已 知这些不同质的观测值的次数分布为正态, 这时可采用Z分数来计算不同质的观测值的 总和或平均值。
❖ 可以看到,在平均数上 下各三个标准差的范围 内,分布着全部数据的 99.73%,反言之,在三 个标准差之外的数据不 足0.27%,因此常把 “三个标准差”做为判 断可疑值取舍的依据。
实验设计
❖ 目的:
研究如何更加合理、有效地获得观察资料,如何更正确、 更经济、更有效的达到目的实验目的,以提示实验中各 种变量关系的实验计划。
❖ 内容:
选择怎样的抽样方式; 如何计算样本容量; 确定怎样的实验对照形式; 如何实现实验组和对照组的等组化; 如何安排实验因素和如何控制无关因素; 用什么统计方法处理及分析实验结果,
统计表的种类
❖ 简单表:只按研究现象(或变量) 的名称、地点、时序等列出数据的 统计表。
❖ 分组表:只按一个标志分组的统计 表称为分组表。
❖ 复合表:按两个或两个以上标志分 组的统计表称为复合表。
简单表
表2-3 各校学生数一览表
学校 A校 B校 C校
人数
985
762
893
D校 1051
分组表
❖ 表2-4 上海市区男幼儿20米跑步用时
表明数据越分散、不集中;差异量越小,表明数据越集 中,变动范围越小。 ❖ 全距
❖ 百分位数 ❖ 四分位数 ❖ 平均差 ❖ 方差 ❖ 标准差
二、平均差 平均差(average deviation 或者 mean deviation)是指一组数据中,
每一个数据与该组数据的平均数离差
的绝对值的算术平均数,通常用AD或 MD表示。
10
尺度线 0




等级
图2-1 某年级操行评定结果条形图
基线
复式条形图
35
30

25

人 20 数 15
10
5
0




等级
图2-2 某年级操行评定结果条形图
4.5
初中
高中
4
大专
本科
3.5
3
2.5
2
1.5
1
0.5
0
世卫组织对来本地旅游的警告
卫生部、本市的新闻发布会
所在单位和住宅区有无患者
例: 图2-3 三项影响较大的SARS信息对不同文化程度民 众的影响
对出现的次数,即某一事物或某种情况在某一 总体中出现的比率。
统计误差
❖ 误差是测得值与真值之间的差值。 ❖ 测得值=真值+误差 ❖ 统计误差归纳起来可分为两类:测量误差与抽样
误差。 ❖ 由于使用的仪器、测量方法、读数方法等问题造
成的测得值与真值之间的误差,称为测量误差。 ❖ 由于随机抽样造成的样本统计量与总体参数间的
以标准差为单位,因而具有可比性。 ❖ 可加性:标准分数使不同的原始分数具有相
同的参照点,因而具有可加性。 ❖ 明确性:标准分数较原始分数的意义更为明
确。 ❖ 合理性:标准分数保证了不同性质的分数在
4、标准分数的应用
❖ 用于比较几个分属性质不同的观测值
在各自数据分布中相对位置的高低。
❖ 计算不同质的观测值的总和或平均值,
1.3、统计图
❖ 统计图是整理和呈现数据的另一种 方法,它把研究变量与被说明事物 之间的数量关系用图形表现,直观、 形象地表达出事物的全貌及其数据 的分布特征,使人一目了然,便于 理解和记忆,印象深刻。
统计图的构成
❖ 统计图一般由图号、标题、标目、图形、图 注等几部分构成。
❖ 统计图中的标目由基线和尺度线构成。对于 有纵、横轴的统计图,一般以基线表示被观 察的现象,而尺度线则表示其数量。
相关文档
最新文档