02 数据整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单式条形图
60 50 40 人 30 数 20 10 0
甲 乙 丙 丁
图形
尺度线
基线
等级
图2-1 某年级操行评定结果条形图
复式条形图
35 30 25 人 数 20 15 10 5 0 甲 乙 等级 丙 丁
男 女
图2-2
某年级操行评定结果条形图
4.5
õ Ð ³ Ö
4
ß Ð · Ö ¾ Æ ±¿
ó ¨ ´ ×
性质类别:按事物的不同性质进行分类。 数量类别:按数值大小进行分类,并排序。
数据类型 分类数据 计数数据 等级数据 等距数据 测量数据 连续型数据 离散型数据
比率数据
变量、随机变量、观测值
变量是可以取不同值的量。统计观察的指标
都是具有变异的指标。当我们用一个量表示这个 指标的观察结果时,这个指标是一个变量。
5
7 18
5
6 16
9
9 26
10
8 26
3
4 13
3
3 10
1
0 3
1
1 3
37
38 115
例: 表2-6
学习成绩 初一 初二 初三 高一 高二 高三 合计 好
中学生心理烦恼调查被试分布
中 差 未填 合计 174 116 119 57 112 17 595
女生 男生 女生 男生 女生 男生 女生 男生 18 12 10 4 17 1 62 19 12 10 9 3 1 54 64 38 26 18 43 7 196 54 40 31 15 24 3 167 3 8 12 4 5 2 34 11 5 7 2 9 1 35 2 0 10 3 7 0 22 3 1 13 2 4 2 25
A B C D E……)。
失误:指存在明确差错的数据或答案。
在剔除不合格问卷的过程中,注意不能把一
些不符合自己主观假设的数据随意去掉。因此这
项工作一定要非常慎重。对于个别极端数据是否
该剔除,应遵循三个标准差法则。
2.数据的分组
分组要以被研究对象的本质特性为基础
分类标志要明确,要能包括所有的数据 数据分组的标志
乙 47%
丙 19% 丁 4%
甲 30%
线形图
线形图用来表示连续型资料。它能表
示两个变量之间的函数关系;一种事物随 另一种事物变化的情况;某种事物随时间 推移的发展趋势等。
基于线形图,既可对有关统计变量进
行数量比较,又可分析发展的趋势。
例如:对有意义的词汇,小学一年级至初中三 年级学生视觉、听觉记忆再现率的情况。
70 60 50 40 百 分 比 30 20 10 0 一 二 三 四 年 五 级 六 初一 初二 初三
视觉记忆 听觉记忆
图2-5 有意义的材料再现率比较线形图
再见!
2010年3月
1、统计表的构成
表号 标题 表2-1 统计表的格式
顶线
横标目的总标目
横标目
注:
纵标目
数字
源自文库
表线
表注
标目
底线
例: 表2-2 街道 甲 乙 丙 丁 总计
北京市四街道智力落后患者分布 检查人数 51841 76030 49508 51788 229168 病人数 159 263 190 170 782 患病率(‰) 3.1 3.5 3.8 3.3 3.4
第二讲
数据整理与图表呈现
一、数据的整理
1、数据的整理
心理和教育研究中收集的各种原始资
料杂乱无章,只有经过整理分析才能从 中提取出有用的信息。
在对资料进一步分析之前,需要进行
认真的整理。
1.审核资料
审核资料的目的,是为了剔除
不合格的资料,以确保资料的可靠
性和可信性。
审核是对原始资料进行初步的
一般把容量n ≥30的样本称为大样本;
而n <30的样本称为小样本。
统计量和参数
统计指标 平均数 标准差 相关系数 回归系数 统计量 参数
X
S
r b
μ
σ
ρ β
二、统计表
统计表是用来表达研究
变量与被说明的事物之间数 量关系的表格。它可以将大 量数据的分类结果清晰、概 括、一目了然地表达出来, 便于分析、比较和计算。
审查和核实。不符合要求的数据主
要有三种:缺失、可疑、失误。
缺失:指数据不全或缺项未填;例如一份资
料中未回答的问题占10%以上,或者缺少关键性
资料。
可疑:指难以辨认或怀疑其真实性的数据;
例如,有的被试填答的问卷全部选同一个选项 (如全选A或全选B);有的被试填答的结果可以 看到是一种规则的排列方式(如A B C D E D B C
对于有纵、横轴的统计图,一般以基线表示
被观察的现象,而尺度线则表示其数量。
2、统计图的分类
条形图:用直条的长短来表示统计项目
数值大小的图形,主要是用来比较性质相 似的间断型资料。
圆形图:是用于表示间断型资料比例的
图形。圆形的面积表示一组数据的整体, 圆中扇形的面积表示各组成部分所占的比 例。各部分的比例一般用百分比表示。
例: 图2-3 三项影响较大的SARS信息对不同文化程度民众的影响
圆形图
乙 47% 丙 19%
尺度线
甲 30%
丁 4%
基线 图2-4 某年级操行评定结果圆形图
绘制圆形图的步骤
求出各组成部分所占的百分比
某一成分数量 总数量
求出各部分的中心角度
某一成分数量 360 总数量
以顺时针方向画出扇形 标出不同颜色及百分比
3.5 3 2.5 2 1.5 1 0.5 0
À À é ¯ Ô ´ ¾ × Ã Î Ä ¯ æ Ê Î ×Ö ¶ À ±µ Â Ó µ ¾ · À ú ¿ ¢ ¾ Ð Ä Â Å ¢ ¼ á Î É ² ¡ ±Ê µ Ð Î ·² »
ù Ú ¥ » Í ¡ ¬ ø Ð Þ ¼ ß Ë Ô µ Î º ×Õ Ç Ó Î » Õ
资料来源:见《心理学报》1979年第1期103页,选部分引用
2.统计表的种类
简单表:只按研究现象(或变量)的名
称、地点、时序等列出数据的统计表。
分组表:只按一个标志分组的统计表称
为分组表。
复合表:按两个或两个以上标志分组的
统计表称为复合表。
简单表
表2-3 学校 人数 A校 985 各校学生数一览表 B校 762 C校 893 D校 1051
用来表示随机现象的变量,称为随机变量。
一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。一个随
机变量可以有许多个观测值。
总体、个体和样本
需要研究的同质对象的全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出的用以推测总体的部分对象的
集合称为样本。
样本中包含的个体数,称为样本的容量n。
三、统计图
统计图是整理和呈现数据的另一种方
法,它把研究变量与被说明事物之间的数 量关系用图形表现,直观、形象地表达出 事物的全貌及其数据的分布特征,使人一 目了然,便于理解和记忆,印象深刻。
1、统计图的构成
统计图一般由图号、标题、标目、图形、
图注等几部分构成。
统计图中的标目由基线和尺度线构成。
分组表
表2-4
年龄组
上海市区男幼儿20米跑步用时
3岁~ 4岁~ 5岁~ 6岁~
平均用时
(秒)
7.71
7.16
6.04
5.53
资料来源:引自《华东师范大学学报》,1985年第2期第30页
复合表
表2-5
甲
某年级操行评定结果
乙 丙 丁 合计
班别
男
一班 6
女
5
男
8
女
8
男
6
女
4
男
2
女
1 40
二班
三班 合计