教育统计学01—绪论与数据整理资料
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 变量与观测值 • 变量指可以取不同数值的事物属性,通过观察确定的变量 的取值称为观测值:如某学生英语考试成绩。 • 自变量和因变量:被操纵和待观察的变量
三:学习目标与方法
• • • • • • • • • • • 目的: 理解数理统计学的方法及原理; 掌握各种统计方法的使用条件; 根据研究目的合理设计实验; 熟练运用SPSS制作图表和分析实验数据,并合理推断; 熟练阅读中英文文献,能完成论文写作; 方法: 克服畏难情绪,使用2-3本参考书掌握知识点; 克服统计无用论和统计万能论 课后上机实践SPSS; 完成一定的练习,包括作业和论文解读。
四:参考书目
• 现代心理与教育统计学 张厚璨 徐建平 北京师范大学出版 社 2009 第三版; • 心理统计学 胡竹菁主编 高等教育出版社 2010 第一版; 教育与心理统计学 张敏强 人民教育出版社 2010 第三版; • 行为科学统计 Frederick & Larry 著,王爱明 李悦 等译 中国 轻工业出版社 2008 第一版;
教育统计学
理论、方法、实践
关于统计学的评论
学者不能离开统计而研究,政治家不能离开统计而施 政,事业家不能离开统计而执业——马寅初 • 在终极的分析中,一切知识都是历史;在抽象的意义 下,一切科学都是数学;在理性的世界里,所有的判断都 是统计学。——C.R.Rao(美国科学院院士、英国皇家统计 学会会员,目前健在的最伟大统计学家之一,1920—) • There are three kinds of lies: lies, damned lies, and statistics. —— Benjamin Disraeli(前英国首相,1804-1881) • Not everything that can be counted counts; and not everything that counts can be counted.—— Albert Einstein •
77
72 67 62 57
8
4 1 2 1 40
16
8 4 3 1
32
36 37 39 40
.20
.10 .025 .05 .025 1
.40
.20 .10 .075 .025
40
20 10 7.5 2.5
1.2 编制茎叶图
94 89 88 84 89 97 84 99 90 85 87 86 81 84 80 77 75 83 80 77 89 82 73 62 67 58 72 77 92 84 73 79 77 62 83 70 86 88 77 79
实验设计:被试间、被试内、混合,SPSS的使用 本质:描述事物特征、比较两件事物的 同一属性的差异、考察一件事物不同属 性之间的关系、分析影响事物变化的因素。
二:主要内容
• • • • • 数据 计数数据、测量数据 离散数据(阶段电价)、连续数据 横截面数据、时间序列数据 称名数据、顺序数据、等距数据、等比数据
(1)数据排序:降序、升序(Excel); (2)个位为叶,十位以上为茎 (3)数据=茎x茎宽+叶 5 8 6 2 2 7 7 0 2 3 3 5 7 7 7 7 7 9 9 8 0 0 1 2 3 3 4 4 4 4 5 6 6 7 8 8 9 9 9 9 0 2 4 7 9
1.3 编制直方图
工具:SPSS17.0; 18.0;19.0. 环境建构 SPSS 中的变量和数据 使用SPSS绘图:图形>>旧对话框>>条形图、线形图、饼图、 直方图、散点图......。 • 其中条形图、饼图适用于描述离散数据特征,直方图、散 点图适用于描述连续数据特征 • 举例 • • • •
第一讲 数据初步整理
•主要内容:收集数据的方法,编制次数分布表,编制茎叶 图;制作三线表;使用SPSS制作条形图、饼图、 散点图、直方图、 线形图;初步了解数据特性。 •作业:编制一项实验数据的次数分布表,制作条形图、饼 图、散点图、直方图。 某班期中考试的数学成绩和物理成绩如下,请 (1)编制两项成绩的次数分布表(以5分为组距),并制作 直方图; (2)编制三线表表示数学和物理成绩中不及格(59分及以 下)、及格(60--79分)、优秀(80分及以上)的人数,并制 条形图和饼图; (3)制作以数学成绩为横轴,物理成绩为纵轴的散点图。
85 ~ 89
80 ~ 84
[84.5, 89.5)
[79.5, 84.5)
87
82
9
10
35
26
14
24
.225
.25
.875
.65
87.5
65
75 ~ 79
70 ~ 74 65 ~ 69 60 ~ 64 55 ~ 59 ∑
[74.5, 79.5)
[69.5, 74.5) [64.5, 69.5) [59.5, 64.5) [54.5, 59.5)
条形图
多线线图>>定义>>类别轴,定 义线的方式>> ok
简单>>定义>>类别轴>> ok
可用添加文本框来家标题
线形图
• 与条形图相同
饼图
直方图
添加正态曲线:双击>>图表编 辑器>>工具栏最下一行>>添加 曲线按钮>>常规>>ok
图1-8 某班成绩分布直方图1
调整横轴:双击>>图表编辑器 >>右击>> X >>分箱>>确定锚 值>>ok
图1-9 某班成绩分布直方图2
连续变量的线图
多线线图-(其他统计量)招生数-变量-年份-类别轴-新生性别-定义 线的方式
散点图(等距、等比变量)
图形-旧对话框-散点-简单分布-挑选变量到X、Y轴
3D条形图(称名、顺序变量)
• 图形-旧对话框-3D条形图-变量选入X、Z轴-编辑-属性-类别 • 编辑-3D Rotation
实验设计与统计方法
自变量 1(顺序、称名) 1(顺序、称名) 2及以上
(称名、顺序、等 距、等比)
自变量水平 因变量 2 3及以上 2及以上 1(等距、等比) 1(等距、等比) 1
(等距、等比)
统计方法 T检验 单因素方差分析 回归分析
2及以上
2及以上
(称名、顺序)
2及以上
2及以上 2及以上
1(等距、等比)
1.1 编制次数分布表
94 89 88 84 89 97 84 99 90 85 87 86 81 84 80 77 75 83 80 77 89 82 73 62 67 58 72 77 92 84 73 79 77 62 83 70 86 88 77 79 (1)求全距R:R=Xmax—Xmin 2 = 99—58=41. (2)定组数K:8≦K≦18,或, K 1.87( N 1) 5 K=8(可能变化,以最终划定的为准); (3)定组距 i:奇数或5的倍数,也可用R/K(=5.125)取整; (4)列组限:表述组限 实际组限 15 ~ 19 [14.5, 19.5) (5)求组中值:(组实上限—组实下限)/2; (6)登记次数。
1、数据搜集的基本理论与方法
• (二)调查数据与实验数据 • 人们要获得社会经济现象的相关数据,运用相应的调查方 法,向客观实际搜集数字资料的过程就是统计调查。通过 统计调查获得的数据就是调查数据。 • 搜集数据的另一个途径是实验。在实验中控制一个或多个 变量,在一定的控制条件下观测实验对象,从实验过程中 获得数据。这种在实验中控制实验对象、观测整个实验过 程而搜集到的数据就是实验数据
2及以上
(等距、等比)
多因素方差分析
结构方程模型 卡方检验
2及以上
(称名、顺序、等 距、等比转化为称 名)
1(计数)
参数与统计量
• 总体、样本、抽样 • 总体:研究对象的全体集合,每个对象称为一个个体,总 体有时是有限的,有时是无限的; • 样本:从总体中抽取的一定数量的个体组成的集合,个体 数量称为样本容量; • 抽样:从总体中抽取样本的过程。 • 总体的特征指标(M,SD等)称为参数,样本的特征指标称 为样本统计量,统计推断就是用样本统计量来推断总体参 数的过程。在这一过程中样本对总体的代表性至关重要, 操作中常用大样本(>30)或抽样方法(随机,分层)来 保证代表性。
一:学科性质
• 概率论:研究随机现象总体特征的理论和方法学; • 数理统计:以概率论为基础,抽象出所反映事物特 征的数量关系,对所考察的问题作出推断和预测, 为决策和行动提供建议的学科; • 应用统计:将数理统计的原理和方法应用于自然和 社会各领域产生的学科,注重阐述各种统计方法的 使用条件和对统计结果的解释; • 教育统计是数理统计在教育领域的应用。
一:学科性质
教育统计学 对象:教育现象、规律; 手段:量和质的研究,探讨研究对象的本质规律; 内容:专门研究如何收集、整理、分析实验或调查获得的 数据(描述统计:你的智商分数是多少),并如何根据所 获得的数据进行科学的推论以寻找客观规律(推断统计: 由样本之间的差异推论总体之间的差异)。 • 功能:是进依据(将样本结果推 论到总体);是教育评价的工具(获取、整理、解释、评 价教学质量);有利于训练科学的推理和思维方法。 • • • •
1、数据搜集的基本理论与方法
• (三)统计数据的搜集方法 • • • • 直接观察法(视频:儿童说谎比例、功能) 报告法(通讯法)(幼儿教师基本素质调查) 采访法(你会为孩子购买学区房吗?) 调查法(家长的幼儿学习观:孩子该学写字还是学洗手)
• 实验法(儿童推理能力发展研究:来自SCIENCE的报告)
作业
女 数 学 物 理 男 数 学 物 理 1 73 80 17 96 95 2 85 80 18 95 89 3 66 72 19 76 70 4 52 66 20 83 69 5 95 85 22 50 55 6 86 93 22 67 75 7 77 65 23 73 80 8 75 70 24 88 77 9 63 55 25 93 99 10 59 50 26 81 82 11 88 79 27 76 81 12 65 70 28 68 53 13 91 91 29 55 49 14 87 92 30 86 72 15 75 90 31 73 80 16 83 87 32 90 94
1、数据搜集的基本理论与方法
• (一)数据搜集的概念 • 数据搜集是根据统计研究预定的目的要求和任务,运用相 应的科学的方法与手段,有计划、有组织地向客观实际搜 集数字资料的过程。 • 搜集的方式有两种: • 一种是直接向调查单位搜集资料,即原始资料,又称为初 始资料; • 一种是根据研究的目的,搜集已经加工、整理过的,说明 总体现象的资料,一般称为次级资料或第二手资料。如各 种年鉴里的数据。
四种数据
• 称名数据:说明某事物与其他事物在类别上的差异,如性 别,颜色等; • 顺序数据:无相等单位,无绝对零点的数据,描述事物属 性的多少,如能力等级,喜爱程度等,不可进行加减乘除 • 等距数据:有相等单位,无绝对零点(可能有相对零点) 的数据,如温度,不同组不能进行加减乘除; • 等比数据:有相等单位,有绝对零点的数据,如重量、感 觉阈限等,可进行加减乘除运算。 • 自变量可以是以上四种数据,因变量可以是顺序、等距和 等比变量。
1.1 编制次数分布表
组别 95 ~ 99 90 ~ 94 实际 组限 [94.5, 99.5) [89.5, 94.5) 组中值 97 92 次数 (f) 2 3 累积次数 向上 40 38 向下 2 5 相对 次数 .05 .075 累积 累积 相对次数 百分比 1.00 .95 100 95
二:主要内容
描述统计 教 育 与 心 理 统 计 学
数:平均数(算术、几何、倒数)、中位数、 众数、方差、标准差、变异系数、标准 分数、相关系数、比率; 表:三线表
图:线形图、条形图、直方图、散点图、饼图
推断统计
统计估计:参数估计:点估计、区间估计 非参数估计:概率密度、邻近分类
假设检验:参数检验:单总体、双总体 比率检验、Z、t、F检验;相关系数显著 性、回归方程显著性 非参数检验:Х2检验;秩和、中数、符号
1.1 编制次数分布表
• 下面是40名学生在某项测验中的成绩,试将其制作成次数 分布表和茎叶图,转制次数直方图,并按不及格(59分及 以下)、及格(60--79分)、优秀(80分及以上)分类编 制条形图、饼图。
94 89 88 84 89 97 84 99 90 85 87 86 81 84 80 77 75 83 80 77 89 82 73 62 67 58 72 77 92 84 73 79 77 62 83 70 86 88 77 79