测量与评价
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
名词解释
1、测量:从广义上来讲,测量是根据法则给事物分派数字。
此定义包含了三个方面的特性:
法则、事物、数字。
2、教育测量:是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。
它
主要包括对学生的内在精神属性的测量,教育测量主要是一种间接的测量。
3、评价是根据某种价值观对事物及其属性进行判断、衡量。
4、教育评价:是指根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地
收集信息、分析解释,对教育现象进行价值判断,从而为不断优化教育和教育决策提供依据的过程。
5、相对评价法:指在评价对象的集合中选取一个或若干个作为基准,然后把各个对象与基
准进行比较。
6、绝对评价法:指在评价对象的集合之外确定一个标准,评价时候把评价对象与客观标准
进行比较。
7、个体内差异评价法:指吧被评价者的过去和现在比较,或将评价对象的不同方面进行比
较。
8、临床督导评价法:就是对评价者的实际行动进行直接的现场观察和记录,然后把观察结果和评估意见反馈给被评者,并和被评者一起商讨改进措施的一种评价方法。
9、标准化考试:系统地组织程序,统一的标准,对误差进行了控制,即考试的编制、实施、评分、解释到常模均是标准化。
10、常模:指的是标准化考试的大样本团体的成绩的平均数,亦即大样本团体分数的一般水平
11、智力测验:是对人的智力的一种客观的、标准化的测量。
它以一组标准刺激无一起被试反应根据这些客观反应来度量被试的智力高低。
12、学生评价:是以学生为对象的教育评价,它是依据一定的教育价值标准对学生的学业成就、个性发展、品德状况、体质能力等方面做出价值判断,并把判断结果反馈于教育实践以改进教学,是对学生学习进展与行为变化的评价。
13、品德测评:是指根据一定的目标,运用科学的手段,对学生的政治品质、道德品质、思想品质(包括知、情、意、行)的测试和评定。
14、定时考核法:是指根据德育的要求,拟定德育试题,指定考试地点,在规定的时间内,按照一定的考试要求,对学生进行考核。
15、教师评价:是对教师活动进行描述和价值判断的过程。
选择,填空
1、法则是测量的标准,也就是测量的依据和准则,即我们根据什么来进行测量。
事物是测量的对象,也就是对什么进行测量。
数字是测量结果的表现形式。
T.2、测量的三个要素:单位(如米、克,教育测量的单位不能直接加减乘除);参照点(计算的起点,有绝对零点和相零点);量表(测量工具)。
T.3、将量表从低级到高级排列主要有四种量表水平:类别量表水平、顺序量表水平、等距量表水平、比率量表水平。
4、教育测量过对象的复杂性:首先,他是内在的,不能直接测量;其次它是多变的;另外,有些主客观因素也会影响测量的结果。
T.5、哲学史上三种价值观:①客观主义价值观;②主观主义价值观;③辩证唯物主义价值
观。
T.6、教育测量的历史知识:
①《学记》记载中国在西周实行了教育考评;
③ 1702年英国剑桥大学首先用笔试代替口试;
④ 1845年美国在初等教育中以笔试代替口试;
⑤ 1864年英国费舍收集学生成绩样本汇成《量表集》开启了标准化测量的萌芽;
⑥ 1897年莱斯的拼字测验推动教育测验的发展;
⑦冯特的测量方法和高尔顿的统计方法对教育测量产生重大影响;
⑧ 1905年法国比纳-西蒙智力量表具有经典型;
⑨ 1904年美国的桑代克为教育测量之父,其名言:“凡是存在的东西都有数量,凡是有数量的东西都可以测量”。
7、泰勒主持了课程设置和成绩测试的“八年研究”(1933-1940年),首次提出了“教育评价”的概念,并发表了《史密斯—泰勒报告》,此报告誉为“划时代的教育评价宣言”,泰勒被称为“教育评价之父”。
8、1967年,斯克里芬发表了《评价方法论》第一次对形成性和终结性评价等不同类型的评价之间做了区分。
T.9、信度是测量结果的稳定性或可靠的程度,即测量的结果是否真实、客观地反映了考生的实际水平。
可以从三个方面来理解信度:①实测值与真值相差程度;②统计量与参数之间接近程度;③两次重复测量或等值测量之间的关联程度。
10、信度系数以多大为宜:对于学科测验,信度系数要求达到0.9以上,智力测验要求达到0.8以上,品德测验能达到0.6以上。
T.11、效度是测量结果的准确性和有效性程度,也是指测量是否达到了预期的目的。
12、、效标关联效度又称为经验效度和统计效度,是以测验分数和效标之间的相关系数来表示测验的效度的高低的。
T.13、难度是测验试题的难易程度,是试题对学生知识和能力水平的适合程度的指标。
公式:P=R/N;P表示难度指标;N代表参加考试的总人数;R表示答对某道客观题的人数。
14、在常模参照性测验中要求试题难度适中,即大多数题目的难度在0.3- 0.7之间,整个试卷平均难度在0.5左右。
T.15、区分度是指测验对考生实际水平的区分程度。
公式:D=P H-P L;D代表区分度;P H表示高分组的难度;P L表示低分组的难度。
D>0为正区分,D<0为负区别,D=0为零区。
16、提高区分度的方法:使题目的难度适中,使整个考试的难度适中;着重考察复杂的学习结果。
T.17、测验目标:测验所要达到的某种具体目的,它明确规定测验所要达到的预期结果或标准。
是编制测验的出发点和依据。
T.18、布卢姆把教育目标分为认知领域、情感领域和动作技能领域的目标。
他把认知领域的教育目标分为知识、应用、理解、分析、综合和评价六类。
19、1977年,加涅在《学习的条件》的第三版中将认知领域分为言语信息、智力技能、认知策略三种。
智力技能分辨别、概念、规则、高级规则四类;学习的结果分智力技能、认知策略、言语信息、运动技能和态度五种。
20、日本的梶田叡一在他的《教育评价》分为三大目标:基础目标、提高目标、体验目标. T.21、测验题型可以分为两大类,一类是封闭式,另一类是开放式。
T.22、测验编制中,设计试卷的蓝图是命题双向细目表。
23、进行教育测验的编制时,一套试题中的客观题约60%,主观题约占40% ;测验试题难度的掌握一般情况下,较容易的试题占20%左右。
T.24、教育评价指标从达标水平去考察,可以分为必达指标和期望指标。
教育评价指标从精确度去考察,可以分为硬指标和软指标两种。
硬指标是指“硬件”,是固定的精确的指标。
软指标是指“软件”,是伸缩性较大,不精确的指标。
T.25、社会标准:以社会对教育的现象要求为依据,要求达标过程社会化规范化。
科学标准:根据客观规定和原则为依据,要求达标符教育的客观规律。
26、行为目标评价法指采用可观测的行为目标作为评价的依据的一种评价方法。
行为目标的表达要注意两点:应设立可能观察行动的场合;应容易表示出行动的程度或阶段。
27、加权平均法是通过自评、专家组评、社会群众评等不同方面的评价,或者学生、教师、领导等不同阶层的评价者的评价来综合评定被评者的分数。
28、评价信息收集的标准主要有准确性、可靠性和时限性。
准确性是指收集到的信息与评价目标的一致性,指采集到的材料是评价目标真正需要的资料。
可靠性是指收集到的资料的真实可靠,是信得过的资料,这些资料所反映的情况完全符合客观实际。
时限性是指严格按照评价工作所规定的时限去采集评价信息。
29、处理评价信息的方法:①定性分析描述法:包括等级评定法、评语鉴定法、写实分析法。
②定量分析评判法:包括统计分析评判法和模糊综合评判法。
T.30、教育评价过程是评价者依据某种标准对被评价者有关方面情况进行评判的过程。
T.31、评价心理是指评价者和被评价者对评价过程的实践活动和评价过程的各种关系、交往等现实活动的反映。
T.32角色心理是指身份的自我意识及潜意识的表现的一种心理学现象,是特定的职业责任、道德规范、行为习惯、职业利益等的反映。
33、心理定势是指由一定的心理活动所形成的准备状态,影响或决定同类后继心理活动趋势的一种心理现象。
34、时尚效应是指对新颖、时髦事物的向往和崇拜的一种心理现象。
35、施评过程心理包括自尊心理、首因效应、近因效应、晕轮效应、参照效应、理想效应、顺序效应、趋中心理、成见效应、宽大效应、附和权威心理。
36、首因效应是指第一印象,比较鲜明,深刻,持续时间较长,经久不忘,不易改变的心理效应。
晕轮效应又称光环效应,是指观察某个人时,由于对象的某些品质或特征看起来比较突出,使观察者对此产生了特别清晰和明显的知觉,从而掩盖了对其它特征、品质的知觉和评价。
理想效应指对评价对象设想完美的先期印象影响实际评价的一种心理现象,也叫做“求全效应”。
37、趋中心理是评价者对评价对象既不愿对优者给太高的评价,也不愿给劣者太低的评价,尽量缩小差距,向中间状态集中的一种心理现象。
38、顺序效应是指由于评价的先后顺序,而对评价对象的评价结果产生干扰的心理态势。
成见效应是指对评价对象的既有看法和态度影响对评价对象作出正确判断的一种心理现象。
39、结果处理过程的心理现象:类群效应、从众心理、逆反心理、本位心理、模式效应。
40、从众心理是指个体因团体或个人真实的或臆想的压力所引起的行为、观点变化的一种心理现象。
41、被评价者受评过程心理现象包括自卫心理、迎合心理和应付心理。
42、敏感心理主要表现在分数敏感、利害因素敏感和公正敏感。
43、语文成绩测验的种类有:听说测验;单字测验;词语测验;阅读测验;作文测验;语文综合测验。
44、单字测验中三种类型:回忆、自由联想、随机抽样
45、语文教学目标分为识记、理解、应用和评价四级。
46、西周有数学教育,隋唐出现数学考试,科举制有“算学”。
47、现阶段,中学数学教学目的包括数学基础知识,基本技能和数学能力。
48、标准化考试中的四种常模:年级、年龄、百分、标准分数。
(对每种常模的理解)
49、智力结构论:1967年,美国心理学家 吉尔福特提出了智力的三维结构论,他用内容、操作和成果三个变项构成的立体模型来描述智力结构。
50、多维智力论:受吉尔福特的智力结构论的影响,美国哈佛大学心理学教授 嘉德纳提出多维智力理论。
他强调人类的智力至少包括以下7种不同的智力:①言语智力;②数理逻辑智力;③空间智力;④音乐智力;⑤体能智力;⑥人际智力;⑦自知智力。
51、智力测验的先驱者是英国的遗传学家高尔顿和美国心理学家卡特尔。
高尔顿首先使用等第评定量表和问卷法作为测验的辅助工具。
卡特尔于1890年发表论文《心理测验与测量》,首先使用了“心理测验”这个术语。
52、韦克斯勒智力量表包括语言和操作两部分,语言分常识、理解、算术、类似、词汇、数字广度;操作由数字符号、图像完成、积木设计、图像列、拼图、迷津组成。
其测验结果有言语智商、操作智商、全量表智商三种。
53、德国心理学家斯腾于1913年提出了心智商数的概念;推孟将心智商数乘以100,提出了智商的概念,也称为比率智商。
智商公式:比率智商(IQ )=()100()
MA CA 智龄实龄 54、学生评价的类型:①定位性评价:在特定的教学活动之前判定学生的前期准备,又称为安置性评价。
②形成性评价:是评价的结果能够指导以后的教学与学习的评价。
③诊断性评价:是为了使教学适合于学习者的需要和背景而在一门课程和一个学习单元开始之前对学习者所具有的认知、情感和技能方面的条件进行的评价。
55、档案袋评价:根据学生的反映,以及教师的评价、观察、考查、成绩测验等,得出有关学生进步和发展的系统而持续的记录。
T.56、品德测评指标体系确立的依据:①依据社会的需要;②依据德育大纲;③依据品德结构;④依据学生年龄特征。
T.57、问卷测评法:是指通过使用问卷或量表测试学生思想品德的一种方法。
它包括自编问卷法和自陈量表法。
58、项目评分法:是指设置一些测试的项目,每一项目都给予一定的分值,然后参考这些项目,对学生的思想和行为表现进行测量。
它主要包括加减评分和测试评分两种。
59、情境测验法:这种方法是由教师先巧妙地设计一种情境,让学生在这种情境中开展活动,教师对学生在该条件下活动或反应进行全面的考察和分析,据此来对其思想行为加以衡鉴。
它的种类颇多,主要有留痕法(由Voelker 所创,我国学者略加改良)、评分法(由哈特逊—梅 即 Hartshorne & Ma 所创)。
60、社会关系测量法:这是研究团体中友伴相互吸引与排斥关系的测量方法。
(这里所说的社会关系是指学生在班级和学校社团中的人际关系。
)
61. 语意分析法:由奥古斯丁(Osgood,1957)和其同事所创立。
这种方法的目的是测量和比较概念的意义。
运用这种方法的理论依据是:人类是文字的动物,通过语言可以窥知人类本身许多东西。
这种方法的具体运用是,使用一些由两个相对的形容词所构成的量尺,要求受试者对某个概念加以评定。
T.62、行为观测法:这是一种有目的有计划地考察学生思想行为的方法。
较常见的方法有:①自然观察法;②实验观察法;③情境观测法;④跟踪观测法;⑤时间样本法。
T.63、教师评价的主体:①教育行政部门、学校、教师参评;②学生参评;③家长参评④教
师自评。
64、教师评价模式包括实证范式评价和人文范式评价。
实证范式评价又包括:行为目标评价模式、操作主义评价模式。
人文范式评价包括:发展性评价模式、主体性评价模式、团体性评价模式教师校本评价模式
T.65、教师评价的三种指标体系:教师素质指标、教师职责指标、教师绩效指标。
66、教学工作评价:是指对教学工作的过程和结果进行的价值判断。
67、备课评价的内容:评价教师课前所做的四项备课工作和三种备课形式。
68、对四项备课工作评价的内容:①钻研教材的评价内容;②了解学生的评价内容;③选择教法的评价内容;④准备教具的评价内容;
69、对三项备课形式的评价内容:①对学期备课评价的内容;②对单元备课评价的内容;③对课时备课评价的内容;(教案的种类:讲义式教案、提纲式教案、综合式教案。
教案的内容格式:分两部分,一是一般情况,二是教学内容、目标、教法和进程。
)
70、上课评价的内容:①教学目的明确,完成任务好;②教学内容正确、充实,抓住重点、难点、关键;③教学方法适合,教师善“启”善“导”;④上课组织得好,具有教学机智性;
⑤教学基本功扎实;⑥教学效果好。
71、作业的布置与批改的评价内容
72、课外辅导的评价内容
73、目标评价模式的提出者是泰勒,被称为教育评价之父。
泰勒将课程评价分为四个阶段:确定教育目标;选择学习经验;组织学习经验;评价学习效果。
74、CIPP模式:即背景评价、输入评价、过程评价、结果评价。
最早是由斯塔弗毕姆、格林、古巴提出。
75、外观评价模式最早由斯太克提出。
1967年他发表《教育评价的全貌》,文中提出了外观评价模式。
外观评价模式中强调两个方面的操作过程:描述和判断。
76、回应模式是1973年斯太克在《方案的评价:特别是回应性评价》中提出的。
T.77、学校体育评价的原则:自主性原则、动态性原则、人文化原则、多极化原则。
78、中小学校评价的指标(四个指标):基础性指标、发展性指标、学校特色发展指标、教育效益指标。
T.79、发展性的中小学学校评价的方法:内部评价和外部评价相结合;形成性评价和终结性评价相结合;定性评价和定量评价相结合。
简答
1、教育评价的种类:根据评价的对象和范围的不同,可以分为宏观、中观、微观教育评价;根据评价的时间和作用不同,可以分为诊断性、形成性和总结性评价;根据评价的基准不同,可以分为相对评价和绝对评价;根据评价的性质不同,可以分为需要性、可行性和配置性评价;根据评价的主客体不同,可以分为自我评价和他人评价。
2、提高测验信度的方法:适当增加测验题目的数量;测验的难度要适中;测验的内容应尽量同质;测验的程序要统一;测验的时间要充分;评分要尽量做到客观化、减少评分误差。
3、教育评价的基本原则:①方向性原则;②公平性原则;③客观性原则;④科学性原则;
⑤可行性原则;⑥指导性原则。
4、客观性原则:
5、可行性原则:
6、构建教育评价指标体系的主要依据有:教育方针、政策、法规;教育理论和知识;教育规律;教育工作实际。
7、教育测量数据的特点包括:①绝大部分属于等级变量,可以比较大小不能加减更不能乘除。
②大多数数据从本质上说是主观的。
③教育测量的数据具有随机性。
④教育测量的数据具有模糊性。
8、评价者对被评价者的一般心理影响表现在哪些方面:①对自信心和自我概念、自我知觉的影响;②对情绪稳定和不安的影响;③对意志和动机的影响;④对要求水平和达到目标的影响;⑤对评价者和被评价者之间关系的影响。
9、阅读测验的七种方法:问题回答法、次序排列法、正误分析法、预料后果法、确定要旨法、情感体察法、体味含意法。
10、标准化考试的特点:①试题编制过程的标准化;②考试实施过程的标准化;③标准化考试的评分、计分方法要标准化;④标准化考试必须编制常模。
11、标准化考试的基本程序,包括以下七个最基本的程序:①编制考试计划;②编制考试初稿;③预测;④修改考试原稿;⑤制定常模;⑥收集考试的信息、效度资料;⑦编制考试指导手册。
12、与智商相关的六个因素:①遗传与环境;②种族;③性别;④学习成绩;⑤参加测试的动机、情绪和努力程度;⑥被试的人格特征。
13、教学工作评价与教学评价是有区别的:①教学评价的主要对象是教师的教学工作和学生的学习过程,教与学的双边活动的沟通对象是教学内容,是在一定的环境中进行的,然而,教师的活动是起主导作用的,学生的学是主体。
②教学评价应包括教学过程中教师、学生、教学内容、教学方法手段、教学环境、教学管理诸因素的全面的评价,而教学工作则是教学评价中特别主要的一个方面的评价,这里仅指对教师的备课、上课、批改作业、课外辅导、命题考试等教师教学工作的基本环节的评价。
T.14、教学工作评价的功能:①检查;②反馈;③激励;④研究;⑤定向;⑥管理。
T.15、依据:①教育方针和政策法规;②教学大纲和教科书;③教学规律和教学原则;④学生的身心发展规律;⑤参考新的思想观念(新的人才观,新的知识观,新的学生观,新的学生素质观,新的教师素质观)。
16、现代中小学学校评价的要素分析:现代中小学学校评价的要素:学校管理评价、中小学师资水平的评价、学校文化评价、办学条件评价。
论述
1、教育评价与教育测量的关系:教育测量不是教育评价,但是两者有密切的联系。
教育测量是教育评价获得数据资料的重要手段。
测量是评价的依据,评价是测量的具体体现。
两者又是有区别的,测量关心的是数量的多少,评价关心的是价值的高低,测量是一种纯客观的过程,评价带有主观性,是主观估计和客观测量的统一,测量是一种单一的活动,评价是一种综合的活动。
2、试卷编制的质量要求:①明确测验的目标;②题量尽可能大,试题的覆盖面尽量宽;③掌握好试题的区分度和难度;④注意改进题型;⑤每道试题的编写要讲究科学性;⑥制定好标准答案,评分标准和评卷的具体要求;⑦拼卷和检核。
3、评价信息收集的方法:①观察;②听汇报;③调查访问;④座谈会;⑤收集文字资料;)
⑥发问卷;⑦测试。
4、教育评价心理及其调控(第七章)
5、学生评价的功能:(定义)①是教师评价和学校评价的重要组成部分;②是促进学生自我成长与发展的重要手段;③是教师了解教学得失,改进教学方法,提高教学质量的重要途径;
④是教师了解学生的学习困难,帮助学生找出存在问题的重要方法。
6、表现性评价及其主要形式:是一种质性的评价方法,是一种新型的更直接地考察学生综合运用知识、解决实际问题能力的方法,在促进学生发展和改进教学方面有重要作用。
7、表现性评价的主要形式:演示、口头表述、模拟表现任务、实验与调查、作品选集、完成研究项目。
8、构建中小学生品德测评指标体系的基本要求:①重视指标体系的开放性;②重视指标体系的教育性;③处理好普遍性与特殊性的关系;④处理好稳定性和发展性的关系;⑤处理好统一性和灵活性的关系。