集团人才评价中心开发方案模板
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
集团人才评价中心
开发方案
XX集团人才评价中心
开发方案
1 什么是评价中心
评价中心(Assessment Center), 在第28届评价中心国际会议给出的定义是: 评价中心是由对多次行为的标准化评估构成的, 由许多受过训练的观察者运用技术手段, 对被评价人主要从专门设计的
模拟情景中表露出的行为做出判断, 这些判断被提交到评委参加的
会议上或经过统计方法加以分析整合。
在为达成评分意见统一的
讨论过程中, 每位评委要全面地解释被考核人行为的原因, 提交评分结果, 讨论的结果是按照设计好的以测度被考核人行为的维度/竞争能力( Dimension/Competence ) 或其它变量给被考核人绩效总评。
应当运用统计的方法以符合专业认可的标准。
简单地说, 评价中心就是一种测定一群人中每个个体在多种情
景事件( Exercises) 中表现出的行为特征的操作程序。
评价中心源于20世纪20年代, 最初用于军事目的。
1948年出版的《对人的评价》第一次使用了”评价中心”一词并详细介绍
了评价中心在第二次世界大战期间在军事上的发展与应用。
布奈
博士( Douglas Bray) 和比哈莫博士( William Byham) 是早期对评价中心进行工业应用研究的著名心理学家。
布奈博士1956年应美国AT&T公司之邀负责设计并指导对贝尔系统管理人员的职业发展
进行纵向研究, 引入26个维度以及业务游戏( Business Game) 、无领导小组讨论、文件筐作业等测评情景, 连续两个夏季共对422
名员工进行了测试, 在随后的25年内又对这些人中依然留在公司
内的至少进行了两次以上的评估。
评估获得了成功, 并成为贝尔系统管理人员获得晋升的标准评估手段。
2 评价中心的作用
1、用于筛选人员。
重点在于挑选这样的应聘人员, 她们表现出胜任工作岗位所必须的行为;
2、用于员工职业发展。
重点在于考察员工哪些方面有优势, 哪些方面尚欠缺, 接着进行培训以克服缺陷。
3 评价中心的评分维度
人们总是希望能从尽量多的方面对被评价者进行评价, 但人的信息加工能力是有限的,如果评分维度过多, 就会增加评分者的信
息加工负担, 造成评分误差。
Russel的研究表明, 如果评价中心的维度过多, 评分者对某个维度的评分就会受到其它维度的影响, 从而产生晕轮效应。
这样, 一些维度尽管表面上名称不同, 但在实际评分时却被当作同一个维度进行评价, 这就违背了设计者希望区分
多个维度的初衷, 并浪费了资源。
Gaugler和Thornton曾研究了评分维度的数目对于评分的影响。
研究者让评分者分别使用3个、6个和9个维度对被评价者的行为进行评价。
结果表明, 使用3个维度时, 对行为分类和评分的准确度(rating accuracy)最高; 而使用6个维度时, 行为观察准确度(observational accuracy)最高。
因此, 她们提出在评价中心中应尽量减少评分维度。
国内研究者吴志明也
曾做过相似的研究, 她的研究表明, 评分维度为3个和6个时, 评分者的评分一致性都很高, 而评分维度为9个时, 评分者的评分一致性会有很大的下降。
因此从加强评分一致性与改进评分效果的角
度出发, 她建议在评价中心的一个测评情境中, 评分维度应以6个左右为宜。
4 评价中心中的评分效果
评价中心中的评分是一个非常复杂的过程。
评分者要从被评
价者所表现出的诸多行为中辨别、筛选、记录其典型行为, 做出最终评价; 观察和评价的过程需要在很短的时间内完成。
这些对评
分者的要求是非常高的。
衡量评分效果一般有两个指标:
( 1) 、评分准确度( rating-accuracy) , 即将评分者的评分与专家的评分( 又称基准分数, True Score) 进行比较, 两者差异越小则评分越准确, 它反映的是评分的结果;
( 2) 、行为观察准确度( behavioral-accuracy) , 指评分者对被评价者典型行为回忆( 或再认) 的准确程度, 它关注的是评分者的信息加工过程。
5 改进评分效果
改进评分效果最有效的方法, 就是在评分之前, 由专家对评分者进行系统的培训。
当前最常见的培训方法有两种: 行为观察培训法( Behavioral observation training) 和参照系培训法( Frame-of-
reference training) 。
1、行为观察培训法( Behavioral observation training, 简称BOT)
行为观察培训法着眼于评分者的”观察”, 而非”评分”。
Thornton 和 Zorich 假设在评分时, 评分者的观察过程和评分过程是
分开的。
她们认为, 评分者的观察过程包括对被评价者行为表现的
觉察( detection) 、知觉( perception) 和回忆( recall) ( 或再认, recognition) , 而评分者的评分过程则包括对信息的分类( categorization) 、综合( integration) 、评价( evaluation) 。
Thornton 等人认为评分误差主要是由于评分者评分时掌握的信息
不足所致, 因此, 如果能够设法改进评分者对被评价者行为的观察, 评分的有效性就会提高。
BOT并不关注评分者对信息的综合和评价, 而主要是教授给评分者一些观察和记录被评价者行为的方法, 比如行为观察训练。
同时, BOT鼓励评分者先观察后评分, 即观察时先详细记录被评价者的行为表现, 待观察完毕后再统一评分。
BOT培训效果的评估指标一般是行为观察准确度。
这里的假
设是: 如果评分者能够更好的观察被评价者的行为, 她就能够更好的回忆( recall) 或再认( recognition) 被评价者的行为, 从而使评分更加准确。
行为观察准确度是基于一些客观的、能够量化的指标。
采用较多的方法是: 研究者要求评分者对测试情境中被评价者的某
一特定行为或事件的出现次数进行估计, 然后将这一估计值与该行
为在测试情境中实际出现的次数进行比较, 从而得出行为观察准确
度的指标。
Sulsky和Day[11]提出了行为观察准确度的另一种测量
方法: 行为再认( behavior recognition) , 研究者首先发给评分者一份
行为列表( behavioral checklist) , 评分者需要判断表上所列的这些
行为是否在测试情境中出现, 然后, 研究者利用信号检测论的方法, 计算出评分者的行为观察准确度。
2、参照系培训法( Frame-of-reference training, 简称FOR培训法)
参照系培训法强调按照统一的评分标准来培训评分者, 即在所有评分者头脑中形成统一的评分参照系( frame-of-reference) 。
FOR培训法是以认知心理学中的图式驱动( schema-driven) 理论为基础的, 它假设评分者的评分过程是一个自上而下的认知加工过程, 评分者的观察和评分是同时进行的, 这与BOT的假设是完全不同的。
同时, 图式驱动理论认为, 日常生活中, 人们在头脑里逐渐形成
了一整套图式( schema) , 这些图式中包含着她们评价她人的标准
和尺度, 她们在评分时也倾向于使用自己的图式( 或称标准) 去评估被评价者的表现。
可是, 不同的评分者头脑中的图式往往是不同
的, 这就造成了评分者评分标准的不统一, 进而影响评分的准确性。
因此, 在FOR培训中, 培训者要求评分者按照事先制定的统
一的评分标准( 或称图式) 去仔细观察被评价者所表现出的典型行
为, 并同时做出评价( 即on-line evaluation) 。
FOR培训法的假设: 如果评分者按照专家提供的维度和标准进行评分, 评分就会更加有效。
FOR培训的方法: 首先, 培训时强调评分的多维性, 向评分者解释各个维度的定义, 并详细说明每个维度上的不同水平上都有何
典型行为表现, 在FOR培训中, 一般会使用行为尺度评定量表
( behaviorally anchored rating scales, 简称BARS) ; 第二, 鼓励评分者一边观察一边评分, 而非先观察后评分; 第三, 为评分者提供模拟
评分的机会, 并针对她们的评分给予反馈。
在FOR培训法中, 一般使用评分准确度这一指标来评估培训效果。
3、两种培训法效果比较
Woehr和Huffcutt进行了一次元分析, 比较了不同培训方法的
效果。
她们总结后发现, 一般见来评估培训方法有效性的因变量有
以下4种: ( 1) 晕轮效应( halo error) ; ( 2) 宽容效应( leniency error) ; ( 3) 评分准确度( rating accuracy) ; ( 4) 行为观察准确度( observational accuracy) 。
其中, BOT能够显著提高行为观察准确度, 而FOR培训法提高评分准确度的效果最为明显, 同时, 两种培训法都能在一定程度上降低晕轮效应和宽容效应。
Woehr和Huffcutt同时提出, 在FOR培训中需要注意的是, 培训者提出的评
分标准( 或绩效标准, performance standards) 是否反应了企业的真
实要求; 另一点需要引起重视的是, 不同培训方法的组合( 例如将BOT和FOR相结合) 会产生更好的效果。
6 评价中心的效度
1、评价中心的结构效度
评价中心的结构效度一般有两个指标: 汇聚效度( convergent validity) 和区分效度( discriminant validity) 。
汇聚效度, 指同一评分维度的评分在不同测评方法之间的相关, 相关系数越高, 说明汇聚效度越好。
区分效度, 是指同一测评方法内不同评分维度之间评分的区分
性, 也用相关系数表示, 相关越低, 说明区分效度越好。
对于评价中心结构效度的研究, 多采用多质多法( multitrait-multimethod matrix approach, MTMM) 和验证性因素分析( confirmatory factor analysis, CFA) 两种方法。
Schleicher等人提出了改进评价中心结构效度的建议:
( 1) 、减少评分者信息加工量, 帮助评分者更加有效的加工信息;
( 2) 、为各个评分维度提供更加清晰、详细的解释;
( 3) 、使评分者按照评分维度( 而非测评方法) 来加工、组织和评价自己获得的信息。
2、评价中心的效标关联效度
已经由充分的证据表明, 评价中心具有良好的效标关联效度, 能够较好的预测被评价者未来的工作表现。
Gaugler等人对关于评价中心的研究得出的107个效度系数进行了元分析, 发现在不同的效标类型下, 评价中心的效标关联效度分别是: 绩效评定为0.36、潜能评定为0.53、培训中的表现为0.35、职业生涯进展为0.36。
评价中心应用于不同目的时的效度是: 选拔为0.41、提升为0.30、早期识别为0.46、研究为0.48。
7 基于胜任力模型的评价中心体系
胜任力( Competency) 是指在工作情景中员工的价值观、动机、个性或者态度、技能力和知识等关键行为特征。
胜任力模型。