考试系统中组卷策略探究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

考试系统中组卷策略探究

摘要:针对考试系统中组卷策略的探讨,常用的算法有三种,随机选取法、回溯法、基于遗传算法的自动组卷算法。对比了其各方面的合理性和实用性等后,选择遗传算法着重进行了探讨和研究。

关键词:组卷策略遗传算法

1 考试模式的发展趋势

考试是教育教学过程中非常重要的一个环节,通过考试教师可以了解学生对知识的掌握程度,也可以从侧面衡量一下教学效果的优劣。传统的考试需要教师在考试前做大量的准备工作,如试卷的编辑、整理、打印、分发等。如何充分利用计算机去完成考试中的重复性工作,提高工作效率,改善手工出卷的状况,就是一项非常有意义的课题。尤其是在教育领域,如何更好地利用计算机网络技术开展现代化教育是非常重要的课题。

考虑上面两方面的因素,利用计算机,结合计算机网络等技术,使计算机能够从建设好的试题库中有效地自动选择相关试题,组成具有相当水准的试卷是大势所趋,也是当前和以后的重点应用发展。

2 当前主要组卷策略调查

在形成试卷的过程中,最重要的无非就是组卷策略了。虽然自动组卷算法是个被探讨了很长时间的问题,但至今还没有一个很好的解决其自动出题的算法方案。被提出和研究讨论的组卷策略主要有如下的几种。

2.1 随机选取法

所谓随机选取法是根据组卷的相关设置和要求,由计算机使用随机函数从试题库中自动抽取若干试题,构成目标试卷。组卷的过程就是重复随机函数的过程,直到生成试卷符合要求为止或由其他因素停止抽取。这种策略的优点很明显,简单,重复随机操作即可。但是缺点也很大,具有很大的随机性和不确定性。在限制条件的控制下,随机选取法有时能够抽取一组令用户满意的试题。但是由于它随机选取试题的范围太大,无法确定目前条件下是否能够抽取合适的试题,从而进行大量的无效操作进入死循环,最终可能导致组卷失败。

2.2 回溯法

回溯法又叫基于深度与广度搜索的自动组卷算法,它是在随机算法的基础上,将随机选取产生的每一状态记录下来,在指标约束度越来越大,在选取试题已不可能的情况下向前回溯,释放上次记录的状态类型,修改从前已做过的选择,然后再依据一定的规律变换一种新的状态进行试探,通过不断地回溯试探直到试题生成完毕或回到出发点为止,以打破僵局。

对于组卷要求简单的试卷而言,组卷成功率较高。该算法上可以遍历每一种可能的状态综合,但实际上但题库中题量较大时,状态类型的组合数便成为了一个天文数字,故该组卷方法只适用于题量较少的题库系统,且该方法占用的内存量很大,而且组卷速度较慢,不容易满足所有的约束条件。

2.3 基于遗传算法的自动组卷算法

遗传算法(Genetic Algorithms,GA)是模拟生物自然选择和自然遗传制的随机优化算法,它最先由美国John Holland教授于1975年提出。该算法首先生成一定规模的初始群体,然后使其中的个体以一定的概率进行交叉与变异,实现个体结构的重组,再按预定的评价函数选择复制优秀个体,组成新的一代,如此循环迭代,以期最终找到满足寻优条件的全局最优解。遗传算法具有简单通用、可靠性强、全局寻优、收敛速度快特点,而且适用于并行处理,这些都适宜于处理组卷的问题。

3 基于遗传算法的组卷策略实现

通过对当前主要组卷策略的调查和研究,基于遗传算法的自动组卷算法具有良好的并行性、全局优化性和稳健性,是其中比较适宜的。

3.1 算法基本流程

算法描述为:(1)随机产生初始种群;(2)使用适应度函数对个体进

行计算;(3)按照一定概率对个体进行选择、交叉、变异等操作产生新种群;(4)重复(2)(3),直到找到最佳解或迭代次数足够多。

3.2 算法关键技术

知道了算法流程是不够的,还要了解关键技术。在进行组卷过程中,种群中的个体如何进行编码、初始化群体是如何确定的、适应度函数函数是如何构造的、怎么运用遗传算子、怎么判定终止条件,这些都是遗传算法组卷的关键技术。

(1)编码。遗传算法主要是对群体中的个体施加操作,从而完成优化。遗传算法不能直接处理问题空间的参数,而只能处理以基因链码形式表示的个体。因此,要是用遗传算法,就必须把优化问题的解的参数形式转化为基因链码的形式表示。这一转换操作就叫做编码。

(2)初始群体的设定。由于遗传算法的群体操作需要,必须为遗传操作准备一个由若干初始解组成的初始群体。初始群体的每个个体都是通过随机方法产生的,初始群体也称作进化的第一代。

初始群体的设定可以采取如下策略:根据问题固有的知识,设法把握最优解所占空间在整个问题空间中的分布范围,然后在此分布范围内设定初始群体。

先随机生成一定数目的个体,从中挑出最好的个体加入到初始群体中。这种过程不断迭代,直到初始群体中的个体数达到了预先确定

的规模。种群数目影响遗传算法的有效性。太小,遗传算法会很差或者根本找不出问题的解,因为太小的种群数目不能提供足够的采样点太大,会增加计算量,使收敛的时间增长。因此,在实际应用中,种群数目一般控制在30~150之间较为合适。

(3)适应度函数的设计。遗传算法在搜索过程中一般不需要其它外部信息,仅用目标函数值来评价个体或解的优劣,并作为遗传操作的依据。目标函数又称为适应度函数。对目标函数唯一的要求是针对输入可计算出能加以比较的非负结果。这一特点使得遗传算法的应用范围很广。在具体应用中,适应度函数的设计要根据待求解的问题而定,适应度函数的设计直接影响到遗传算法的性能。

(4)遗传算子。一般的遗传算法都包含三个基本操作选择、交叉、变异。选择是决定以一定的概率从群体中选择出若干个个体的操作。选择操作也叫做复制操作,根据个体的适应度函数值所度量的优劣程度决定在下一代是被淘汰还是被遗传。一般的适应度较大的个体优良有较大的生存机会,而适应度较小的个体低劣生存机会也小。交叉是指把两个染色体换组的操作,其用意是将两个个体的染色体的基因进行互换以产生新的后代。变异是指让遗传因子以一定的概率发生变化的操作。

4 结语

自动组卷问题的实质就是,根据当事人的约束条件,快速从试题库

相关文档
最新文档