基于遗传算法的智能组卷策略的研究综述Word版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《基于遗传算法的智能组卷策略的研究》综述

姓名刘春晓

学号 2015216104

专业计算机技术

班级 3班

天津大学计算机科学与技术学院

2016年 6 月

基于遗传算法的智能组卷策略的研究综述

摘要随着计算机技术的日益发展和成熟,手工组卷已经不能满足现代的教学要求,组卷智能化在提高教学质量方面发挥着很重要的作用。文章对组卷策略进行了梳理,对比和总结,主要介绍了遗传算法的优点,从遗传算法的基本流程、编码方式、适应度函数和遗传算子方面进行了归纳。接着分析了目前智能组卷策略研究的不足和挑战,最后总结了未来的研究设想。

关键词智能组卷;遗传算法;适应度函数;遗传算子

1引言

在计算机技术发展飞速的今天,计算机应用已经慢慢的渗透到人类生活的方方面面,计算机的辅助教学功能也逐渐得到大家的重视。传统的手工组卷受到人为因素的干扰,导致考试的效率低下,组卷智能化已经成为不可或缺的一项研究。

近几年,智能优化算法倍受人们关注,如人工神经网络、遗传算法,为解决复杂问题提供了新的方法,并在诸多领域取得了成功。组卷问题是一个在一定约束条件下的多目标参数优化问题,针对传统的组卷算法具有组卷速度慢、成功率较低、试卷质量不高等缺点。

智能组卷算法在计算机辅导教学过程中之所以受到重视,是因为它把人工智能技术运用到了组卷中,能够智能的设计试卷的结构和内容,包括试卷的难易度,知识点,题型和题量等,使生成的试卷质量比较高。

遗传算法(Genetic Algorithm ,GA)基于达尔文的进化论和孟德尔的自然遗传学说,是通过模拟遗传选择和自然淘汰的生活进化的随机搜索和全局优化算法(张建国 2009:1)。由于该算法有智能的搜索技术和收敛性质,可以较好的满足智能组卷的要求。所以本系统选用遗传算法作为组卷算法,以试题章节、试题数量、试题知识点、试题题型、试题难度分布、试题曝光度、覆盖度、试题分数分配等约束为组卷条件,使试卷有更好的区分度。

基于遗传算法的智能组卷系统实现了组卷智能化,优化了其他组卷算法的不足,使教学更加自动化和公平化,提高了组卷效率。

2研究现状分析

在系统开发之前,应该首先选择适合本系统的组卷算法,组卷算法的选取对试卷的质量影响颇大。只有相对好的算法才能提高组卷的效率和成功率。组卷实质上就是在复杂的约束条件下的多目标求最优解的问题,保证试卷能够满足教学要求。随着计算机技术和人工智能理论的飞速发展,各种组卷策略层出不穷,选择适合的算法对系统运行有极其重要的作用。分析各种组卷算法的优缺点,找到最优的组卷算法是该系统开发的任务之一。这里我们就现阶段组卷算法进行分析和总结。

现阶段比较成熟的组卷算法有随机选取法、回溯试探法和遗传算法。随机选取法生成的试题重复率较高,难以达到预期效果。回溯试探法是一种有条件的深度优化法,对于状态类型和题量较小的题库系统而言,组卷成功率高,但占用内

存。这两类组卷算法对于规模比较小的试题库有一定的作用,但可能满足不了用户对组卷效率的要求。由此可见想要设计一套较好的智能组卷系统,应该选择规模适当的试题库和较好的组卷算法。在现有的智能组卷算法中选择一个收敛性强、适应度大、效率高的算法显得尤为重要。

2.1 盲目随机选取算法

随机选取算法容易实现且逻辑简单,在早期组卷时曾被广泛应用。该算法有两种随机选择性:先设定属性的指标,随机从试题库中选取子集判断是否满足设定的指标,符合则加入试卷,不符合则选取下一子集判断,循环操作直到组成试卷;从试题库中随机抽取试题判断是否满足试卷约束条件。

在随机抽取试题过程中,要做到:随机、无法预知、不重复、优化数据存取及快速组卷等(池抚新等 1999)。随机选取算法具有组卷速度快、结构简单等优点,但试题的重复率偏高,生成的试题知识点分布不均匀,难以达到预期的组卷效果,多数会导致组卷不成功。

2.2 深度与广度搜索算法

深度与广度搜索算法又被称为回溯试探算法。该算法是基于随机选取算法,对其缺点进行改进后提出的。深度与广度搜索算法仍然沿用随机抽取的方法从试题库中抽题,但在抽题过程中如果不能找到符合要求的试题且组卷还没有结束时,就会采用深度与广度搜索算法,将最近的搜索结果丢弃,向上回溯到最近的一个节点重新找一条路径进行搜索,直到组卷结束。该算法放弃部分搜索结果而不是全部的结果,减少了盲目随机选取算法的无效循环,提高了组卷效率。

该算法在理论上是可以搜索到每一种组卷结果的,但随着试题库数量的增加,它的遍历次数也会成比例增加,所以该算法比较适合容量小的试题库。如果试题库过大,该算法会占用太多的内存资源,消耗组卷时间,所以该算法在实际应用中是受限制的。

2.3 遗传算法

遗传算法是在20世纪70年代由进化计算的创始人之一Holland提出的。该

算法用一系列程序步骤来表示将人造染色体的一个种群进化到另一个种群的过

程,该算法使用自然选择机制和遗传学的交叉、突变机制。到目前为止遗传算法

是相对比较适合应用到组卷系统中的,它是一种具有搜索功能的自适应全局的优

化算法。它利用选择算子、交叉算子和变异算子三大遗传算子,促进解集合类似

种群在自然界的自然选择和优胜劣汰,不断进化最终收敛到最优状态。遗传算法

跟传统算法比较优势有:对可能的解有广泛的标示性,应用更加普遍;能够对种

群进行全局搜索;在种群空间中的搜索具有随机性;对搜索空间没有特殊要求,

适用范围广。

遗传算法使用单个染色体适应性来实现繁殖,完全模拟自然界优胜劣汰,适者生存的生存法则。进行繁殖时,交叉操作交换两个单独染色体的一部分,突变操作则改变染色体上随机选中的某个基因的值(Michael Negnevitsky 2005:221)。通过多次繁殖后,适应性低的染色体就会灭绝,适应性高的染色体会在之后的繁殖中占据主导地位。个体不断选择、交配和变异后产生下一代的种群,不断的进化产生符合自然环境的种群。

目前遗传算法在国内外的研究中很受欢迎,虽然在应用过程中还是存在不足之处仍需改进,但已经取得了很大的成果。遗传算法在借鉴了魏斯曼的自然选择理论和孟德尔遗传学后形成了比较成熟的算法体系,在智能组卷领域体现其特有的优势。

3问题与挑战

不管是随机选取法、回溯试探法还是遗传算法本身并不能直接解决智能组卷问题,遗传算法的不足之处如下:

1、早熟。这是最大的缺点,即算法对新空间的探索能力是有限的,也容易收敛到局部最优解。

2、大量计算。涉及到大量个体的计算,当问题复杂时,计算时间是个问题。

3、处理规模小。目前对于维数较高的问题,还是很难处理和优化的。

4、难于处理非线性约束。对非线性约束的处理,大部分算法都是添加惩罚因子,这是一笔不小的开支。

5、稳定性差。因为算法属于随机类算法,需要多次运算,结果的可靠性差,不能稳定的得到解。

所以我们需要对遗传算法进行改进,将遗传算法中的生物学机制与试卷体系进行类比和编码,其中还有一个关键问题,如何把智能组卷问题映射为一个数学模型。只有在这个基础上,遗传算法才能发挥出作用。

4未来研究方向

目前遗传算法组卷的研究,从理论到应用都有了一定的基础,但是还存在一些可以完善的地方。具体而言,今后的方向可以有以下两个方面:

(1)遗传算法与其他计算智能方法的相互渗透和结合,使组卷效率更高:遗传算法正日益和神经网络、模糊推理以及混沌理论等其他职能计算方法相互渗透和结合,以到达取长补短的作用。

(2)并行处理遗传算法:并行处理的遗传算法的研究不仅是遗传算法本身的发展,而且对于新一代智能计算机体系结构的研究都是十分重要的,遗传算法在操作上具有高度的并行性。并行处理后的遗传算法组卷将大大提高组卷速度,优化试卷结构。

相关文档
最新文档