一种基于遗传算法的智能组卷方法的研究 PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
研究定位与目标
在前人工作的基础上,对各种遗传算法的改进方法进行分 析比较,寻找一种基于遗传算法的智能组卷方法,提高算法的 效率和成功率,进一步缓解了早熟和局部最优解等问题。并应 用到东师理想网络题库管理系统中。
研究意义
理论意义 提供一种新的组卷方法 对于软件设计方法的研究也有一定的促进作用 现实意义 使老师从组卷工作中解脱出来 提高了组卷的质量和效率
国内外研究现状
组卷算法发展现状: 将试题库看做题集,组卷时由教师逐题筛选抽取 --计算机作为工具,但实质上仍然是人工组卷 将试题库看做试卷集,将已经出好的试卷存储起来,考试时 随机抽取一份试卷 --试卷数量有限,组卷缺乏灵活性 应用某种组卷算法自动抽题组卷 --虽然灵活性大,但组卷效果不太理想
算法介绍-遗传算子
变异算子 变异概率:
其中, fmax为最大适应值,f为个体适应值,favg为平均适应值。 k3 =0.1, k4 =0.005 ,当 fmax - f 越趋近于 0 ,那么 Pm 就越 趋近于 k3 ;反之 Pm 很小。 变异方式:
算法介绍-应用小生境技术
海明距离: 在信息编码中,两个合法代码对应位上编码不同的位数称为码 距,称海明距离 。 例如:10110101 异或 10101010 = 00011111 那么 hamming distance = 5 应用小生境技术的思想是: 惩罚函数为:
适应度函数为:F = 1 - f ,(0 < F < 1) 目标函数为: gi(0<=gi<=1),表示第 i个约束与用户要求之间的差距程度,越 接近约束条件gi 越小。 wi (wi>0,0<= w1+w2+…+wn <=1)是赋 予第 i约束条件的权重。 例如:
P是约束条件, 试卷要达到的总分,g1是约束分数与试卷实际 分数的相差程度。
用模式理论分析早熟原因
遗传算法是求解满足多个约束条件的最优解的方法。也就是搜 索解空间内的一个符合要求的模式。 选择算子:复制优秀模式 交叉算子:模式重组(搜索解空间) 变异算子:增加新模式(保持模式的多样性) 模式在进化中的变化
因此早熟现象发生的根本原因是种源自文库多样性的过早丧失。
算法介绍-数学模型
算法介绍-初始种群
本文采用的策略是:始种群的创建可以通过例如总分、题 型和答题时间的要求对题库进行初步过滤,达到加快算法收敛并 减少迭代次数的目的。
群体规模既决定了多样性的多少,同时也影响算法的效率。 那么规模控制在 [n,2n]的范围内本文认为比较合适。 (n为个体 长度或试卷所含试题数量)。 最大进化代数设置为:500
本文还有应用精英选择策略,就是要对适应度比较大的个 体保护起来,使其能够保留到下一代 。
算法介绍-遗传算子
交叉算子 交叉概率:
其中, fmax为最大适应值,f为个体适应值,favg为平均适应值。 K1=0.8,K2=0.5,当fmax – f 越趋近于 0 ,那么Pc越趋近于 k1 ; 反正Pc 将很小。 交叉方式:
海明距离 个体编码长度
算法介绍-终止条件
最大染色体适应度满足要求(如大于0.95),算法终止,返 回最大染色体适应度的个体。 进化到规定的最大代数(500),算法终止,返回最大染色 体适应度的个体。若此时最大个体适应度值不满足要求(如 小于0.85)则认为本次问题求解失败。 连续5代的平均适应度的比值在[1.000,1.005]时,算法终 止,,返回最大染色体适应度的个体。若此时最大个体适应 度值不满足要求(如0.85)则认为本次问题求解失败。
算法介绍-编码方式
十进制分段实数编码方法(与传统的二进制编码方式相比): 省略了编码和解码的过程,使编码更有实际意义,缩短求解时间 减少了个体编码的长度 便于分段进行交叉和变异等操作 分段编码也有利于种群的初始化
算法介绍-遗传算子
选择算子 选择既要符合物竞天择、适者生存的客观规律,还要有足 够的随机性,那么本文选择轮盘赌选择机制。避免了种群中适 应度比较大的个体流失或者被破坏掉 。
研究内容
深入研究遗传算法理论和考试理论 比较各种算法之间的优点及其不足 探索遗传算法的各种改进措施对算法的影响 总结早熟成因和应对措施 从多方面对遗传算法进行改进 ,如: 初始种群的选取 遗传算法的编码和适应度函数的设计 遗传算子的自适应设计 小生境技术的应用
创新点
应用创新: 应用到 东师理想网络题库管理系统 算法创新: 对遗传算法的一种多方面改进。 即比较几种成熟的而且效率较高、成功率较大的改进方 法,分析其改进原理及对算法的影响,并引入到本文。在损 失尽可能小的性能的前提下提高遗传算法的成功率。
国内外研究现状
智能组卷算法发展现状:
误差补偿法 --成功率低
随机抽取算法 --成功率低 深度与广度搜索算 (回溯算法) --如果题库规模太大,效率很低 基于遗传算法的组卷算法 --比较优秀,但有很多不足
主要问题
一般的组卷算法只能在非常简单的约束条件下完成试题的选 择抽取,基本不能满足目前的考试需要。 传统的遗传算法成功率低和效率差、容易产生局部最优解和 早熟等问题。 各种改进的遗传算法在选择,编码,交叉,变异等环节做出 了局部改善,而且在一定程度上缓解了早熟和局部最优解等 问题 ,但是仍然需要改进。
一种基于遗传算法的智能组卷方法的研究
提纲
国内外研究现状与主要问题 研究定位与目标 研究意义 主要研究内容、创新点 本文的组卷算法 软件展示
国内外研究现状
国内外研究成果:
国外的研究生入学考试(GRE) 、TOFEL等
清华大学等联合编制“高等学校工科高等数学课程试题库系统” 山东省高教自考办公室等联合编制“高等数学题库系统 全国计算机等级考试系统等等
假设每个试题为一个8维向量(题分-a1,题型-a2,难度等 级-a3,章节-a4,时间-a5,知识点-a6,区分度-a7,认知程度a8),那么一套试卷就是一个n*8的目标矩阵。n是一套试卷的 试题数。例如:aij 就是第i题的第j个属性值(1<= i <=n, 1<= j <=8)。
矩阵如下:
算法介绍-适应度函数设计