基于数据挖掘的遗传算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于数据挖掘的遗传算法
xxx
摘要:本文定义了遗传算法概念和理论的来源,介绍遗传算法的研究方向和应用领域,解释了遗传算法的相关概念、编码规则、三个主要算子和适应度函数,描述遗传算法计算过程和参数的选择的准则,并且在给出的遗传算法的基础上结合实际应用加以说明。
关键词:数据挖掘遗传算法
Genetic Algorithm Based on Data Mining
xxx
Abstract:This paper defines the concepts and theories of genetic algorithm source, Introducing genetic algorithm research directions and application areas, explaining the concepts of genetic algorithms, coding rules, the three main operator and fitness function,describing genetic algorithm parameter selection process and criteria,in addition in the given combination of genetic algorithm based on the practical application.
Key words: Data Mining genetic algorithm
前言
遗传算法(genetic algorithm,GAs)试图计算模仿自然选择的过程,并将它们运用于解决商业和研究问题。遗传算法于20世界六七十年代由John Holland[1]发展而成。它提供了一个用于研究一些生物因素相互作用的框架,如配偶的选择、繁殖、物种突变和遗传信息的交叉。在自然界中,特定环境限制和压力迫使不同物种竞争以产生最适应于生存的后代。在遗传算法的世界里,会比较各种候选解的适合度,最适合的解被进一步改进以产生更加优化的解。
遗传算法借助了大量的基因术语。遗传算法的基本思想基于达尔文的进化论和孟德尔的遗传学说,是一类借鉴生物界自然选择和自然遗传机制的随机搜索算法。生物在自然界的生存繁殖,显示对其自然环境的优异自适应能力。受其启发,人们致力于对生物各种生存特性的机制研究和行为模拟。通过仿效生物的进化与遗传,根据“生存竞争”和“优胜劣汰”的原则,借助选择、交叉、变异等操作,使所要解决的问题从随机初始解一步步逼近最优解。现在已经广泛的应用于计算机科学、人工智能、信息技术及工程实践。[2]在工业、经济管理、交通运输、工业设计等不同领域,成功解决了许多问题。例如,可靠性优化、流水车间调度、作业车间调度、机器调度、设备布局设计、图像处理以及数据挖掘等。遗传算法作为一类自组织于自适应的人工智能技术,尤其适用于处理传统搜索方法难以解决的复杂的和非线性的问题。
1.遗传算法的应用领域和研
究方向
1.1遗传算法的特点
遗传算法作为一种新型、模拟生物进化过程的随机化搜索方法,在各类结
构对象的优化过程中显示出比传统优
化方法更为独特的优势和良好的性能。
它利用其生物进化和遗传的思想,所以
它有许多传统算法不具有的特点[3]:
※搜索过程不直接作用在变量上,而是
作用于由参数集进行了编码的个体
上。此编码操作使遗传算法可以直接
对结构对象进行操作。
※搜索过程是从一组解迭代到另一组
解,采用同时处理群体中多个个体的
方法,降低了陷入局部最优解的可能
性,易于并行化。
※采用概率的变迁规则来指导搜索方向,不采用确定性搜索规则。
※对搜索空间没有任何的特殊要求,只利用适应度信息,不需要其它辅助信息,适应范围广。
※对于给定的问题,可以产生许多的潜在解,最总选择可以由使用者确定。
遗传算法的优越性只要表现在:首先他在搜索过程中不容易陷入局部最优,即使在定义的适应值函数是不连续的、非规则的或是有噪声的情况下,它也能以很大的概率找到整体最优解;其次由于它固定的并行性,遗传算法非常适合于大规模的并行计算机。
※遗传算法提供了一种求解复杂系统优化问题的通用框架,它不依赖于问
题的具体领域,对问题的种类有很强
的鲁棒性,广泛适用于很多科学。1.2遗传算法的应用领域
1.函数优化
函数优化是遗传算法的经典应用领域,也是对遗传算法进行
性能评估的常用算例。很多人构
造出的各种各样的复杂形式的测
试函数,有连续函数也有离散函
数,有凸函数也有凹函数,有低
维函数也有高维函数,有确定函
数也有随机函数,有但峰值函数
也有多峰值函数等。用这些几何
特性各具特色的函数来评价遗传
算法的性能,更能反映算法的本
质效果。而对于一些非线性、多
模型、多目标的函数优化问题,
用其他优化方法比较难求解,而
遗传算法却是可以方便的得到较
好的结果。
2.组合优化
随着问题规模增大,组合优化问题的搜索空间也急剧扩大,有
时在目前的计算机上用枚举法很
难或不可能求解精确最优解。对
这类复杂问题,人们已经意识到
应把主要精力放在求其满意解上,
而遗传算法是寻求这种满意解定
的最佳工具之一。实践证明,遗
传算法已经在求解旅行商问题、
背包问题、装箱问题、布局优化、
图形划分问题等各种具有NP难度
的问题得到成功应用。
3.自动控制
在自动控制领域中有很多优化相关的问题需要求解,遗传算
法已在其中得到初步的应用,并
显示出良好的效果。例如用遗传
算法进行航空控制系统的优化、
使用遗传算法设计空间交回控制
器、基于遗传算法的模糊控制器
的优化设计、基于遗传算法的参
数辨识、基于遗传算法的模糊控
制规则的学习、利用遗传算法进
行人工神经网络的结构优化设计
和权值学习,都显示出遗传算法
在这些领域的应用可行性。
4.图像处理
图像处理是计算机视觉中的一个重要研究领域。在图像处理
过程中,如扫描、特征提取、图
像分割等不可避免的存在一些误
差,从而会影响图像的效果。如
何使这些误差最小是使计算机视
觉达到实用化的重要要求。遗传
算法在这些图像处理中优化计算
方面找用武之地。目前已在模式
识别、图像恢复、图像边缘特征
提取等方面取得了应用。
5.数据挖掘
数据挖掘是近几年出现的数据库技术,它能够从大型的数据
库中提取隐含的、先前未知的、
有潜在应用价值的知识和规则。
许多数据挖掘问题可视为搜索问
题,数据库视为搜索空间,挖掘
算法视为搜索策略。因此,应用
遗传算法在数据库中进行搜索,
对随机产生的一组规则进行进化,
直到数据库能被该组规则覆盖,