遗传算法(Genetic Algorithm,GA)最早是由美国的 John holland于20世纪70年代提出,该算法是根据大自然中生物体进化规律而设计提出的。是模拟
达尔文生物进化论的
自然选择和
遗传学机理的
生物进化过程的计算
模型,是一种通过模拟自然进化过程搜索
最优解的方法。该算法通过数学的方式,利用
计算机仿真运算,将问题的求解过程转换成类似生物进化中的
染色体基因的交叉、变异等过程。在求解较为复杂的组合优化问题时,相对一些常规的优化算法,通常能够较快地获得较好的优化结果。遗传算法已被人们广泛地应用于组合优化、机器学习、信号处理、自适应控制和人工生命等领域。
简介
遗传算法的起源可追溯到20世纪60年代初期。1967年,美国密歇根大学J. Holland教授的学生 Bagley在他的博士论文中首次提出了遗传算法这一术语,并讨论了遗传算法在博弈中的应用,但早期研究缺乏带有指导性的理论和计算工具的开拓。1975年, J. Holland等提出了对遗传算法理论研究极为重要的模式理论,出版了专著《自然系统和人工系统的适配》,在书中系统阐述了遗传算法的基本理论和方法,推动了遗传算法的发展。20世纪80年代后,遗传算法进入兴盛发展时期,被广泛应用于自动控制、生产计划、图像处理、机器人等研究领域。
基本框架
编码
由于遗传算法不能直接处理问题空间的参数,因此必须通过编码将要求解的问题表示成遗传空间的染色体或者个体。这一转换操作就叫做编码,也可以称作(问题的)表示(representation)。
a)
完备性(completeness):问题空间中的所有点(候选解)都能作为GA空间中的点(染色体)表现。
b)健全性(soundness): GA空间中的染色体能对应所有问题空间中的候选解。
c)非冗余性(nonredundancy):染色体和候选解一一对应。
适应度函数
进化论中的适应度,是表示某一个体对
环境的适应能力,也表示该个体繁殖后代的能力。遗传算法的适应度
函数也叫
评价函数,是用来判断群体中的个体的优劣程度的指标,它是根据所求问题的
目标函数来进行评估的。
遗传算法在搜索进化过程中一般不需要其他外部信息,仅用评估函数来评估个体或解的优劣,并作为以后
遗传操作的依据。由于遗传算法中,
适应度函数要比较排序并在此基础上计算选择
概率,所以适应度函数的值要取正值。由此可见,在不少场合,将目标函数
映射成求最大值形式且
函数值非负的
适应度函数是必要的。
适应度函数的设计主要满足以下条件:
b) 合理、一致性
c)计算量小
d)通用性强。
在具体应用中,
适应度函数的设计要结合求解问题本身的要求而定。
适应度函数设计直接影响到遗传算法的性能。
初始群体选取
遗传算法中初始群体中的个体是
随机产生的。一般来讲,初始群体的设定可采取如下的策略:
a)根据问题固有知识,设法把握最优解所占
空间在整个问题空间中的分布范围,然后,在此分布范围内设定初始群体。
b)先随机生成一定数目的个体,然后从中挑出最好的个体加到初始群体中。这种过程不断
迭代,直到初始群体中个体数达到了预先确定的规模。
运算过程
(1)初始化:设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0)。
(2)个体评价:计算群体P(t)中各个个体的
适应度。
(3)
选择运算:将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的
适应度评估基础上的。
(4)交叉运算:将交叉算子作用于群体。遗传算法中起核心作用的就是交叉算子。
(5)
变异运算:将变异算子作用于群体。即是对群体中的个体串的某些
基因座上的基因值作变动。群体P(t)经过选择、交叉、
变异运算之后得到下一代群体P(t+1)。
(6)终止条件判断:若t=T,则以进化过程中所得到的具有最大
适应度个体作为
最优解输出,终止计算。
遗传操作包括以下三个基本遗传
算子(genetic operator):选择(selection);交叉(crossover);
变异(mutation)。
选择
从群体中选择优胜的个体,淘汰劣质个体的操作叫选择。选择
算子有时又称为再生算子(reproduction operator)。选择的目的是把优化的个体(或解)直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的,常用的选择算子有以下几种:适应度
比例方法、随机遍历抽样法、局部选择法。
交叉
在自然界生物进化过程中起核心作用的是生物
遗传基因的重组(加上变异)。同样,遗传算法中起核心作用的是
遗传操作的交叉算子。所谓交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。通过交叉,遗传算法的搜索能力得以飞跃提高。
变异
变异算子的基本内容是对群体中的个体串的某些基因座上的基因值作变动。依据个体编码表示方法的不同,可以有以下的算法:
a)实值变异。
b)二进制变异。
一般来说,变异算子操作的基本步骤如下:
a)对群中所有个体以事先设定的变异概率判断是否进行变异
遗传算法引入变异的目的有两个:一是使遗传算法具有局部的
随机搜索能力。当遗传算法通过交叉
算子已接近
最优解邻域时,利用变异算子的这种局部
随机搜索能力可以加速向最优解收敛。显然,此种情况下的变异概率应取较小值,否则接近最优解的积木块会因变异而遭到破坏。二是使遗传算法可维持群体
多样性,以防止出现未成熟收敛现象。此时收敛概率应取较大值。
终止条件
当最优个体的
适应度达到给定的
阈值,或者最优个体的适应度和群体适应度不再上升时,或者迭代次数达到预设的代数时,算法终止。预设的代数一般设置为100-500代。
特点
遗传算法是解决搜索问题的一种通用算法,对于各种通用问题都可以使用。
搜索算法的共同特征为:
(1) 首先组成一组候选解
(4) 对保留的候选解进行某些操作,生成新的候选解。
在遗传算法中,上述几个特征以一种特殊的方式组合在一起:基于染色体群的并行搜索,带有猜测性质的选择操作、交换操作和突变操作。这种特殊的组合方式将遗传算法与其它搜索算法区别开来。
遗传算法还具有以下几方面的特点:
(1)算法从问题解的串集开始搜索,而不是从单个解开始。这是遗传算法与传统优化算法的极大区别。传统优化算法是从单个初始值
迭代求最优解的;容易误入局部最优解。遗传算法从串集开始搜索,覆盖面大,利于全局择优。
(2)遗传算法同时处理群体中的多个个体,即对搜索空间中的多个解进行评估,减少了陷入局部最优解的风险,同时算法本身易于实现并行化。
(3)遗传算法基本上不用搜索空间的知识或其它
辅助信息,而仅用
适应度函数值来评估个体,在此基础上进行
遗传操作。
适应度函数不仅不受
连续可微的约束,而且其
定义域可以任意设定。这一特点使得遗传算法的应用范围大大扩展。
(4)遗传算法不是采用确定性规则,而是采用概率的变迁规则来
指导他的搜索方向。
(5)具有自组织、自适应和自学习性。遗传算法利用进化过程获得的信息自行组织搜索时,
适应度大的个体具有较高的生存概率,并获得更适应
环境的
基因结构。
(6)此外,算法本身也可以采用动态自适应技术,在进化过程中自动调整算法控制参数和编码精度,比如使用模糊自适应法。
不足之处
(1)编码不规范及编码存在表示的不准确性。
(2)单一的遗传算法编码不能全面地将优化问题的约束表示出来。考虑约束的一个方法就是对不可行解采用阈值,这样,计算的时间必然增加。
(3)遗传算法通常的效率比其他传统的优化方法低。
(4)遗传算法容易过早收敛。
(5)遗传算法对算法的精度、可行度、计算复杂性等方面,还没有有效的定量分析方法。
应用
由于遗传算法的整体搜索策略和优化搜索方法在计算时不依赖于梯度信息或其它辅助知识,而只需要影响搜索方向的目标函数和相应的适应度函数,所以遗传算法提供了一种求解复杂系统问题的通用框架,它不依赖于问题的具体领域,对问题的种类有很强的
鲁棒性,所以广泛应用于许多科学,下面我们将介绍遗传算法的一些主要应用领域:
函数优化
函数优化是遗传算法的经典应用领域,也是遗传算法进行性能评价的常用算例,许多人构造出了各种各样复杂形式的测试函数:连续函数和离散函数、
凸函数和
凹函数、低维函数和高维函数、单峰函数和多峰函数等。对于一些
非线性、多
模型、多目标的函数优化问题,用其它优化方法较难求解,而遗传算法可以方便的得到较好的结果。
组合优化
随着问题规模的增大,组合优化问题的搜索空间也急剧增大,有时在计算上用
枚举法很难求出
最优解。对这类复杂的问题,人们已经意识到应把主要精力放在寻求满意解上,而遗传算法是寻求这种满意解的最佳工具之一。实践
证明,遗传算法对于组合优化中的NP问题非常有效。例如遗传算法已经在求解
旅行商问题、
背包问题、
装箱问题、图形划分问题等方面得到成功的应用。
此外,GA也在生产调度问题、自动控制、
机器人学、
图象处理、
人工生命、遗传编码和
机器学习等方面获得了广泛的运用。
车间调度
车间调度问题是一个典型的NP-Hard问题,遗传算法作为一种经典的智能算法广泛用于车间调度中,很多学者都致力于用遗传算法解决车间调度问题,现今也取得了十分丰硕的成果。从最初的传统车间调度(JSP)问题到柔性作业车间调度问题(FJSP),遗传算法都有优异的表现,在很多算例中都得到了最优或近优解。