马尔科夫链模型及其在基因遗传分析中的应用研究
遗传算法的马尔可夫模型

遗传算法的马尔可夫模型1. 引言遗传算法是一种基于生物进化理论的优化算法,通过模拟自然选择、遗传变异和交叉等操作,寻找问题的最优解。
马尔可夫模型是一种描述随机过程的数学模型,它具有记忆性和状态转移概率等特点。
本文将介绍遗传算法与马尔可夫模型的结合应用,以及它们在解决实际问题中的优势和局限性。
2. 遗传算法基本原理遗传算法主要由个体表示、适应度评估、选择、交叉和变异等几个基本操作组成。
•个体表示:通常使用二进制编码来表示问题的解空间中的一个解。
每个二进制位表示一个决策变量或参数。
•适应度评估:根据问题的具体情况,设计适应度函数来评估每个个体的优劣程度。
适应度函数越大,说明个体越好。
•选择:根据适应度函数值选择出一部分较好的个体作为”父代”参与繁殖下一代。
常用的选择方法有轮盘赌选择、排名选择等。
•交叉:从”父代”中选取两个个体,按照某种规则进行交叉操作,生成新的个体。
交叉操作可以保留两个个体的优点,并产生新的解。
•变异:对新生成的个体进行变异操作,以增加种群的多样性。
变异操作可以随机改变某个基因位上的值,引入新的解。
通过不断重复选择、交叉和变异等操作,逐渐优化种群中的个体,以找到最优解。
3. 马尔可夫模型基本原理马尔可夫模型是一种离散时间、离散状态空间、具有马尔可夫性质的随机过程。
它具有以下几个特点:•状态转移概率:在任意时刻,系统从一个状态转移到另一个状态的概率只与当前状态有关,与之前的历史状态无关。
•记忆性:系统只需要记录当前状态即可预测未来状态的概率分布,不需要保存过去所有历史信息。
•马尔可夫链:由一系列满足马尔可夫性质的状态组成,并且在每次转移时都遵循一定的概率分布规律。
马尔可夫模型可以用于建模和预测各种具有随机性的系统,如天气预测、金融市场分析等。
4. 遗传算法与马尔可夫模型的结合将遗传算法与马尔可夫模型相结合,可以利用遗传算法的全局搜索能力和马尔可夫模型的状态转移特性,更好地解决一些复杂问题。
利用马尔可夫模型进行基因序列分析的教程(九)

利用马尔可夫模型进行基因序列分析的教程随着科技的不断发展,基因组学研究在生物学领域扮演着越来越重要的角色。
基因序列分析是基因组学研究的重要组成部分,它可以揭示基因的结构和功能,为疾病的研究和治疗提供重要参考。
马尔可夫模型是一种常用的序列分析工具,它在基因序列分析中有着广泛的应用。
本文将介绍如何利用马尔可夫模型进行基因序列分析。
1. 马尔可夫模型简介首先,我们来简单介绍一下马尔可夫模型。
马尔可夫模型是一种基于状态转移概率的数学模型,它可以描述状态序列的转移规律。
在基因序列分析中,我们可以将基因序列看作是由一系列基因组成的状态序列,而马尔可夫模型可以用来描述这些基因之间的转移概率。
这样一来,我们就可以利用马尔可夫模型来分析基因序列中的一些重要特征,比如基因的结构和功能。
2. 马尔可夫模型在基因序列分析中的应用接下来,我们将介绍一些马尔可夫模型在基因序列分析中的具体应用。
首先,马尔可夫模型可以用来预测基因序列中的一些重要结构,比如编码蛋白质的基因的起始子和终止子。
通过分析基因序列中的马尔可夫模型,我们可以发现这些结构的一些共性特征,从而帮助我们更好地理解基因的功能。
此外,马尔可夫模型还可以用来比较不同基因序列之间的相似性。
通过比较不同基因序列的马尔可夫模型,我们可以计算它们之间的相似性指标,从而帮助我们找出它们之间的一些共同特征。
这对于研究基因之间的进化关系非常有帮助。
3. 利用马尔可夫模型进行基因序列分析的具体步骤最后,我们将介绍一下利用马尔可夫模型进行基因序列分析的具体步骤。
首先,我们需要选择一个合适的马尔可夫模型,这通常包括选择模型的阶数和状态空间。
然后,我们需要根据基因序列的特点,来估计马尔可夫模型的参数。
这包括计算状态转移概率矩阵和初始状态分布。
最后,我们可以利用估计的马尔可夫模型来进行基因序列分析,比如预测基因结构和比较基因序列的相似性。
总结马尔可夫模型是一种强大的工具,它在基因序列分析中有着广泛的应用。
一阶马尔可夫链在基因遗传中的应用

文 章编 号 :6 2— 5 X(0 0J4— 3 1— 3 1 7 0 8 2 1 0 0 4 0
一
阶 马 尔 可 夫 链 在 基 因 遗 传 中 的 应 用
樊 宏 亮
( 四川农业大学 生命科学与理学 院,四川 雅安 6 5 1 ) 2 0 4
摘
要 : 临床 上 , 个 家 系中如果 同时存在 两种 单基 因病 , 在 一 而控 制 这 两种 单基 因病 的致 病 基 因位 于不
的是位于非同源染色体上基因, 父母 的基 因类型决定后代 的基 因类型 , 而基 因在遗传时随代数的递增 , 基因
比例 也就 趋于 一种 相对 稳态 。用 一 阶马尔 可夫链模 型对 非 同源 染色 体 上 的基 因进 行 了分 析 , 到 基 因 的遗 得
传规律趋于相对稳态。并进一步运用此模型对常染色体上的传染疾病进行 了预测 , 为控制常染色体遗传病
2 基 因类 型 描述
生物 的表 型 由相 应 的基 因决 定 , 因分 显性 基 因 d和 隐性基 因 r 基 两种 。每 种表 型 由两个 基 因决定 , 个 每 基 因可 以是 d r , 中任一个 。于是形 成 了 3种基 因型 : 显性 纯合 体 D( ) 杂 合体 日( ) 隐性 纯 合体 R(r , , r) 基 因型为显 性纯 合体 和杂合 体 时表征 呈 显性 , 因类 型 为 隐性 纯 合 体 时 , 基 表形 成 隐性 。生 物 繁 殖 时后 代 以 随机概 率继 承父母 的各 一个 基 因型 , 成后代 的基 因。父母 的基 因类 型决 定后 代 基 因型 的概率 。群体 中雄 形
过程 。
定 义 : 有 以下两 个性 质 的马尔 可夫 过程 称为 马尔 可夫链 : 具 ( )无 后效 性 , 1 即系统 的第 n次 实验 结果 出现 的状 态 只与第 ( n一1 次 时 的状 态有 关 ,而与 它 以前 的状 )
利用马尔可夫模型进行基因序列分析的教程(五)

基因序列分析是生物信息学领域的重要研究内容之一。
利用马尔可夫模型进行基因序列分析可以帮助研究者理解基因的结构和功能,从而为疾病的治疗和预防提供重要的信息。
本文将介绍利用马尔可夫模型进行基因序列分析的基本原理和方法,希望读者能够通过本文了解基因序列分析的基本知识,并能够在实际研究中应用马尔可夫模型进行基因序列分析。
1. 马尔可夫模型简介马尔可夫模型是一种描述随机过程的数学模型,它具有“马尔可夫性质”,即未来的状态仅仅取决于当前的状态,与过去的状态无关。
在基因序列分析中,可以利用马尔可夫模型描述DNA序列中碱基的分布规律,从而推断基因的结构和功能。
2. 马尔可夫模型在基因序列分析中的应用在基因序列分析中,马尔可夫模型通常被用来预测DNA序列中的隐含Markov 模型和隐含马尔可夫模型,以及用在基因识别中。
通过对已知基因序列的训练,可以建立马尔可夫模型,然后利用该模型对未知的基因序列进行预测和分析。
3. 利用马尔可夫模型进行DNA序列的建模在利用马尔可夫模型进行基因序列分析时,首先需要对DNA序列进行建模。
通常情况下,可以将DNA序列中的碱基分为四类:A、C、G和T。
然后,可以利用马尔可夫模型描述碱基之间的转移概率。
以二阶马尔可夫模型为例,可以建立一个4*4的矩阵,表示从一个碱基转移到另一个碱基的概率。
4. 马尔可夫模型参数的估计在建立马尔可夫模型之后,需要对模型的参数进行估计。
参数估计的方法通常包括极大似然估计和贝叶斯估计。
通过对已知的训练数据进行统计分析,可以估计马尔可夫模型中的转移概率和初始状态概率。
5. 利用马尔可夫模型进行基因识别基因识别是基因序列分析的重要任务之一。
利用马尔可夫模型可以对DNA序列进行分析,从而识别其中的基因区域。
通过对DNA序列进行标记,可以利用马尔可夫模型进行概率推断,从而识别基因区域和非基因区域。
6. 马尔可夫模型在基因序列比对中的应用除了基因识别外,马尔可夫模型还可以应用于基因序列比对。
马尔可夫链计算方法在遗传变异预测中的应用效果考量

马尔可夫链计算方法在遗传变异预测中的应用效果考量引言遗传变异是指基因或染色体中的DNA序列发生了变化。
对于生物进化和遗传发育等过程具有重要意义。
准确预测遗传变异是遗传学和生物学研究的关键问题之一。
然而,由于传统的实验方法受限于成本和效率,基于计算模型的预测方法成为了研究的热点。
马尔可夫链计算方法作为一种重要的预测模型,在遗传变异预测中具有广泛的应用。
本文将考察马尔可夫链计算方法在遗传变异预测中的应用效果,并讨论其优势与局限性。
一、马尔可夫链基本原理马尔可夫链是一种离散时间和状态的随机过程,其基本原理是一种概率模型,描述了在给定当前状态下,从一个状态到另一个状态的转移概率。
它遵循“马尔可夫性”,即下一个状态的概率只取决于当前状态,与过去的状态无关。
马尔可夫链的状态空间可以是有限的或无限的。
二、马尔可夫链在遗传变异预测中的应用1. 马尔可夫链模型对序列分析的应用马尔可夫链模型可以用于分析DNA或RNA序列中的遗传变异。
通过建立序列的马尔可夫模型,可以预测序列中特定基因或氨基酸的出现概率,从而揭示可能的遗传变异。
例如,在细菌基因组序列中,马尔可夫链模型可以预测不同类型的基因功能区域,如启动子、编码区和终止子。
这种预测有助于理解基因组的结构和功能,为生命科学研究提供重要信息。
2. 马尔可夫链模型在遗传疾病风险预测中的应用马尔可夫链模型还可以用于预测遗传疾病的风险。
通过分析家族病史和基因序列数据,可以建立基因突变的马尔可夫模型。
该模型可以计算一个人遗传疾病的患病风险,从而帮助医生和患者做出相应的防治措施。
这在遗传咨询和个性化医学中具有重要的应用前景。
3. 马尔可夫链模型在群体遗传变异分析中的应用马尔可夫链模型还可以用于分析群体遗传变异的模式和动态。
通过建立群体的马尔可夫模型,可以预测群体的遗传变异趋势和演化方向。
这对于理解物种的遗传多样性、种群分化和进化等问题具有重要意义。
例如,在人类遗传变异研究中,马尔可夫链模型可以帮助揭示人类种群的历史演化和迁移路径。
利用马尔可夫模型进行基因序列分析的教程(七)

利用马尔可夫模型进行基因序列分析的教程基因序列是生物体内遗传信息的载体,对基因序列的分析可以帮助我们理解生物体的遗传特征,甚至可以为医学研究和生物工程领域提供重要的信息。
马尔可夫模型是一种用于分析序列数据的数学模型,它可以帮助我们理解序列数据的内在规律,对基因序列的分析中有着重要的应用。
本文将介绍利用马尔可夫模型进行基因序列分析的基本原理和方法。
基因序列可以被看作是由A、T、C、G四种碱基组成的序列,马尔可夫模型可以帮助我们理解这些碱基之间的相关性。
一阶马尔可夫模型假设当前的状态只与前一个状态有关,这在基因序列分析中意味着当前位置的碱基只与前一个位置的碱基有关。
我们可以通过建立基因序列的马尔可夫模型,来研究碱基之间的转移规律和相关性。
首先,我们需要对基因序列进行建模。
假设我们有一个基因序列“ATGCTA”,我们可以将其表示为一个状态序列,其中每个状态代表一个碱基。
然后我们可以统计每个碱基出现的频次,得到转移矩阵。
转移矩阵描述了从一个状态到另一个状态的转移概率,它可以帮助我们理解碱基之间的相关性和转移规律。
接下来,我们可以利用马尔可夫模型进行基因序列的分析。
通过计算马尔可夫链的平稳分布,我们可以得到每种碱基在基因序列中的出现概率。
这可以帮助我们理解基因序列的组成规律和特点。
此外,我们还可以利用马尔可夫模型进行基因序列的预测。
给定一个初始状态和马尔可夫链的转移矩阵,我们可以预测基因序列的未来状态,从而理解基因序列的发展趋势和特点。
除了一阶马尔可夫模型,我们还可以考虑更高阶的马尔可夫模型。
高阶马尔可夫模型考虑了当前状态与前几个状态的相关性,它可以更准确地描述基因序列中碱基之间的相关性和转移规律。
通过建立高阶马尔可夫模型,我们可以更深入地理解基因序列的特点和规律。
在基因序列分析中,马尔可夫模型还可以与其他的数学模型相结合,进行更深入的分析。
例如,我们可以将马尔可夫模型与隐马尔可夫模型相结合,用于基因序列的识别和预测。
马氏链模型在基因遗传中的应用

马氏链模型在基因遗传中的应用摘要:马尔可夫模型是研究离散时间、离散状态随机转移过程的有力工具。
本文利用状态转移的无后效性,通过定义状态和状态概率构造转移概率矩阵建立马氏模型,并讨论此模型在基因遗传中的应用。
关键词:马尔可夫模型;概率矩阵;基因遗传1 引言随着科技的进步,人们为了提高产量,越来越注重遗传学的研究。
豆子的茎秆有黄有绿,猪的毛有白有黑,人类会出现色盲等先天性疾病,这些都是基因遗传的结果。
无论是人,还是动植物的基因从一代到下一代的转移都是随机的,并且无后效性,于是马氏链成为遗传学的工具。
本文将利用马氏链建立一个属于完全优势基因遗传的模型,并讨论该模型在基因遗传中的应用。
2 模型的建立在自然界中,生物个体的遗传特征是由两个基因决定的,用A表示优势基因,用a表示劣势基因。
于是个体就有三种基因类型,即是两个优势基因AA,称为优种,优势基因与劣势基因各一个Aa,称为混种,两个劣势基因aa,称为劣种。
若个体的基因类型为优种或混种时,外部特征为优势,如豆子的茎秆是绿色,个体的基因类型为劣种时,外部特征是劣势,如豆子的茎秆是黄色。
生物繁殖时,一个后代从父本和母本中各继承一个基因,即后代属于哪一种基因类型完全由父母的基因类型决定,与再上一代的基因类型无关,满足马氏链模型中的无后效性。
下面利用马尔可夫模型来比较一下混种繁殖和优种繁殖两种繁殖形式,哪种更好?在繁殖的过程中用一混种与一个个体交配,所得后代仍用混种交配,如此继续下去,称为混种繁殖。
建立马氏链模型描述在混种繁殖下各代具有三种基因类型的概率,并讨论稳态情况。
用基因类型优种AA(第一种),混种Aa(第二种)和劣种aa(第三种)定义状态,状态概率表示第代个体具有第种基因类型的概率,记作。
当用混种Aa与优种AA交配时,后代的基因类型只能是AA和Aa,其概率各为½,当用混种Aa与Aa交配时,后代的基因类型可以是AA,Aa和aa,其概率分别为¼,½,¼,当用混种Aa与劣种aa交配时,后代的基因类型只能是Aa 和aa,其概率各为½,由此可以写出转移概率矩阵为设初始混种与优种交配,即,由(,为转移概率矩阵)式计算任意时段的状态概率,计算结果如下表,混种繁殖下三种基因类型的状态概率(初始与优种交配)由此表可以看出,当时,表明经过足够多代繁殖以后,优种、混种、劣种的比例接近于下面我们通过计算验证这个猜想。
马尔可夫链模型

马尔可夫链模型一、基因遗传问题豆科植物茎的颜色有绿有黄,生猪的毛有黒有白,人会得一些先天性疾病等,这些都与基因遗传有关。
基因从一代到下一代的转移是随机的,并且具有马氏性。
因此马氏链模型是研究遗传学的重要工具之一。
生物的外部表征如豆科植物茎的颜色,人的皮肤或头发,是由生物体内相应的基因决定。
基因分优势基因与劣势基因,分别用d 和r表示。
每种外部表征由体内的两个基因决定,而每个基因都可以是d或r中的一个,于是可以得到三种基因类型,即dd、dr 和rr,分别称为优种、混种和劣种,用D、H和R表示。
含D、H 基因类型的个体,外部表征呈优势,如豆科植物的茎呈绿色,人的皮肤有色素;含劣种R基因类型的个体外部表征呈劣势,如豆科植物的茎呈黄色,人的皮肤无色素。
生物繁殖时,一个后代随机的继承父与母各自的两个基因中的一个,形成两个基因。
一般两个基因中哪个遗传下去是等概率的,所以父母的基因类型就决定了每一后代基因类型的概率。
下面我们以马氏链为工具讨论两个具体的基因遗传模型。
随机交配这是自然界中生物群体一种常见的、也是最简单的交配方式。
考察一个群体,假设雄性和雌性的比例永远相等,并且有相同的基因类型分布,即雄性和雌性的D 、H 、R 的数量比例相等。
所谓随机交配是指对于每一个不论属于D 、H 或R 的雌性(或雄性)个体交配,都以D :H :R 的数量比例为概率与一个属于D 、H 或R 的雄性(或雌性)个体交配,其后代则按照前面所说的方式等概率地继承其父母亲的各一个基因,来决定它的基因类型。
假定在初始一代的群体中,三种基因类型的数量比是D :H :R =a :2b :c ,满足21a b c ++=。
记,p a b q b c =+=+,则群体中优势基因d 与劣势基因r 的数量比例为:p q ,且1p q +=。
讨论随机交配方式产生的一系列后代群体中的基因类型分布。
用1,2,3n X =分别表示第n 代的一个体属于D 、H 及R 基因类型,即三种状态,0,1,2,.()i n a n = 表示个体属于第i 种状态的概率,1,2,3i =可视为第n 代的群体属于第i 种基因类型的比例。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
马尔科夫链模型及其在基因遗传分析中的应用研究内容提要 文中简述了马尔科夫链模型的基本原理,介绍了利用马尔科夫链对农作物基因遗传过程进行的分析研究,从而得出了基因类型的分布情况和农作物种植最适宜的换种代数间隔,使得可以更好的种植农作物。
关键词 马尔可夫链模型 基因遗传 换种间隔一、引言对基因遗传的分析一直是人们较为关心的话题。
在研究出某物种基因的遗传分布后,对人们今后的对该物种进行的各种改良提供了良好的依据,尤其是对农作物基因类型的研究。
在研究出农作物的各代之间基因类型的关系和分布情况之后,我们可以据此改善农作物的种植方法,从而提高产量。
本文依据马尔科夫链的两种重要类型对农作物的基因遗传进行了分析研究,同时,分析研究马尔科夫链在一对父母的大量后代中,雌雄随机的配对繁殖,一系列后代的基因类型的演变过程中的应用。
二、马尔科夫链1.马尔可夫链的基本概念定义 ①.设{(),0,1,2,}n X X w n ==⋅⋅⋅是定义在概率空间(,,)F P Ω上,取值在非负整数上的随机变量序列,其表示对每个n 系统的状态。
当状态1,2,,(1,2,)n X k n =⋅⋅⋅=⋅⋅⋅时表示共有k 个状态;n 时刻由状态n X i =,下一个时刻n+1变到状态1n X j +=的概率记作ij p ,则1(|)ij n n p P X j X i +===表示在事件n X i =出现的条件下,事件1n X j +=出现的条件概率,又称它为系统状态X 的一步转移概率。
如果对任意的非负整数121,,,,,n i i i i j -⋅⋅⋅及一切0n ≥有1(|,,1,2,,1)n n k k P X j X i X i k n +====⋅⋅⋅-=1(|)()n n ij ij P X j X i p n p +====,则称X 是马尔科夫链。
②.矩阵(ij p )称为马尔科夫链X 的一步转移概率矩阵。
称10()(|)(|)ij n n m m p n P X j X i P X j X i ++======为马尔科夫链X 的n 步转移概率,而(()ij p n )为X 的n 步转移矩阵。
③. 系统状态n X i =的概率记作称()i a n 称为状态概率,1()1ki i a n ==∑;对状态概率计算的基本方程为1(1)(),1,2,,ki i ij i a n a n p i k =+==⋅⋅⋅∑,从而可得状态概率向量12(){(),(),,()}i k a n a n a n a n =⋅⋅⋅。
2.马尔科夫链的两个重要类型①.正则链 一个有k 个状态的马尔科夫链,如果存在整数N 从任一状态出发经N 次状态转移能以正概率到达另外任意状态。
正则链存在位移的极限状态w ,()()a n w n →→∞,w 称作稳态概率,w 满足wP w =,且11ki i w ==∑。
②.吸收链 存在吸收态(一旦到达就不会离开的状态i ,1ii p =),且从任一非吸收态出发经有限次转移能以正概率到达吸收状态。
有r 个吸收状态的吸收链的转移概率矩阵标准形式0r r I P RQ ⨯⎡⎤=⎢⎥⎣⎦,其中R 有非零元素。
计算10()s s M I Q Q ∞-==-=∑,12(,,,)k r y y y y Me -=⋅⋅⋅=,其中e 为单位矩阵,1y 表示从第i 个非吸收态出发,被某个吸收态吸收前的平均转移次数。
三、马尔科夫链的应用马尔可夫过程的一个最大特点就是其所具有的无后效性, 即系统在将来的状态只和现在有关, 而与以前的状态无关, 其基本的思想就是通过对系统当前数据信息的分析, 得到系统在当前状态的初始分布, 同时通过对系统在下一状态的数据信息的分析得出系统在两个状态之间发生各种转移的概率大小, 并具体求出基于初始状态的转移概率。
在对农作物基因遗传的分析研究中,首先需要明确:生物的外部特征由内部相应的基因决定,基因分为优势基因R 和劣势基因r 两种。
每种外部特征由这两个基因决定,每个基因都可以是R 、 r 中的任一个,从而形成了3种基因类型:RR (优种D ),Rr (混种H ),rr (劣种F )。
当基因类型为优种和混种时,外部表征呈优势;基因类型为劣种时,外部表征成劣势。
同时,生物繁殖时后代随即且等概率的继承父、母的各一个基因,形成它的两个基因。
父母的基因类型决定后代基因类型的概率。
1.模型假设:①设群体中雄性、雌性的比例相等,基因类型的分布相同(记作D:H:F )②.每个雄性个体以D:R:F 的概率与一雌性个体交配,其后代随机地继承它们的各一个基因。
③.设初始一代基因类型比例D:H:F=a:2b:c(a+2b+c=1),记p=a+b,q=b+c ,则群体中优势基因和劣势基因的比例R:r=p:q(p+q=1)。
2.符号说明①.状态1,2,3,n X =⋅⋅⋅表示第n 代得一个个体属于D 、H 、F 。
②.状态概率()i a n 表示第n 代得一个个体属于状态i (i=1,2,3)的概率。
③.ij p 表示在确定雄性个体基因为i 的情况下,让其与所有雌性个体随机交配繁殖,所得后代的基因类型为j 的条件概率,即1((|(ij n n p P X j X i +===后代基因类型)父基因类型))。
从而我们可以计算出: 111(1(RR |1(RR =p n n p P X X +===后代为)父基因为))121(2(Rr |1(RR =q n n p P X X +===后代为)父基因为))131(3(|1(RR =0n n p P X X +===后代为rr )父基因为))321(2(|3(r =p n n p P X X +===后代为Rr )父基因为r ))221(2(|2(Rr =p/2+q/2=1/2n n p P X X +===后代为Rr )父基因为))311(1(|3(r =0n n p P X X +===后代为RR )父基因为r ))321(2(|3(r =p n n p P X X +===后代为Rr )父基因为r ))331(3(|3(r =q n n p P X X +===后代为rr )父基因为r ))则其状态转移概率矩阵为0/21/2/20p q P p q p q ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦,因(1)(),0,1,2,a n a n P n +==⋅⋅⋅ 故而可求得(0)(,2,)a a b c =,22(1)(0)(,2,)a a P p pq q ==,22(2)(1)(,2,)a a P p pq q ==,22(3)(2)(,2,)a a P p pq q ==,…由此可以看出该模型属于正则链,其稳态分布22(,2,)w wP p pq q ==,自然界中优势基因和劣势基因所占的比例通常是相等的,即都为1/2,从而D:H:F=1/4:1/2:1/4,得(D+H ):F=3:1。
这很好的验证了孟德尔利用数学统计对豌豆基因遗传分析,并提出基因分离定律和自由组合定律所得出的结论,即无论父母的基因类型情况为何,其后代所表现出的特性中显性基因所决定的特性与隐性基因决定的特性所占的比例始终接近3:1。
我们由此可以主观的得出结论马尔科夫链在动态分析检测中具有良好的应用,而且其方法较为简洁方便理解。
在农作物的种植的过程中,农民通常会在今年所收获的作物中选出饱满的适宜种植的作为下一年种子,就这样年复一年对同一种农作物进行种植,但对其最终的收获多少只归结为天气问题、肥料的使用等一系列的问题。
由于缺乏对专业知识的理解,从来都没有考虑过基因的问题。
在此我们根据马尔科夫模型对一种农作物的基因遗传进行了分析和研究,最终,利用马尔科夫链的一个重要类型即吸收链得出最优的换种代数间隔,给农民最好的种植农作物提供了良好的依据。
因此,我们分析研究了马尔科夫链在一对父母的大量后代中,雌雄随机的配对繁殖,一系列后代的基因类型的演变过程中的应用。
根据基因的分离和自由组合定律,我们对各种父母基因类型进行组合,得出了后代各种基因类型的概率(如表1)表1 父母基因类型决定后代各种基因类型的概率用状态1,2,3,4,5,6nX=表示配对基因组合为DD,FF,DH,DF,HH,HF.利用表1计算父母基因组合确定的情况下,子代的各种基因组合的概率,得其状态转移概率矩阵为:1000000100001/401/201/400000101/161/161/41/81/41/401/4001/41/2P⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦,由此状态转移矩阵可以看出状态1和状态2为吸收态,即无论初始如何,经过若干代的近亲繁殖以后,基因类型将全变为优种或劣种。
把矩阵P分块,令1001I⎡⎤=⎢⎥⎣⎦,1/201/4000101/41/81/41/4001/41/2Q⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦从而可得:18/31/64/32/34/34/38/34/3()4/31/38/34/32/31/64/38/3M I Q -⎡⎤⎢⎥⎢⎥=-=⎢⎥⎢⎥⎣⎦ 29201729(,,,)6336T y Me ==,因i y 表示从第i 个非吸收态出发,被某个吸收态吸收前的平均转移次数。
在此具体是:从各种不稳定的基因类型进行自由交配,最终到达稳定基因类型时所需要的时间。
由此结果我们可以得出结论:优种和劣种的某些品质不如混种,而近亲繁殖后大约5-6代就需要重新选种。
四、结论马尔可夫链应用的基础是无后效性和平稳性。
在预测时是假定系统的转移趋势是遵循已经确定的概率矩阵,因此转移概率的确定和转移趋势对预测结果的准确与否和准确程度有十分重要的影响。
最关键的是系统的转移趋势确实是比较平稳的,即要求影响系统状态转移趋势的外界条件不发生大的变化,如果系统的外界因素发生了较大的改变,说明转移概率也会发生变化,就得按照市场的变化重新计算转移概率。
另外,系统状态的划分要能很好地体现系统的实际情况。
对于有些复杂的系统, 划分状态时还要根据各个状态所包含的实际内容和意义来进行,然后就是依据划分好的状态界限来确定系统的初始状态分布。
从上面的分析中,我们可以看出马尔科夫链具有良好的应用效果。
马尔科夫模型可以应用于很多领域,而且分析过程较为简洁明了,最终结果具有一定的对现实情况的说明性。
只要在当前状态的发生和下一状态的发生之间有相对确定的概率关系时,我们就可以利用状态转移概率矩阵计算下一状态的各个情况发生的概率,并由此进行分析研究得出结论。
参考文献[1] 盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2011.[2] 袁荫棠.概率论与数理统计[M].北京:中国人民大学出版社,2011.[3] 查秀芳.马尔可夫链在市场预测中的作用[J].江苏大学学报(社会科学版),2003,5(1).[4] 李民,段爱明.马尔科夫模型的市场预测方法及其应用[J].中南大学商学院数学理论与应用.2005,9(3).[5] 张新时.遗传与进化[M].北京:中国地图出版社,2005.。