数学建模 蛋白质分子量分解问题的探究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分子量分解问题的研究

摘 要

生命蛋白质在形成过程中由若干种氨基酸经不同的方式组合而成,针对拥有一定分子量的蛋白质分子在形成过程中所存在的若干的不同的组合方式问题 ,在给定的蛋白质分子量x 条件下,我们分不拥有计算机和拥有计算机两种情况考虑:一、在没有计算机的情况下,我们通过题中条件建立多元一次方程组,建立了一般数学模型,利用矩阵法得出不附加任何约束条件下的最为一般的数学模型,求解满足已知条件的解,得到不同x 条件下方程通解的表达式;二、在拥有计算机的情况下,共建立三个数学模型:分别为:1、不考虑任何其他约束条件下的蛋白质分解,我们用F ort ran 编程穷举满足方程的所有解,但是我们发现直接编程通过18次循环来求解十八元一次方程工作量较大,因此在模型一中我们

将程序循环的上限合理地改为了][]

1[n …]1[1-i 1i a i a a n x ---,从而减少程序运行次数。

当X 取1000的时候,运行的次数已经减少到28268次,提高了程序运行的效率,运行时间减少到0.187秒。提高了程序运行的效率,缩短了运行时间。2、在模型二中通过考虑确定C 、H 、O 、N 各元素的相对分子含量,在原有的FO RTRA N程序中增加了4个约束条件,建立延伸拓展模型,得出合理的有可能在生活中存在的氨基酸的组合数.减少了无用解的数目,缩短了程序运行时间。以分子式为14146343O N H C 的蛋白质为例。其相对分子质量为936,分解成氨基酸的组合形式有256种,所用时间<2s ,组成形式只有原来的1/100,时间缩减为原来的1/5.3、模型三通过生物化学手段确定蛋白质中所含氨基酸的种类M ,从而减少方程中未知量的个数,将18元整数一次方程简化为M (M<=18)元一次方程,从而大大减少了运算量,节省了时间。

最后我们对模型进行了分析,并得到模型的整体评价和推广前景。

关键词

n元一次不定方程,矩阵法,氨基酸、各元素含量

一、问题重述

生命蛋白质是由若干种氨基酸经不同的方式组合而成.在实验中,为了分

析某个生命蛋白质的分子组成,通常用质谱实验测定其分子量x (正整数),然后将分子量x 分解为n个已知分子量a [i ](i=1,.。...。。,n )氨基酸的和的形式.某实验室所研究的问题中:

n =18, x ≤1000

a[i](i=1,..。....,18)分别为57, 71, 87, 97, 99, 101, 103, 113, 114, 115, 128, 129, 131, 137, 147, 156, 163, 186 要求针对该实验室拥有或不拥有计算机的情况作出解答。

二、问题分析

蛋白质是以氨基酸为基本单位构成的生物高分子。由生物常识可知,组成

蛋白质的氨基酸总共有20种,由于亮氨酸和异亮氨酸、谷酰胺和赖氨酸相对分子质量相同,所以题目中给出的氨基酸分子质量有18种。分析某个生命蛋白质的分子组成,即通过N 元一次方程X x a i i i =∑=18

1求出组成蛋白质的氨基酸的种类和

数目.在没有计算机的情况下,常采用辗转相除法解N元一次方程,但由于过程繁琐,计算量大,我们尝试改用矩阵法。在有计算机的情况下,我们可以利用蛋白质本身的特性,补充约束条件,结合FORTRA N语句编程,可以有效减少运算结果和运算时间。

三、模型假设

1、忽略各个氨基酸分子结合失去一分子水的影响,给定的蛋白质分子量X 单纯只是几个已知的氨基酸分子量之和而不考虑其他影响因素;

2、假设所有被测定的蛋白质均由给定分子量的20种氨基酸组成,不含有其他组成成分。因为组成蛋白质的20种主要氨基酸中有两对分子量相等,故为18种相对分子质量;

3、假设氨基酸分子结合过程中是任意排列组合的,不存在互斥或互补现象,即任何两种氨基酸都可以同时存在于同一个蛋白质中,没有任何一种氨基酸的存在是以其他氨基酸的存在为前提的。实际中这一假设是成立的;

4、假设给定的蛋白质分子量X 和氨基酸已知分子量i a 数据准确,无测量误差;

5、假设实验测定中蛋白质是水解完全的;

6、假设实验室拥有测定物质化学性质的仪器

四、符号系统

i a :第i 种氨基酸的实际分子质量

i x :蛋白质分子中各组成氨基酸的数目

X

:蛋白质分子的实际分子质量

i i i i N O H C ,,,:第i 种氨基酸C,H,O ,N 原子的个数

C %、H %、O %、N %:该蛋白质中相应元素的质量分数

m :该蛋白质含有的氨基酸种类数目

五、模型建立

5。1在没有计算机的情况下

由题目可知,本题是一个典型的多元一次不定方程的求解问题。所谓多元一次

不定方程,就是可以写成下列形式的方程:1122...n n a x a x a x A +++=,它是指未知数的个数多余方程个数的方程,这类方程可能有无穷多解。传统方法中常用的方法为辗转相除法,但是当n较大的时候计算起来比较繁琐,因此,我们利用矩阵的初等变换求不定方程的通解。

1821,....,,a a a 是18个整数,经过一系列初等整消法变换,矩阵

⎪⎪⎪⎪⎪

⎪⎪⎭

⎝⎛n a a a a 1....000....................0....1000....0100. (001321)

(1)

可化为整数矩阵

⎪⎪⎪⎪⎪

⎪⎪⎭

⎫ ⎝⎛0......................................0...0......18321333323122322211131211n n n n n n n p p p p p p p p p p p p d p p p p

(2)

其中,d 是1821,....,,a a a 的最大公因数,并且

⎪⎪⎪⎩⎪

⎪⎪⎨⎧=++++=++++=++++=++++0

..............................................................0...0......332211332323213123232221211313212111n nn n n n n n n n n n a p a p a p a p a p a p a p a p a p a p a p a p d

a p a p a p a p 1)(==⨯n n n ij I p

定理1 设(n a a a ,...,21)=1,0

2,

01,...,n x x x 为不定方程b x a x a x a n n =+++...2211的一组特解

121,...,-n t t t 为任意整数,那么它的通解为:

0111

22201

110112211.....................

;

(...)n n n n n n n n n n x x a t x x a t x x a t x x a t a t a t -----⎧=+⎪=+⎪⎪

⎨⎪=+⎪⎪=-+++⎩

证明 由1122...n n a x a x a x b +++=及000

1111...nn a x a x a x b +++=,得 000111222()()()0n n n

a x x a x x a x x -+-+-= 故

0000

111222111

()()()...()n n n n n n a x xa x x a x x a x x ----=-------, 显然上式有n —1个自由未知量,不难求得它的n-1个解为:

相关文档
最新文档