MIT科学家对新陈代谢模型进行修正

2014-10-13 15:39| 发布者: chenl| 查看: 1973| 评论: 0|来自: 研发埠

摘要: 新陈代谢网络为每个在器官或生物中可能出现的化学反应序列的数学模型,它们或被用来为制造过程设计微生物,或被用来研究疾病。基于遗传分析和实证研究,或许花费数年就能把他们组装起来。麻省理工学院的科学家研发了一种新型分析工具,这种工具表明原本的那些模型中的许多地方可能是错误的。幸运的是,同样的工具可以很容易对原模型进行修正。

——MIT科学家通过分析89种新陈代谢过程模型,发现其中有44种存在缺陷,并建议对其进行修正。

麻省理工学院Jose-Luis Olivares供图

新陈代谢网络为每个在器官或生物中可能出现的化学反应序列的数学模型,它们或被用来为制造过程设计微生物,或被用来研究疾病。基于遗传分析和实证研究,或许花费数年就能把他们组装起来。

麻省理工学院的科学家研发了一种新型分析工具,这种工具表明原本的那些模型中的许多地方可能是错误的。幸运的是,同样的工具可以很容易对原模型进行修正。

该工具的研发者之一,麻省理工学院应用数学与计算机科学教授Bonnie Berger说:“加利福尼亚大学圣迭戈校区的数据库中拥有所有这些模型。事实表明,这些模型大都使用浮点算法进行计算。大多数计算机系统使用近似的数值表示来提高计算效率。” Berger指出:“我们已经能够证明需要使用精确的算法来计算它们。当我们使用精确的算法计算它们时,可以发现,这些模型中的许多大家原以为真实的模型,无论在何种情况下,都不会出现一点点生长。”

Berger和他的同事们在最新一期的Nature Communications期刊上介绍了他们的新型工具和他们使用这种工具所做的分析。这篇论文的第一作者是Leonid Chindelevitch,在这项著作完成期间,他曾是Berger所带领的研究团队的博士研究生。现在他是哈佛大公共卫生学院的一名博士后。麻省理工学院生物学副教授Aviv Regev和Berger的另一位以前的学生Jason Trigg也加入了他和Berger的研究团队。

浮点运算是一种类似于计算机科学计数法的算法。它以一个小数乘以一个底数的幂的形式表示数值。与精确算法相比,尽管它牺牲了一些精度,但反过来,它又增加了计算效率。

事实上,为了使用精确算法来分析与新陈代谢网络一样庞大和复杂的数据结构,Berger和Chindelevitch不得不寻求一种不牺牲任何精度的简化问题的方法。

修剪网络

Chindelevitch说:“新陈代谢网络描述的是我们可能感兴趣的一种特定生物内所能发生的所有反应的集合。因此,如果我们对酵母菌或大肠杆菌或结核杆菌感兴趣的话,那么它就是一种将一切我们知晓的这种生物内将一些物质转换成其他的一些物质的过程集合在一起的方法。通常它会从环境中汲取营养物质,然后它通过其内部机理将这些营养物质转换成,不管它们是什么,它想生成的物质—乙醇,对于它来说,乙醇是一种不同的细胞成分,等等。”

因此,这种网络就代表每一个由生物的DNA编码的酶催化的化学反应序列,这些化学反应序列能够将特定的营养物质转换成特定的化学产物。网络中的每一个节点表示某些反应链中的中间阶段。

为了将这种网络简化到足以达到精确算法分析的程度,Chindelevitch和Berger提出了一种能够首先识别所有因这样、那样的原因而不能在模型环境下发生的反应序列的算法,然后这种算法就删除那些不发生的反应序列。其次,它识别出能够正常发生的反应链。无论反应的中间产物是什么,它们都有效地完成了一个单一的反应。最后,这种算法将这些反应链简化成一个单一的反应。

最为关键的是,Chindelevitch和Berger能够使用数学方法证明这些更改不会影响分析的结果。

Chindelevitch 说:“精确算法允许你做什么取决于对模型所做的关键假设,即稳定状态,每种代谢物既不会过剩,也不会赤贫。每种物质的产出与其消耗平衡。”

当Chindelevitch和Berger对圣迭戈的数据库中的89中新陈代谢网络模型应用它们的分析时,他们发现其中44中模型存在错误或漏洞。如果网络中所有反应的产物是平衡的,生物模型也就无法生长。

修正网络模型

然而,通过改编用于压缩感知领域的算法,Chindelevitch和Berger也能识别网络错误的可能位置。

压缩感知用于观察一些一旦被采集就可以被压缩的复杂信号,比如音频记录或数字图像,采集它们需要密集的计算。这是因为它们可以被转换成不同的数学表示,从而使它们看起来比原来更加简单。例如一个音频信号起初由每秒44,000个样本构成,就可以使用较小的样本频率的加权总和来表示它。

压缩感知会聪明地实施初始采样,这使得它可以从0开始构建比较简单的表示,而不必首先完成比较复杂的表示。以相同的方式,压缩感知能够将一个音频信号分解成权重较大的频率成分。Chindelevitch和Berger的算法可以将新陈代谢网络中的那些对化学不平衡贡献最大的关系孤立出来。

Chindelevitch说:“我们希望这个研究会推动大家重新分析并重建许多现存的新陈代谢网络模型,也希望它能在我们做的这些分析方面激起一些合作,我们也建议在模型被公布之前,首先对它们进行修正。”

罗格斯大学计算机科学系主任Desmond Lun(研究领域为计算生物学)说:“这不是一个大家希望出问题的领域。我认为麻省理工学院的研究人员们所做的工作将会改变人们关于某个事情的态度,这就是它提出了一个大多数人都认为不是问题的问题。我认为这会让我们更加地小心。”

Desmond Lun解释道:“因为计算机只能存储这么多数字,所以计算机只能以有限的精度运行。即使这样,我必须说的是,计算机能够存储大量的数字。通过软件,你可以或多或少地在意以这种方式损失了多少精度。有非常非常好的软件可以最小化精度损失。我甚至会认为,我想大多数人都会这么认为,这对于这些新陈代谢模型足矣。”

因为对它们所做的分析通常与实验证据吻合的比较好,所以模型误差可能会在我们没注意的情况下消失。Desmond Lun说:“这些浮点误差会因软件的不同而不同。因为某些人使用了一款软件,所以他们获得了这些非常成功的结果。然后如果我使用一款不同的软件时,我将得不到成功的结果。当然出现这种情况会让人有所顾虑。”


译自:http://newsoffice.mit.edu/2014/flawed-metabolic-networks-1007

本文版权属研发埠所有,如需转载请注明出处!



鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

360网站安全检测平台