"); //-->
早在 20 世纪 80 年代,美国国立生物技术信息中心(NCBI)数据库、欧洲生物信息学研究所(EBI)数据库和日本 DNA 数据库(DDBJ)的相继成立,就明示了生物信息学已经成为了生命科学研究的重要工具。
《中国科学院院刊》的 “融合科学与开放数据” 专题中指出,信息技术的深度融入,使得现代生命科学研究范式发展成为集人工智能驱动的生物设计和生物模拟(“干实验”)、自动化驱使的实验研究(“湿实验”)于一体的计算机辅助生物学范式。
在产业界,美国麻省理工学院已与安进、巴斯夫、拜耳、礼来、Sunovion 制****等医****公司开展机器学习方法的合作;半导体设备龙头企业泛林(Lam Research)公司已成立投资机构加速半导体合成生物学研究……
在学术界,人工智能在合成生物学领域的应用,正在让它朝着可定量、可计算、可调控和可预测的方向跃升。
今年 1 月,德州农工大学合成系统生物学创研中心袁戎华团队公布了一项新成果,相关文章以题为 “Machine learning-informed and synthetic biology-enabled semi-continuous algal cultivation to unleash renewable fuel productivity” 发表在 Nature Communications 期刊上。据文章介绍,该团队基于机器学习的培养设计和合成生物学的平台,突破了藻类生产中 “相互遮荫” 和 “高收获成本” 的限制,实现 43.3 克 / 平方米 / 天的生物质产量,使最低生物质销售价格降至每吨约 281 美元。
本次,生辉 SynBio 邀请到了袁戎华博士来与我们分享其所在的合成系统生物学创研中心的研究进展。
图丨袁戎华 (来源:受访者提供)
1997 年,袁戎华从复旦大学生物系毕业后,就前往美国亚利桑那大学继续学习。在大家云集的植物学系,师从 David William Galbraith 教授(现任河南大学生命科学学院名誉院长),并接触到彼时刚刚出现的基因芯片技术。
硕士毕业后,他曾在巴斯夫公司植物分部任职,心向往之,最后还是回归学术界发展,并加盟知名的加州大学旧金山分校从事基因芯片和系统生物学的研究。2004~2007 年,他在田纳西大学一边工作一边读博士,毕业后进入德州农工大学工作,恰逢合成生物学开始兴起。
袁戎华说,“基于对生物系统的了解,自然想要再进一步去设计,所以从系统生物学转向合成生物学研究,几乎是顺理成章的事。”
2016 年,在袁戎华联合多位教授的推动下,德州农工大学的合成系统生物学创研中心正式成立。两年后,袁戎华被任命为合成生物学和可再生产品首席教授,开始领导团队的研究。
“自发聚集沉降” 大幅度降低藻类生产成本
据袁戎华介绍,目前,团队的研究方向主要有四个,分别是可再生材料、生物炼制、合成生物学以及碳捕捉和利用。
其中,碳捕捉和利用是在 “碳中和” 和 “碳达峰” 的大背景下,衍生出来的新方向。团队致力于将高度顽固的木质纤维素废物转化为可替代的生物产品,例如用于生物柴油的脂质或用于生物塑料的 PHA(聚羟基链烷酸酯),同时还集中于第二代的和第三代生物燃料的生物炼制,并利用合成生物学打造平台,不断地优化可再生材料的生产和生物炼制。目前,已有相应的技术转化公司—— SynShark LLC ,正在进行 “用烟草生产角鲨烯” 的产业化工作。
1 月份发布的这项新研究,正是基于合成生物学平台,结合机器学习,释放了可再生燃料的生产力。“该项研究达到的生物质产量,不仅是美国能源部 2022 年目标(25 克 / 平方米 / 天)的 1.7 倍,也是目前世界上最高的户外蓝藻和藻类单位平方米生产产量。” 袁戎华说道。
而这项研究的开始,可以追溯到 2016 年。
2016 年时,袁戎华曾和中国科学院上海生命科学研究院计算生物学研究所的朱新广教授(同时任职于上海植生所)合作,相关论文 “Enhanced limonene production in cyanobacteria reveals photosynthesis limitations” 发表在《美国国家科学院院刊》上。在这项研究中,通过建模指导,对蓝藻细长聚球藻 PCC 7942 进行设计,获得高产菌株,实现了超过 100 倍的柠檬烯产量增长。其中所做的菌株改造,是将从植物中获得的人工启动子转入蓝藻细长聚球藻 PCC 7942 菌株。
而在这项工作,袁戎华等人选中的菌株是聚球藻 UTEX2973,他们认为这种藻类高度活跃,具有高产柠檬烯的潜力。将人工启动子和柠檬烯合成基因转入 UTEX2973 后,发生了一个有趣的现象,那就是在一些特定的条件下,出现了自动沉降的现象,而且速度很快,绝大多数的细胞沉降至底部,上清液中剩余很少。
这是一个让袁戎华激动的发现。众所周知,藻类从水中的分离采收过程是一个大量耗能、成本增加的阶段,甚至达到总成本的 30% 和总能耗的 50% 占比,这也意味着,若能实现藻类从水中自动沉降,则可以极大程度上降低成本。
今年 1 月发布的文章,正是基于工程化的 UTEX 2973 所进行的研究,改造后的菌株被命名为 L524,它能产生柠檬烯,可从蓝藻细胞中排出,从而产生疏水表面相互作用并触发细胞聚集以实现沉淀。柠檬烯是作为一种增值产品,此外,该菌株能够同时生产生物质,作为潜在的航空燃料前体。
“机器学习算法” 精准预测光可用性和生长速率
除了简化收集降低成本外,藻类生产中另一个有待解决的难题是 “相互遮荫” 的限制。在培养过程中,当藻类细胞增殖至一定高密度时,光通路受到影响,细胞生长开始受到相互遮蔽的抑制,因此无法获得高生物质产量。
对此,文章第一作者龙彬想到了结合机器学习算法打造预测模型的好办法。他们建立了两套机器学习算法,首先,将机器学习作为一种有效的 LDP (光路预测模型) 预测工具来评估藻类培养物中的光可用性;其次,这种光可用性用于通过第二种机器学习模型 GRM(生长速率预测模型)来预测蓝藻的生长速率。
据文章介绍,预测的 LDP(光路) 和实际测量的 LDP 之间 R^2 分数高达 0.993,足以证明机器学习模型的准确性,此外,与只能预测一维光路的传统数学模型不同,机器学习预测的 LDP 可以是二维甚至是三维的。
“目前,我们团队做到了二维的水平,更重要的是,这种 LDP 预测方法可以转移到任何现有的藻类培养系统,例如室内 / 室外 PBR(光生物反应器) 或池塘系统。” 袁戎华说道。
图丨数据处理和机器学习(来源:论文)
通过 LDP 预测工具获得有效数据后,输入第二个模型 GRM 来预测蓝藻的生长速率。文章中指出,这种整合在以前的研究中尚未实现。预测值和实际测量值之间的 R^2 值为 0.992。
袁戎华等人利用两个预测模型,模拟蓝藻生产的动态,得到最佳生长光密度(OD730)——2.3,并基于这一数据打造了半连续培养的模式(SAC)。具体来说,当光密度值超过 2.3 时,会开始收集蓝藻,然后使蓝藻生长再逐渐升至 2.3,始终保持在最佳光生长条件。在这样的培养模式下,柠檬烯和生物质的产量均得到了显著提升,在光生物反应器中,生物质生产率为 0.1 克 / 升 / 小时,柠檬烯生产率为 0.2 毫克 / 升 / 小时;通过室外池塘系统扩大 SAC 的规模,实现了 43.3 克 / 平方米 / 天的生物质产量,使最低生物质销售价格下降到约 281 美元 / 吨。
“仅比玉米贵一点,通常用于生产乙醇的低成本生物质原料是玉米,大约为 260 美元 / 吨。” 袁戎华说道。
图丨生长速率预测、生长模拟和半连续藻类培养 (SAC)(来源:论文)
人工智能与合成生物学结合具有巨大商业价值
针对这项研究,袁戎华表示还将有进一步的工作。
“基于机器学习的生长模拟非常灵活,可以扩展以整合其他生长影响因素,如温度和营养,这也是传统的数学模型无法做到的。目前,团队已经在开展相关工作。”
袁戎华还透露,这项研究的商业价值也受到了极大的关注。文章发布以后,学校负责商业转化的机构决定立刻申请专利,一些公司也表达了合作的意愿。“不过目前商业转化还处于一个早期阶段,预计这项技术将在藻类生产以及碳捕捉和利用方面有很大的市场应用前景。”
最近,袁戎华团队主要集中于运用这套体系来做碳捕捉和利用,并且已经得到了美国能源部的支持,目前已经与知名的圣路易斯华盛顿大学,南方公司,和清洁碳利用联盟建立了合作。
作为德州农工大学合成系统生物学创研中心的领导人,对于中心的发展布局,袁戎华早有规划。大体分为四个部分。
“第一部分是生物设计,主要是基于计算机科学进行设计,包括人工智能和其他方面;第二部分是高通量的工程发酵;第三部分是扩大规模;第四部分是系统生物学,利用液相色谱 - 质谱联用仪(LC-MS)、液相色谱与串联质谱(LC-MS-MS)等,进行蛋白组学、代谢组学的相关研究。” 袁戎华介绍道。
“这样一来,合成系统生物学创研中心能够实现 “设计 — 构建 — 验证 — 学习 — 设计” 的反馈循环,比如,当我们发现一个好的菌株,能够深入探究其机理,从而实现再设计升级。这种布局也将推动信息架构设计、信息科学理论、信息技术开发的跃迁。”
采访最后,袁戎华表示,人工智能与合成生物学的结合会有非常好的前景。“实际上,若干年前,人工智能就已经广泛地应用于生物学领域,很多平台已经完全商业化了。从我们实验室来说,除了通过人工智能进行过程控制外,也用它进行蛋白的预测。”
未来人工智能将更好地服务于合成生物学的发展。“合成生物学的设计部分本身就具有很大的挑战性,我本身是系统生物学出身,对于数据量和数据的能力更是有非常深刻的理解”,他说,“我们现在已经积累了数目非常庞大的生物学数据,如果能够对这些数据进行有效的挖掘,就能够提高我们科研的效率,让整个合成生物学有更快的进展。”
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。