使用 MongoDB 和 AWS 将应用程序迁移到云端
生物技术巨头使用 MongoDB Atlas 和各种 AWS 技术和服务将实验时间从几天缩短到几分钟。
在MongoDB Atlas和 Amazon Web Services等产品的帮助下,Thermo Fisher(纽约证券交易所代码:TMO)正在将其应用程序迁移到公共云,作为更大的 Thermo Fisher Cloud 计划的一部分。上周,我们的首席技术官兼联合创始人 Eliot Horowitz 在 AWS re:Invent 上与 Thermo Fisher 高级软件架构师 Joseph Fluckiger 一起介绍了他们在内部和跨客户看到的一些变革性优势。本回顾将涵盖约瑟夫的演讲部分。
约瑟夫首先告诉听众,赛默飞世尔可能是他们从未听说过的最大的公司。Thermo Fisher 在 50 个国家/地区拥有超过 51,000 名员工,2015 年的收入超过 170 亿美元。 十年前通过 Thermo Electron 和 Fisher Scientific 合并成立,是全球基因检测和精密实验室领域的领先公司之一设备市场。
Thermo Fisher Cloud 是一种建立在 Amazon Web Services 上的新产品,由 35 个应用程序组成,由 150 多个 Thermo Fisher 开发人员提供支持。它允许客户简化他们的实验、处理和协作工作流程,从根本上改变研究人员和科学家的工作方式。它为 10,000 名独特客户提供服务并存储超过 130 万个实验,使其成为科学界最大的云平台之一。对于内部团队,Thermo Fisher Cloud 还简化了开发工作流程,允许开发人员利用基于 AWS 构建的微服务架构共享更多代码并创建一致的用户体验。
该公司生产的精密实验室仪器之一是质谱仪,其工作原理是采集样品,用电子轰击样品,并通过加速样品并将其置于电场或磁场中来分离离子。然后,样品中的原子按质量和电荷排序,并与已知值匹配,以帮助客户确定相关样品的确切成分。Joseph 的团队开发了为这些机器提供动力的软件。
Thermo Fisher 质谱仪用于:
·检测杀虫剂和污染物——任何对你有害的东西
·在行星外任务中识别有机分子
·处理来自运动员的样本以寻找提高成绩的物质
·推动产品真实性测试
在演示期间,Joseph 在 Thermo Fisher Cloud 中展示了一个名为 MS Instrument Connect 的应用程序,该应用程序允许客户通过任何移动设备或浏览器查看其光谱仪器的状态以及实时实验结果。科学家不再需要坐在仪器前监控正在进行的实验。MS Instrument Connect 还允许 Thermo Fisher 客户轻松查询仪器并获取利用率统计信息。支持 MS Instrument Connect 和来回编组数据的是部署在 MongoDB Atlas 中的 MongoDB 集群,我们的托管数据库即服务。
Joseph 分享了 MongoDB 正在 Thermo Fisher 和 Thermo Fisher Cloud 的多个项目中使用,包括最初部署在 DynamoDB 上的 Instrument Connect。其他值得注意的应用程序包括 Thermo Fisher Online Store(从 Oracle 迁移)、Ion Reporter(从 PostgreSQL 迁移)和 BioPharma Finder(从 SQL Lite 迁移)。
为了支持科学实验,赛默飞世尔需要一个能够轻松处理各种快速变化数据的数据库,并允许其客户以多种不同方式对数据进行切片和切块。实验数据也非常大;每个实验都会产生数百万“行”数据。在解释为什么选择 MongoDB 用于整个组织的如此广泛的用例时,Joseph 称该数据库为“瑞士军刀”,并引用了以下特征:
·高性能
·高灵活性
·提高开发人员生产力的能力
·能够部署在任何环境、云或本地
真正引起观众注意的是 Joseph 将 Thermo Fisher 一直使用的现有数据库与 MongoDB 进行比较的部分。
MongoDB 与 MySQL 的比较 (Aurora)
如果我将幻灯片减少到一张,那就是这张幻灯片,”约瑟夫说,“这绝对是非凡的。我们所做的是将数据插入到 MongoDB 和 Aurora 中,仅用 1 行代码,我们就能够击败 MySQL 的性能。
除了以 40 倍的代码减少 6 倍的性能之外,MongoDB 还帮助降低了应用程序的架构复杂性。
MongoDB 与 SQL Lite 的比较
对于用于提高药物测试性能的质谱应用,Thermo Fisher 将数据层从 SQL Lite 重写为 MongoDB,并将其代码减少了约 3.5 倍。
Joseph 然后将 MongoDB 与 DynamoDB 进行了比较,指出虽然这两个数据库都很棒且易于部署,但 MongoDB 提供了一种更强大的查询语言来运行更丰富的查询,并允许更简单的模式演变。他还提醒听众,MongoDB 可以运行在任何环境中,而 DynamoDB 只能运行在 AWS 上。
最后,Joseph 展示了一个架构图,展示了 MongoDB 如何与多种 AWS 技术和服务(包括 AWS Lambda、Docker 和 Apache Spark)一起使用来并行化算法并显着减少实验处理时间。
他最后解释了赛默飞世尔将应用程序推送到 MongoDB Atlas 的原因,理由是它的易用性、无缝迁移过程以及即使在重新配置集群时也没有停机时间。该公司在 7 月初的发布日期前后开始测试 MongoDB Atlas,并于 9 月开始在该服务上推出生产应用程序。Thermo Fisher 团队通过使用 MongoDB Atlas 节省了时间(否则这些时间将用于编写和优化他们的数据层),他们能够投入更多时间来改进他们的算法、客户体验和处理基础设施。
任何时候我可以使用像 MongoDB Atlas 这样的服务时,我都会使用它,以便我们 Thermo Fisher 可以专注于我们擅长的领域,即成为科学服务的领导者。