必一体育官网下载

NEWS

必一体育官网下载:AI for Science前沿:加速合成新材料的
发布时间:Monday 13th of May 2024 01:25:36 PM 来源:必一体育官网 作者:必一体育app官方     阅读:1

  随着科学实验数据采集设备的发展和计算机能力的提升,大量高质量科学数据正在成为值得深度挖掘的矿藏,AI for Science正在成为解决多个学科中复杂系统难题的重要研究范式。在新材料研领域,AI技术的大规模应用可以快速筛选和设计出具有特定属性的化合物或材料,大幅度减少试错时间,并且对材料生产流程进行优化。近期Nature杂志发表了美国加州大学伯克利分校和劳伦斯国家实验室研究团队的工作。该团队开发了名为“A-Lab”的自主实验系统,基于文献数据,通过机器学习算法等技术进行模拟实验和机器人实验。该系统验证了AI平台在自主发现新材料方面的巨大潜力,该领域预计未来将持续产生新成果。

  为缩小计算筛选和实验实现新材料之间的速度差距,我们开发了一个用于无机粉末固态合成的“自主实验室”——A-Lab。该实验平台利用计算、文献历史数据、机器学习(machine learning,ML)和主动学习(active learning)来规划机器人实验,并解释结果。在连续运行了17天的实验中,A-Lab成功合成了58种目标化合物中的41种(包括各种氧化物和磷酸盐等)。这些目标化合物是通过利用Materials Project和Google DeepMind的大规模从头计算(ab initio,从基本物理原理出发进行计算)的物质相稳定性数据进行筛选的,即这些目标化合物在理论上可以在一定条件下稳定存在。合成配方由基于文献训练的自然语言模型提出,并使用基于热力学的主动学习方法进行优化。主动学习是一种特殊的机器学习方法,通过优化选择对模型提升最有帮助的样本来进行训练,可以在数据标注代价高昂或者数据稀缺的情况下大大提高模型的学习效率和性能。A-Lab对失败的化学合成进行分析,为改进当前的材料筛选和合成设计技术提供了直接且可操作的建议。实验的高成功率,证明了人工智能驱动平台在自主发现材料方面的有效性,这将进一步激发对计算、历史知识和机器人技术的整合。

  尽管可以借助高通量计算在大规模中识别出有潜力的新材料,但在实验中成功制备这些材料,往往具有挑战性并且耗费时间。加速材料发现的实验阶段,不仅需要自动化,还需要自主性——即实验主体基于数据解读和决策的能力。早期研究已经在材料研究的几个方面尝试了自主性,包括碳纳米管产量、光伏效能和光催化活性机器人以及贝叶斯驱动优化。与用于优化的传统机器学习算法相比,人类研究者从丰富的背景知识中受益,这些知识指导他们做决策。而且,越来越被认为自主性将需要编码领域知识、获取多元数据源和主动学习的结合。

  本文提出的A-Lab是一个自主实验室,它将机器人技术与从头计算的数据库、机器学习驱动的数据解读、从文本挖掘的文献数据中学习得到的合成启发式方法以及主动学习相结合,以优化粉末形态新型无机材料的合成。尽管早期研究在有机化学领域已经展示过基于液体处理的自主工作流程,但A-Lab解决了操作和鉴定固态无机粉末所面临的特殊挑战。通常需要研磨来确保化学反应前体之间有良好反应性。前体即在化学反应中被转化为最终产品的初始物质,这些前体可能具有各种与其密度、流动行为、颗粒大小、硬度和可压缩性相关的物理属性。化学反应能否按照预期进行,与前体的物理属性密切相关。使用固态粉末非常适合制造业和技术升级,而且A-Lab对合成的方法生成了克级样本量,足够在设备中进行材料初步性能测试与分析。

  在选定一组经Materials Project(一个计算材料学的开源科学项目)筛选的在空气中稳定的目标材料(即我们期望最大化产量的合成产品)后,A-Lab使用基于文献历史数据训练的机器学习模型来生成合成配方,并由机器人执行这些配方。通过X射线衍射(XRD)来对合成产品进行特性分析,并由两个机器学习模型共同解析其模式。当合成配方未能达到高产目标(50%)时,主动学习通过提出改进的后续配方来形成闭环。A-Lab在17天的运行期间,成功合成了58种目标材料中的41种。这些材料涵盖了33种元素和41种结构原型。对未获得的17种目标材料进行检查后发现,有些失败是由于合成过程或计算错误,其中一些问题可以通过对实验室决策进行微调来解决。

  A-Lab遵循的材料发现流程如图1所示。在此项研究中,所有考虑的目标材料都是A-Lab第一次接触的,即目标材料不在算法训练数据中。据我们了解,这58个目标中有52个,此前学界都没有发布过合成报告。本研究所述的实验是A-Lab首次尝试合成这些目标材料。每一个目标都被预测处于或非常接近于稳定状态,这在Materials Project与Google DeepMind的数据库中可以交叉验证。

  所谓稳定状态,在化学上称为“稳定相构成的凸包”。稳定相是一种材料或化合物在特定条件下(如特定温度和压力)能够保持的形态或状态,这些状态可能包括固态、液态、气态,或者更具体的晶体结构。凸包是一个数学术语,描述了一组点在二维或空间中所能构成的最小凸多边形或多面体。我们可以根据实验或计算得到的数据标出所有已知稳定相的位置。这些点所围成的最小凸多边形就是凸包。如果一种材料的能量低于凸包上对应点的能量(也就是,其能量超过凸包不超过10 meV/原子),那么我们可以认为这种材料是稳定的。

  由于A-Lab在开放空气环境中操作样品,我们只考虑了预计不与O2、CO2和H2O反应的目标。

  对于每一种提交给A-Lab的化合物,我们的机器学习模型会生成最多5种初始合成配方。该模型通过对文献中提取的大量合成数据进行自然语言处理,学会了评估目标“相似性”,这类似于人类根据已知相关材料间的类比来进行初次尝试合成。接着,第二个机器学习模型将基于文献中的加热数据提出一个建议的合成温度(方法部分)。如果这些受文献启发的配方的合成效率没有超过50%,A-Lab将继续使用名为ARROWS(Autonomous Reaction Route Optimization with Solid-State Synthesis,自主反应路径优化)的主动学习算法进行实验。该算法集成了从头计算的反应能量和观察到的合成结果,以预测固态化合物的反应路径。在该算法的指导下进行实验,直到获得目标作为主要相或A-Lab可用的所有合成配方用尽为止。

  A-Lab通过三个集成工作站进行实验,涵盖了样品准备、加热和表征三大步骤。机器臂在这些工作站之间传输样品和实验器具。在固态物质化学制备中,样品准备、加热和表征是三个关键步骤:

  1. 样品准备:这是实验的第一步,涉及到将原材料或化学物质按照特定的比例混合在一起。这些原始材料可能需要以特定的形式(如粉末)存在,并且可能需要经过特殊处理(如干燥或脱气)以确保反应能够成功进行。

  2. 加热:一旦样品准备完成,下一步通常是加热。加热可以帮助催化某些化学反应发生,使得原材料转变为目标产品。加热条件(如温度、压力和时间)对于反应的成功至关重要,并且必须根据具体的反应类型来选择。

  3. 表征:最后一步是表征,也就是分析和测试产生的产品,从而确定它们的性质和组成。这通常涉及到使用各种仪器和技术(例如X射线衍射、红外光谱分析、核磁共振等)来研究样品的物理和化学性质。这一步可以帮助确认是否成功地制备出了目标产品,并了解该产品的具体特性。

  第一工作站负责分配并混合前体粉末,然后将其转移到氧化铝坩埚中。第二工作站的机器臂将这些坩埚装入四个可用的箱式炉中进行加热。样品冷却后,另一机器臂将它们转移到第三工作站。在第三工作站,样品被研磨成细粉并通过X射线衍射进行检测。实验室的操作通过应用程序编程接口控制,该接口允许人类研究员或决策智能体实时提交任务。

  合成产品的相位和重量分数,是从其X射线衍射图案中提取出来的。这一过程通过概率机器学习模型完成,该模型是在无机晶体结构数据库(ICSD)中的实验结构上进行训练的。上述方法遵循了先前研究工作。因为本研究中考虑的目标材料还未有实验报告,所以它们的衍射图样是通过模拟Materials Project中可用的计算结构,并进行了修正,以减小密度泛函理论(DFT)误差。

  在材料科学和物理化学中,密度泛函理论被广泛用于模拟和预测材料的性质。然而,密度泛函理论并不是完全精确的,它包含一些近似(例如交换-相关泛函的选择),这些误差可能影响到模拟结果的精度和可靠性。通过改进计算方法、选择更合适的泛函或者使用校正项等方式,可以减小密度泛函理论计算引起的误差,以使其更接近实验观测结果。

  对于每个样品,由机器学习识别出的相位会经过自动化Rietveld精修进行确认。Rietveld精修是一种用于分析X射线或中子衍射数据,以确定晶体结构参数的方法,由荷兰科学家Hugo Rietveld开发。接下来,样品重量分数会自动报告给A-Lab的管理服务器,以便在有必要的时候指导后续实验迭代,寻找高目标产量的最优配方。

  根据上述流程,A-Lab在连续17天的实验中成功合成了58种目标化合物中的41种,成功率达到了71%。我们进一步发现,仅通过对实验室决策算法进行微小修改,这个成功率就可以提升到74%,如果进一步改良计算技术,则可以提升到78%。高成功率证明了从头计算的方式能够有效地识别新的、稳定的、可合成的材料。所有58种化合物的结果都展示在图2中。以化合物分解能量(以对数尺度表示)为横轴。化合物分解能量是一个常用热力学指标,描述了从相图上邻近的物质形成该化合物的驱动力。负(正)分解能量表明一个材料在0K温度时是稳定的(亚稳态的)。在本研究工作考虑的目标中,有50种化合物被预测为稳定,而剩余的8个虽然处于亚稳态,但位于凸包附近。在我们考虑的分解能量范围内,并未观察到分解能量与材料是否成功合成之间有明显相关性。

  总体而言,A-Lab合成的41种材料中,有35种是使用基于文献合成数据训练的机器学习模型所提出的配方,进而合成得到的。当参考材料与我们的目标高度相似时,这些受文献启发的配方更有可能成功。这证实了目标“相似性”是选择有效前体的有用指标。同时,对于热力学稳定(物质在常温常压不会自发分解或与环境中其他物质反应,能够保持当前状态)的材料而言,选择前体仍然是一个极为复杂的任务。尽管最终获得了71%的目标,但A-Lab测试的355种合成配方中,只有37%成功产生了预期产品。这一发现与先前研究也有所对应,早期研究工作已经证明前体选择在决定合成路径上具有显著影响。

必一体育官网下载
必一体育官网
新闻中心
产品中心
必一体育app官方
网站地图
关注我们

扫一扫 关注必一体育官网下载

返回顶部