一个有机合成人员一天可以完成多少个化学合成反应?在大多数有机合成实验室中,一个熟练的有机合成人员每天通常完成的反应不超过10个。
近日,浙江大学、之江实验室的研究人员开发了一种全自动集成系统,用于高通量化学合成、在线表征和大规模光催化反应条件筛选。
借助液芯波导(LCW)、微流控液体处理和AI技术,该系统仅需几秒即可完成快速光催化反应,并且,每天能够对10,000个反应条件进行高通量筛选。
近年来,基于自动化机器人技术和微流控化学技术,各种自动化、高通量的有机合成与筛选技术相继问世。
然而,尽管目前流动光催化系统的反应速度有了显著的提高,但其通量仍远低于基于大数据的AI技术应用于化学合成领域所需的水平。
目前,缺乏大量可靠高质量的数据也是阻碍AI技术在化学合成领域应用的主要因素。
为了应对这一挑战,浙大团队利用微流体液芯波导(LCW)、自动化微流体液体处理和AI技术,开发了一种自动化高通量系统,可以在几秒内完成超快速光催化反应,并能够在一天内对多达10,000次反应进行大规模筛选。
自动化超高通量光催化合成、表征和筛选系统
研究人员利用LCW技术设计并构建了一种新型微流控光催化微反应器,将高强度激光引入微流控光催化反应通道,显著提高光催化反应速度。
利用该系统,研究人员对光催化[2+2]环加成反应进行了全面的筛选,总共筛选了多达12,000个条件,包括光催化剂和底物种类两个离散变量以及激光强度、浓度、流速和光催化剂比例四个连续变量。
AI辅助超高通量光催化合成与筛选
研究人员开发了AI辅助吸光度预测方法,利用AI方法分析对流和分子扩散效应的影响因素,将相邻反应溶液相互混合的非稳态数据解耦,预测各自反应溶液对应的稳态吸光度数据。
为了获得准确的预测结果,使用10个基于线性模型、决策树、神经网络和集成学习原理的回归模型,处理大量的非稳态吸光度数据,预测相同反应条件下对应的稳态吸光度数据,从中寻找性能最优的模型。
基于12,000个反应条件的海量输出数据和目标数据,通过测试集的R^2和RMSE值评估了10个回归模型的性能。
其中,XGB回归模型的预测性能最好,在训练集和测试集比例为70:30的情况下,其RMSE最小,为0.0140,R^2最大,为0.991。
结果表明,使用非稳态实验模式,光催化[2+2]环加成反应条件的筛选通量从每天2600个条件提升到10,000个条件/天,这是迄今为止报道的有机合成领域的最高水平。此外,在试剂消耗方面,完成整个筛选实验只需要每种底物4.0mmol,每种光催化剂0.05mmol。
为了进一步利用上述12,000个数据,研究人员初步探索了AI技术应用于智能化学合成筛选的潜在可能性,利用XGB算法进行了跨底物和跨光催化剂的AI辅助产品产量预测。研究结果如下所示。
未来潜力
在未来充分利用这12,000个数据并进一步结合AI技术(如贝叶斯优化方法)来快速优化新产品将具有重要意义。
此外,该系统可进一步改进,以适应不同类型的光催化反应的需求,例如,更换其他波长的光源或尝试其他类型的反应,如光催化交叉偶联反应,以扩大其应用范围。
对于工业生产的光催化反应的放大,该系统在提高光催化底物的浓度方面表现出独特的潜力。除了有机合成外,该系统的应用未来还可以扩展到其他合成领域,例如光诱导材料合成或生物分子合成。