1400年才能完成的实验5周搞定,机器化学家会颠覆同事吗

发布者:章豆豆 2023-5-3 18:48

注意看你眼前这台机器人叫“小来”它正在代替人类化学家做实验人们吃惊地发现它能将一项历时1400年的工作量缩短为短短5

近日,南都记者来到中科大精准智能化学实验室,看“小来”在实验室来回穿梭,不时伸出机械手臂将试管放入仪器中,它正在进行的是一款芬顿催化剂的创制工作。

“它为什么叫小来?因为我儿子叫小来,而且我知道未来已来。”中科大化学与材料科学学院江俊说,作为全球首个数据智能驱的全流程机器化学家,其优势在于装载有物理模型、全流程自实验、数据分析理实交融、实验结果自主优化迭代。

机器化学家小来身上有整个团队8年的心血,更重要的是它承载着化学家们一个梦想——当传统的“试错法”成为过去式,未来人工智能将对化研究带来怎样的变革?

“理性的化学”,化学家们的毕生梦想

江俊爱开玩笑。他常说,自己做机器化学家研究最开始是受了同事的“刺激”。江俊早年从事过理论物理研究,之后又转而攻读了理论化学博士,2011年12月来到中科大任化学物理系教授。

有次,一位中科大计算机所的同事聊天时跟他提起,“真羡慕你,化学物理这门学科的讲义不用换。不像我们计算机所,知识迭代速度快,我们过两年讲义就要改一波。”

“我当时想这人是不是在讽刺我们化学物理‘不思进取’?”汪俊笑称。那次谈话后,他开始思考,之所以计算机进化飞快,是因为他们可以把知识数字化、代码化、迁移化。人们坐在家里,就能随时使用代码,前人的智慧结晶用一个子函数就能调过来。相比起来,化学物理这些学科知识迁移则相当低效。如果借助人工智能技术把化学物理知识数据化,会带来什么?

这里就要提到一直以来化学家们的一个梦想——有人称之为精准化学,也有人叫做理性的化学。

“化学在公众里面,在我们的老百姓心目中是个什么样的形象?”中科大精准化学重点实验室主任李震宇问。一时间,台下听众脑中很多念头闪过。他紧接着说,“这个形象可能并不高大上,很多人甚至有种刻板印象,觉得化学不环保、不经济、不安全。”

如果从深层次考虑,为什么公众会产生这样一个印象?李震宇称,这和化学研究长期深度依赖“试错法”有关。化学的起源可以追溯到早期的炼丹术、炼金术,“碰上了就碰上了,没碰上就错了”,基于经验来试错的过程不仅低效,同时也会产生副产物、转化率不够等问题。

对江俊、李震宇这样的化学家们来说,一个理想的化学研究应该是这样:“我们把东西放进去,想让它转化成什么,就能百分百转化成什么,同时这个过程中不会产生其他我们不想要的东西。这就要求整个化学研究做到精准的设计,中间所有过程是透明的,机理是清楚的,过程是可控制的。”

“人家做颠覆性技术,你怎么颠覆同事”

数据时代为精准化学的实现带来新的机遇。但难题也随之而来:人工智能来自数据,从哪里获得这么多科学数据呢?

江俊说,自己很崇拜爱因斯坦,因为能够从理论的角度建立方程,从而产生海量的理论大数据。相较于通过实验获取直观可测量的数据,理论大数据成本较低、更好实现,但同时也缺失了现实的复杂度。

“数据智能时代给我们的科学机遇就在于可以用理论模拟大数据产生预训练模型,然后利用应用实测小数据对模型进行校准,建立起各项复杂体系的理实交融模型。”江俊说。这是什么意思呢?

江俊以最近火爆全球的ChatGPT为例解释称,ChatGPT最开始的逻辑就是漫无目的地读各种书,学各种网络语言,建立一个预训练的模型。接下来,请一批“工人”为模型预测的结果来打分,用实测的数据来校准,完善预测,然后指导实践。

沿着这个思路,中科大机器化学家诞生了。它自动阅读海量化学文献,自己学习和处理知识,调用底层的理论模型进行思考,模拟计算物质的演化规律,进而指导化学实践。

以潜力巨大的高熵(高复杂、高无序)化合物催化剂为例,其多种元素的高度无序混合带来高稳定性,也给人工试验找出最优配比带来极大挑战。获得最优配方需要遍历测试极其庞大的化学配比组合,目前仅限于对最多3种金属组合进行优化。

而机器化学家发挥其数据驱动和智能优化的优势,智能阅读1.6万篇论文并自主遴选出5种非贵金属元素,融合2万组理论计算数据和207组全流程机器实验数据,建立理实交融的智能模型,使用贝叶斯优化程序从55万种可能的金属配比中找出最优的高熵催化剂,将传统“炒菜式”遍历搜索所需的1400年缩短为5周。有其他同事对江俊开玩笑,“别人都是做颠覆性技术,你怎么专门颠覆同事呢?”

“小来”正在做实验。 南都记者 王凡 摄

有了“化学大脑”之后,未来化学人才如何培养

事实上,这并不是人类创造出来的第一个人工智能化学机器人。比如2018 年,来自格拉斯哥大学的研究人员就训练出了一个由人工智能驱动的化学合成机器人;2020年,利物浦大学研究团队自研了一款智能移动AI化学家,一周之内可以研究1000种催化剂配方,相当于一个博士生4年的工作量。相较于前者,中科大的机器化学家到底有何不同?

“差别就在于我们实现了化学大脑。”江俊告诉南都记者。他对利物浦大学研究团队并不陌生,对方还多次来中科大实验室实地参观。他提到,对方团队的AI化学机器人因为没有物理模型,不能提出任何科学假设,只能验证已有的发现。比如,对方的AI化学家“找”到的材料是很久之前有人发表过验证成功的材料,只是在此基础上优化了配方,这是因为AI化学家没有预见性。

江俊说,令对方最震撼的还是化学大脑的“灵魂”——智能化。每次跑完数据化学机器人会自动归档,如果数据量累积到一个程度,它就会自动分析。这种方式能让机器人真正用智能决策去做实验,通俗点说,当机械思考能力跟上来后,类似“人”的思考也更多了。

江俊告诉南都记者,这也是为什么,在中科大机器化学家出世后,前面提到的利物浦大学研究团队负责人给全组的博士生都发了一封email,意思是“加油,中国人已经把‘化学大脑’做出来了。”有大脑才能思考,有思考才能预见,有预见才能创造新材料。江俊说,如今,机器化学家“小来”所做的实验已经跳出了经验主义的陷阱。

这个灵魂的产生背后离不开一个交叉团队,既要懂化学,又要懂计算机,还要懂硬件设计和软件架构等。而这也得益于中科大少年班交叉培养的模式。说到这就要提到江俊的另一重身份,他曾是两届少年班班主任。“我们少年班的优势就是学生不分专业,一进来什么都学,就和ChatGPT一样漫无目的地学,直到大三才开始选专业,在此之前就是学知识。

不可避免地,机器化学家的研究也面临一些难题。江俊称,现在最大的难点就是数据不统一。机器人阅读海量论文,但其中的数据质量良莠不齐,不同实验室条件不同,测量标准也不一样,数据经常出现冲突。这都可能导致机器人在阅读学习的过程中出现“误解”。

在他看来,解决这个问题需要利用举国体制的优势,尽快建立化学研究的数据标准和采集标准。一旦统一标准,累积的数据矿质量会更高。

还有一个疑问是,当人工智能机器人真的发展到这个地步,未来化学家还能做什么?化学人才的培养又会有何不同?

江俊认为,历史经验告诉我们,一个好的工具诞生,会带来更多可能性,也意味着科研人员能做更多的事情。比如,化学研究的精准智能设计会降低副产物,减少污染,真正实现绿色化学。

谈到化学人才的培养,江俊认为,未来的化学人才首先要有扎实的基础。现在的知识谱已经无比庞大,我们应该找到一片喜欢的叶面看清它的脉络。在任何一个专业,无论是物理还是化学,把专业内的知识脉络看清楚,迁移到另外一个叶面,也能很快掌握它的逻辑。

还有一点就是开放的心态。江俊拿自己举例,“当年我那么大年纪开始学AI也很痛苦,我的学生们很快搞懂了还给我上课。所以我们要相信年轻人比我们更有创造力,要多给他们机会。”

南都记者 王凡 发自安徽合肥

大家都在看