当前,人工智能已经全面渗透到科学研究的各个领域。以化学学科为例,得益于AI的应用,化学反应预测与新化学物质的发现、化学试验的自动化与智能化等均取得了显著突破。特别是人工智能驱动的机器人,即“机器化学家”,可以自动阅读文献、远程执行实验方案、借助计算机即时优化实验条件,将科研人员从重复繁杂的劳动中解放出来,大大提升了科研活动效率。然而,笔者在调研中发现,机器化学家仍然面临诸多问题与挑战,需要加强统筹部署。
机器化学家未来发展面临诸多问题
机器化学家是能够自主执行化学研究的人工智能机器人。与其他复杂的实验室系统相比,机器化学家具有完整的人工智能软件、复杂的内部循环(如假设生成、选择、评估和完善)以及以高通量执行单独规划的循环实验能力。
目前,机器化学家广泛应用于新型分子合成和功能材料创制等方面,帮助科研人员解决了大量科学难题。
但笔者调研发现,虽然我国机器化学家在智能化学创新领域已经居于全球领跑地位,但其在核心算法和算力、高质量化学数据集方面仍存在不足,未来发展面临相关研究人才缺乏、资源平台分散等问题。
第一,原创核心算法和算力不足。一是我国在算法领域缺乏以数学为基础的原始核心模型、代码和框架创新,机器化学家与国外同类平台相比仍有差距。例如,当前英国利物浦大学的研究团队研发的机器化学家采用了启发式算法,将化学家长期积累的专业知识巧妙融入到机器化学家的决策流程中,在处理化学实验问题时具有独特优势。二是我国在算力领域仍面临一些“卡脖子”问题。中国科技大学等单位自主研发的ChemGPT是一种化学领域的聊天机器人程序,可以基于论文知识来建议实验方案等,但因为GPU算力不足,ChemGPT“跑不快”,训练迭代很慢。
第二,缺乏高质量的化学数据集。虽然机器化学家已经建立了包含8000万化合物、1000万化学反应等资源的数据库和检索引擎,但目前依然面临实验数据缺乏和实验数据标准化不够等问题。一是目前数据大多来源于国外数据库,获取成本很高。二是数据采集过程不统一,不同设备、环境、操作人员得到的数据有很大差异。实验生成的不同类型的数据包括图像、结构数据等格式不同。三是数据质量有待提高。化学研究的精准化和智能化依赖实验数据的准确性,但现阶段我国高质量的科研数据较为匮乏,很多科研数据都从文献中收集,而文献中的数据常常是被“美化”过的理想数据。
第三,缺乏“人工智能+化学”的复合型人才。机器化学家的发展需要化学、物理、数学、计算机、自动化等多学科专业人才的跨学科合作,但目前大多数人才都是单学科人才。虽然有些高校和科研机构已经开始积极探索跨学科的课程设计和项目合作,但仍处于起步阶段。同时,行业内部缺乏有效的内部培养和培训机制。此外,相关领域的技术工程师同样缺乏。
第四,缺乏高度整合且开放的人工智能资源平台。目前,中国科学技术大学、北京大学、清华大学、浙江大学、华东师范大学、中国科学院宁波材料技术与工程研究所等单位多个化学研究团队都在进行机器化学家的相关研究与部署,其中不免出现“百模大战”,数据库、算力平台等资源分散、重复建设等情况,缺乏一个共建的开放式人工智能资源平台,使各团队实验数据可以交汇、共享,自动提炼出数字化知识图谱和人工智能模型,进而指导机器化学家自动优化,研制出更好、更高效的化学品。
加强部署抢占未来化学研究制高点
当前,人工智能已经成为各国争夺未来化学研究制高点的抓手。针对目前机器化学家面临的问题与挑战,建议从数据、人才、技术攻关等方面加强部署。
第一,加快建设高质量的化学数据库或知识库。破除数据壁垒,整合国内目前已有的相关数据库和分散存在的小型数据库,对数据格式、标准、工具及代码等进行统一规划设计,进一步提升相关数据库的数据质量。加强人工智能模型训练的化学数据库建设,使用新的人工智能模型生成高质量数据。发展具有可迁移性的机器学习算法,实现数据的高效、高精度提取,为数据驱动的智能化学提供基础。将化学数据库和知识库作为重要研究成果,纳入科研人员考评、项目验收机制。
第二,尽快重构化学研究人才体系。人工智能驱动的化学研究既需要科研人员具备扎实的基础和开放的心态,还需要多领域人才协作。应在高校本科化学系设置编程、人工智能和自动化课程,鼓励学生进行STEM与社会科学课程的交叉学习,为研究生与博士后提供项目实践机会。同时,企业也要承担培训责任,通过定制化培训计划,为有潜质的人才搭建跨领域成长桥梁。加快建立跨学科跨领域合作机制,鼓励人工智能研究人员与基础科学领域研究人员、工程师通力合作。
第三,形成多地联动、多机构联合的工作机制,推动国内机器化学家研究团队进行深度合作和共同推广。加强技术、工程与科学的有机结合,以机器为载体、以数据为要素,加速扩大机器化学家智能平台的规模,发展可自主解决科学难题的强化学智能,形成针对化学智能的符号语言与数据智能驱动的科学方法论。
总之,政府部门应针对国际竞争重点领域,加强顶层设计,集中产学研多方资源,发挥机器化学家的赋能作用。由产业部门提供化学应用领域的大量数据和应用场景,高校和科研机构提出相应科学问题,并提供智力资源,产学研各方共同助力化学重点领域的技术研发与应用。
(作者均系中国科学技术发展战略研究院副研究员)
(来源:https://digitalpaper.stdaily.com/http_www.kjrb.com/kjrb/html/2025-02/17/content_584700.htm?div=-1)
地址:中国 北京市海淀区玉渊潭南路8号 邮编(ZIP):100038
电话(Tel):86-10-58884543 咨询:webmaster@casted.org.cn 新闻与信息:xxxz@casted.org.cn
版权所有 中国科学技术发展战略研究院 备案号/经营许可证备号:京ICP备10036465号-11
技术支持:中研网