AI自主完成3小时量子实验,牛津-多伦多大学团队将Agent用于科研
创始人
2025-04-17 21:20:39
0

AI Agent 也能做量子物理实验了!

近日,英国牛津大学曹舒翔博士使用基于大模型的 AI Agent,成功地让真人实验人员告别了繁琐重复的实验工作。具体来说,曹舒翔博士和合作者所搭建的 Agent 能够理解科研人员使用自然语言所描述的实验过程和实验目标,结合它自带的知识库,自行完成量子物理实验的设计、执行和数据分析。

图 | 曹舒翔(来源:曹舒翔)

他们把这套系统部署在了自己的超导量子计算实验平台上,成功实现了单比特和两比特量子门的自动校准。而且,Agent 可以根据科研需要在量子计算机上生成量子态并进行分析。在这个案例展示之中,最复杂的部分是两比特门的自动校准。而本次设计的 Agent 在没有人为干预的情况下,进行了大约 3 个小时的自动实验,并成功找到多组可以实现两比特门的参数组合。

(来源:arXiv)

相比其他的工作,曹舒翔博士和合作者所搭建的 Agent 针对实验物理学研究场景实现了三个功能:

第一,Agent 能够根据科研人员提出的实验描述和实验目标,设计出全部的实验步骤,并把实验步骤转换为一个“状态机”,即无论是实验成功还是实验失败,Agent 都能知道下一步该做什么。在这种情况下,Agent 自动规划的工作流程更加可靠,要么能够工作到实验成功完成,要么会在进入无法恢复的不得已状态下向科研人员求助。

第二,Agent 能够动态分析并理解已经存在的操作仪设备的代码库,将每一步实验通过这些代码库实现出来。实验人员可以随时向代码库中修改或添加新的仪器操作接口增强 Agent 的实验能力。

第三,在每一个实验完成之后,Agent 能够自行分析实验数据,借此判断这次实验是否成功达到预期目的。如果不成功,它会先判断是否需要重新调整参数;如果需要,它将自行调整参数。与此同时,在这一步的结果会返回给“状态机”并驱动“状态机”的运行。

要实现以上的功能,需要让大模型掌握整个实验所需的知识。曹舒翔和所在团队设计的 Agent,相比此前已有系统有着三个重要改进。

首先,Agent 能够根据知识把实验步骤转化为“状态机”,并让大模型来决定状态的更新和跳转。曹舒翔表示通过本次研究,他们证明使用“状态机”可以成功稳定的实现复杂实验流程的自动化。

其次,Agent 能将知识同时从代码和文档里提取出来,并能进行结构化的整理和存储。在进行实验设计或代码生成时,Agent 可以进行高效快速的查询,并能翻译成实验脚本代码。相比直接生成大段的代码,这一方案更加符合自动化实验的场景,且具有较好的稳定性。

再次,在曹舒翔等人所打造的知识库之中,包含了图片的多模态数据,他们还通过引入小样本学习,并使用多模态大模型针对实验数据进行解读。借此发现,很多实验很难仅仅通过自然语言来对实验成功与否进行精确描述。而该团队先给模型展示一些成功和失败的案例图片,再把采集到的数据转化为图片并让模型进行分析,借此极大提升了模型准确率。

总的来说,Agent 可以极大降低超导量子计算平台的实验成本,并能把科研人员从技术细节和工程细节中解放出来。同时,曹舒翔认为本次解决方案的适用范围非常广泛,不仅能用于量子计算,也能用于其他类型的科学研究,甚至能用于工业和服务业的复杂自动化场景中。

(来源:arXiv)

据了解,曹舒翔本科毕业于浙江大学竺可桢学院,并在毕业后到牛津大学攻读博士。在此期间,由他联合创立的量子人工智能公司 Rahko 于 2022 年被美国生物技术公司 Odyssey Therapeutics 收购。曹舒翔目前在牛津大学从事博士后研究,主要研究 AI 在科研领域可能的运用场景。该研究的共同一作张子健来自加拿大多伦多大学的 Alan Aspuru-Guzik 课题组,他的研究专注于 AI Agent 的知识表示和人机交互。

曹舒翔表示,本次研究受到了早期 GPT Agent 工作 AutoGPT 的启发。最早的 AutoGPT 能在给定一个任务目标之后,一步一步地实现目标,并能使用搜索引擎和文件创建等简单的工具。

在本次研究之中,曹舒翔等人先是开展了一些预实验,比如让一些早期 Agent 直接控制量子计算设备。但是,实验效果却是差强人意,主要是因为模型无法了解他们的实验要求,只能照猫画虎地进行“看似有用实则无用”的操作。在曹舒翔等人看来,这其实就是模型在没有知识储备的情况下进行的“敷衍”。

后来,领域内的其他团队开始使用更复杂的检索增强生成(RAG,Retrieval-Augmented Generation)方法,来将具体场景的知识提供给模型,借此来增强模型的能力。

后来,曹舒翔等人调研了很多其他 Agent 的实现方法,借此提出一种适合该团队研究场景的解决方案。与此同时,他们提出一个针对实验知识进行整理和存储的方案,即通过撰写结构化文档的方式,不仅能让大模型进行快速索引并查找到相关内容,还能为人类进行分析和阅读。

通过以上方案,让模型拥有了使用量子实验设备的能力。在接下来的研究中 Agent 首先在模拟构建的量子计算设备测试环境中进行了进行交互,验证了准确性后在真实量子计算设备上进行了验证。

期间,该团队测试了很多方案。例如,在最早的方案之中他们并没有引入“状态机”,而是让模型直接生成长脚本并完成实验,但是他们发现,目前的模型还不足以直接完成这类复杂任务。

于是,他们通过引入更多的 Agent 并把任务加以细分,借此找到了每个功能的最佳实现方法,并将它们进行整合,进而在真实量子计算机上成功完成测试。

但是,测试中他们发现此前构建的系统稳定性欠佳,原因是大模型很难去解读实验数据。由于这些数据是模型完全没有见过的,因此通过语言描述很难进行准确区分。

为此,他们尝试了很多方法,包括直接分析文字数据、让模型自己写代码进行数据分析并解读分析结果等。最后,他们发现最稳定和最实用的方案是:使用小样本学习配合多模态的方式,来教会模型却解读数据。

完成以上步骤之后,他们使用大模型针对量子计算机进行自动校准的复杂实验,成功校准了单比特门和两比特门,同时展示了模型根据真人科研人员指令快速构建新实验的能力。

(来源:arXiv)

日前,相关论文以《应用于量子计算的自动化实验室智能体》(Agents for self-driving laboratories applied to quantum computing)为题发表在预印本网站 arXiv 上 [1]。同时,曹舒翔博士在 2025 年美国物理学会全球峰会上(APS Global Summit 2025)以《利用基于知识的 AI 智能体实现实验自动化:超导量子处理器案例研究》(Automating Experiments with Knowledge-Based AI Agents: A Case Study in Superconducting Quantum Processors)对相关工作进行了汇报 [2]。

图 | 相关论文(来源:arXiv)

未来,曹舒翔等人将研究如何让参数更小的模型来驱动他们所搭建的Agent。该团队目前的 Agent 框架尚未涉及到针对模型的微调,这就要求驱动这个框架的模型的本身能力必须足够好。比如,目前得使用 GPT-4、Claude-3-Opus 等模型才能产生比较稳定的效果。所以,未来他们将通过微调方式或蒸馏方式来使用参数更小的模型,以及降低框架所需要的推理开销。

图 | 美国物理学会全球峰会(来源:曹舒翔)

同时,他们还将增强模型对于科学数据的理解。目前,该团队将扫描到的结果生成为一张带有坐标系的二维图片,尽管模型可以识别出图片中科研人员感兴趣,并希望更进一步进行精细扫描研究的部分,但却不能准确指出具体的参数范围。因此,他们将进一步研究能够处理科学任务的多模态模型。

最后,他们将通过寻找合适的优化方法,来让模型更高效地部署到边缘计算设备上,从而让本次案能够适用于更多应用场景。

参考资料:

1.https://arxiv.org/pdf/2412.07978

2.https://summit.aps.org/events/MAR-G18/4

运营/排版:何晨龙

相关内容

热门资讯

宁波朗迪取得网布烫边切割装置专... 金融界2025年8月6日消息,国家知识产权局信息显示,宁波朗迪环境科技有限公司取得一项名为“网布烫边...
富兴塑膜取得PVC塑膜压纹成型... 金融界2025年8月6日消息,国家知识产权局信息显示,苍南县富兴塑膜有限公司取得一项名为“一种PVC...
美国拟2030年前在月球建成核... △艺术家描绘的月球上的电力系统。(图片来源:NASA) 当地时间8月5日,据多家美国媒体报道,美国交...
TTG3-1KSG,清清正反手... TTG3-1战胜KSG,终于结束了对KSG的连败。从EWC回来之后他们似乎变强了,清清证明了为什么萝...
中国电信视联网赋能基层治理 提... 近日,丰都县仁沙镇依托中国电信视联网技术,进一步提升基层治理智能化水平,推动乡村基层治理体系不断完善...
《上古OL》开发商被砍掉的《黑... 微软最近的大裁员砍掉了《上古卷轴OL》开发商备受期待的新IP(代号为黑鸟计划)以及Rare工作室的《...
山东科嘉电气:高效智能充电方案... 山东科嘉电气近日推出了两款创新充电设备,专为不同领域提供专业、高效、安全的充电解决方案。这些设备分别...
科技前沿丨普通家庭何时能用上保... 7月31日召开的国务院常务会议审议通过《关于深入实施“人工智能+”行动的意见》。会议指出,当前人工智...
泰科汽车取得油箱加油单向阀专利... 金融界2025年8月6日消息,国家知识产权局信息显示,芜湖泰科汽车科技有限公司取得一项名为“一种油箱...
当年吹爆Edge浏览器的我,现... 每位资深玩家,在对枪失败、团战暴毙后,都有一套神圣的仪式: “诶今天鼠标有点飘”、“这键盘键程不对”...
走出光伏同质化困境,BC生态圈... 来源:澎湃新闻 隆基绿能创始人、首席技术官李振国 同质化的红海厮杀,令光伏产业深陷恶性竞争泥潭。乘...
AL被打晕了?IG辅助抢大龙翻... ★游戏马蹄铁原创 AL对战IG第二局 IG无愧是现在LPL的人气王,流量王,他们的比赛不仅是明星选...
LOL:BLG被曝不是全华班,... Shadow护照是意大利的 在LPL赛区中,全华班自带流量和话题,像RNG、BLG这种主打全华班的...
紧盯AI人才,“鹅厂”招新,软... 8月6日,腾讯2026校园招聘正式启动。本次招聘面向2025年1月至2026年12月期间毕业的大学生...
DOTA2 7.39d 更新深... 当看到 7.39d 的更新日志时,我的第一反应是:这不是简单的数值微调,而是V社对当前版本生态的一次...
《仁王3》制作人访谈:保留硬核... 今年6月,《仁王3》发布了首支预告片,并宣布游戏将于明年年初正式发售,登陆PlayStation 5...
青春好市 | 以手抵心,对话千... 当棕榈叶在指尖翻飞成灵兽,当大漆在掌心打磨出光华,当破碎的古瓷片在你手中重获新生...这不是遥远的传...
IDC:Q2中国消费级游戏本市... IT之家 8 月 6 日消息,市场研究机构 IDC 今天发文,披露了中国消费级游戏 PC 市场的数据...
小米手机欧洲市场份额首超苹果,... 【太平洋科技快讯】8 月 6 日,小米集团合伙人、小米集团总裁、部总裁兼小米品牌总经理卢伟冰在社交媒...
王者荣耀:夏侯惇喜迎加强,亚连... 王者荣耀本赛季已经进入中期,还没有拿到王者印记的小伙伴确实该抓紧时间了,毕竟到了赛季后半段上分难度会...