神州问学论文发布:提出企业级大模型智能体规划新范式“Routine”
创始人
2025-07-29 12:41:53
0

近日,神州数码旗下神州问学的研究团队在预印本平台Arxiv发布论文《Routine: A Structural Planning Framework for LLM-Agent System in Enterprise》,提出一种名为“Routine”的结构化规划框架,旨在解决大模型智能体(LLM-Agent)在企业专业场景应用中面临的三大核心挑战:场景知识缺乏导致流程编排错误、规划格式不统一引发执行不稳定,以及低代码方法非AI原生导致的用户不友好问题。

论文作者为曾冠程、陈雪怡、胡嘉旺、齐少华、毛雅瑄、王展韬、聂一凡、李爽、冯秋阳、邱鹏旭、王钰佳、韩文强、黄琳琰、李刚、莫晶晶、胡浩文。

企业中智能体系统的痛点:

论文指出,当前企业级智能体系统在实际部署中存在显著瓶颈:

1.知识鸿沟与工具编排混乱:通用模型缺乏企业特定场景知识,难以正确编排工具链,常忽略关键工具类型。

2.规划非标准化导致执行偏差:模型依赖泛化理解遵循非标准规划,导致规划到执行的转化过程不稳定。

3.低代码方案的局限性:传统低代码方式对非技术人员门槛高,且构建的工作流难以跨场景复用,非AI原生方法效率低下。

为解决这些问题,神州数码团队创新性地提出了“Routine”规划范式:

Routine由多个更小、更具体的子任务执行步骤组成,子任务是独立的,但之间又相互关联。因此,一条Routine执行步骤需要包括足够信息,让智能体能够稳定地遵循规划步骤,以下是一条完整的Routine子任务步骤组成:

类似场景下的Routine可能包含重叠的步骤,仅在某些流程段上有所不同,类似于同一工作流的不同分支。在这种情况下,可以通过创建分支步骤和执行条件来合并类似的场景,以在一个Routine中设置多个相似的工作流。

Routine格式作为大语言模型生成规划与实际执行引擎之间的中间表示层,将每一步工具调用以标准化格式明确表达,涵盖工具名称、参数、依赖关系与执行状态等关键字段,能够有效提升执行模型遵循规划的准确性,指导智能体完成多样化的场景任务。

Routine智能体系统的核心架构

以Routine机制为核心,研究团队优化了智能体系统的设计,包含四大关键模块的优化:

1.规划模块:

标准化格式:Routine由明确的子任务步骤组成,包含步骤编号、名称、行为描述、输入/输出参数描述和调用的工具名称,并且支持分支流程表示。

AI生成与优化:业务专家提供流程草稿,模型利用专用提示模板进行优化,输出结构化的自然语言Routine。消融实验证明,AI优化的Routine能显著提升执行准确率,接近甚至部分超越人工标注基准。

2.执行模块:

小参数模型:采用小参数模型,通过指令微调与强化学习等方法训练,设置对应的多步工具调用奖励函数,指导模型适配到场景,增强模型指令遵循能力。

a.上下文工程机制:研究团队明确了智能体系统解决任务所需要的信息和配置,并构建了对应的上下文模板,其中不仅包含角色定义、任务背景与行为规范等常规内容,还包含了系统参数、解决问题对应的Routine规划、变量记忆字典、工具列表等关键信息;

3.工具模块:

MCP服务器:使用MCP服务器作为标准化工具层,对工具的名称、参数、返回格式进行统一定义和管理。

4.记忆模块:

流程记忆:存储专家创建或AI优化的场景Routine集合,根据用户任务相似度动态检索召回最相关的Routine,避免将所有Routine塞入上下文。

变量记忆:将长文本参数等存储为变量键,执行时自动替换为实际值,极大减轻模型上下文压力,减少参数传递中的符号错误。

几个模块相互协作,形成了功能完善的智能体系统,如图中所示:

文章中总结了以下工作:

1.结构化规划范式:设计了一套结构化的标准规划格式“Routine”,显著提升智能体通过多步工具调用解决复杂问题的稳定性。在实际企业场景中的验证表明,Routine显著提升了模型工具调用的执行准确性,将GPT-4o的性能从41.1%提高到96.3%,将Qwen3-14B的性能从32.6%提升到83.3%。

2.Routine遵循能力训练:为进一步验证Routine框架的有效性,研究团队构建了一个Routine格式的指令遵循训练数据集,通过指令微调和强化学习,使其场景特定评估的准确性增至88.2%,表明该框架显著改善了模型在执行计划方面的遵循性。

3.基于Routine的数据蒸馏:通过知识蒸馏方法生成了一个场景特定的多步骤工具调用数据集,在此蒸馏数据集上进行微调使模型准确性提高到95.5%,接近GPT-4o的水平。这些结果充分展示了Routine框架在领域特定工具使用模式优化和增强模型适应新场景能力方面的有效性。

后续应用:

以AI for Process为核心方向,Routine框架的引入显著提高了代理系统在企业场景中的适应性,推动了AI for Process的技术愿景。它不仅优化了领域特定工具使用模式,还增强了模型应对复杂任务的能力,为企业流程的智能化和自动化提供了稳健可靠的解决方案。

未来,通过在训练流程中引入强化学习,能更好地提升模型对多样化场景的流程泛化能力。通过持续的研究和优化,Routine框架有望在未来进一步提高智能体的自主性和适应性,推进企业智能体在企业环境中的广泛应用。

神州问学将持续深耕场景化知识引擎与智能体协同技术,致力于构建具备更强流程认知与自适应进化能力的企业级智能体,打通从复杂业务逻辑到敏捷AI落地的关键路径,为企业智能化转型提供坚实、灵活且可规模化的技术支撑。

相关内容

热门资讯

“风云家族”上“星” 太空“气... 中新社北京12月27日电 (记者 马帅莎 郑莹莹)风云四号C星(又称风云四号03星)12月27日在西...
智赋荆楚,灵启新程!华为坤灵中... 智能化浪潮席卷荆楚大地,在长江经济带与中部崛起战略的双重驱动下,湖北中小企业作为区域经济的“活力引擎...
贯彻中央部署,重要委员会成立!... 撰文 | 李岩 中国工信新闻网27日消息,26日,工业和信息化部人形机器人与具身智能标准化技术委员...
上海克林技术取得绕线系统专利,... 国家知识产权局信息显示,上海克林技术开发有限公司取得一项名为“一种绕线系统”的专利,授权公告号CN2...
超值预警!这免费官网竟能精准狙... 当免费成为主流,究竟哪款AIGC检测官网才能真正帮你识别和优化AI生成内容的网络可见度? 优采云AI...
2025全球智能手表出货量预计... 12月27号消息,根据Counterpoint Research最新发布的报告显示,全球智能手表出货...
数翊科技华中研发总部项目签约落... 近日,数翊科技与光谷光电子信息产业园签约,将在光谷建设华中研发总部,开发以分布式数据库软件为核心的A...
赛维斯照明取得筒灯结构专利,提... 国家知识产权局信息显示,中山市赛维斯照明有限公司取得一项名为“一种筒灯结构”的专利,授权公告号CN2...
广电流量卡深度测评:信号、流量... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
东旭光电取得重载连接器专利,具... 国家知识产权局信息显示,芜湖东旭光电装备技术有限公司取得一项名为“重载连接器”的专利,授权公告号CN...
【赠书福利】豆瓣9.1分的神级... 天气预报为什么总不准? 股市为什么难以预测? 心跳为什么偶尔会咯噔一下? ——全是“混沌”在捣鬼! ...
原航发集团董事长曹建国: 已从... 12月27日,据澎湃新闻报道,曾任中国航空发动机集团有限公司(简称“中国航发集团”)董事长、党组书记...
原创 荣... 2025年12月26日,根据多家科技媒体的消息,荣耀这家智能手机厂商在成都举办新品发布会,正式发布“...
理文造纸取得用于造纸生产的打浆... 国家知识产权局信息显示,广东理文造纸有限公司取得一项名为“一种用于造纸生产的打浆磨浆装置”的专利,授...
美国初创公司高管:人形机器人市... 在加利福尼亚州山景城举行的Humanoids Summit上,多位人形机器人初创公司的创始人与高管表...
更安全更便捷更微创:重庆医生首... 近日,聚焦胸外科机器人手术的专题研修活动“胸外科机器人手术大师班”在重庆医科大学附属大学城医院举行。...
“成都造”家储产品发往尼日利亚... 12月26日,四川华体照明科技股份有限公司(以下简称“华体科技”)在其成都双流总部基地举行了新型储能...
上海旅超AI音乐赛携手AI开放... 第一届上海旅游攻略超级大赛(第一季)启动以来,收获热烈反响。为有效扩大赛事社会影响半径,上海旅超大赛...
原创 仅... 最近,台湾的气氛有些紧张。台防务部门发布了一则消息,称大陆将于12月27号,也就是大约48小时后,在...
联名徕卡三年后,小米造了一台“... 如果一台手机,它的开机界面是 Leica、机身刻着 Leica,背面还镶了颗 Leica 经典可乐标...