神州问学论文发布:提出企业级大模型智能体规划新范式“Routine”
创始人
2025-07-29 12:41:53
0

近日,神州数码旗下神州问学的研究团队在预印本平台Arxiv发布论文《Routine: A Structural Planning Framework for LLM-Agent System in Enterprise》,提出一种名为“Routine”的结构化规划框架,旨在解决大模型智能体(LLM-Agent)在企业专业场景应用中面临的三大核心挑战:场景知识缺乏导致流程编排错误、规划格式不统一引发执行不稳定,以及低代码方法非AI原生导致的用户不友好问题。

论文作者为曾冠程、陈雪怡、胡嘉旺、齐少华、毛雅瑄、王展韬、聂一凡、李爽、冯秋阳、邱鹏旭、王钰佳、韩文强、黄琳琰、李刚、莫晶晶、胡浩文。

企业中智能体系统的痛点:

论文指出,当前企业级智能体系统在实际部署中存在显著瓶颈:

1.知识鸿沟与工具编排混乱:通用模型缺乏企业特定场景知识,难以正确编排工具链,常忽略关键工具类型。

2.规划非标准化导致执行偏差:模型依赖泛化理解遵循非标准规划,导致规划到执行的转化过程不稳定。

3.低代码方案的局限性:传统低代码方式对非技术人员门槛高,且构建的工作流难以跨场景复用,非AI原生方法效率低下。

为解决这些问题,神州数码团队创新性地提出了“Routine”规划范式:

Routine由多个更小、更具体的子任务执行步骤组成,子任务是独立的,但之间又相互关联。因此,一条Routine执行步骤需要包括足够信息,让智能体能够稳定地遵循规划步骤,以下是一条完整的Routine子任务步骤组成:

类似场景下的Routine可能包含重叠的步骤,仅在某些流程段上有所不同,类似于同一工作流的不同分支。在这种情况下,可以通过创建分支步骤和执行条件来合并类似的场景,以在一个Routine中设置多个相似的工作流。

Routine格式作为大语言模型生成规划与实际执行引擎之间的中间表示层,将每一步工具调用以标准化格式明确表达,涵盖工具名称、参数、依赖关系与执行状态等关键字段,能够有效提升执行模型遵循规划的准确性,指导智能体完成多样化的场景任务。

Routine智能体系统的核心架构

以Routine机制为核心,研究团队优化了智能体系统的设计,包含四大关键模块的优化:

1.规划模块:

标准化格式:Routine由明确的子任务步骤组成,包含步骤编号、名称、行为描述、输入/输出参数描述和调用的工具名称,并且支持分支流程表示。

AI生成与优化:业务专家提供流程草稿,模型利用专用提示模板进行优化,输出结构化的自然语言Routine。消融实验证明,AI优化的Routine能显著提升执行准确率,接近甚至部分超越人工标注基准。

2.执行模块:

小参数模型:采用小参数模型,通过指令微调与强化学习等方法训练,设置对应的多步工具调用奖励函数,指导模型适配到场景,增强模型指令遵循能力。

a.上下文工程机制:研究团队明确了智能体系统解决任务所需要的信息和配置,并构建了对应的上下文模板,其中不仅包含角色定义、任务背景与行为规范等常规内容,还包含了系统参数、解决问题对应的Routine规划、变量记忆字典、工具列表等关键信息;

3.工具模块:

MCP服务器:使用MCP服务器作为标准化工具层,对工具的名称、参数、返回格式进行统一定义和管理。

4.记忆模块:

流程记忆:存储专家创建或AI优化的场景Routine集合,根据用户任务相似度动态检索召回最相关的Routine,避免将所有Routine塞入上下文。

变量记忆:将长文本参数等存储为变量键,执行时自动替换为实际值,极大减轻模型上下文压力,减少参数传递中的符号错误。

几个模块相互协作,形成了功能完善的智能体系统,如图中所示:

文章中总结了以下工作:

1.结构化规划范式:设计了一套结构化的标准规划格式“Routine”,显著提升智能体通过多步工具调用解决复杂问题的稳定性。在实际企业场景中的验证表明,Routine显著提升了模型工具调用的执行准确性,将GPT-4o的性能从41.1%提高到96.3%,将Qwen3-14B的性能从32.6%提升到83.3%。

2.Routine遵循能力训练:为进一步验证Routine框架的有效性,研究团队构建了一个Routine格式的指令遵循训练数据集,通过指令微调和强化学习,使其场景特定评估的准确性增至88.2%,表明该框架显著改善了模型在执行计划方面的遵循性。

3.基于Routine的数据蒸馏:通过知识蒸馏方法生成了一个场景特定的多步骤工具调用数据集,在此蒸馏数据集上进行微调使模型准确性提高到95.5%,接近GPT-4o的水平。这些结果充分展示了Routine框架在领域特定工具使用模式优化和增强模型适应新场景能力方面的有效性。

后续应用:

以AI for Process为核心方向,Routine框架的引入显著提高了代理系统在企业场景中的适应性,推动了AI for Process的技术愿景。它不仅优化了领域特定工具使用模式,还增强了模型应对复杂任务的能力,为企业流程的智能化和自动化提供了稳健可靠的解决方案。

未来,通过在训练流程中引入强化学习,能更好地提升模型对多样化场景的流程泛化能力。通过持续的研究和优化,Routine框架有望在未来进一步提高智能体的自主性和适应性,推进企业智能体在企业环境中的广泛应用。

神州问学将持续深耕场景化知识引擎与智能体协同技术,致力于构建具备更强流程认知与自适应进化能力的企业级智能体,打通从复杂业务逻辑到敏捷AI落地的关键路径,为企业智能化转型提供坚实、灵活且可规模化的技术支撑。

相关内容

热门资讯

凯利信取得电梯支架横梁焊接工装... 金融界2025年7月29日消息,国家知识产权局信息显示,常熟市凯利信金属制品有限公司取得一项名为“一...
蘑菇车联:打造物理世界实时搜索... 据了解,该技术突破传统AI局限,首次实现从感知到决策的毫秒级闭环,为智慧城市与自动驾驶提供核心驱动力...
Xinnor声称RAID重建速... 来源:至顶网 软件RAID供应商Xinnor宣称其产品能在仅仅五小时多一点的时间内重建一个61.4...
不要被网络博主剧本呈现的爱情,... 在这个信息爆炸的时代,网络的每一个角落都充斥着各式各样的声音与画面,其中不乏情侣博主们精心编织的甜蜜...
Roblox连接断开的深层原因... Roblox凭借其强大的创意功能和丰富的交互体验,持续成为全球玩家热衷的虚拟世界平台。但在沉浸于这个...
中国电信战略升级 “云改数转智... 来源:IT时报 作者/ IT时报记者 钱立富 郝俊慧 编辑/ 王昕 “今年是人工智能规模应用的元年。...
属实难绷 国外一对情侣买了PS... 近日一则视频显示,一对情侣通过外卖平台DoorDash购买PlayStation 5后,才发现无法在...
红米REDMI 15 5G印度... REDMI红米品牌在印度市场即将迎来一款备受瞩目的新品——REDMI 15 5G智能手机,其正式发布...
夸克AI眼镜支持高德地图:直接... 快科技7月29日消息,在2025世界人工智能大会(WAIC)上,阿里巴巴重磅发布了首款自研AI眼镜—...
俱乐部成绩提升带动奖金与商务增... 来源:王者荣耀李小白君 【投稿】那些穷b俱乐部能不能学一学,成绩有了,奖金多了,商务自然就有了
原创 w... 说起IG这个队伍啊,其实2025这个赛季组建之初,就一直是LPL流量前三的队伍之一,原因大家也懂,全...
《明末:渊虚之羽》发售5天通关... 国产类魂游戏《明末:渊虚之羽》自7月24日发售以来已过去近5天。 根据Steam官方数据显示,截至...
外媒对比《明末》与《黑神话》b... 近日,国外游戏媒体Gamerant对近期发售的《明末:渊虚之羽》(以下简称《明末》)与第一位国产3A...
原创 美... [熊猫] 美国真是搬起石头砸自己的脚,因为他们自己的“中国行动计划”政策,导致大批的中国科学家和人才...
《骨头船长》正式登陆Steam... World of Poly工作室制作并发行,一款历经 7年开发的动作冒险新游《骨头船长》正式登陆St...
因给《怪物猎人:荒野》封号玩家... 这几个月《怪物猎人:荒野》的口碑急速下降,除了更新内容挤牙膏外,还有封号力度过大的情况,引发大量玩家...
《影之刃零》获外媒高度评价:高... 近日,外媒PC Gamer刊发长篇试玩体验,盛赞国产动作游戏《影之刃 零》(Phantom Blad...
原创 爆... LPL第三赛段IG和FPX的BO3,双方大战2局之后,IG爆冷0-2不敌FPX,苦吞首败! 第一局...
浙江卡环科技取得用于紧固件自动... 金融界2025年7月29日消息,国家知识产权局信息显示,浙江卡环科技有限公司取得一项名为“一种用于紧...