极进Extreme合作伙伴——中科新远网络解决方案提供商

新闻中心

NVIDIA Dynamo 新增多轮智能体工具流支持,提升推理与工具调用响应效率

阅览 : 3
更新时间 : 2026-05-21

在智能体应用持续升温的背景下,推理服务已不再只是简单返回一段文本结果。面对带有多轮上下文、工具调用、推理片段和结构化响应的复杂请求,底层推理引擎需要同时保证正确性、稳定性与响应速度。NVIDIA 最新介绍了 Dynamo 在这一方向上的一系列增强,目标是更好支撑代理式 AI 工作流。

此次更新的核心之一,是让 Dynamo 更完整地支持多轮智能体交互中的推理+工具调用结构。文章指出,在真实智能体场景中,模型往往会先输出一段推理内容,再发起一个或多个工具调用。如果这些内容在后续轮次中被错误重组、遗漏,模型就可能失去关键上下文。为此,Dynamo 对推理解析器和工具调用解析器进行了加强,以更准确保留各段内容之间的对应关系。

另一个重点是提升流式返回体验。过去,一些系统虽然能够流式输出推理文本,但工具调用往往要等到整轮响应结束后才能交给上层应用处理,这会增加等待时间。Dynamo 现在支持在工具调用结构完成后更早分发相关事件,使上层智能体框架能够更快执行工具请求,从而缩短整体交互链路。

在系统协同层面,NVIDIA Dynamo 被用于编排异构推理流程。对于带有大量固定系统提示和工具定义的智能体应用,只要前缀保持稳定,推理系统就能更有效复用缓存,减少首个 token 输出时间。


相关文章
GPU 加速油气勘探,打造新一代地震数据分析平台
GPU 加速油气勘探,打造新一代地震数据分析平台
2026-04-30
国内一家领先的油气勘探企业承接了大量的国内外石油天然气勘探项目,每年面临庞大的地···
NVIDIA 与 SAP 扩大合作,为企业专业智能体强化安全与治理能力
NVIDIA 与 SAP 扩大合作,为企业专业智能体强化安全与治理能力
2026-05-22
在 SAP Sapphire 2026 大会上,NVIDIA 与 SAP 宣布进一步扩大合作,目标是帮助企业在关···
诺基亚联合英伟达:以仿真训练平台重构工业具身智能开发范式
诺基亚联合英伟达:以仿真训练平台重构工业具身智能开发范式
2026-05-22
在具身智能技术驱动的工业革命浪潮中,NVIDIA 正为全球企业架设连接人工智能与物理世界···
NVIDIA 发布 AI 模型服务优化指南,聚焦降低部署链路摩擦
NVIDIA 发布 AI 模型服务优化指南,聚焦降低部署链路摩擦
2026-05-21
AI 模型完成训练后,真正进入生产服务阶段时,往往还会面临一系列部署问题。NVIDIA 在···