极进Extreme合作伙伴——中科新远网络解决方案提供商

新闻中心

NVIDIA Vera CPU:为 AI 工厂智能体工作负载设计的新一代处理器

阅览 : 2
更新时间 : 2026-06-05

随着 Agentic AI 和强化学习进入规模化阶段,CPU 正在从单纯的"喂数据给 GPU"的角色演变为 AI 工厂的关键执行环节。NVIDIA 最新发布的 Vera CPU 正是为这一新设计点打造的处理器,目标是在 AI 工厂中为智能体工作负载提供更高吞吐量和更低延迟。

Vera CPU 搭载 88 颗 NVIDIA Olympus 核心,配合最高 1.2 TB/s 的 LPDDR5X 内存带宽,专门针对 AI 智能体场景中的沙箱代码执行、工具调用、数据检索和编排调度等任务进行优化。这些任务虽然不直接在 GPU 上运行,却是智能体工作流中不可或缺的串行瓶颈环节。

NVIDIA 表示,随着智能体变得越来越强大,它们会执行更多步骤、调用更多工具、运行更多检查,CPU 执行时间在整个请求路径中不断累积。这意味着 CPU 已不再是简单的宿主处理器,而是影响加速器利用率、AI 工厂每瓦和每美元产出的关键因素。

与过去十年以"每美元核心数"为指标的云计算 CPU 不同,Vera CPU 的设计指标是"每美元 Token 数"——即 AI 工厂能产生多少智能输出。这要求 CPU 既具备高核心数以支持数千并发智能体,又需要强单核性能来保证串行执行步骤不成为瓶颈,同时还要有高能效内存带宽来避免数据搬运卡死流水线。

在微架构层面,NVIDIA Olympus 核心相比前代 Grace 实现了最高 50% 的 IPC 提升,通过更宽的前端、先进分支预测、深度乱序指令调度以及专用内存预取来维持在重负载下的一致性性能。对于分支密集的智能体代码和数据处理任务而言,这意味着更短的任务完成时间,从而在相同时间内服务更多请求。

对于 AI 工厂运营者来说,Vera CPU 的意义在于让加速器不再等待编排、工具执行或数据搬运。在强化学习场景中,这意味着每个训练窗口可以完成更多评估、产出更多有效数据,帮助模型更快达到更高的质量水平。

相关文章
GPU 加速油气勘探,打造新一代地震数据分析平台
GPU 加速油气勘探,打造新一代地震数据分析平台
2026-04-30
国内一家领先的油气勘探企业承接了大量的国内外石油天然气勘探项目,每年面临庞大的地···
NVIDIA Vera CPU:为 AI 工厂智能体工作负载设计的新一代处理器
NVIDIA Vera CPU:为 AI 工厂智能体工作负载设计的新一代处理器
2026-06-05
NVIDIA 发布 Vera CPU,搭载 88 颗 Olympus 核心与 1.2 TB/s 内存带宽,针对 Agentic ···
NVIDIA DOCA 芯片内安全方案为 Agentic AI 基础设施提供运行时防护
NVIDIA DOCA 芯片内安全方案为 Agentic AI 基础设施提供运行时防护
2026-06-05
NVIDIA 发布基于 BlueField DPU 与 DOCA 的芯片内安全方案,通过运行时威胁检测、数据···
30 行 Python 代码节省数十万美元:NVIDIA nvCOMP 实现 LLM 检查点无损压缩
30 行 Python 代码节省数十万美元:NVIDIA nvCOMP 实现 LLM 检查点无损压缩
2026-06-04
训练大语言模型需要定期保存检查点,包含模型权重、优化器状态和梯度的完整快照。在大···