在 Build 2026 上,英伟达与微软展示了覆盖端侧到云端的统一 AI 智能体部署栈。端侧发布了提供 1 petaflop AI 算力与最高 128GB 统一内存的 RTX Spark,以及搭载 GB300 芯片、可本地运行最高万亿参数模型的 DGX Station for Windows。云端,Nemotron 3 Ultra 推理模型上线微软 Foundry,Claude 模型也已在 Azure 的 GB300 系统中原生运行。数据层,微软 Fabric Data Warehouse 内置的 NVIDIA 加速计算使 SQL 执行速度最高提升至 CPU 基线的 6 倍。此外,微软位于威斯康星州的 Fairwater AI 工厂提前上线,并已完成对下一代 NVIDIA Vera Rubin 平台的验证,其推理吞吐量提升最高达 10 倍。