NVIDIA 同步发表两套以 Omniverse 和 Cosmos 平台驱动的全新蓝图,提供大规模、可控的合成资料生成引擎,协助开发人员加速后期训练机器人与自驾车。1X、Agility Robotics、Figure AI、Foretellix、Skild AI 和 Uber 等企业已率先采用 Cosmos,进一步加速训练流程,提升实体 AI 系统的效能与应用范围。
NVIDIA执行长黄仁勋表示:「正如大型语言模型彻底改变生成式与代理 AI,Cosmos 世界基础模型则为实体 AI 带来重大突破。Cosmos 提供开放且完全可客制化的推理模型,为机器人与实体产业的跨越式发展创造全新机会。」
在 Cosmos 平台中,Cosmos Transfer WFM 支援将结构化影片输入(如分割图、深度图、姿态估计图等)转换为可控的高真实度影片输出,显著简化感知 AI 的训练流程。Agility Robotics 率先导入 Cosmos Transfer 和 Omniverse,以生成大量合成资料训练机器人模型。该公司技术长 Pras Velagapudi 表示:「Cosmos 帮助我们扩大训练资料范围,超越现实世界资料的限制,进一步提升机器人的学习与执行效能。」
此外,Foretellix 应用 Cosmos Transfer 蓝图模拟不同天气、光线条件,丰富自驾车驾驶场景资料集,Parallel Domain 也针对感测器模拟应用类似技术。NVIDIA GR00T 蓝图则结合 Omniverse 和 Cosmos Transfer,可在数小时内大规模生成多样化资料集,加速 AI 模型训练。
Cosmos Predict WFM 则主打多模态世界生成,支援文字、图像与影片输入,预测虚拟世界中物体动作与运动轨迹。1X、Skild AI、Nexar 与 Oxa 等企业已将 Cosmos Predict 应用于人形机器人、自驾系统的开发与优化。搭配 NVIDIA Grace Blackwell NVL72 系统与 NVLink 技术,开发者可实现即时世界生成,满足高效能应用需求。
针对影片理解与互动预测,NVIDIA 推出 Cosmos Reason WFM,支援时空感知与思维链推理,能以自然语言描述物体行为并预测互动结果,协助开发人员优化实体 AI 资料注释、模型训练与高阶任务规划。
NVIDIA 同时提供 DGX Cloud 上的 PyTorch 指令码与 NeMo 架构,简化 Cosmos WFM 的后期训练流程,并透过 NeMo Curator 加速资料处理。Linker Vision、Milestone Systems 与 Virtual Incision 等企业均采用该解决方案,推进视觉代理模型、自驾车与手术机器人开发。
为落实负责任 AI,NVIDIA 宣布在 Cosmos WFM 上实施开放护栏,并与 Google DeepMind 合作整合 SynthID 浮水印技术,强化 AI 生成内容的透明度。
