透过搭载 Blackwell 平台的 Google 分散式云端(GDC),协助企业在地端资料中心安全部署代理型 AI,保障病患纪录、金融交易与政府机密等机敏资讯。NVIDIA 的机密运算技术能防止 Gemini 模型中的敏感程式码遭未经授权存取,并确保用户提示与微调资料不被外泄或窜改。Google Cloud 副总裁 Sachin Gupta 表示,这项结合 Gemini 模型与 Blackwell 的合作,让企业能在不牺牲效能的前提下安全创新。
代理型 AI 有别于传统 AI,其具备推理、适应与决策能力,能在动态环境中自主行动。例如在 IT 支援中,不仅提供解答,更能自动诊断与修复问题;在金融领域则能即时封锁可疑交易并调整侦测规则。随著企业导入代理型 AI,这类具备高度资料隐私保护与自主决策能力的解决方案,正成为推动新一波技术革新的关键。
虽然许多企业已能透过多模态推理模型整合文字、影像、程式码等多种资料类型,打造云端代理型 AI 应用并解决复杂问题,但对安全性或资料主权有严格要求的企业仍难以实现。随著最新消息发表,Google Cloud 成为首批提供机密运算功能的云端服务供应商之一,能保护云端与混合环境中的代理型 AI 工作负载。
这项解决方案由搭载 Blackwell GPU 与 NVIDIA 机密运算技术的 NVIDIA HGX B200 平台所驱动,使客户在不影响资料安全性或模型完整性的前提下,达成突破性的效能与能源效率。
在生产环境中扩展代理型 AI,需要兼顾强大的可观察性与安全性,以确保效能稳定并符合法规。Google Cloud 今日宣布推出全新 GKE Inference Gateway,透过先进的路由与扩充能力,优化 AI 推论工作负载的部署。该服务整合 NVIDIA Triton 推论伺服器与 NVIDIA NeMo Guardrails,能提供智慧型负载平衡以提升效能、降低成本,并集中控管模型的安全与治理。
展望未来,Google Cloud 也将整合专为跨 AI 工厂服务与扩充推论模型而设计的开源函式库 NVIDIA Dynamo,进一步强化代理型 AI 工作负载的可观察性。
