根据OpenAI官方说明,这项更新是整合了擅长操作网站的Operator,以及善于网路资料归纳的深入研究工具这两大系统,让ChatGPT不再局限于回应问题,而是具备选择最佳执行策略、动态调整方式、主动与用户互动的能力。这也意味著,只要透过一段自然的语句,例如「帮我整理这周信箱内与专案相关的会议内容并排入简报」,ChatGPT就能判断最佳执行方式,启用浏览器、API、甚至虚拟电脑,完成跨平台、多步骤的任务流程。
这项智慧体功能强调的是「行动力」,不仅能处理财务试算表、建构投资分析模型、汇整产业趋势,也支援将图表与资料转换为简报格式,所有过程都可编辑、可监控,而且操作权永远掌握在使用者手中。无论是旅游规划、报税、简报撰写、行程管理、Email草稿拟定,ChatGPT都能以人类直观操作的方式来完成复杂流程。
在实测与基准评比中,ChatGPT智慧体的表现也刷新了多项纪录。例如在WebArena与BrowseComp网页浏览任务中,表现超越同类工具;在DSBench的资料科学分析测验中,甚至胜过人类分析师。另一项重点在于试算表编辑能力,在SpreadsheetBench测试中获得71.3%的准确率,是目前业界已知最高水准。
使用者也能透过ChatGPT智慧体连接个人帐户,包括行事历、邮件与云端资料,授权后,智慧体能协助调阅内容、提供会议建议、帮忙预约,甚至整理每日报告。若任务需要登入网站、涉及个人隐私,ChatGPT也会主动提醒使用者接管控制权,确保资安无虞。资料处理方面,OpenAI也明确指出,这些操作都在使用者本地环境执行,输入资讯不会储存在伺服器上。
目前这项功能已率先开放给Pro、Plus与Team方案的用户,每月最多可执行50项任务,Pro方案甚至无任务数限制。Enterprise与Education版本则预计于7月内陆续开放。用户可在对话时切换至「智慧体模式」启用这些功能,也能排定任务重复执行。
尽管智慧体的简报功能目前仍在测试阶段,尚未支援以试算表自动生成简报,但OpenAI表示已著手开发下一代模型,未来将可输出更精致、图文结构更完善的成果。开发团队也同步启动漏洞奖励计划,邀请研究人员协助测试与强化整体系统安全。
综合而言,这次的更新代表ChatGPT不再只是被动的文字助理,而是一个可以「思考后执行」的数位工作伙伴。从单纯的对话引导,进化为能够操作网站、连结真实资讯来源、自动执行重复工作,并结合用户目标弹性调整行动逻辑,进一步拉近人机协作的距离。

