在这满满AI的Google I/O中,首先看到Gemini相簿上的应用加入「Ask Photos」功能,用户只要对Gemini说想要寻找的特定情境照片,如自己的车牌号码、小孩在游泳池畔等指令,Gemini便会从相簿中找出符合指令情境的照片。在Worksppace中,Gemini能够帮用户从gmail、meet中找出想要摘要重点的信件或会议。

Ask Photos-让用户透过下达更精准的指令能从照相簿中找到想要的照片。翻摄Google YouTube。
Ask Photos-让用户透过下达更精准的指令能从照相簿中找到想要的照片。翻摄Google YouTube。
透过镜头来请Gemini回答眼前的问题。翻摄Google YouTube。
透过镜头来请Gemini回答眼前的问题。翻摄Google YouTube。
Veo是透过指令制作AI影片的新功能。翻摄Google YouTube。
Veo是透过指令制作AI影片的新功能。翻摄Google YouTube。

Google也为Gemini加入了语音的对话功能,称之为Gemini Live,其中可以透过手机镜头来即时回应的「Project Astra」在会场中透过影片演示,拿著Gemini的手机,利用手机背面的镜头行进对话。使用者沿路问Gemini办公室的声音是哪里发出来的?如何用桌上的彩色铅笔做出生动的描述?桌上电脑萤幕中的程式码是什么?甚至还能问他刚刚是否有看到使用者的眼镜,Gemini也能流畅且迅速的回答出使用者眼镜就放在刚刚桌上有著红色苹果的位置。

可以直接透过镜头询问Gemini。翻摄Google YouTube。
可以直接透过镜头询问Gemini。翻摄Google YouTube。

Gemini加入了影片制作功能-Veo,透过指令的输入能生成长达1分钟的高画质AI影片,并预告近期会开放。

在Google搜寻方面,Gemini加入对多个单字解读能力,例如可以在Google搜寻中输入请他设计7天健康自己做的菜单、附近亲子友善、宠物友善餐厅等,「Ask Videos」,则是加入了镜头协助辨识,例如相机坏了,就能直接开启镜头对著坏掉的相机问Gemini为什么相机的这边坏掉,Gemini就会进行搜寻后回答你可能的原因与解决的方式。 

为了提供更加个人化的体验,Gemini Advanced订阅者很快就能建立自订版的Gemini-Gem。用户可以根据自己的需求,像是个人专属的健身伙伴、厨房助手、编写程式码的搭挡,甚或是创意写作的导师等等来打造出自己风格的Gem。建立Gem的方式非常简单,只需要描述自己希望Gem能完成什么任务,以及想要的回应风格,像是:「你是我的路跑教练,用要正向、乐观和激励的方式来帮我排定每天的慢跑训练计划。」告诉Gemini这些指示后,只需要透过一个点击,它就能延伸这些指令,建立符合你的特定需求的 Gem。

打造专属Gemini个人助理Gem。翻摄Google YouTube。
打造专属Gemini个人助理Gem。翻摄Google YouTube。

Google预告将整合更多Google工具到Gemini里面,包括Google日历、Google Tasks和Google Keep。 部分更新功能也将于即日起对企业客户开放,许多新功能则会于日后陆续推出。

全场共提到了120次「AI」。翻摄Google YouTube。
全场共提到了120次「AI」。翻摄Google YouTube。
延伸閱讀:Google I/O 2024

點擊閱讀下一則新聞 點擊閱讀下一則新聞
中华队明战日本争12强冠军!台北101点灯助阵喝采