Gemini 2.0 是目前最強大的多模態AI模型,可支援全新類型的AI代理,讓其具備視覺、聽覺及多步驟推理能力。該模型的核心應用包括 Project Astra 和 Project Mariner,這些研究原型展示了通用AI助理的潛力。
主要特點:
- 多模態感知與記憶
Gemini 2.0 可即時分析周遭環境。例如,當被問及一座雕塑時,AI能辨識其為「My World and Your World」,並提供藝術家Eva Rothschild的背景及作品主題。 - 多語言切換能力
該系統支持多語言對話,能無縫切換語言,如用法語及泰米爾語進行互動,提供多元文化背景資訊。 - 多步驟任務處理
Project Mariner 展示了AI在執行複雜任務中的能力,例如搜尋藝術家資料、找到相關畫作並購買所需的材料,確保用戶始終掌控過程。 - 虛擬與物理世界應用
AI能分析遊戲中的基地佈局並提供攻擊策略,或應用於機器人,協助日常生活中的物理操作,如理解3D空間及物件的關係。
Gemini 2.0 展示了跨領域應用的可能性,為下一代多模態AI代理鋪平了道路。了解更多詳情,請訪問 deepmind.google/gemini。