Gemini 2.0 推出 | 深層學習突破性的多模態AI模型

Gemini 2.0 是目前最強大的多模態AI模型,可支援全新類型的AI代理,讓其具備視覺、聽覺及多步驟推理能力。該模型的核心應用包括 Project AstraProject Mariner,這些研究原型展示了通用AI助理的潛力。

主要特點:

  1. 多模態感知與記憶
    Gemini 2.0 可即時分析周遭環境。例如,當被問及一座雕塑時,AI能辨識其為「My World and Your World」,並提供藝術家Eva Rothschild的背景及作品主題。
  2. 多語言切換能力
    該系統支持多語言對話,能無縫切換語言,如用法語及泰米爾語進行互動,提供多元文化背景資訊。
  3. 多步驟任務處理
    Project Mariner 展示了AI在執行複雜任務中的能力,例如搜尋藝術家資料、找到相關畫作並購買所需的材料,確保用戶始終掌控過程。
  4. 虛擬與物理世界應用
    AI能分析遊戲中的基地佈局並提供攻擊策略,或應用於機器人,協助日常生活中的物理操作,如理解3D空間及物件的關係。

Gemini 2.0 展示了跨領域應用的可能性,為下一代多模態AI代理鋪平了道路。了解更多詳情,請訪問 deepmind.google/gemini

Share:

More Posts