OpenAI 推出新工具助力開發者構建 AI 代理

https://openai.com/index/new-tools-for-building-agents

Summary

今天,OpenAI推出了一系列新工具和API,旨在幫助開發者輕鬆構建可靠且有用的代理系統。這些新工具包括網頁搜索工具、文件搜索工具和計算機使用工具,並且引入了新的響應API,以支持多步驟工作流程和多模態理解。這些工具將使開發者能夠更高效地創建各種應用,從個人助理到客戶支持系統。

Highlights

  • 🌐 網頁搜索工具:允許模型訪問互聯網信息,提供最新和準確的回應,並且在Simple QA基準測試中達到90%的高分。
  • 📄 文件搜索工具:支持上傳和篩選文件,並提供直接搜索端點,方便開發者快速獲取私有數據。
  • 💻 計算機使用工具:使開發者能夠控制運行中的計算機,包括虛擬機和舊版應用程序,從而自動化任務。
  • 🔄 響應API:支持多步驟和多工具調用,為開發者提供靈活的API設計,簡化複雜應用的構建過程。
  • 🛠️ 代理SDK:全新設計的SDK支持多代理協作,簡化開發流程,並允許開發者分離業務邏輯以便於測試。

keyword #OpenAI #API #代理系統

OpenAI 於 2025 年 3 月 11 日推出了全新的 Responses API 與 Agents SDK,旨在協助開發者更高效地構建 AI 代理應用。

Responses API:

此 API 結合了 Chat Completions API 的簡潔性與 Assistants API 的工具使用功能,為開發者提供了一個靈活的平台來構建代理應用。通過單次 Responses API 調用,開發者可以利用多種工具和模型迭代來解決日益複雜的任務。 

內置工具:

網頁搜尋(Web Search): 允許代理從網路上獲取最新資訊,並提供清晰且相關的引用來源。在 Responses API 中,使用 gpt-4o 和 gpt-4o-mini 時,網頁搜尋可作為工具使用,並可與其他工具或函數調用結合使用。 

文件搜尋(File Search): 使代理能夠從大量文件中檢索相關資訊,支持多種文件類型,並具備查詢優化、元數據過濾和自定義重新排序功能,從而提供快速、準確的搜索結果。 

電腦操作(Computer Use): 使代理能夠在電腦上執行任務,捕獲模型生成的鼠標和鍵盤操作,並將這些操作轉化為可執行的命令,以實現電腦操作任務的自動化。 

Agents SDK:

OpenAI 同時推出了開源的 Agents SDK,旨在簡化多代理工作流的編排。該 SDK 提供了易於配置的代理、智能交接、安全防護以及跟蹤與可觀測性等功能,幫助開發者高效地管理和協調多個代理之間的協作。 

這些新工具的推出,標誌著 OpenAI 在協助開發者和企業構建實用且可靠的 AI 代理方面邁出了重要一步。未來,OpenAI 將繼續投資於更深入的 API 集成和新工具的開發,以幫助在生產環境中部署、評估和優化代理。

相關連結:

Share:

More Posts