想要打造精準度高、不胡說八道的企業級 AI 助理嗎?以下是 RAGFlow 的完整安裝與本地部署步驟教學,帶你快速上手這款強大的開源工具。
RAGFlow 教學:從零開始建立你的 AI 知識庫
RAGFlow 是一個強大的開源 RAG(檢索增強生成)引擎,旨在幫助企業與開發者輕鬆建立基於大型語言模型 (LLM) 的 AI 知識庫。無論你是開發者、數據研究人員,或是對 AI 應用有興趣的技術愛好者,本篇 RAGFlow 教學都將帶你一步一步完成安裝與配置,打造屬於你自己的智能問答系統。
為什麼企業級 RAG 應用首選 RAGFlow?
在眾多 RAG(Retrieval-Augmented Generation)工具中,RAGFlow 脫穎而出的關鍵在於其獨創的「深度文檔理解 (Deep Document Understanding)」技術。傳統的 RAG 系統在處理 PDF、Word 或 PPT 時,經常因為排版複雜、表格或圖片而導致文字擷取混亂,影響後續 AI 回答的準確性。而 RAGFlow 採用了基於視覺與版面分析的智能分塊(Chunking)機制,能夠精準識別文檔中的標題、段落、表格與圖片關係。這種「高精度的文檔解析技術」,能確保餵給 LLM 的 Context(上下文資料)極其乾淨,從而大幅降低 AI 的幻覺現象(Hallucinations),是目前構建企業私有知識庫最值得信賴的開源方案之一。
在開始進行 RAGFlow 安裝之前,我們建議先了解其基本運行架構,這能幫助你在後續的客製化配置中更加得心應手。
RAGFlow 本地部署與安裝指南
1. 系統要求:
在開始 RAGFlow 教學之前,請先確認你的主機系統符合以下硬體要求,以確保後續 Docker 容器與檢索服務能順利運行:
- CPU: 至少 4 核心(強烈建議 8 核心以上,以加快文件解析與向量化速度)
- 記憶體 (RAM): 至少 16 GB(建議 32 GB 以上,特別是當你需要處理大型知識庫或運行本地 embedding 模型時)
- 磁碟空間: 至少 50 GB(建議使用 NVMe SSD,以顯著提升 Elasticsearch 的讀寫效能)
- Docker: 版本 24.0.0 或更高
- Docker Compose: 版本 v2.26.1 或更高
2. 安裝 Docker 和 Docker Compose:
Docker 和 Docker Compose 是運行 RAGFlow 的核心容器化基礎。如果你的伺服器尚未安裝,請參考 Docker 官方文檔 進行安裝。確保 Docker 服務已啟動並設定為開機自啟,這樣才能繼續進行 RAGFlow 安裝的後續步驟。Docker 能夠確保 RAGFlow 及其依賴項(如 Elasticsearch, PostgreSQL, Redis 等)在隔離環境中穩定運作,而 Docker Compose 則讓我們可以透過單一指令一鍵啟動這些多容器服務。
3. 設置系統參數:
由於 RAGFlow 內部整合了高密度的全文檢索與向量檢索組件(基於 Elasticsearch),系統必須調整 Linux 核心參數,否則會因為內存映射(Memory Map)限制而導致資料庫啟動失敗。請確保將 vm.max_map_count 的值設定為不小於 262144:
# 檢查當前系統值
sysctl vm.max_map_count
# 如果小於 262144,請執行此指令暫時啟用
sudo sysctl -w vm.max_map_count=262144
為了讓此配置在系統重啟後依然有效,請編輯 /etc/sysctl.conf 文件,在檔案最末端添加以下內容:
vm.max_map_count=262144
完成這個設定能避免 Elasticsearch 在 RAGFlow 運作時突然崩潰,這是確保系統高可用性(High Availability)的重要一環。
4. 下載 RAGFlow 原始碼:
使用 Git 將 RAGFlow 的官方 GitHub 儲存庫克隆(Clone)到你的本地環境:
git clone https://github.com/infiniflow/ragflow.git
5. 啟動 RAGFlow 伺服器:
進入專案中的 docker 目錄,並利用 Docker Compose 啟動所有相關服務:
cd ragflow/docker
sudo docker-compose -f docker-compose.yml up -d
此操作將會自動下載並啟動 RAGFlow 的核心 Docker 鏡像。請注意,由於整合了多個高階 AI 引擎與資料庫,鏡像檔案較大(約為 1 GB 以上),下載時間取決於您的網路速度。使用 -d 參數可以讓容器在背景(Background)運行,釋放您的終端機視窗。如果您在啟動時遇到錯誤,可以移除 -d 參數來檢視詳細的啟動日誌(Log)。
6. 檢查服務器狀態:
您可以使用以下指令即時監控 RAGFlow 的伺服器日誌,確認所有初始化腳本是否順利執行:
docker logs -f ragflow-server
當終端機出現以下訊息時,代表您的 RAGFlow 伺服器已成功啟動並準備就緒:
* Running on all addresses (0.0.0.0)
* Running on http://127.0.0.1:9380
* Running on http://x.x.x.x:9380
INFO:werkzeug:Press CTRL+C to quit
7. 訪問 RAGFlow 網頁控制台:
打開瀏覽器並輸入伺服器的 IP 地址,即可進入 RAGFlow 直覺友好的 Web UI 介面。在預設配置下,HTTP 服務端口為 80。如果您是在本機測試 RAGFlow,直接瀏覽 http://localhost 即可。若是部署在雲端 VM,請確保您的防火牆已開放對應的端口(如 9380 或 80),以便順利連線。
8. 配置 RAGFlow 整合 LLM:
要讓 RAGFlow 開始進行推理問答,我們需要為其接入大語言模型。在 service_conf.yaml 檔案中,將 user_default_llm 設定為你偏好的 LLM 供應商(例如 OpenAI、Anthropic 或本地運行的 Ollama),並在 API_KEY 欄位填寫你的 API 金鑰。RAGFlow 的優勢在於其優異的兼容性,它不僅支援 GPT-4、Claude 3 等主流雲端 API,也能完美對接本地部署的 Llama 3 或是 Mistral,實現完全私有化的數據安全閉環。
9. 開始構建你的第一個 AI 知識庫:
完成上述部署與模型配置後,恭喜你!你已經成功建立了自己的 RAGFlow 系統。現在你可以登入後台,創建第一個專屬知識庫,並上傳 PDF、Markdown 或 txt 文件。RAGFlow 將自動進行高精度的文檔解析,讓你一鍵開啟高準確度的 AI 智能對話。
本篇 RAGFlow 教學旨在幫助你跨出本地部署的第一步。如果在安裝過程中遇到任何架構或調優問題,建議造訪 RAGFlow 官方中文文檔 獲取最新的社群支援與更新資訊。祝你的 AI 知識庫建置順利!



