RAGFlow 教學:從零快速搭建企業級 RAG 知識庫與本地部署指南

想要打造精準度高、不胡說八道的企業級 AI 助理嗎?以下是 RAGFlow 的完整安裝與本地部署步驟教學,帶你快速上手這款強大的開源工具。

RAGFlow 教學:從零開始建立你的 AI 知識庫

RAGFlow 是一個強大的開源 RAG(檢索增強生成)引擎,旨在幫助企業與開發者輕鬆建立基於大型語言模型 (LLM) 的 AI 知識庫。無論你是開發者、數據研究人員,或是對 AI 應用有興趣的技術愛好者,本篇 RAGFlow 教學都將帶你一步一步完成安裝與配置,打造屬於你自己的智能問答系統。

為什麼企業級 RAG 應用首選 RAGFlow?

在眾多 RAG(Retrieval-Augmented Generation)工具中,RAGFlow 脫穎而出的關鍵在於其獨創的「深度文檔理解 (Deep Document Understanding)」技術。傳統的 RAG 系統在處理 PDF、Word 或 PPT 時,經常因為排版複雜、表格或圖片而導致文字擷取混亂,影響後續 AI 回答的準確性。而 RAGFlow 採用了基於視覺與版面分析的智能分塊(Chunking)機制,能夠精準識別文檔中的標題、段落、表格與圖片關係。這種「高精度的文檔解析技術」,能確保餵給 LLM 的 Context(上下文資料)極其乾淨,從而大幅降低 AI 的幻覺現象(Hallucinations),是目前構建企業私有知識庫最值得信賴的開源方案之一。

在開始進行 RAGFlow 安裝之前,我們建議先了解其基本運行架構,這能幫助你在後續的客製化配置中更加得心應手。

RAGFlow 本地部署與安裝指南

1. 系統要求:

在開始 RAGFlow 教學之前,請先確認你的主機系統符合以下硬體要求,以確保後續 Docker 容器與檢索服務能順利運行:

  • CPU: 至少 4 核心(強烈建議 8 核心以上,以加快文件解析與向量化速度)
  • 記憶體 (RAM): 至少 16 GB(建議 32 GB 以上,特別是當你需要處理大型知識庫或運行本地 embedding 模型時)
  • 磁碟空間: 至少 50 GB(建議使用 NVMe SSD,以顯著提升 Elasticsearch 的讀寫效能)
  • Docker: 版本 24.0.0 或更高
  • Docker Compose: 版本 v2.26.1 或更高

2. 安裝 Docker 和 Docker Compose:

Docker 和 Docker Compose 是運行 RAGFlow 的核心容器化基礎。如果你的伺服器尚未安裝,請參考 Docker 官方文檔 進行安裝。確保 Docker 服務已啟動並設定為開機自啟,這樣才能繼續進行 RAGFlow 安裝的後續步驟。Docker 能夠確保 RAGFlow 及其依賴項(如 Elasticsearch, PostgreSQL, Redis 等)在隔離環境中穩定運作,而 Docker Compose 則讓我們可以透過單一指令一鍵啟動這些多容器服務。

3. 設置系統參數:

由於 RAGFlow 內部整合了高密度的全文檢索與向量檢索組件(基於 Elasticsearch),系統必須調整 Linux 核心參數,否則會因為內存映射(Memory Map)限制而導致資料庫啟動失敗。請確保將 vm.max_map_count 的值設定為不小於 262144:

# 檢查當前系統值
sysctl vm.max_map_count

# 如果小於 262144,請執行此指令暫時啟用
sudo sysctl -w vm.max_map_count=262144

為了讓此配置在系統重啟後依然有效,請編輯 /etc/sysctl.conf 文件,在檔案最末端添加以下內容:

vm.max_map_count=262144

完成這個設定能避免 Elasticsearch 在 RAGFlow 運作時突然崩潰,這是確保系統高可用性(High Availability)的重要一環。

4. 下載 RAGFlow 原始碼:

使用 Git 將 RAGFlow 的官方 GitHub 儲存庫克隆(Clone)到你的本地環境:

git clone https://github.com/infiniflow/ragflow.git

5. 啟動 RAGFlow 伺服器:

進入專案中的 docker 目錄,並利用 Docker Compose 啟動所有相關服務:

cd ragflow/docker
sudo docker-compose -f docker-compose.yml up -d

此操作將會自動下載並啟動 RAGFlow 的核心 Docker 鏡像。請注意,由於整合了多個高階 AI 引擎與資料庫,鏡像檔案較大(約為 1 GB 以上),下載時間取決於您的網路速度。使用 -d 參數可以讓容器在背景(Background)運行,釋放您的終端機視窗。如果您在啟動時遇到錯誤,可以移除 -d 參數來檢視詳細的啟動日誌(Log)。

6. 檢查服務器狀態:

您可以使用以下指令即時監控 RAGFlow 的伺服器日誌,確認所有初始化腳本是否順利執行:

docker logs -f ragflow-server

當終端機出現以下訊息時,代表您的 RAGFlow 伺服器已成功啟動並準備就緒:

* Running on all addresses (0.0.0.0)
* Running on http://127.0.0.1:9380
* Running on http://x.x.x.x:9380
INFO:werkzeug:Press CTRL+C to quit

7. 訪問 RAGFlow 網頁控制台:

打開瀏覽器並輸入伺服器的 IP 地址,即可進入 RAGFlow 直覺友好的 Web UI 介面。在預設配置下,HTTP 服務端口為 80。如果您是在本機測試 RAGFlow,直接瀏覽 http://localhost 即可。若是部署在雲端 VM,請確保您的防火牆已開放對應的端口(如 9380 或 80),以便順利連線。

8. 配置 RAGFlow 整合 LLM:

要讓 RAGFlow 開始進行推理問答,我們需要為其接入大語言模型。在 service_conf.yaml 檔案中,將 user_default_llm 設定為你偏好的 LLM 供應商(例如 OpenAI、Anthropic 或本地運行的 Ollama),並在 API_KEY 欄位填寫你的 API 金鑰。RAGFlow 的優勢在於其優異的兼容性,它不僅支援 GPT-4、Claude 3 等主流雲端 API,也能完美對接本地部署的 Llama 3 或是 Mistral,實現完全私有化的數據安全閉環。

9. 開始構建你的第一個 AI 知識庫:

完成上述部署與模型配置後,恭喜你!你已經成功建立了自己的 RAGFlow 系統。現在你可以登入後台,創建第一個專屬知識庫,並上傳 PDF、Markdown 或 txt 文件。RAGFlow 將自動進行高精度的文檔解析,讓你一鍵開啟高準確度的 AI 智能對話。

本篇 RAGFlow 教學旨在幫助你跨出本地部署的第一步。如果在安裝過程中遇到任何架構或調優問題,建議造訪 RAGFlow 官方中文文檔 獲取最新的社群支援與更新資訊。祝你的 AI 知識庫建置順利!


蔡正信-數位教練

我是一位專精於數位轉型與AI應用的教練,致力於協助中高齡族群與企業主有效運用科技工具提升生產力。

蔡教練聯繫方式:https://rdcoach.pse.is/62uqz2

手機:0988-515-413

Line官方帳號2.0 : @rd.coach https://lin.ee/n4T9CGA
群英企業管理顧問股份有限公司
資訊顧問電子郵件:[email protected]

跨代際溝通 × AI賦能教學:
結合AI應用、數位工具教學與熟齡學習經驗,專注於中高齡與中小企業的數位轉型輔導,擅長從0到1建構數位素養。

實戰導向 × 客製培訓:
15年數位教學經驗,服務鴻海、1111人力銀行、台南大學、瓦城集團等,設計實用導向的教學模組,強調易學、可複製。

工具整合 × 工作流設計:
善用Evernote、Heptabase、Telegram等多款工具,打造AI第二大腦與一元筆記系統,協助學員從資訊收集到知識轉化。

行動導向 × 教學有感:
500+場講座與工作坊,專注學員實作與成果回報,推動「數位生活力」與「AI生活實驗室」教學風格。

預見未來 × 實踐智慧:
關注生成式AI與數位倫理發展,推動AI工具於科研、商業、教育場域的實作應用,擘劃AI助理與智慧工作未來藍圖。

Share:

More Posts