以下是 RAGFlow 的完整安裝步驟:
RAGFlow 教學:從零開始建立你的 AI 知識庫
RAGFlow 是一個強大的開源工具,讓你能夠輕鬆建立基於大型語言模型 (LLM) 的 AI 知識庫。無論你是開發者、研究人員,或是對 AI 應用有興趣的愛好者,本篇 RAGFlow 教學都將帶你一步一步完成安裝與配置,打造屬於你自己的智能應用。 本教學將會深入探討 RAGFlow 的各個環節,讓你可以更了解 RAGFlow 的運作,協助你打造客製化的 AI 應用。 在開始之前,我們建議先了解 RAGFlow 的基本概念,包含 RAG (Retrieval-Augmented Generation) 的原理,以便更有效地運用這個工具。
1. 系統要求:
在開始 RAGFlow 教學之前,請先確認你的系統符合以下要求,以確保順利安裝與運行:
- CPU: 至少 4 核心(建議 8 核心以上以獲得更佳效能)
- 內存: 至少 16 GB(建議 32 GB 以上,特別是處理大型知識庫時)
- 磁碟空間: 至少 50 GB(建議使用 SSD 以加快讀寫速度)
- Docker: 版本 24.0.0 或更高
- Docker Compose: 版本 v2.26.1 或更高
2. 安裝 Docker 和 Docker Compose:
Docker 和 Docker Compose 是 RAGFlow 運行的基礎。 如果尚未安裝,請參考 Docker 官方文檔 進行安裝。 確保 Docker 運行正常,才能繼續進行 RAGFlow 教學的後續步驟。Docker 是一個容器化平台,能夠將應用程式及其依賴項封裝在一個獨立的環境中,方便部署和管理。 Docker Compose 則是用於定義和管理多個 Docker 容器的工具,讓我們可以輕鬆地啟動、停止和擴展應用程式。
3. 設置系統參數:
為了確保 RAGFlow 能夠正常運行,需要調整系統參數。 確保 vm.max_map_count 的值不小於 262144:
# 檢查當前值
sysctl vm.max_map_count
# 如果小於 262144,設置為 262144
sudo sysctl -w vm.max_map_count=262144
為使該設置在重啟後仍然有效,請編輯 /etc/sysctl.conf 文件,添加以下內容:
vm.max_map_count=262144
這個參數調整主要是為了避免 Elasticsearch 在 RAGFlow 中運行時可能出現的內存映射錯誤。 Elasticsearch 需要大量的內存映射空間,因此提高 vm.max_map_count 的值可以確保其正常運行。 如果沒有正確設定這個參數,可能會導致 Elasticsearch 無法啟動,進而影響 RAGFlow 的功能。
4. 下載 RAGFlow:
克隆 RAGFlow 的 GitHub 儲存庫:
git clone https://github.com/infiniflow/ragflow.git
5. 啟動服務器:
進入 docker 目錄,使用 Docker Compose 啟動服務器:
cd ragflow/docker
sudo docker-compose -f docker-compose.yml up -d
此操作將下載並啟動 RAGFlow 的 Docker 映像。請注意,映像大小約為 1 GB,下載可能需要一些時間。 啟動過程中,Docker Compose 會自動下載所需的 Docker 映像,並建立必要的網絡和卷。 使用 -d 參數可以在後台運行 Docker 容器,讓你可以繼續進行其他操作。 如果你想要查看啟動過程中的詳細信息,可以省略 -d 參數,讓 Docker Compose 在前台運行。
6. 檢查服務器狀態:
查看服務器日誌,確保其成功啟動:
docker logs -f ragflow-server
當看到以下信息時,表示服務器已成功啟動:
* Running on all addresses (0.0.0.0)
* Running on http://127.0.0.1:9380
* Running on http://x.x.x.x:9380
INFO:werkzeug:Press CTRL+C to quit
7. 訪問 RAGFlow:
在瀏覽器中輸入服務器的 IP 地址,即可訪問 RAGFlow 的網頁界面。如果未更改配置,默認 HTTP 服務端口為 80。 如果你是在本地運行 RAGFlow,可以使用 http://localhost 或 http://127.0.0.1 訪問。 如果你是在遠程服務器上運行,需要將 x.x.x.x 替換為服務器的實際 IP 地址。 確保防火牆沒有阻止對 9380 端口的訪問,否則可能無法正常訪問 RAGFlow 的網頁界面。
8. 配置 LLM:
在 service_conf.yaml 文件中,設置 user_default_llm 為所選的大型語言模型(LLM)工廠,並在 API_KEY 欄位填寫相應的 API 密鑰。RAGFlow 支援多種 LLM,例如 OpenAI 的 GPT 系列、Google 的 PaLM 系列等。 你需要根據你選擇的 LLM,申請相應的 API 密鑰,並將其填寫到 service_conf.yaml 文件中。 正確配置 LLM 是 RAGFlow 能夠正常工作的關鍵,否則 RAGFlow 將無法與 LLM 進行交互,也就無法進行 AI 對話。
9. 開始使用:
完成上述步驟後,您即可開始使用 RAGFlow,創建知識庫,並進行 AI 對話。 現在,你可以開始嘗試匯入你的資料,並開始探索 RAGFlow 的強大功能。 這份 RAGFlow 教學希望能幫助你順利開始使用 RAGFlow。 在使用過程中,如果遇到任何問題,可以參考 RAGFlow 的官方文檔,或是在社群中尋求協助。 祝你使用愉快!
如需更多詳細信息,請參閱 RAGFlow 的官方文檔。



