RAGFlow 教學:輕鬆打造你的 AI 知識庫 (完整安裝與配置指南)

以下是 RAGFlow 的完整安裝步驟:

RAGFlow 教學:從零開始建立你的 AI 知識庫

RAGFlow 是一個強大的開源工具,讓你能夠輕鬆建立基於大型語言模型 (LLM) 的 AI 知識庫。無論你是開發者、研究人員,或是對 AI 應用有興趣的愛好者,本篇 RAGFlow 教學都將帶你一步一步完成安裝與配置,打造屬於你自己的智能應用。 本教學將會深入探討 RAGFlow 的各個環節,讓你可以更了解 RAGFlow 的運作,協助你打造客製化的 AI 應用。 在開始之前,我們建議先了解 RAGFlow 的基本概念,包含 RAG (Retrieval-Augmented Generation) 的原理,以便更有效地運用這個工具。

1. 系統要求:

在開始 RAGFlow 教學之前,請先確認你的系統符合以下要求,以確保順利安裝與運行:

  • CPU: 至少 4 核心(建議 8 核心以上以獲得更佳效能)
  • 內存: 至少 16 GB(建議 32 GB 以上,特別是處理大型知識庫時)
  • 磁碟空間: 至少 50 GB(建議使用 SSD 以加快讀寫速度)
  • Docker: 版本 24.0.0 或更高
  • Docker Compose: 版本 v2.26.1 或更高

2. 安裝 Docker 和 Docker Compose:

Docker 和 Docker Compose 是 RAGFlow 運行的基礎。 如果尚未安裝,請參考 Docker 官方文檔 進行安裝。 確保 Docker 運行正常,才能繼續進行 RAGFlow 教學的後續步驟。Docker 是一個容器化平台,能夠將應用程式及其依賴項封裝在一個獨立的環境中,方便部署和管理。 Docker Compose 則是用於定義和管理多個 Docker 容器的工具,讓我們可以輕鬆地啟動、停止和擴展應用程式。

3. 設置系統參數:

為了確保 RAGFlow 能夠正常運行,需要調整系統參數。 確保 vm.max_map_count 的值不小於 262144:

# 檢查當前值
sysctl vm.max_map_count

# 如果小於 262144,設置為 262144
sudo sysctl -w vm.max_map_count=262144

為使該設置在重啟後仍然有效,請編輯 /etc/sysctl.conf 文件,添加以下內容:

vm.max_map_count=262144

這個參數調整主要是為了避免 Elasticsearch 在 RAGFlow 中運行時可能出現的內存映射錯誤。 Elasticsearch 需要大量的內存映射空間,因此提高 vm.max_map_count 的值可以確保其正常運行。 如果沒有正確設定這個參數,可能會導致 Elasticsearch 無法啟動,進而影響 RAGFlow 的功能。

4. 下載 RAGFlow:

克隆 RAGFlow 的 GitHub 儲存庫:

git clone https://github.com/infiniflow/ragflow.git

5. 啟動服務器:

進入 docker 目錄,使用 Docker Compose 啟動服務器:

cd ragflow/docker
sudo docker-compose -f docker-compose.yml up -d

此操作將下載並啟動 RAGFlow 的 Docker 映像。請注意,映像大小約為 1 GB,下載可能需要一些時間。 啟動過程中,Docker Compose 會自動下載所需的 Docker 映像,並建立必要的網絡和卷。 使用 -d 參數可以在後台運行 Docker 容器,讓你可以繼續進行其他操作。 如果你想要查看啟動過程中的詳細信息,可以省略 -d 參數,讓 Docker Compose 在前台運行。

6. 檢查服務器狀態:

查看服務器日誌,確保其成功啟動:

docker logs -f ragflow-server

當看到以下信息時,表示服務器已成功啟動:

* Running on all addresses (0.0.0.0)
* Running on http://127.0.0.1:9380
* Running on http://x.x.x.x:9380
INFO:werkzeug:Press CTRL+C to quit

7. 訪問 RAGFlow:

在瀏覽器中輸入服務器的 IP 地址,即可訪問 RAGFlow 的網頁界面。如果未更改配置,默認 HTTP 服務端口為 80。 如果你是在本地運行 RAGFlow,可以使用 http://localhosthttp://127.0.0.1 訪問。 如果你是在遠程服務器上運行,需要將 x.x.x.x 替換為服務器的實際 IP 地址。 確保防火牆沒有阻止對 9380 端口的訪問,否則可能無法正常訪問 RAGFlow 的網頁界面。

8. 配置 LLM:

service_conf.yaml 文件中,設置 user_default_llm 為所選的大型語言模型(LLM)工廠,並在 API_KEY 欄位填寫相應的 API 密鑰。RAGFlow 支援多種 LLM,例如 OpenAI 的 GPT 系列、Google 的 PaLM 系列等。 你需要根據你選擇的 LLM,申請相應的 API 密鑰,並將其填寫到 service_conf.yaml 文件中。 正確配置 LLM 是 RAGFlow 能夠正常工作的關鍵,否則 RAGFlow 將無法與 LLM 進行交互,也就無法進行 AI 對話。

9. 開始使用:

完成上述步驟後,您即可開始使用 RAGFlow,創建知識庫,並進行 AI 對話。 現在,你可以開始嘗試匯入你的資料,並開始探索 RAGFlow 的強大功能。 這份 RAGFlow 教學希望能幫助你順利開始使用 RAGFlow。 在使用過程中,如果遇到任何問題,可以參考 RAGFlow 的官方文檔,或是在社群中尋求協助。 祝你使用愉快!

如需更多詳細信息,請參閱 RAGFlow 的官方文檔

蔡正信-數位教練

我是一位專精於數位轉型與AI應用的教練,致力於協助中高齡族群與企業主有效運用科技工具提升生產力。

蔡教練聯繫方式:https://rdcoach.pse.is/62uqz2

手機:0988-515-413

Line官方帳號2.0 : @rd.coach https://lin.ee/n4T9CGA
群英企業管理顧問股份有限公司
資訊顧問電子郵件:[email protected]

跨代際溝通 × AI賦能教學:
結合AI應用、數位工具教學與熟齡學習經驗,專注於中高齡與中小企業的數位轉型輔導,擅長從0到1建構數位素養。

實戰導向 × 客製培訓:
15年數位教學經驗,服務鴻海、1111人力銀行、台南大學、瓦城集團等,設計實用導向的教學模組,強調易學、可複製。

工具整合 × 工作流設計:
善用Evernote、Heptabase、Telegram等多款工具,打造AI第二大腦與一元筆記系統,協助學員從資訊收集到知識轉化。

行動導向 × 教學有感:
500+場講座與工作坊,專注學員實作與成果回報,推動「數位生活力」與「AI生活實驗室」教學風格。

預見未來 × 實踐智慧:
關注生成式AI與數位倫理發展,推動AI工具於科研、商業、教育場域的實作應用,擘劃AI助理與智慧工作未來藍圖。

Share:

More Posts