網站客服機器人怎麼建？Markdown vs RAG 知識庫架構實戰對比｜開發工具箱 6

前言

想幫自己的網站加一個 智能客服機器人，很多人第一個反應是去查「RAG 怎麼建」——向量資料庫、embedding、Supabase……看完就放棄了。但其實，你不一定要從 RAG 開始。

這篇是工具箱開發系列第六篇，要對比的是兩種最常見的知識庫架構：用 Markdown 文件直接當知識庫，以及用 RAG（檢索增強生成）做向量搜尋。這兩種方法在同一個工具箱裡並存——工具箱的說明機器人用 Markdown，AI 小編功能用 RAG——正好可以用真實的工程決策來對照。

除了比較兩種架構，這篇也會說明是怎麼做出來的：Claude Code 負責哪段、Groq 是什麼、提示詞怎麼設計。目標讀者是對 AI 自動化有興趣、玩過 Claude Code 或 n8n、但還不確定自己能不能做更複雜東西的人。如果你已經確定想建一套 智能客服 系統，或想先了解完整的 RAG 智能機器人 規劃方式，也可以從這裡開始。

為什麼知識庫的設計決定了智能客服機器人的上限

AI 回答不準的真正原因不是模型太弱

很多人在建 AI 機器人的時候，把大部分時間花在選模型、調參數、優化回應速度——但最後影響使用者體驗的，往往不是這些。同樣用 Claude 或 GPT-4，一個沒有知識庫的機器人只能靠模型的通識知識亂猜，一個有完整知識庫的機器人可以精準回答你的產品細節。模型的能力是上限，知識庫的品質才是日常表現的地板。

換句話說：如果你的機器人一直給出模糊或錯誤的答案，九成的問題不是模型不夠強，而是你給它的知識不夠準確或不夠完整。這個認知是建好智能客服機器人的第一步。

九個功能、使用者不知道從哪裡開始問

工具箱有文章上架工具、GSC 排名查詢、部落格文章生成、社群貼文追蹤、AI 小編、財務發票管理、訂閱費用監控……九個以上的功能模組，每個都有自己的操作邏輯和限制。對第一次進來的使用者，這個數量有點壓倒性——他們不知道「我現在遇到的問題要用哪個工具」，也不知道某個步驟卡住了要怎麼辦。

文件寫得再完整，使用者也懶得從頭讀。他們需要的是一個可以直接問的對象，一問一答，比手冊快。說明機器人存在的理由就是這個：讓使用者不用自己找文件，有問題直接問，它對照知識庫給答案。

整體架構：三個工具各自在做什麼

Claude Code——從聊天介面到後端一起做

Claude Code 負責把整個聊天機器人做出來。包含右下角可以展開的聊天視窗、訊息泡泡的排版、打字等待動畫、送出和接收的邏輯，還有後端接 AI 模型的那段程式。我把需求說清楚，Claude Code 從介面到後端一起實作，不需要自己寫任何一行程式碼。

這也是 vibe coding 的核心：我的工作是說清楚「這個機器人要長什麼樣、要做什麼事」，Claude Code 負責把它實現。遇到問題就描述問題，讓它想辦法，不需要自己去查語法。

Groq——為什麼聊天機器人要選速度快的 AI

Groq 是 AI 模型的提供方。很多人熟悉 Claude 或 ChatGPT，但 Groq 在這個場景有一個很明顯的優勢：速度。Groq 用自研晶片跑開源 AI 模型（這個專案用的是 Llama 3.3 70B），回應速度明顯比一般雲端 AI 快。

聊天機器人的使用者體驗裡，等待時間是最容易讓人放棄的環節。如果回覆要等超過兩三秒，使用者心理上就開始覺得怪，繼而放棄對話。選 Groq 是為了讓回覆感覺「幾乎是即時的」，而不是讓使用者盯著三個跳點等很久。如果你的應用對準確度要求更高、可以接受稍慢的速度，換用 Claude API 也完全可以，架構不需要改，換一個 API key 就好。

知識庫——把知識和 AI 分開管理

知識庫是這套系統的靈魂，也是這篇文章的重點。整個機器人的架構可以理解成：AI 是一個會說話的引擎，知識庫是它的油箱——引擎再好，油箱空了就跑不動。

把知識和 AI 分開管理有一個很重要的好處：你的知識更新了，不需要重新訓練模型，不需要重新部署系統，只需要更新知識庫，下一個問問題的使用者就立刻得到更新後的答案。這個設計讓維護成本變得非常低，也讓非技術背景的人可以自己維護機器人的知識內容。

Markdown vs RAG——兩種知識庫做法的完整對比

方法一：Markdown 文件怎麼當知識庫

Markdown 做法的核心概念很直覺：把你的知識寫成一份純文字文件，每次使用者問問題，系統就把這整份文件加上使用者的問題一起送給 AI，讓 AI 在「讀過這份說明書」的狀態下回答。

工具箱說明機器人用的就是這個做法。有一份叫做 CHATBOT.md 的文件，裡面是每個工具的功能說明、操作步驟、常見問題。每次對話，整份文件都會被帶進去當作 AI 的背景知識。

Markdown 做法的優點：

零額外基礎設施：不需要向量資料庫、不需要 embedding 服務、不需要額外帳號
維護成本極低：有新功能就加一個段落，存檔後立即生效，不需要重新部署
可讀性高：任何人都能直接打開文件來讀和編輯，不需要技術背景
快速起步：從零到機器人可以回答問題，整個建置可能不到兩小時

Markdown 做法的限制：

知識量有上限：AI 模型每次能接收的文字有長度限制（context window），文件太長就必須截斷
無法精準查段落：整份文件一次全部送進去，AI 需要自己從幾千字裡判斷哪段最相關
沒有語意搜尋：只靠文字匹配，問「月費監控」找不到「訂閱費用」這種語意相近但詞彙不同的段落

方法二：RAG 架構怎麼運作

RAG（Retrieval-Augmented Generation，檢索增強生成）的核心思想是：不要把整份知識庫一次全部塞給 AI，而是先讓機器搜尋出「最相關的那幾段」，再把這幾段帶去讓 AI 回答。

這個流程分三個步驟。第一步：知識先被「向量化」——把文字轉成數值格式（embedding），讓電腦能計算語意上的相似度，而不只是文字匹配。第二步：向量資料存進向量資料庫（例如 Supabase）。第三步：每次使用者問問題，系統先把問題也向量化，去資料庫找最相近的幾個段落，只帶著這些段落去問 AI。

工具箱的 AI 小編功能就是這樣設計的：每個客戶可以上傳品牌資料的 PDF，系統用 Google Gemini Embeddings 把文件向量化、存進 Supabase Vector Store，AI 在生成貼文時能精準查詢品牌知識。這套 RAG 架構和說明機器人的 Markdown 做法在同一個工具箱裡並存。

RAG 做法的優點：

可以處理大量知識：不受 context window 限制，幾萬字、幾十萬字的文件都可以
精準段落匹配：只帶入最相關的幾段，而不是整份文件，AI 的回答更聚焦
語意搜尋能力：能找到詞彙不同但語意相關的內容，覆蓋範圍更廣
適合多文件場景：多個客戶、多個產品線的知識可以共存，查詢時自動過濾

RAG 做法的代價：

需要額外基礎設施：向量資料庫的帳號和設定
建置更複雜：需要 embedding 模型、向量化流程、查詢邏輯，在 n8n 裡要接更多節點
更新流程較繁瑣：新增知識不是改文件就好，需要重新跑向量化流程存進資料庫
維護成本更高：多一層基礎設施就多一個可能出錯的地方

對比表格：兩種架構的關鍵差異一覽

比較項目	Markdown 文件	RAG 架構
知識量上限	受 context window 限制	幾乎無上限
建置難度	低，一份文件就能啟動	中高，需向量資料庫與 embedding
更新方式	直接編輯文件，立即生效	需重新向量化並更新資料庫
搜尋方式	整份文件一起送，AI 自行判斷	語意搜尋，只帶最相關段落
維護成本	低，文字編輯即可	較高，多一層基礎設施
適合情境	知識量小、更新頻繁、快速起步	知識量大、多文件、需精準匹配

什麼條件下需要從 Markdown 升級到 RAG

升級的判斷不是「RAG 比 Markdown 更專業所以要用 RAG」，而是看你的知識量和使用情境是否已經超出 Markdown 能負荷的範圍。以下三個條件出現任何一個，就是升級的訊號：

第一：知識量超過單一文件容量。當 CHATBOT.md 長到超過幾萬字，AI 開始因為文件被截斷而找不到對的資訊，回答變模糊，這時候 RAG 的分段查詢就開始有意義。

第二：需要查詢多份獨立文件。如果每個客戶、每個產品有自己的知識庫，用 Markdown 就需要維護很多份文件，且無法跨文件查詢。RAG 的向量資料庫可以把多份文件統一存進去，查詢時自動找到對的那份。

第三：搜尋準確度明顯下降。當使用者反映「問了但沒得到對的答案」，而你確認答案其實在文件裡，通常是 AI 在長文件裡找錯了段落。RAG 的精準段落匹配可以解決這個問題。

提示詞設計——讓智能客服只說它該說的話

System Prompt 的兩個組成部分

不管用 Markdown 還是 RAG，知識庫只是原料，提示詞（system prompt）才是決定機器人「個性和邊界」的地方。提示詞結構分兩個部分：第一部分是知識內容，也就是 Markdown 文件的全文，或 RAG 查詢出來的相關段落；第二部分是行為規則，告訴 AI 怎麼使用這份知識。

很多人只設計第一部分，忽略了第二部分。結果機器人雖然有知識，但回答方式、語氣、邊界都不受控，使用者體驗就很不穩定。行為規則是讓機器人在設計意圖範圍內穩定運作的保護機制。

四個不可缺少的行為規則

工具箱說明機器人的提示詞裡，行為規則包含以下四條：

語言和語氣：全程繁體中文、口語化說明、不說程式術語。這條規則讓機器人的回答對行銷背景的使用者友善，不會突然冒出「API endpoint」或「localStorage」這種詞。目標受眾是誰，語氣就往誰靠。

回答長度：以 1–3 句為主，不給不必要的廢話。聊天機器人的場景裡，使用者想要的是快速確認，不是閱讀一篇文章。長篇大論反而讓人找不到重點。

知識邊界：如果文件裡沒有相關資訊，說「這個細節我不確定，建議詢問管理員」，不亂猜。這條規則防止 AI 在知識庫沒覆蓋的地方自行發揮，產生聽起來有道理但其實錯誤的資訊。

範疇限制：問題超出工具箱範疇時，禮貌說明只負責這個主題。避免使用者把它當成通用 AI 助理使用，偏離設計目的，也避免機器人「越界」給出你無法負責的回答。

這件事 Markdown 和 RAG 都一樣需要做好

RAG 解決的是「找到對的知識」這個問題，提示詞解決的是「怎麼用這個知識回答」這個問題。兩者是不同層次的問題，不能互相取代。

即使你把整個知識庫都用 RAG 搭好，如果行為規則沒設計清楚，機器人還是可能給出語氣不對、範圍太廣、或者該說「不確定」卻硬要回答的問題。先把提示詞設計好，再去選知識庫架構，比顛倒過來更有效率。

人化視角——同一個工具箱裡並存的兩套架構

為什麼說明機器人先選 Markdown

做工具箱的時候，我一開始有考慮過直接用 RAG——AI 小編功能已經有一套 Supabase + Gemini 的 RAG 流程在跑，把同樣的架構複製過來感覺是最「標準」的做法。

但我停下來想了一下：說明機器人的知識庫是幾千字的工具說明，不是幾萬字的品牌文件。用 RAG 在這個規模上，查詢精準度的提升微乎其微，但維護複雜度直接翻倍——每次更新說明，不只要改文字，還要重新跑 embedding、確認向量資料庫同步。這個代價不值得。

我把這個判斷描述給 Claude Code，它幫我確認：CHATBOT.md 目前的大小遠低於 Groq 模型的 context window，直接放進系統提示詞沒有截斷問題。確認之後選了 Markdown，快速驗證機器人的實用性，等知識量真的長到一個程度再升級。

什麼條件會觸發升級

目前決定「什麼時候升級 RAG」的判斷標準只有一個：Markdown 開始出現可以量化的問題——使用者反映答案找不到、文件開始被截斷、或者需要跨多個客戶查詢知識。在這之前，繼續用 Markdown 就好。

工具箱裡已經有 RAG 的實作可以直接參考，升級的時候不是從零開始，是把現有架構複製過來調整。這讓「升級」這件事的成本比想像中低，也讓「先用簡單的做法快速驗證」這個策略更值得採用。技術選型的最高原則不是選最先進的，而是選現在規模最合適的。

常見問題 FAQ

Q1：我沒有工程師背景，Markdown 這種做法做得到嗎？

完全做得到。Markdown 文件就是純文字，你不需要會任何程式語言就能編輯它；聊天介面是 Claude Code 幫你做出來的，不需要自己寫；Groq 的設定只需要一個 API key，申請後填入環境變數就好。整個流程裡，你唯一需要投入時間的是「把你的產品說清楚」——這件事不需要技術背景，需要的是你對自己產品的了解。

Q2：Markdown 和 RAG，我應該從哪個開始？

如果你的知識庫在幾千字以內、更新頻繁、想快速驗證機器人有沒有用，從 Markdown 開始。如果你的知識量已經超過一份文件能容納、需要查詢多份文件、或者需要精準的語意搜尋，才考慮 RAG。不要因為「RAG 看起來比較專業」就從 RAG 開始——先驗證你的知識庫設計方向是對的，再決定要不要升級架構。

Q3：提示詞要怎麼設計才不會讓機器人亂回答？

提示詞裡至少要包含四件事：語言和語氣的設定（目標受眾是誰就往誰靠）、回答長度的限制（聊天機器人不需要長篇大論）、知識邊界的定義（文件裡沒有的就說不確定，不要亂猜）、以及範疇限制（超出設計目的的問題禮貌拒絕）。這四條規則寫清楚，機器人的行為就會穩定很多。

Q4：知識庫更新後，機器人多久會知道？

用 Markdown 做法的話，更新完文件存檔，下一個問問題的使用者馬上就得到新答案，系統每次都是即時讀取文件，不需要重新部署。如果是 RAG 架構，更新後需要重新跑 embedding、把新的向量資料存進資料庫才會生效，通常是幾分鐘的流程。兩者的更新速度差距在大多數使用情境下不是決定性因素，選架構還是要回到知識量和搜尋精準度的需求。

Q5：Groq 是什麼？和 Claude API 或 ChatGPT 差在哪裡？

Groq 是一家做 AI 推理加速的公司，用自研晶片跑開源 AI 模型（例如 Meta 的 Llama 系列），速度比一般雲端 GPU 明顯更快。和 Claude API 或 OpenAI 的差別在於：Claude 和 GPT 是各家自己的閉源模型，Groq 跑的是開源模型，通常更便宜、速度更快，但在複雜推理任務上可能稍弱。聊天客服這種有固定知識範疇的應用，Groq 的速度優勢很值得利用。

總結

Markdown 還是 RAG，本質上不是技術優劣的選擇，而是規模與需求的判斷。知識量小、更新頻繁、想快速驗證，Markdown 是最低摩擦的起點；知識量大、需要跨文件搜尋、對精準度有高要求，RAG 才發揮它的價值。兩者是升級關係，不是替代關係——從 Markdown 開始，等遇到 Markdown 解決不了的問題，再升級 RAG。

整個開發過程，從聊天介面到後端 API，全部是 Claude Code 做的，沒有自己寫任何一行程式。知識庫是一份 Markdown 文件，維護它的人不需要任何技術背景，只需要把產品說清楚。建智能客服機器人最難的不是選架構，而是把你的知識整理成 AI 能準確使用的格式——這件事根本不需要寫程式。

下一篇會繼續分享工具箱的其他功能，包含訂閱費用監控的設計思路。

想了解更多 AI 工具與 n8n 實務應用結合，歡迎參考官方網站：https://aiqkangber.com/