AI 為什麼只需要一句指令，它就知道怎麼做？看懂 AI Agent 的推理與規劃能力

前言

你只丟一句「整理本週的客服問題並寄出報告」，AI Agent（像會做報表的 Manus、會寫程式的 Devin）就自己撈資料、分類、產表、寄信，一步步把任務做完，中間沒有一套寫死的腳本。它怎麼知道該這樣做？靠的是兩項核心能力：推理（Reasoning）先想清楚這題要解什麼，規劃（Planning）再把它排成一步步的順序。這篇就講清楚 AI 怎麼想、又怎麼排。

AI Agent 規劃 Planning 能力示意圖：AI 如何知道多步驟任務的下一步要做什麼 — AI 能自己完成多步驟任務，靠的是規劃（Planning）這項能力。

AI 怎麼把「一句話」變成「一連串動作」？

企業客戶第一次看到 AI Agent 自己完成一件多步驟的事，反應幾乎都是「它怎麼自己知道要這樣做？」這也是規劃最神奇、最值得先搞懂的地方。

AI 把一句目標拆成多步驟：撈訂單、篩出逾期、寫提醒信、寄出，這串步驟是 AI 自己補的 — 你給的是一句「目標」，中間那串步驟是 AI 自己補出來的。

你給的是「目標」，它要自己補出「步驟」

你交代的通常是一個結果，例如「把這個月所有逾期未付款的客戶整理出來，發提醒信」。你沒有告訴它「先去資料庫撈訂單、再篩出逾期的、再一封封寫信」這些細節。把一個目標拆成一串可以執行的步驟，這件事就是規劃。它要自己想出中間缺的那些動作。

多步驟任務，才是 AI Agent 跟聊天機器人的分水嶺

只回答一個問題不需要規劃，但「查資料 → 判斷 → 動手 → 再判斷」這種要好幾步、而且後面要看前面結果的任務，就非規劃不可。一般的聊天機器人停在「回你一句」，會規劃的 AI Agent 則能把整件事從頭做到尾。這一步，正是這幾年 AI 從「很會聊」變成「能幹活」的關鍵。

AI 動腦其實有兩層：先「想清楚」，再「排步驟」

標題說的推理和規劃，其實是 AI 動腦時前後接力的兩件事，分清楚它們，後面就好懂了。

推理（Reasoning）：先搞懂「這題到底要解什麼」

推理是想清楚的那一步。你說「把逾期客戶整理出來發信」，AI 得先讀懂：逾期是指付款超過期限、你要的是「整理」加「發信」兩件事、對象是這個月的客戶。它在動手前，先把一句模糊的要求，想成一個清楚的問題，這就是推理在做的事。

規劃（Planning）：把想清楚的事，拆成一步步的順序

想清楚之後，規劃接手，把「要解的問題」拆成可以一條條執行的步驟，再安排先做什麼、後做什麼。推理負責「懂」，規劃負責「排」，兩者接在一起，AI 才知道整件任務該怎麼動。接下來，就來看它實際是怎麼一步步跑的。

AI 決定下一步，靠的是把 LLM 當「推理引擎」

那它具體是怎麼想出下一步的？關鍵在於：它把背後的大型語言模型（LLM）當成一台「推理引擎」，不停地問自己「現在做到哪、接下來該做什麼」。

AI 規劃的推理循環：想、做、看結果、再想，一圈一圈跑到任務完成 — AI 跑一個「想 → 做 → 看結果 → 再想」的循環，每一圈決定下一步。

它跑的是「想 → 做 → 看結果 → 再想」的循環

拆開來看，AI 每一步都在重複同一個循環：先想一下「我現在知道什麼、接下來缺什麼」，然後做一個動作（通常是去呼叫某個工具查資料或執行），再看這個動作的結果，接著根據結果再想下一步。一圈一圈跑下去，直到任務完成。它的「下一步」不是事先寫死的，是每跑完一圈、看過結果才現算出來的。

所以它能應付「沒照劇本走」的狀況

正因為每一步都看著結果決定，它才有辦法處理意外。比方它本來要寄信，結果發現某個客戶的 Email 缺漏，它可以當場決定「先跳過這筆、記錄下來」，而不是整個流程卡死。會看結果再決定，是它跟「寫死的腳本」最大的差別。

AI 規劃有兩種風格：先想好全部，還是邊做邊調整

同樣是規劃，AI 其實有兩種做法，差別在「什麼時候把計畫定下來」。

AI 規劃兩種風格對照：先想好全部 vs 邊做邊調整，用 GPS 比喻路線 — 先想好全部：一次列完所有步驟再做；邊做邊調整：做一步、看結果、再決定下一步。

先想好全部：開工前就把所有步驟列好

第一種是一開始就把大任務拆成完整的步驟清單，然後照著一條條做。它的好處是清楚、好預測，適合那種步驟固定、不太會出意外的任務。缺點是萬一中途狀況跟預想的不一樣，整張計畫就容易卡住。

邊做邊調整：做一步、看結果、再決定下一步

第二種不先把計畫定死，而是做一步、看結果、再決定下一步。這兩種風格的差別，用導航 GPS 來想最清楚：

先想好全部＝出發前算好整條路線，照著開
邊做邊調整＝開到一半遇到塞車，當場重算一條新路

真實任務很少完全照預想走，所以現在比較強的 AI Agent 大多走「邊做邊調整」這種更靈活的方式。

為什麼「邊做邊調整」反而更可靠？

聽起來「先把計畫想周全」應該比較穩，但實際上會邊調整的 AI 往往更靠得住，原因就藏在「計畫趕不上變化」這句老話裡。

因為真實任務總會冒出意外

一個多步驟任務跑到一半，太多事情會跟預想不一樣：要查的資料是空的、某個工具暫時壞了、查出來的結果跟假設相反。如果 AI 死守開工前那張計畫，遇到這些就只能卡住或硬做。會邊做邊調整的 AI 則能看著實際結果重新安排，它靠得住，靠的是隨時能跟著實際狀況修正，計畫一開始完不完美反而其次。我幫客戶做自動處理進貨單的流程時就深有體會：同一份單子，今天庫存夠、明天缺貨，AI 每次都要看當下的庫存才能決定要不要開採購單，根本沒辦法用一張固定流程跑完。

但「會自己調整」不代表「全部放手」

這裡要留意：AI 能自己安排步驟，不代表每一步都該讓它自己拍板。真正會造成後果的步驟（送出採購單、寄信給客戶、動到金額），我都會在流程裡卡一道人工確認，讓 AI 規劃、執行到那一步先停下，由人看過再放行。讓 AI 安排「怎麼做」，但「要不要送出」的決定權留在人手上。步驟越多、越自動，這道關卡越重要。

推理與規劃在 AI Agent 裡扮演什麼角色？

把鏡頭拉遠，推理（Reasoning）和規劃（Planning）是 AI Agent 裡負責「動腦」的兩塊：推理先想清楚要解什麼，規劃再把它排成步驟，然後才交給後面的工具去執行、記憶去記錄。少了這兩塊，AI 就只能做單一動作，沒辦法把一個大任務一路想清楚、再做到完。

AI Agent 全景：推理規劃、觸發、工具呼叫、記憶、流程、反思六元件，本文聚焦推理與規劃 — AI Agent 全景圖：本文聚焦 Reasoning（推理）與 Planning（規劃），其餘元件會在其他文章深入介紹。

觸發、工具、記憶這些元件，會在其他文章各自展開——例如 AI 怎麼動手用工具（Tool Calling）、AI Agent 的記憶（Memory）怎麼運作。想先看 AI Agent 的整體架構，可以接著讀《AI Agent 是什麼？用 AI 架構四元件，看懂它怎麼從會聊天變成會自己做事》；這篇則是把「Agent 怎麼想清楚、再排出步驟」這塊單獨拆開講清楚。

常見問題 FAQ

Q1：AI 真的會自己規劃，還是只是照寫好的腳本跑？

真的會自己規劃，這也是它跟傳統自動化最大的差別。寫死的腳本只能照固定步驟跑，遇到沒設想到的狀況就出錯；會規劃的 AI 是看著每一步的結果，臨場決定下一步。差別就在它會不會因應實際情況改變做法。

Q2：AI 規劃到一半會不會越做越歪？

有可能，所以好的設計會讓它每做一步就回頭檢查結果對不對，發現不對就調整方向，這個「回頭檢查」本身也是 AI Agent 的一塊能力。步驟越多的任務，越需要在關鍵節點設檢查點，或讓人在中途確認，避免它一路錯到底。

Q3：「先想好全部」和「邊做邊調整」我該選哪種？

看任務穩不穩定。步驟固定、幾乎不會出意外的事（像每天同樣格式的報表），用「先想好全部」清楚又好控制；步驟會隨情況變、常有意外的事（像客戶往來、進貨判斷），用「邊做邊調整」更穩。實務上也常兩種混用。

Q4：讓 AI 自己跑多步驟任務，安全嗎？

只要在會造成後果的步驟前留把關就安全。做法是讓 AI 負責規劃和執行前面的準備，但送出採購單、寄信、動金額這些動作前，停下來等人核准。AI 安排怎麼做，人決定要不要送。步驟越自動，這道人工關卡越不能省。

Q5：沒有工程背景，也能用到會規劃的 AI 嗎？

可以。市面上已經有不少工具把「多步驟任務」做成可以設定的形式，你不一定要自己寫程式。真正要花心思的，是先把你想完成的目標、還有中間的把關點講清楚，AI 才知道要規劃到哪、哪幾步要先停下來問過你，技術反而其次。

總結

AI 之所以知道該怎麼完成一件任務，是因為它會先用「推理」想清楚要解什麼，再用「規劃」把它排成步驟。它手上沒有一張背好的完美計畫表，靠的是把背後的 LLM 當成一台推理引擎，跑著「想 → 做 → 看結果 → 再想」的循環，每一步都看著實際結果，臨場決定接下來該怎麼走。規劃還分「先想好全部」和「邊做邊調整」兩種風格，後者更能應付意外，也更接近現在強一點的 AI Agent 的做法。

說到底，會規劃的 AI 厲害的地方，不在於它一開始想得多周全，而在於事情沒照計畫走的時候，它還能自己找到下一步。而你要做的，是把目標和該把關的地方講清楚，剩下的順序交給它去排。

如果你也想讓 AI 自己接手那些要好幾步才能完成的工作，或正在評估怎麼幫公司導入會規劃的 AI 流程，可以看看我們的AI 自動化與系統開發服務，聊聊你手上那些「步驟多到懶得自己做」的事。