【Agent 觀念篇】什麼是 Agent Skill?從「做豆漿」看懂 AI 如何從聊天機器人進化為數位員工
在推廣企業導入 AI 的過程中,我們最常被問到的一個問題是:「ChatGPT 很聰明,但為什麼它不能直接幫我查庫存、發 Email,或者操作公司的 ERP?」
這就是 Chatbot (聊天機器人) 與 Agent (代理人) 最大的差別。要讓 AI 從「只會說話」進化到「能動手做事」,關鍵就在於 Agent Skill (技能)。
今天我們不談複雜的程式碼,用一個最生活化的例子 —— 「做豆漿」,來帶大家看懂 Agent Skill 到底是怎麼運作的。
過去的痛點:Prompt 太長,大腦當機
在沒有 Agent Skill 之前,如果你要教 AI 做事,你必須把所有的步驟、規則、資料一次全部塞給它(這就是所謂的 Prompt Engineering)。
這就像是你請了一個新員工(AI),然後在他上班第一天,一口氣對他說:
「這是做豆漿的 SOP、這是做燒餅的 SOP、這是炸油條的 SOP、這是店裡的庫存表、這是客戶名單、這是會計準則... 全部記住,等一下客人要什麼你就做什麼!」
這會造成兩個嚴重的問題:
- Token 浪費 (太貴):你每次對話都要把整本百科全書傳給 AI,成本極高。
- 注意力發散 (太亂):資訊量太大,AI 容易「幻覺」,把做豆漿的步驟用到炸油條上。
這就是為什麼早期的 AI 應用很難落地 —— 因為它是「硬背」所有知識,而不是「活用」工具。
現在的解法:Agent Skill (技能資料夾)
現在,我們把「做豆漿」的流程寫成一個獨立的 Skill (技能),並把它放進一個虛擬的 「工具箱 (Skill Library)」 裡。
我們不再要求 AI 背誦所有 SOP,而是教它一個原則:
「這裡有 100 個資料夾(Skills),每個資料夾上面都有標籤。當客人提出需求時,你自己判斷要拿哪一個資料夾出來用。」
這就是 Agent 的核心:它不再是死記硬背的學生,而是一個懂得「查閱手冊」的員工。
Agent Skill 運作三部曲
當你對 Agent 說:「幫我做一杯豆漿」時,它的腦袋裡其實發生了這三個步驟:
第一步:Discovery (發現與檢索) —— 翻目錄
AI 首先會掃描它手邊所有的技能目錄 (Metadata)。它只看標題和簡介,不看內容。
- AI 內心獨白:「主人要豆漿... 讓我看看工具有哪些... 修車指南 不對... 財務報表 不對... 啊!找到一個 豆漿製作指南!就是它了。」
這一步極大地節省了運算資源,因為 AI 只需要快速掃描目錄,而不需要讀取整本手冊。
第二步:Activation (激活與讀取) —— 看說明書
確認目標後,AI 才會把那個特定的 Skill 資料夾打開,讀取裡面的詳細規則 (Schema & Instructions)。
- AI 讀取中:「欲製作豆漿,需準備黃豆與水,比例 1:10,並呼叫 『果汁機 API』...」
這時候,AI 才知道具體該怎麼做。它從對話中提取出參數(例如:你要無糖、還是半糖?),準備執行。
第三步:Execution (執行與回饋) —— 動手做
最後,AI 拿著準備好的參數,去執行那個寫死在程式碼裡的腳本 (Action)。
- 執行:啟動果汁機,運轉 30 秒。
- 回饋:果汁機回傳訊號「製作完成」。
- AI 回覆:「您的無糖豆漿做好了!」
總結:從指令到推理
透過 Discovery → Activation → Execution 這三步驟,我們將 AI 的運作從「被動接收指令」轉變為「主動推理工具」。
這對企業意味著什麼?
- 無限擴充:你可以不斷把新的 SOP (查庫存、報價、核銷) 做成 Skill 丟進工具箱,AI 的能力會越來越強,但不會變笨。
- 精準執行:AI 只有在需要時才讀取規則,大幅降低出錯率。
- 節省成本:不用每次都傳送大量無關資訊,Token 用量更精簡。
智賦 AI 科技 專注於協助企業打造專屬的 Skill Library。如果您希望您的 AI 不只是陪聊,而是能真正接手繁雜工作的數位員工,歡迎與我們聯繫。
「未來的競爭,不是 AI 與人的競爭,而是『會用 Agent 的企業』與『不會用 Agent 的企業』之間的競爭。」
