Sakana Fugu 是 Sakana AI 推出的多代理編排系統,核心概念很直接:使用者只需呼叫一個模型 API,背後卻是由多個專家模型自動協作完成任務。 它不是傳統意義上只會單獨回答問題的大模型,而是訓練成一個「協調者」,懂得根據任務內容去選模型、分派工作、驗證結果,再把答案整合成可用輸出。
Sakana AI 將 Fugu 定位為「Multi-Agent System, Delivered as One Model」,也就是把多代理系統包裝成單一模型體驗。 對開發者來說,這代表不必自己設計複雜工作流,也不必手動管理多個 API key、角色分工或模型路由;Fugu 會在背後自動完成這些工作。
這種產品思路和過去常見的 AI 工具很不同。傳統模型追求的是單一模型能力越來越強,而 Fugu 的思路則是把「系統協作能力」本身變成模型的一部分。 換句話說,它不是單點性能競賽,而是把 AI 團隊化、流程化,讓模型學會如何指揮其他模型。
Fugu 的工作方式,可以理解為「一個會指揮其他模型的模型」。 它會依照任務需求動態選擇模型池中的不同成員,並自動分配 Thinker、Worker、Verifier 等角色,讓每個模型負責自己最擅長的環節。
官方說明指出,Fugu 並不是預先寫死某種流程,而是透過學習去形成更有效的協作模式。 也就是說,它可以根據題目複雜度,自主決定是直接回答、拆解成多步工作,還是調度多個專家模型一起完成。 這讓它在面對編碼、數學、推理、知識檢索與驗證型任務時,能比單一模型更有彈性。
Fugu 目前提供兩個版本:Fugu 與 Fugu Ultra。 Fugu 主打性能與延遲之間的平衡,適合作為日常工作的預設模型,例如程式撰寫、代碼審查與聊天機器人服務。 Fugu Ultra 則更偏向高難度、高精度任務,會調度更深層的專家模型池,以提升答案品質。
這樣的分層設計很實際,因為不是所有任務都需要最高等級的推理成本。 若只是一般查詢、開發輔助或互動式服務,標準版就足夠;但如果是 Kaggle 競賽、論文重現、資安分析、專利調查或高風險工程任務,Fugu Ultra 的價值就更大。
Sakana AI 表示,Fugu 的技術基礎來自兩篇 ICLR 2026 研究:TRINITY 與 Conductor。 TRINITY 主要展示了如何用進化式協調器去統籌多個 LLM,並為不同模型分配思考、執行與驗證角色。 Conductor 則是透過強化學習學會自然語言協調策略,讓系統能設計更有效的模型溝通方式與提示詞。
這個研究方向很重要,因為它把過去依賴人工設計的 agent workflow 轉變為可學習、可適應的協作機制。 也就是說,Fugu 的競爭力不只來自底層模型夠強,更來自它懂得怎麼把多個模型組裝成一個更強的整體。
Fugu 最吸引人的地方之一,是它提供 OpenAI 兼容的 API。 如果開發者已經在使用 GPT、Gemini 或 Claude 的 API,導入 Fugu 的成本就會低很多,因為不需要重寫整套基礎架構,只要把請求送到 Fugu 的端點即可。
這對企業尤其重要。很多團隊真正的痛點,不是缺少模型,而是缺少整合能力;模型切換、權限管理、上下文傳遞、驗證與結果合成,往往才是最耗時的部分。 Fugu 把這些複雜性封裝起來,讓使用者看到的是一個 API,實際背後卻是一整個智能協作系統。
Fugu 的一大特色,是允許使用者控制哪些模型或代理可以加入模型池。 這意味著如果企業有資料隱私、合規或供應商政策考量,可以選擇排除某些提供商或模型。
這點對實務部署很關鍵。許多 AI 系統在示範時表現不錯,但一旦要落地到金融、醫療、法務或政府場景,就會面臨合規與供應鏈風險。 Fugu 透過可配置的代理池,讓系統在保留性能的同時,也保留更多治理彈性。
官方公布的定量結果顯示,Fugu 與 Fugu Ultra 在多項工程、科學與推理基準上表現亮眼,並在部分測試中與 Fable 5 和 Mythos Preview 這類前沿模型並列。 例如在 LiveCodeBench、GPQA-D、SWE Bench Pro 等測試中,兩個版本都展現出非常強的競爭力。
更重要的是,Sakana AI 強調這些成績不是靠單一巨型模型硬撐,而是透過多模型協作取得。 這代表它在架構層面提供了一種不同路線:不一定要押注某一顆超大模型,也可以透過動態編排多個專長模型來逼近甚至超越前沿表現。
Fugu 很明顯是為高價值、長流程、需要驗證的任務而設計。 它特別適合程式開發、代碼審查、論文重現、科學推理、資安分析、資料科學研究、專利檢索與企業自動化工作流。
如果任務只是簡單聊天或單輪問答,Fugu 可能顯得大材小用;但當任務牽涉到「先分析、再拆解、再驗證、最後合成」這類長鏈條流程時,它的系統價值就會更明顯。 這也是為什麼早期使用者多半來自研究、工程與高要求的專業工作場景。
Fugu 的推出,不只是新產品,也是 Sakana AI 對 AI 基礎架構的一次重要表態。 它試圖回答一個更大的問題:未來最強的 AI,是否一定是單一超大模型,還是由多個專家模型組成、會自我協調的系統?
在全球 AI 供應鏈不確定性增加的背景下,Fugu 也帶有明顯的韌性敘事。 官方明確提到它可以在不依賴單一供應商的情況下,提供前沿級能力,這對企業與研究機構來說很有吸引力,因為它降低了被單一供應商綁定的風險。
根據官方頁面,Fugu 提供訂閱與徵費兩種模式,對不同規模的使用者都保留入口。 Fugu Ultra 的定價則是依 token 與上下文長度分級,顯示它明顯針對高強度專業工作負載。
這類定價策略反映出產品本身的定位:它不是大眾娛樂型應用,而是面向研究人員、工程師、企業與重度用戶的專業工具。 對這類用戶而言,重點通常不是單次價格最低,而是能否穩定完成高價值任務。
Sakana Fugu 的真正創新,不只是「做出另一個模型」,而是把多代理協作正式變成一個可直接調用的產品。 它讓模型學會如何分工、如何驗證、如何合成,並把原本需要人工設計的工作流,轉化為可學習的智能系統。
如果說過去的 AI 競爭重點是單一模型的參數、分數與規模,那 Fugu 提供了一條不同路線:讓模型不再只是回答者,而是團隊的協調者。 這也是它最值得關注的地方。