美團發布LongCat-2.0，業界首個全國產算力訓練、推理萬億參數大模型

責任編輯：程向明 2026-06-30 11:20:32原創來源：香港商报网

　　六月最後一天，中國AI大模型天團再次迎來一位重量級選手—美團。　

　　據悉，LongCat-2.0採用MoE架構，總參數規模1.6萬億，每個Token激活參數約480億，原生支持1M超長上下文，可一次處理百萬字級輸入。模型深度適配 Claude Code、OpenClaw、Hermes 等主流 Harness，在Coding任務上有很強的表現。

　　OpenRouter總調用量躋身全球前三，性能接近Claude Opus 4.6

　　今年4月底，美團曾發布LongCat-2.0-Preview版本，並以匿名的方式，接入全球最大的大模型 API 路由平台OpenRouter。

　　OpenRouter數據顯示，截至6月底，LongCat-2.0-Preview的總調用量已躋身全球前三。

　　在Hermes、Claude Code、OpenClaw等Agent場景下，LongCat-2.0-Preview的月調用量分列全球第一、第二和第三位。其在Claude Code的月調用量，僅次於Claude Opus 4.8，是最受全球開發者歡迎的免費模型之一。

　　OpenRouter數據顯示，匿名為Owl Alpha的LongCat-2.0測試版本，在Hermes月調用量位列全球第一、Claude Code的月調用量位列全球第二。

　　社區反饋顯示，在工具調用、複雜指令執行等 Agent 核心能力方面，LongCat-2.0-Preview接近Claude Opus 4.6，落後於最新的Claude Opus 4.8。在國產大模型中，LongCat-2.0-Preview位列頂尖梯隊。

　　相關技術報告顯示，LongCat-2.0引入ScMoE跨層快捷連接架構、零計算專家機制、Ngram Embedding增強等多項原創設計。其中，零計算專家機制可實現Token級動態計算預算，讓複雜Token激活更多專家，簡單Token節省算力，該機制為業界首創。

　　訓練、推理全程依靠國產算力，將於近期開源核心技術

　　作為首個「全國產」萬億參數大模型，LongCat-2.0全程在國產算力上完成訓練，峰值規模超過5萬張國產算力卡，是迄今為止國產算力上完成的最大訓練任務。

　　據悉，2023年起，美團就與國產算力廠商共同推進「模芯協同」研發，從早期的小規模驗證到超大規模穩定訓練，逐步攻克了萬卡級容錯恢復、NPU確定性計算、算力利用率提升等核心難題，驗證了大規模國產訓練的可行性。

　　LongCat-2.0的實踐表明，目前國產算力卡雖然落後於全球頂尖水平，但計算正確性和精度已足夠滿足需求，甚至局部略優，已經可以支撐前沿模型的全流程訓練。對於激活存量國產芯片而言，這是一個重要突破。

　　據悉，由於算力優化、技術突破等綜合因素，LongCat-2.0的訓練、推理成本消耗，低於全球其他萬億參數級別的大模型。

　　對此，LongCat官方宣布，將於近期在多平台同步開源Infra 框架、推理引擎、模型參數等核心技術，以回饋全球開發者社區。（記者林彬彬）

責任編輯：程向明

推薦新聞

7天