美团 LongCat-2.0 开源：1.6 兆参数无需輝達 GPU

2026年7月1日上午10:46 • 专题 • 阅读 212

据路透社于 6 月 30 日报道，美团（Meituan）发布开源 AI 模型 LongCat-2.0，参数规模达 1.6 兆，采用稀疏混合专家（Sparse MoE）架构，完全使用国产 ASIC 超级集群芯片训练，未使用任何英伟达 GPU 或 CUDA 软件栈，模型上下文窗口达 100 万 tokens。

LongCat-2.0 的技术规格与目标应用场景

LongCat-2.0 采用稀疏混合专家（Sparse MoE）架构，与 DeepSeek 和 Mistral 旗下 Mixtral 方案相近：模型不同时激活全部 1.6 兆个参数，而是由内部路由器为每个 token 选择一组专门子模型，相较于相同规模的密集模型可降低推理成本。主要技术规格与部署限制如下：

参数规模：1.6 兆（稀疏 MoE 架构，不同时激活全部参数）

上下文窗口：100 万 tokens（DeepSeek-R1-0528 和 GPT-OSS 均为 12.8 万）

训练硬件：国产 ASIC 超级集群（无英伟达 GPU，无 CUDA 软件栈）

目标应用：AI 代理、编码工具（代码理解、全库编辑、自动化任务）

部署形式：数据中心级推理集群，不支持消费级设备或大多数本地部署

国产芯片训练的市场背景与伯恩斯坦数据

美团声称 LongCat-2.0 的核心推理架构具有可移植性，可在中国现有硬件上运行。此次发布正值美国出口管制持续限制先进 AI 芯片向中国企业出口。

股票研究公司伯恩斯坦（Bernstein）估计，英伟达目前在中国 AI 芯片市场约占 40% 份额，华为份额与之相近；伯恩斯坦同时预测，华为今年将取得进展，使英伟达在中国市场的份额下降约 8 个百分点。

性能声明的现有状态：尚无第三方验证

美团在已发布的基准测试中将 LongCat-2.0 与多款封闭源模型进行比较，但相关报道指出，这些性能声明迄今尚未获得独立公正的第三方评估验证。

报道同时指出，针对国产芯片的优化或限制 LongCat-2.0 在英伟达硬件上的性能，而英伟达硬件目前仍主导全球数据中心。美团表示其核心推理架构仍具有可移植性，独立测试将决定中国以外开发者的采用意愿。

常见问题

LongCat-2.0 的 100 万 token 上下文窗口对哪些应用场景有意义？

截至报道时，DeepSeek-R1-0528 和 OpenAI GPT-OSS 上下文窗口上限均为 12.8 万 tokens；LongCat-2.0 声称达到 100 万 tokens，对需要处理超长代码库、复杂任务链的 AI 代理应用具有潜在意义。惟上述规格声明尚待独立验证。

美团的 AI 研发背景是什么？

美团核心业务为食品外卖和本地生活服务。2023 年以 2.81 亿美元收购 AI 初创公司光年科技（Light Year Beyond）后进入 AI 领域，2025 年才公开宣布内部模型计划，LongCat-2.0 定位为公司 AI 代理与编码工具的推理引擎。

LongCat-2.0 的稀疏 MoE 架构与 1.6 兆密集模型相比有何优缺点？

稀疏 MoE 的核心优势是不激活全部参数，路由至特定子模型，相较于同等规模的密集模型可降低推理计算成本。但针对特定硬件（如国产 ASIC）优化的架构，在其他硬件（如英伟达 GPU）上的性能可能存在限制，独立测试结果尚未公布。

免责声明：以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。

本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com，本站相关工作人员将会进行核查处理回复