“AI 能否撑起美团的新想象力?”
作者丨王薇
编辑丨刘伟
赶在6月最后一天,美团再放大招。其正式发布新一代万亿参数大模型 LongCat-2.0,并将对外开源。
乍一听,这似乎又是一次简单模型迭代、单纯性能“秀肌肉”,可这一次,硬核看点则大有不同。
技术参数方面,LongCat-2.0 采用 MoE 混合专家架构,总参数 1.6 T,每个 Token 激活约 480 亿参数,动态范围 330 亿——560 亿,原生支持 1M 长度的超长上下文。
最关键的是,它是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿参数模型,创下了国产算力的新纪录。
实际上,万亿参数的大模型早已不是新闻热点,但是完全依靠国产算力完成训练和推理全流程、英伟达含量为零的,美团算是开了先例。即便是 DeepSeek V4,也只做到了推理侧适配国产算法,训练阶段依旧绕不开英伟达。
这让人不禁好奇,为何是美团?答案藏在一场关于判断、机遇与布局的运筹之中。
01
国产替代,为何美团“第一”?
时间拉回 2023 年,彼时 ChatGPT 横空出世,直接引爆国内大模型军备竞赛,各家大厂疯狂扫货原版 A100、“特供版” A800/H800,力求赶在管制落地前全力锁定芯片产能与交付。
然而,在那一波疯狂囤卡的浪潮中,美团却选择了“按兵不动”。
有消息称,2023 年上半年,美团内部曾认真讨论一个方向:能不能用国产算力做大模型训练?这个想法最初只是“随口一提”,但后来越想越觉得并非不可能。彼时,国产算力生态尚不成熟,工具链薄弱,成功案例稀缺。行业的普遍共识是“国产卡只能做推理”。但 LongCat 团队不这么看。
团队内部的分析是:大模型算子个数相对有限,适配工作量比想象中更聚焦。CUDA 生态的壁垒建立在通用性和丰富性上,但如果目标收敛到大模型训练,这个壁垒并没有看上去那么不可逾越。只要硬件精度没有问题,就不存在原理上讲不通的障碍。
他们认为,大模型的研发还要继续,国产替代是能走通的路。
三年来,LongCat 团队从千卡起步,逐步攻克算子适配、通信优化、分布式稳定性等基础难题,最终在五万卡集群上完成万亿参数模型的全流程训练与推理。
国内某芯片公司相关高层高景润也对此予以证实,他表示美团是首个在大规模训练而非仅仅是推理层面全面适配国产芯片的大厂,而支撑美团龙猫模型完成训练的主力,正是五万张国产芯片。
另一个答案则既残酷又现实。
“国产很多大模型为了保持领先,依旧想方设法囤积英伟达卡做预训练,尽管美团在AI战略上很清晰,但受到了资源制约,不过也正因如此,才让美团愿意花时间与国产芯片进行极致的适配,以实现另一种方向 AI 突围。”高景润补充道。
当然,这中间,国产芯片替代的叙事逻辑也在悄然发生改变,它不再完全是制裁封锁下各家大厂退而求其次的 “Plan B”。
归根到底,三年“减配”期,让国产 AI 芯片实现了跨越式发展。华为昇腾、寒武纪思元系列、阿里平头哥等高端芯片均借机加速迭代,在算力密度、能效比和成本控制上,已比肩国际领先水平,部分场景甚至实现反超。
不过,作为追赶者,也要客观看待双方综合实力差距。
高景润向雷峰网表示,国产芯片目前在推理效率上已经不存在代差,其所在公司的下一步目标甚至是抢占全球推理市场份额。但门槛极高的训练领域依旧是英伟达的主场,国产芯片与之相比仍有很大差距。
其中核心难点在于,如何将大量高性能存算设备整合,解决上万张卡级联、并行训练时的无损耗通信以及高强度散热问题。这些底层Infra技术,国产芯片仍需时间攻克。
值得肯定的是,此次美团 LongCat-2.0 的重磅推出,侧面印证了国产芯片全面替代的路径是通的。并且随着大模型纸面参数不再稀缺,工程落地效率、实际部署成本,也将成为拉开差距、凸显优势的关键。
02
兵分三路,攥紧 AI 主动权
过去很长一段时间,美团龙猫大模型团队是很紧张的。
因为抛开外卖核心业务不谈,内部不少业务部门其实并不愿意选用 LongCat,更倾向于接入外部模型。
自研模型在内部调用量都上不去的话,就没有价值。毕竟,该部门的首要目标,就是全面支撑公司内部各业务线的 AI 需求,为全业务场景提供底层技术能力支持。
也正是基于这样的定位,一切以业务落地效果为核心。美团内部不会硬性要求业务部门必须使用 LongCat,强行落地自研技术、堆砌自研标签。并且也不将模型下载量和排名作为核心考核指标,这也一定程度上给了 LongCat 更高的灵活度。
接近美团的内部人士透露,为了客观评估龙猫价值,王兴曾下达过一条硬性规定:所有大模型调用请求,都必须经由龙猫统一平台流转,无论是内部模型还是外部模型,都要走这套通道。因为依托这个平台,公司可以直观、客观地统计各模型的调用占比。而龙猫的调用占比大概是在 30% 到 40% 之间。
不过,美团的内部大模型使用规则自今年 4 月迎来大幅调整:平台不再推荐各业务接入外部模型,确有使用需求需写明缘由上报 X3 级高管审批。(更多有关大厂 AI 前沿动态,欢迎添加作者微信:Omayaeww,一起交流~)
此次策略切换或许藏着美团两层考量:此前放开外部模型接入,本意是避免闭门造车,让龙猫在与外部模型的竞争中快速迭代打磨;如今收紧外部模型推荐口径,除数据安全等因素考量外,本质是龙猫的成熟度已能够支撑内部大部分业务场景需求,这也给了平台优先使用自研大模型的底气。
在上述大背景下,LongCat-2.0 悄悄冲上热搜。
据了解,LongCat-2.0 的预览版以匿名身份接入 OpenRouter 平台后,总调用量直接冲进全球前三。在 Hermes 场景月调用量全球第一,Claude Code 场景全球第二——仅次于 Claude Opus 4.8。
可见,美团 AI 不再“藏着掖着”了。
在美团内部,除了龙猫团队,还有其他核心 AI 团队,包括刘炯负责的 GN06 团队 。
GN06 团队前身是美团联合创始人王慧文创办的光年之外,被收购后整体并入美团,长期独立于美团所有主业的存在,主要聚焦应用层做前沿项目探索,团队早期先后推出 AI 图文视频生成工具妙刷、AI 情感陪伴应用 WOW,不过,这些小众产品很快淡出主流视野。
今年 6 月上线的 Tabbit 浏览器,可以算是该团队被收编后,真正意义上主推的一个产品。
除了各类 AI 应用,近期,美团核心本地商业还新成立了 AI Transformation,全面聚焦 AI at Work,对内 AI 赋能。
接近美团 AI 团队的内部人士对此则表示,能明显感觉到这件事的规格提上去了。
此外,美团内部还在尝试各类AI应用,包括“小团”“小美”等 Agent 产品,近期均持续有消息出炉,整体上看,美团的 AI 团队各有分工,但始终沿着“AI at Work、AI in Products、Building LLM”三层 AI 战略持续加速前进。
03
结语
对于美团未来的 AI 路径,王兴也有着更加清晰判断。他在今年 3 月的管理层沟通会上坦言:“AI Agent 对我的冲击比 ChatGPT 冲击更大”。
在6月的财报电话会上,其进一步提出“服务 AI Agent”的概念,强调“面向 Agent 的能力建设将越来越重要”,未来除了服务消费者和商家,服务 AI Agent 本身将成为新的战略重心,这也被称为“To A”商业。
而这也直接关系到美团能否继续守住本地生活领域的主动权。
为此,对内,全面依靠国产芯片的 LongCat-2.0 作为美团核心基座驱动 AI Agent 落地,激活物理世界数字化能力;对外,其主动开放服务接口拥抱 AI 生态。
比起 AI 的故事是否足够性感,美团更加在意实实在在的 AI 落地。
本文作者长期关注大厂电商&AI,覆盖京东、抖音、小红书、快手,欢迎添加作者微信:Omayaeww,交流更多业内信息~
(*文中高景润为化名)