AI飞行客

掠过技术的云层,落地在工程的原野

Cursor被曝「套壳」Kimi?官方认了,马斯克还站台

——Composer 2/2.5 技术拆解与行业启示

Kate | 2026年5月20日

一、传闻是真的

最近圈子里在传一个消息:Cursor 的新模型 Composer 2 和 2.5,底层其实是用月之暗面(Moonshot)开源的 Kimi K2.5「套」出来的。

我先说结论:传闻属实,而且 Cursor 官方压根没打算藏。

Cursor 在 2026 年 3 月 27 日发布的技术报告中写得明明白白:

『We posted to the arXiv a technical report on the training of Composer 2, our coding model for agentic software engineering. The report covers the full training process, from continued pretraining on an open base model, Kimi K2.5, through large-scale reinforcement learning…』

翻译过来就是:我们基于开源模型 Kimi K2.5,做了继续预训练,然后上了大规模强化学习。

5 月 18 日 Cursor 发布 Composer 2.5 时,官方博客又重复了一遍:

『Composer 2.5 基于与 Composer 2 相同的开源检查点构建,即 Moonshot 的 Kimi K2.5。』

换句话说,Cursor 不仅没否认,还主动把「套壳」写进了官方技术报告里。这操作,多少有点「既然瞒不住,不如大方承认」的意思。

二、怎么「套」的?技术拆解

既然官方都摊牌了,那我们就来看看 Cursor 到底在 Kimi K2.5 的基础上做了什么。

阶段一:继续预训练(Continued Pretraining)

Cursor 在 Kimi K2.5 的基础上,用自家的代码数据做了继续预训练。目的是加深模型对代码的理解——毕竟 Kimi K2.5 是一个通用大模型,而 Cursor 要的是「代码Agent」。官方说得很直接:降低预训练损失,能直接提升下游 RL 的表现,基础模型知识越好,Agent 能力越强。

阶段二:大规模强化学习(RL)

这是 Cursor 真正下功夫的地方。他们做了三件事:

  • 定向 RL(Directed RL):传统的 RL 只在任务完成时给奖励,而 Cursor 的做法是——模型哪里做错了,就哪里直接给文本反馈。比如在 SWE-bench 里,模型改了代码但测试挂了,Cursor 不仅告诉它「错了」,还会指出「第 42 行引用了未定义的变量」。这种细粒度反馈让模型学得快得多。
  • 合成数据规模翻 25 倍:用更强的模型(比如 Kimi K2.5 Pro Max)生成高难度训练数据,再让 Composer 2.5 在这些数据上「卷」出来。
  • 底层训练优化:带分布式正交化的分片 Muon + 双网格 HSDP,把训练效率拉满。Cursor 还和 SpaceX AI 合作,用了 Colossus 2 的 100 万个 H100 等效算力——马斯克那套「地表最强超算」。

Cursor CEO Michael Truell 的回应也很有意思。他说 Kimi 打底,自家额外训练+RL 占了 85% 的总算力。言外之意:底座是借的,但上面这栋楼是自己盖的。

三、性能怎么样?值不值

光说不练假把式,我们来看看 Composer 2.5 的实际表现。

基准测试 Composer 2.5 对比
CursorBench v3.1 63.2%(最高 64.8%) Claude Opus 4.7 水平
SWE-bench Verified 70.2%(最高 75.6%) 显著提升
SWE-bench Multilingual 73.7% 行业顶尖

价格上,Composer 2.5 Fast 版每百万 token 输入 15 美元、输出 2.50 美元。Cursor 自己说成本是其他前沿模型的 1/10。这个价格,配上这个性能,性价比确实能打。

四、「套壳」有问题吗?

这是争议最大的地方。Cursor 论坛里有个帖子标题很有意思:

『Composer 2 being KimiK2.5++ is fine, lack of transparency isn’t』

翻译:Composer 2 就是 Kimi K2.5++,这本身没问题;但缺乏透明度,有问题。

有开发者通过修改 API 的 base URL,直接调到了 Cursor 的模型,发现模型 ID 是:

accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast

这 ID 基本等于「Kimi K2.5 + RL」,连遮都懒得遮。于是有用户在论坛里吐槽:至少把模型 ID 改个名吧?

但另一边,更多人觉得这根本不是事。基于开源模型做微调和强化学习,是业界的标准操作。DeepSeek、Qwen、Llama,哪个不是被各家「套」来「套」去?Cursor 至少还写了技术报告,发了论文,比某些「偷偷用开源模型却不吭声」的公司敞亮多了。

我的看法?「套壳」不是原罪,「只会套壳」才是。

Cursor 的价值不在于「造了一个新底座」,而在于它把 Kimi K2.5 这个通用模型,通过继续预训练和定向 RL,调教成了「最懂代码的 Agent」。这就像同一块钢板,有人做成了锅,有人做成了刀——能砍人的是刀工,不是钢板。

五、马斯克为什么站台?

这里还有一条暗线:马斯克。

Composer 2.5 发布当天,马斯克在 X 上发了一条帖子,大意是「都给我去用 Cursor 新模型」。这种级别的站台,不是普通的「产品推荐」。

背后的关系很复杂:

  • Cursor 和 SpaceX AI 达成了算力合作,用的是 Colossus 2——马斯克那套号称「地表最强」的超算,100 万个 H100 等效算力。
  • 马斯克之前还从 Cursor 挖过人——Cursor 的联创之一 Arvid Lunnemark 被挖去了 xAI。
  • 更微妙的是,马斯克 reportedly 握有 600 亿美元收购 Cursor 的优先权。也就是说,如果 Cursor 真被谁买了,马斯克有优先接盘的权利。

这三层关系一叠加,马斯克站台 Cursor 就不仅仅是「喜欢这个产品」了。这是在为潜在的收购铺路,也是在为自家算力业务拉客户。商业世界,没有无缘无故的爱。

六、对行业的启示

Cursor 这件事,其实给整个 AI 行业提了个醒:

第一,开源模型的威力正在被重新定义。

Kimi K2.5、DeepSeek、Qwen——这些中国开源模型,正在成为全球 AI 应用的「基础设施」。Cursor 用 Kimi K2.5 做出了对标 Claude Opus 4.7 的代码 Agent,成本只有 1/10。这意味着什么?意味着「造底座」的门槛确实高,但「用底座造产品」的窗口,正在向所有人敞开。

第二,垂直场景的价值被低估了。

通用大模型再强,也做不到「最懂某个垂直领域」。Cursor 的定向 RL、CursorBench 评估体系、沟通风格校准——这些都不是通用模型能自动长出来的能力。未来的竞争,可能不再是「谁的底座更大」,而是「谁更懂某个场景」。

第三,透明度正在变成护城河。

Cursor 被质疑的其实不是「套壳」,而是「一开始没说清楚」。如果早点公布技术细节,社区的反应可能完全不同。反过来想,敢于公开技术报告、发论文、承认底座来源的公司,反而更容易赢得开发者的长期信任。

结语

Cursor 用 Kimi K2.5 训练 Composer 2/2.5,这事既不是「抄袭」也不是「创新神话」,而是一个务实的商业选择:在开源底座上做深度垂直优化,用 1/10 的成本做出对标顶尖闭源模型的产品。

至于「套壳」的骂名——说实话,在这个行业里,能把「壳」套到极致,本身就是一种本事。

毕竟,用户要的是一把好用的刀,不是一块没加工的钢板。

—— END ——

发表回复

Your email address will not be published. Required fields are marked *.

*
*