杨植麟摸着DeepSeek过河

杨植麟摸着DeepSeek过河

文｜邓咏仪

编辑｜苏建勋

宣布开源模子K2一周后，Kimi引起的全球热潮还在继续。

7月11日，月之暗面（Moonshot AI）开源了万亿参数的MoE模子Kimi K2。这是一个参数高达1T，激活参数32B的MoE模子，包括两款开源模子版本Kimi-Base和Kimi-instruct。

K2是个“偏科”选手，善于编程、智能体类的使命。在Kimi宣布的测评效果中，Kimi K2在自主编程、工具挪用和数学推理三个维度的体现上，都凌驾了同为开源模子的DeepSeek-V3和阿里Qwen3。

△图源：Kimi

Hugging Face数据显示，开源一周后，K2下载量累计凌驾10万，还在快速攀升中。在大模子权威竞技场LMSYS中，K2-Instruct已经冲到总榜第四，仅次于GPT-4o、Claude-3.5、Gemini-1.5-Pro。

马斯克在推特上转发了的OpenRouter趋势数据显示，K2的在一周内攀升至全球趋势榜第二，仅次于Grok 4。

△图源：Twitter

月之暗面这次没有选择大规模营销，而是在用一种全新的方法开源。

K2宣布后，Kimi的算法工程师、研究员，在推特、小红书、知乎上起劲分享K2的事情和手艺，回复用户疑问；Kimi的官方推特也在不中止地刷屏，转发社区里对K2的赞美和建议。

热情的互动引来了更多的“自来水”。Hugging Face联合首创人Thomas Wolf就对Kimi K2大加赞赏，体现开源模子正在挑战最新的闭源权重模子。

宣布热闹得像团建，与这家公司已往半年的默然形成鲜明比照。

已往两年，Kimi履历了一场过山车般的升沉：险些是最后一个推出ChatBot助手Kimi，可是依附着长文本和出圈的策划一炮而红，成为最先出圈的大模子应用产品。

但2025年，险些所有模子厂商，都被横空出生的DeepSeek打得失语。追逐AGI，证实自己尚有手艺实力，酿成了所有厂商要做的证实题。

一经拥有梦幻起源的Kimi，在今年来了个猛转弯：To C的Kimi应用阻止投流，专心主攻模子。去年一经试水的Ohai、Noisee等其他C端应用，以及Kimi在多模态上的实验也迅速暂停。这也让它遭受的质疑更强烈——是不是放弃了预训练？阻止投流后，To C应用放弃了吗？

蛰伏半年，Kimi需要一场翻身仗。K2的宣布，就是回归AGI主线的一种宣言。

“又一个DeepSeek时刻”

K2宣布，已经引起了全球开发者社区的震惊。7月16日，著名的《Nature》杂志发文，体现K2的宣布为“另一个DeepSeek时刻”，足见其赞美。

为什么K2的宣布云云主要？简朴来说，由于K2把DeepSeek模式再走了一遍：主打高性能、低本钱，并且真开源。最主要的是，端出了真的好工具。

K2是个性能强悍的模子。它很专注，目的清晰——就是为了智能体（Agentic AI）而生。

一位Kimi的算法工程师Justin Wong在博客里说：Kimi希望把人与AI的交互方法，从chat-first酿成artifact-first，即交付一个详细的交付物（好比一个3D模子、一个表格），而非交付一段谈天上下文。

用明确话说，就是要真醒目活，不但是纯谈天了。

相识了这点，才华明确Kimi在模子训练蹊径上的诸多选择。

DeepSeek R1宣布时，更多注重思索、推理能力，在宣布后相当长一段时间才加入工具挪用功效。而K2并没有像DeepSeek R1那样带上推理模式（如展现思索历程），虽然也着重提升了气概化写作能力，但并没有过多强调。

K2最看重的照旧Agentic（智能体）能力，把提升“自主使用工具、完成使命”的能力，放到最高优先级。“这在整个领域里是一个很是有数的选择。”一位从业者谈论道。

更详细地说，K2把优化的重点放在了：凭证谈天的上下文，挪用外部的工具，要让挪用速率更快，完成使命的质量更高——好比浏览器、PPT、Excel、3D绘画软件等等。用户也可以接入owl、Cline、RooCode 等 Agent/Coding 框架，来自主编程。

以是，在K2的使用案例中，你可以看到，直接输入Prompt，不必怎么等K2“思索”，K2就迅速天生3D旋转地球模子、天生PPT、天生昼夜循环的山水峡谷3D景观、3D粒子星系、生意看盘等等。

△Prompt: Create a 3D HTML mountain scene with cliffs, rivers, and day-night lighting. Supports drag/zoom, animated transitions, realistic gradients, and toggleable contour lines... (建设一个 3D HTML 山脉场景，包括悬崖、河流和昼夜光照转变。支持拖动和缩放、动画过渡、真实感渐变色，并可切换等高线显示...) 泉源：Kimi

把13万行的原始数据丢给 Kimi K2，可以帮你剖析远程办公比例对薪资的影响，剖析显著差别，自动天生统计图表与回归模子解读等等，用统一色调做出小提琴图（violin plot) 、箱线图（box plot）、散点图（scatter plot）等专业图表，整理成报告。

△泉源：Kimi

K2的另一个焦点孝顺在于，把模子的训练和使用本钱又拉到了一个地板价，同时还坚持着靠近Claude主流模子的性能，主打一个性价比高。

Kimi K2 API的定价是：每百万输入tokens 4元，每百万输出tokens 16元；直接和同样主打编程的Claude 4 Sonnet（每百万输入3美元，每百万输出15美元）的API价钱相比，整体本钱可以下降凌驾75%。

别小看这75%，现在AI编程已经成为创业赛道的“明牌”，赛道里包括Cursor等头部AI编程公司估值已经迅速腾飞。阻止2025年6月，Cursor的ARR（年度经常性收入）已突破5亿美元大关，相较于4月中旬披露的3亿美元，短短两个月内飙升了60%。

开发者会实着实在用脚投票。K2一出，Hugging Face的下载量涨得飞快，K2很快就登上了OpenRouter的趋势榜周第二，开发者一再吐槽为什么API还这么慢，用不上。

K2现在并不完善，输出的效果照旧会有缺乏之处，好比Token输出较量啰嗦，代码质量和顶尖的Claude相比照旧有差别——但架不住它性价比高。许多博主的测试案例中，通俗程序员写一天代码也就几块钱，大大降低了AI编程的算力使用门槛。

性价比高，也源于Kimi一些原创性的立异。

Kimi从训练阶段引入了新的优化器Muon，取代了原来主流的AdamW优化器，在差别Llama架构模子上，Muon的算力需求只有AdamW的52%。

优化器是大模子里的一个焦点组件，决议着在训练时的模子参数怎样调解。优化器优化得越好，模子在同样的硬件情形下跑得更快、更稳，换种角度说，也更节约了算力。

这可以说是一场手艺冒险。Muon原本是一个较量前沿的优化器偏向，甚至没有揭晓正式论文，以前只在小型模子上训练乐成过。但Kimi选择将Muon扩大到万亿参数去实验，并且解决了大规模训练下的许多手艺难点，让Muon成为这次K2宣布最受尊重的事情之一。

在公司门口放钢琴、公司名字用传奇摇滚专辑命名，这看起来是很朋克。但在重大的市场压力下，专注在一个偏向，把一个新手艺架构直接上到万亿参数去训练，用真金白银去试，还乐成了。

这才是真的朋克。

六小龙没有转头路

从K2宣布的细节看，DeepSeek在全球造成的影响仍在一连。

今年1月宣布的DeepSeek R1是全球AI叙事的分水岭。在那之前，海内无论是大厂，照旧AI首创，各人都在卷AI应用，抢夺用户和留存。

Kimi一经在2024年做过一波激进投流，和字节的豆包对打。但投流、增添是在大厂恬静区里的事情，Kimi很快就显得力有未逮。2024年11月，豆包宣布MAU过亿，在海内一时风头无两。

很快，这些效果都被DeepSeek R1迅速逾越。

DeepSeek之后，无论是大厂照旧首创，各人都形成共识：追求模子能力提升才是最主要的事。海内To C应用的战场上，险些就剩下元宝、夸克和豆包在厮杀。

现在商业化已经是个有点遥远，且不是最主要的问题了。面临在模子和应用上都在All in的大厂，留给大模子首创的路险些只有一条：开源，和攻克最难的问题。

前不久的36氪Waves大会上，真格基金合资人戴雨森在谈到Kimi与Minimax时曾说： “一年前，各人比投放、比用户，比投放，着实是大厂的时机。现在则回到手艺前沿，回到强认知，我相信反而更适合以手艺大牛为焦点的创业团队。 ”

六小龙们都做出了自己的选择。DeepSeek R1的攻击后，各家呈上的答卷，实则批注晰一种蹊径的分野：Kimi已经有点像Anthropic，主打提升编程、智能体的能力；Minimax和阶跃牢牢抓紧多模态；智谱则是走更本土、To B/To G的蹊径；百川选择继续做医疗模子；01早已宣布不再做超大基础模子迭代，转而专注在大模子落地上。

此前，Kimi在外洋着名度有限，但K2的爆火已经带来着实的回报：全球开发者圈子里最先关注起Kimi，有人最先研究CEO杨植麟的过往履历？⒄呙窍不墩飧龀渎罂宋幕耐哦印狵imi团队成员在小红书、推特展示公司里以传奇乐队命名的聚会室，也会在Twitter坦承“现在K2还不完善，infra尚有许多缺乏，正在加班加点修复。”

△泉源：Twitter

而更早之前，在Kimi专注提升模子能力，推出包括深度研究等产品后，着实也反哺到了产品上：Kimi的Web端数据从6月最先反弹，会见量环比增添30%。

某种水平上，开源和朋克有着同样的精神内核，自由、开放、尊重手艺，这是现在AI圈子里最强势的"注重力钱币"，不但能建设名声、展现信仰，尚有招揽人才——这才是AI首创现在最着急的事。

K2宣布后，一位Kimi研究员一经在博客里提到：“ 2025年，智能的上限仍然完全由模子决议，作为一家以AGI为目的的公司，若是不去追求智能的上限，那我一天也不会多呆下去。”

追求AGI看似是一条窄路，对还在这条路上的首创公司而言，照旧一条平坦大路。

只要足够专注。

封面泉源｜视觉中国

接待交流

本文来自微信公众号“智能涌现”，作者：邓咏仪，36氪经授权宣布。

分享： 2025-07-24 20:05:17 共81款