“开源模子验货官”Perplexity，给Kimi K2盖了个戳

“开源模子验货官”Perplexity，给Kimi K2盖了个戳

作者｜ Yoky邮箱｜ yokyliu@pingwest.com

Perplexity 每一次纳入新模子，都是很强的信号：这一次，亮的是 Kimi K2。

7 月 13 日，Perplexity 联合首创人兼 CEO Aravind Srinivas 在 X 上宣布新闻：“Kimi K2 的内部评测效果很是惊艳，我们很快会启动 post-training。”

Perplexity的站台，让K2在开源社区的热度继续飙升，这种盛况并不生疏——上一次泛起类似的惊动效应，正是Perplexity宣布选择纳入DeepSeek-R1的时间。

这背后反应出一个有趣的征象：关于全球开发者来说，Perplexity用不必某个开源模子，现实上已经演酿成了一个主要的风向标。它所指向的，不但仅是手艺优劣，更是开源模子能否经受住真实工业情形磨练的要害信号。

AI搜索是离“真实天下使命”最近的试炼场，而Perplexity对模子的需求远不止“自制”这么简朴。

Aravind曾在Reddit上诠释为什么没有接入GPT-4.5：“GPT-4.5的解码速率只有11个token/秒，相比之下，4o是110个token/秒（快10倍），我们自己的Sonar模子是1200个token/秒（快100倍）。这导致用户体验不佳，由于他们期望快速、准确的谜底。”

换句话说，实时响应和低延迟是选型的生死线。Perplexity的峰值请求量可达一样平常十倍，任何凌驾两秒的期待都会显著降低用户体验。在vLLM + FP8实测中，K2的MoE架构仅激活32B参数，在相同硬件条件下输出速率比R1快一倍，且单位本钱更低，这正是高并发场景下经济与性能的最佳平衡点。

今年4月，Aravind预告了Perplexity的系列新功效，他强调这不是简朴的产品改动，而是底层模子的重构：“我们需要重写基础设施才华大规模实现。”

他形貌的焦点功效是更强盛的深度研究署理，能够思索30分钟或更长时间，“包括工具使用、交互式和代码执行功效，就像Manus等最近的原型所展示的那样。”

这实质上是一个纯Agent模式：给定自然语言需求，模子必需自主拆解使命、挪用工具、执行代码，最终天生完整报告。这种能力恰恰与Kimi K2的“模子即Agent”理念完全对齐——K2不是把Agent能力看成后训练插件，而是在预训练阶段就将原生Agent手艺刻入权重。

K2在训练阶段引入了数百万条合成Agent使命，笼罩搜索、浏览器、日历、Python、SQL等17种真实工具挪用场景。模子学会在简单会话内一连编排16-20步操作，无需人类编写事情流。官方演示中，K2用16次IPython挪用将13万行原始数据完成洗濯、建模、绘图并输出交互网页报告，全程零人工干预——这直接对应Perplexity设想的“30分钟自主研究”。

虽然，选择开源模子的更深层缘故原由在于完整的控制权。拥有完整权重意味着Perplexity可以恣意举行LoRA、RLHF、工具蒸馏，无需担心挪用频率、并发上限或隐私合规问题。K2接纳MIT改协议，月活低于1亿即可商用，Hugging Face直接提供fp8/fp16全套权重，128K上下文窗口足够一次性处置惩罚整份财报。对Perplexity而言，这意味着“模子-索引-工具”三层架构可以完全私有化，不再受任何闭源条款约束。

Perplexity 在其生长历程中，逐步从依赖 OpenAI 的 GPT 模子转向使用开源模子，并在此基础上举行了自研和微调。

2023年下半年，Perplexity 宣布推出两款新的“pplx-7b-online”和“pplx-70b-online”，划分基于开源模子 Mistral-7b 和 LLaMA 2-70b 构建。“我们从LLaMA-2宣布之日起就最先使用开源模子，”Aravind Srinivas说道。

从模子特点来看，Mistral-7B以轻量化和高速率成为早期实验，验证了小模子在特定使命的可行性；Llama-2-70B提供了更广的知识笼罩面；随后，Perplexity还接纳了Code Llama-34B，补强了代码相关的笔直能力。

真正的转折点泛起在2025年2月，DeepSeek-R1让Perplexity完成了从“使用开源模子”到“基于开源模子自研”的要害跳跃，获得了完整的权重控制能力。此后，Perplexity又继续深度调优Sonar模子，展现了自研能力的成熟，专门针对搜索问答场景举行优化。

现在选择Kimi K2，正是这一战略的最新体现——不但在速率和本钱上优于R1，其原生Agent能力更完善契合了“30分钟自主研究”的产品需求。

综合来看，Perplexity的模子选型必需在高性价比与高性能之间找到平衡，同时知足特定的产品需求。由于现在尚无开源模子能完全抵达其标准，Perplexity只能阶段性地选择最优解，这种“择优而用”的战略反而让其成为了开源模子能力评判的主要风向标。

点个爱心，再走吧

相关推荐：78动漫网页版火影忍者黄漫画㊙️18禁打屁屁视频

分享： 2025-07-25 03:13:26 共81款