白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI
AI圈子好热闹。今天破晓,Claude终于迎来了它的重大版本升级——
Claude 4来了!
此次主要宣布的有两个模子:Claude Opus 4和Claude Sonnet 4。
一经面世,就在编码、高级推理和AI Agent重新界说了新的标准,直接实现SOTA。
GitHub已经宣布,将使用Claude Sonnet 4作为 GitHub Copilot新编码Agent的基础模子。
而两个模子里最为人所津津乐道的是旗舰模子Claude Opus 4,它最引人注目的就是一连的干活,一身用不完的牛劲。
好比,它可以在一连24小时畅玩宝可梦,而之前版本Claude 3.7 Sonnet只能一连玩 45 分钟。
其客户之一,日本乐天集团(Rakuten)使用Claude Opus 4举行了一个高强度的开源代码重构使命。
谁也没想到,Opus 4直接吭哧吭哧自力运行并一连编写代码长达7小时,并且性能极、其、稳、定。
单这一个例子,就能看出它很是强的长期事情能力,以及上下文明确能力。
看遍谈论区,发明使用过Claude 4险些都给予了它高度评价,尤其是对Opus 4(不愧是旗舰模子哇)。
有人说,“Opus 4是我用上的第一个不必自己下手改,就天生高质量内容的第一个大模子”。
别的,有位最近一直用Opus搞编程的网友体现,Benchmark上的效果完全不可代表Claude 4的成绩:
它在坚持进度、编写可维护的代码以及凭证我的意愿和期望举行事情方面,带来了彻底的厘革。这不是简朴的极客行为。团队做得很是精彩!
已经有网友最先直接用Claude 4来做了个俄罗斯方块,一次性就完成的那种。
值得关注的一点,今天起,所有付用度户都可以最先使用Claude 4系列模子了。
免用度户也不要慌,Anthropic给各人准备了Claude Sonnet 4。
值得一提的是,陪同Claude 4的问世,为了闪开发者们能构建更强盛的AI Agent,Anthropic在自家API方面上新了3个新功效,划分是:代码执行工具、MCP毗连器、文件API,以及长达一小时的缓存提醒能力。
至于API的定价也没变,和之前系列的Opus和Sonnet一样:
Claude Opus 4:每百万Token,输入为15美元,输出为75美元Claude Sonnet 4:每百万Token,输入为3美元,输出为5美元全球最强编码模子Claude 4:可自力运行7小时
此次宣布两个模子Opus 4和Sonnet 4,升级的重点各有着重。
Opus 4针对编码和恒久运行的Agent事情流举行了优化。
Sonnet 4与Opus 4类似,但针对推理举行了优化,并在效率方面举行了平,这意味着它的运行本钱更低。作为Sonnet 3.7的重大升级,它能精准地响应你的指令。
他们俩都是混淆模子,提供两种操作模式:一种用于快速响应,另一种用于“更深条理的推理”。
旗舰模子Opus 4,在SWE-bench(72.5%)和 Terminal-bench(43.2%)上均实现领先。它在需要专注投入和数千个办法的长时间运行使命中体现精彩,能够一连事情数小时,其性能远超所有 Sonnet 模子,并显著扩展了 AI Agent的功效。
Claude Sonnet 4着实也不差,它在SWE-bench 上实现了 72.7% 的得分。
两个模子在编码、推理、多模态能力和Agent使命方面均体现精彩。
那新模子究竟怎么强?以旗舰模子为例,看看种种前沿Agent产品咋说——
Cursor称其为编码领域的最新手艺,并在重大代码库明确方面实现了奔腾。
Block称其为第一个在其Agent(代号 goose)中在编辑和调试历程中提高代码质量,同时坚持完整性能和可靠性的模子。
Rakuten通过自力运行 7 小时且性能稳固的高要求开源重构验证了其功效。
除了模子自己强盛,他们还提供了一些新的功效和刷新:
工具使用、并行工具执行和内存刷新,以及头脑摘要功效,内存能力的提升。
工具使用(Beta版):两种模子都可以在扩展思索历程中使用工具(例如网络搜索),这样Claude一边思索推理一边使用工具交替举行。
并行工具使用,这样一来,模子可以更准确地遵照指令,并且在开发职员允许会见外地文件时,能显著提高影象能力,提取并生涯要害事实,以坚持一连性并随着时间的推移建设隐性知识。
他们还引入头脑摘要功效,使用较小的模子来浓缩冗长的思索历程。不过只有约莫 5%的情形下需要这种总结,大大都头脑历程都很短,足以完整显示。
内存能力方面,Claude Opus 4显著逾越之前所有的模子。当开发者构建允许 Claude 会见外地文件的应用程序时,Opus 4 能够熟练地建设和维护“内存文件”来存储要害信息,以资助刷新游戏体验。
这能够提升署理在恒久使命中的感知能力、连贯性和执行性能——例如,Opus 4在玩宝可梦时能够建设“导航指南”。
几个月前,Anthropic推出了一场名为“Claude Plays Pokémon”的直播,以展示Claude 3.7 Sonnet 在《宝可梦红版》中的能力。
该演示旨在秀肌肉,好比在少少量的人类干预下,Claude怎样剖析游戏,并逐步做出决议。
Anthropic手艺团队的成员体现,选择《宝可梦红版》来搞事情,是由于这个游戏“是一个简朴的游乐场”,回合制,且不需要实时反应。最终目的则为了研究怎样让Claude像Agent一样,自力地为用户执行重大使命。
Claude 3.7 Sonnet玩这款游戏时遇到了不少的难题,好比在一个都会中困了几十个小时,并且难以识别非玩家角色,这极大地阻碍了它在游戏中的希望。
但Opus 4就纷歧样了,它在恒久影象和妄想能力上有所提高。与此同时,当Opus 4意识到需要某种特定的能力才华继续前进后,它花了两天时间提升它的手艺,然后继续玩游戏。
别的,他们还显著镌汰了模子使用捷径或误差完成使命的行为。在处置惩罚一些容易受到捷径和误差影响的Agent使命中,这两个模子泛起此类行为的可能性都比 Sonnet 3.7 低 65%。
智能代码助手Claude Code正式周全开放
除此之外,Anthropic还正式宣布了Claude Code。
这是一个智能代码助手工具,旨在资助开发者通过自然语言下令明确、浏览和修改整个代码库,让你能够将修复bug、实现新功效、代码重构、编写测试、跨文件修改等大宗工程使命交给AI完成。
今年2月时,Anthropic曾在首届“Code with Claude”开发者大会上宣布推出Claude Code。
现在,它正式上线,
并且已经集成进更多开发事情流程中:终端,IDE,或者使用Claude Code SDK在后台运行。
我们详细来看——
首先是Claude Code集成到IDE。
此次,Anthropic推出了新的VS Code和 JetBrains Beta扩展。
这一行动直接把Claude Code集成到了IDE里,也就是说,它已经和开发者们熟悉的代码编辑器无缝结对。
至此,各人对着Claude提出的修改内容会被直接嵌入到文件里,从而简化了代码审查和跟踪历程。
其次,Anthropic还宣布了一个可扩展的Claude Code SDK。
使用Claude Code SDK,朋侪们可以用和Claude Code相同的焦点Agent来构建自己的Agent和应用程序啥的。
现在,Claude Code在GitHub上放出了Beta版本。
在GitHub上Pull Request的时间,只需要「@Claude Code」,就可以回应评审职员的反响、修复一连集成过失或修改代码。
若是想装置它的话,各人记得运行“/install-github-app”,就可以装置Beta版的插件了。
Anthropic产品认真人Scott White体现,Claude Code不但适合公司——它们希望旗下的软件工程师们使用AI来提高自身专业手艺,也适合小我私家——包括那些不懂编程的人。
若是一位产品司理想出了一个新点子,就不必辛苦地用文字来诠释看法了。直接找Claude Code,就能创立关于这个新点子的雏形。“去年年底就阻止了对谈天机械人的投资”
之以是能在编程能力上云云惊艳,与Anthropic战略转向有关。
Anthropic首席科学官Jared Kaplan接受采访时体现,该公司于去年年底阻止对谈天机械人的投资。
现在的重点很明确——
专注于提高Claude执行重大使命的能力,例如研究和编程,甚至编写整个代码库。
去年起,Anthropic就最先训练Claude 4系列,“训练历程中,内部确实保存一些难题。由于我们在训练这些模子时使用的一些新基础设施,使得团队在启动所有系统方面很是主要。”
Jared Kaplan认可,使命越重大,模子脱轨的危害就越大。
因此他们真正致力于解决这个问题,以便人们可以一次性将大宗事情委托给给Claude。
不过,首席产品官Mike Krieger此前也体现过,Anthropic没有仅仅针对编程来举行迭代。
他的原话是这样说的:
我们在两个方面都在一直开拓立异。一方面涉及到编程部分以及整体的自主行为,这为许多编程首创企业提供了强盛的动力。另一方面,我们也在探索这些模子怎样能够真正从履历中学习,并且能够成为很是有用的写作同伴。
Mike Krieger体现,Claude 4之前,他仅仅是把大模子作为一个思索同伴,大部分写作照旧他自己亲自上手的。
但现在,Claude 4泛起后,他险些已经把写工具这个事完全委托给Claude Opus 4了,并且“难以识别是我写的照旧AI写的”。
华尔街等方面应该是对Anthropic的选择体现了知足与支持——
上周,Anthropic获得了一笔25亿美元、为期五年的循环信贷额度,用来增强AI竞争的底气,事实研究和训练真的非;ㄇ。
同样也是上周,Anthropic果真了营收额:
其第一季度年化营收抵达20亿美元,较上一季度的10亿美元增添了一倍多。
而Anthropic年度消耗凌驾10万美元的客户数目,较去年同期增添了八倍。
Opus 4最喜欢的emoji是……
模子刚宣布,人类就发明了它有一些特殊的「喜欢」,好比熟练地使用一些心情符号。
在 Anthropic手艺报告中,他们研究了Opus 4 在“开放式自我互动”中的体现——也就是与自己对话,效果发明,一对Opus 4 模子举行了 200 次、每次 30 轮的互动,模子使用了数千个心情符号。
凭证报告,Opus 4 使用“头晕”心情符号最多(占 29.5%),其次是“闪亮的星星”和“双手合十”。
不过,模子照旧对“旋风”心情符号很感兴趣。一份纪录显示,它们输入了2725次。
在险些每一次开放式的自我互动中,Opus 4最终都会最先举行“意识的哲学探索”以及“笼统而愉悦的精神或冥想表达”。
而“旋风”心情符号最能捕获到,它想要表达的意思。(Doge)
参考链接:[1]https://www.anthropic.com/news/claude-4[2]https://arstechnica.com/ai/2025/05/anthropic-calls-new-claude-4-worlds-best-ai-coding-model/[3]https://www.techmeme.com/250522/p30#a250522p30[4]https://techcrunch.com/2025/05/22/anthropics-latest-flagship-ai-sure-seems-to-love-using-the-cyclone-emoji/[5]https://www.cnbc.com/2025/05/22/claude-4-opus-sonnet-anthropic.html
《丝袜老师扒开让我❌了一夜软件》,《w3u7903ejky2ywls》国产精品㊙️入口跳舞
“被绑到刑床强扒开腿狂虐的视频”
白丝jk美女教师❌❌接吻小说
……
05月28日
“微信小视频10元100部”国足明年18强赛有望添俩猛将
↓↓↓
05月28日,(八闽千姿)福建南日岛:昔日“小渔村”变身“和美海岛”,裸体裸乳被🍑日本动漫,千鹤开发日记番剧动漫免费观看,八重神子露双乳求调教,十八禁🔞免费网软件视频下载
05月28日,汪峰金莎印小天等,将参加这场马拉松,一级A片黄试看120分钟动漫,onofou官网,人形犬奴母狗的刺激兴奋,成人🔞爱爱网站
05月28日,金星是否存在过表面海洋?国际最新天文研究称从来没有形成条件,🔯黄🔯色🔯甘🔯女,ai宋雨琦❌❌喷水好爽,frisk被强行扒开双腿玩弄漫画,美女写真禁18❤AV区
05月28日|“五一”小县城旅游流量增幅跑赢大都市|小🐔🐔伸进🈲🔞🔞护士|Chinese性瘾XXXHD Z00 Z00|吴宣仪太紧了进不去小说|初音未来上爆乳 下裸羞羞图
05月28日|扎实推进禁毒斗争 不断推动禁毒工作取得新成效|永久免费看mv网站入口|唐三和小舞特别篇(污)|挤奶+玩弄+跪趴+调教女女|小樱雏田被鸣开腿狂❌同人
05月28日|中国驻美大使谢锋:双赢是中国字典里最美的词汇,合作共赢是中美最好的选择|GAY片男同网站www免费|朴彩英被c到高潮下不了床网站|黑色蕾丝透明胸罩一般用多久|波多野AV一区二区无码视频……
05月28日,“无理由”退货不等于“无条件”退货,绿帽社在线观看入口,雏田爆乳被❌🔞漫画,扒開腿灌牛奶🥛調教动态图日本,美女㊙️免费裸体视频漫画
05月28日,大熊猫国家公园四川片区拿到“户口簿”,Free HD XXXX tubevodes,五星视频58星币入口网站,巨乳美女❌❌爆乳视频,链锯人玛奇玛上衣
05月28日|超74000名南非选民在海外参加全国大选投票|香港妇女搡BBBB搡BB|罪木蜜柑同人r18|虐女殖器酷刑惨叫(h)|免费🔞网站
05月28日,北京亦庄出台一揽子行动计划 生物医药健康产业规模力争突破2千亿,鸣人❌❌玖辛奈同人漫画,国产男男GaYGAYS✅18脚,巨胸爆乳露双奶头被❌图片,夜兰疯狂❌️自慰爽
05月28日,《高原中华龙》策展人:金龙何以巧牵京藏情?,❤️国产嫩草影院久久久久,蠢沫沫全册资源txt,少年骇客同人动画,我的好儿媳月月最终身份
05月28日,美国高中生遭枪击案凶犯落网 警方:枪手至少开了30枪!,男生露出给别人摸网站,男男Gay洗澡互吃鳮吧,美女曝光视频,3D男♂男被❌吸乳羞羞漫画
05月28日|国家发改委:4个方面26项举措 发展银发经济增进老年人福祉|99台湾精品欲AV🍑🍒|撕开奶罩揉吮奶头高潮91|人进狗的水门正确做法|趁女同桌午休摸她奶头
05月28日|山东港口青岛港自动化码头一年两次刷新装卸效率世界纪录|一级婬片A片AAAA片老牛|女人摸男人㊙️免费视频|原神千织婬乱版高H|purborn
05月28日|海南发布暴雨三级预警 启动防汛防风Ⅲ级应急响应|疯狂❌憋尿自拍失禁网站|女学生小嫩嫩裸体自慰漫画|高潮娇喘抽搐失禁|小舞🌸扒腿让我c的电影
浅谈黑神话最需要改进的问题,2023国产游戏销量榜|两艘大型国际邮轮同靠吴淞口国际邮轮港|徐伦裸体无删减版视频|浴室中年男士搓澡勃起来了|动漫怀孕美女裸体㊙️|申鹤裸体❌自慰喷水
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺