白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI
AI圈子好热闹。今天破晓,Claude终于迎来了它的重大版本升级——
Claude 4来了!
此次主要宣布的有两个模子:Claude Opus 4和Claude Sonnet 4。
一经面世,就在编码、高级推理和AI Agent重新界说了新的标准,直接实现SOTA。
GitHub已经宣布,将使用Claude Sonnet 4作为 GitHub Copilot新编码Agent的基础模子。
而两个模子里最为人所津津乐道的是旗舰模子Claude Opus 4,它最引人注目的就是一连的干活,一身用不完的牛劲。
好比,它可以在一连24小时畅玩宝可梦,而之前版本Claude 3.7 Sonnet只能一连玩 45 分钟。
其客户之一,日本乐天集团(Rakuten)使用Claude Opus 4举行了一个高强度的开源代码重构使命。
谁也没想到,Opus 4直接吭哧吭哧自力运行并一连编写代码长达7小时,并且性能极、其、稳、定。
单这一个例子,就能看出它很是强的长期事情能力,以及上下文明确能力。
看遍谈论区,发明使用过Claude 4险些都给予了它高度评价,尤其是对Opus 4(不愧是旗舰模子哇)。
有人说,“Opus 4是我用上的第一个不必自己下手改,就天生高质量内容的第一个大模子”。
别的,有位最近一直用Opus搞编程的网友体现,Benchmark上的效果完全不可代表Claude 4的成绩:
它在坚持进度、编写可维护的代码以及凭证我的意愿和期望举行事情方面,带来了彻底的厘革。这不是简朴的极客行为。团队做得很是精彩!
已经有网友最先直接用Claude 4来做了个俄罗斯方块,一次性就完成的那种。
值得关注的一点,今天起,所有付用度户都可以最先使用Claude 4系列模子了。
免用度户也不要慌,Anthropic给各人准备了Claude Sonnet 4。
值得一提的是,陪同Claude 4的问世,为了闪开发者们能构建更强盛的AI Agent,Anthropic在自家API方面上新了3个新功效,划分是:代码执行工具、MCP毗连器、文件API,以及长达一小时的缓存提醒能力。
至于API的定价也没变,和之前系列的Opus和Sonnet一样:
Claude Opus 4:每百万Token,输入为15美元,输出为75美元Claude Sonnet 4:每百万Token,输入为3美元,输出为5美元全球最强编码模子Claude 4:可自力运行7小时
此次宣布两个模子Opus 4和Sonnet 4,升级的重点各有着重。
Opus 4针对编码和恒久运行的Agent事情流举行了优化。
Sonnet 4与Opus 4类似,但针对推理举行了优化,并在效率方面举行了平,这意味着它的运行本钱更低。作为Sonnet 3.7的重大升级,它能精准地响应你的指令。
他们俩都是混淆模子,提供两种操作模式:一种用于快速响应,另一种用于“更深条理的推理”。
旗舰模子Opus 4,在SWE-bench(72.5%)和 Terminal-bench(43.2%)上均实现领先。它在需要专注投入和数千个办法的长时间运行使命中体现精彩,能够一连事情数小时,其性能远超所有 Sonnet 模子,并显著扩展了 AI Agent的功效。
Claude Sonnet 4着实也不差,它在SWE-bench 上实现了 72.7% 的得分。
两个模子在编码、推理、多模态能力和Agent使命方面均体现精彩。
那新模子究竟怎么强?以旗舰模子为例,看看种种前沿Agent产品咋说——
Cursor称其为编码领域的最新手艺,并在重大代码库明确方面实现了奔腾。
Block称其为第一个在其Agent(代号 goose)中在编辑和调试历程中提高代码质量,同时坚持完整性能和可靠性的模子。
Rakuten通过自力运行 7 小时且性能稳固的高要求开源重构验证了其功效。
除了模子自己强盛,他们还提供了一些新的功效和刷新:
工具使用、并行工具执行和内存刷新,以及头脑摘要功效,内存能力的提升。
工具使用(Beta版):两种模子都可以在扩展思索历程中使用工具(例如网络搜索),这样Claude一边思索推理一边使用工具交替举行。
并行工具使用,这样一来,模子可以更准确地遵照指令,并且在开发职员允许会见外地文件时,能显著提高影象能力,提取并生涯要害事实,以坚持一连性并随着时间的推移建设隐性知识。
他们还引入头脑摘要功效,使用较小的模子来浓缩冗长的思索历程。不过只有约莫 5%的情形下需要这种总结,大大都头脑历程都很短,足以完整显示。
内存能力方面,Claude Opus 4显著逾越之前所有的模子。当开发者构建允许 Claude 会见外地文件的应用程序时,Opus 4 能够熟练地建设和维护“内存文件”来存储要害信息,以资助刷新游戏体验。
这能够提升署理在恒久使命中的感知能力、连贯性和执行性能——例如,Opus 4在玩宝可梦时能够建设“导航指南”。
几个月前,Anthropic推出了一场名为“Claude Plays Pokémon”的直播,以展示Claude 3.7 Sonnet 在《宝可梦红版》中的能力。
该演示旨在秀肌肉,好比在少少量的人类干预下,Claude怎样剖析游戏,并逐步做出决议。
Anthropic手艺团队的成员体现,选择《宝可梦红版》来搞事情,是由于这个游戏“是一个简朴的游乐场”,回合制,且不需要实时反应。最终目的则为了研究怎样让Claude像Agent一样,自力地为用户执行重大使命。
Claude 3.7 Sonnet玩这款游戏时遇到了不少的难题,好比在一个都会中困了几十个小时,并且难以识别非玩家角色,这极大地阻碍了它在游戏中的希望。
但Opus 4就纷歧样了,它在恒久影象和妄想能力上有所提高。与此同时,当Opus 4意识到需要某种特定的能力才华继续前进后,它花了两天时间提升它的手艺,然后继续玩游戏。
别的,他们还显著镌汰了模子使用捷径或误差完成使命的行为。在处置惩罚一些容易受到捷径和误差影响的Agent使命中,这两个模子泛起此类行为的可能性都比 Sonnet 3.7 低 65%。
智能代码助手Claude Code正式周全开放
除此之外,Anthropic还正式宣布了Claude Code。
这是一个智能代码助手工具,旨在资助开发者通过自然语言下令明确、浏览和修改整个代码库,让你能够将修复bug、实现新功效、代码重构、编写测试、跨文件修改等大宗工程使命交给AI完成。
今年2月时,Anthropic曾在首届“Code with Claude”开发者大会上宣布推出Claude Code。
现在,它正式上线,
并且已经集成进更多开发事情流程中:终端,IDE,或者使用Claude Code SDK在后台运行。
我们详细来看——
首先是Claude Code集成到IDE。
此次,Anthropic推出了新的VS Code和 JetBrains Beta扩展。
这一行动直接把Claude Code集成到了IDE里,也就是说,它已经和开发者们熟悉的代码编辑器无缝结对。
至此,各人对着Claude提出的修改内容会被直接嵌入到文件里,从而简化了代码审查和跟踪历程。
其次,Anthropic还宣布了一个可扩展的Claude Code SDK。
使用Claude Code SDK,朋侪们可以用和Claude Code相同的焦点Agent来构建自己的Agent和应用程序啥的。
现在,Claude Code在GitHub上放出了Beta版本。
在GitHub上Pull Request的时间,只需要「@Claude Code」,就可以回应评审职员的反响、修复一连集成过失或修改代码。
若是想装置它的话,各人记得运行“/install-github-app”,就可以装置Beta版的插件了。
Anthropic产品认真人Scott White体现,Claude Code不但适合公司——它们希望旗下的软件工程师们使用AI来提高自身专业手艺,也适合小我私家——包括那些不懂编程的人。
若是一位产品司理想出了一个新点子,就不必辛苦地用文字来诠释看法了。直接找Claude Code,就能创立关于这个新点子的雏形。“去年年底就阻止了对谈天机械人的投资”
之以是能在编程能力上云云惊艳,与Anthropic战略转向有关。
Anthropic首席科学官Jared Kaplan接受采访时体现,该公司于去年年底阻止对谈天机械人的投资。
现在的重点很明确——
专注于提高Claude执行重大使命的能力,例如研究和编程,甚至编写整个代码库。
去年起,Anthropic就最先训练Claude 4系列,“训练历程中,内部确实保存一些难题。由于我们在训练这些模子时使用的一些新基础设施,使得团队在启动所有系统方面很是主要。”
Jared Kaplan认可,使命越重大,模子脱轨的危害就越大。
因此他们真正致力于解决这个问题,以便人们可以一次性将大宗事情委托给给Claude。
不过,首席产品官Mike Krieger此前也体现过,Anthropic没有仅仅针对编程来举行迭代。
他的原话是这样说的:
我们在两个方面都在一直开拓立异。一方面涉及到编程部分以及整体的自主行为,这为许多编程首创企业提供了强盛的动力。另一方面,我们也在探索这些模子怎样能够真正从履历中学习,并且能够成为很是有用的写作同伴。
Mike Krieger体现,Claude 4之前,他仅仅是把大模子作为一个思索同伴,大部分写作照旧他自己亲自上手的。
但现在,Claude 4泛起后,他险些已经把写工具这个事完全委托给Claude Opus 4了,并且“难以识别是我写的照旧AI写的”。
华尔街等方面应该是对Anthropic的选择体现了知足与支持——
上周,Anthropic获得了一笔25亿美元、为期五年的循环信贷额度,用来增强AI竞争的底气,事实研究和训练真的非;ㄇ。
同样也是上周,Anthropic果真了营收额:
其第一季度年化营收抵达20亿美元,较上一季度的10亿美元增添了一倍多。
而Anthropic年度消耗凌驾10万美元的客户数目,较去年同期增添了八倍。
Opus 4最喜欢的emoji是……
模子刚宣布,人类就发明了它有一些特殊的「喜欢」,好比熟练地使用一些心情符号。
在 Anthropic手艺报告中,他们研究了Opus 4 在“开放式自我互动”中的体现——也就是与自己对话,效果发明,一对Opus 4 模子举行了 200 次、每次 30 轮的互动,模子使用了数千个心情符号。
凭证报告,Opus 4 使用“头晕”心情符号最多(占 29.5%),其次是“闪亮的星星”和“双手合十”。
不过,模子照旧对“旋风”心情符号很感兴趣。一份纪录显示,它们输入了2725次。
在险些每一次开放式的自我互动中,Opus 4最终都会最先举行“意识的哲学探索”以及“笼统而愉悦的精神或冥想表达”。
而“旋风”心情符号最能捕获到,它想要表达的意思。(Doge)
参考链接:[1]https://www.anthropic.com/news/claude-4[2]https://arstechnica.com/ai/2025/05/anthropic-calls-new-claude-4-worlds-best-ai-coding-model/[3]https://www.techmeme.com/250522/p30#a250522p30[4]https://techcrunch.com/2025/05/22/anthropics-latest-flagship-ai-sure-seems-to-love-using-the-cyclone-emoji/[5]https://www.cnbc.com/2025/05/22/claude-4-opus-sonnet-anthropic.html
《巜一边亲一边摸下奶韩国》,《w3u7903ejky2ywls》美女全婐app免费
“免费➕无码➕国产在线54高中生”
军训教官解开裤裆吃我j男男视频
……
05月28日
“灰原哀扒开屁股让主人玩”仁川福地
↓↓↓
05月28日,【两会30秒】成都市市长王凤朝:将进一步增强外国朋友旅游体验感,甘雨被强❌喷水羞羞动漫,ai换脸赵露思裸体❌开腿羞羞,一个one成人黄版免费iOS,校花爽⋯好大⋯快⋯深点在线观看
05月28日,青海民和震后集中安置点:民众喜迁新居 幸福食堂开餐,刘若琳被❌到爽🔞,男模互摸jiji秘视频网站,无职转生18禁本子全彩无遮,神里绫华裸体❌自慰喷水
05月28日,中央专项彩票公益金支持居家和社区基本养老服务提升行动项目资金管理办法公布,德国妓女与动交ZOZ0z,将军,不可以!(限)暖冬笔趣阁免费阅读,qq黄群秒进qq群2023,初音未来被触手❌捆绑
05月28日|以更大的决心和力度深化改革开放(继续巩固和增强经济回升向好态势·两会之后看落实⑥)|女同巨乳裸体动漫|老师你奶好大摸起来好爽视频|SpermatidPro官方入口|深夜成人🔞🈲一次看到爽
05月28日|时政微纪录丨习主席的欧洲时间(第一集 春到巴黎)|XXNX16👙中国免费视频视频|女人羞羞❌免费视频|朱竹清拨开胸罩露出奶头|罪木蜜柑同人r18
05月28日|道路因雪崩阻断 新疆喀纳斯景区暂停开放|美女㊙️免费裸体舞视频|扒开❌狂揉❌脱脱内内视频双男|变成家畜的妈妈小说|青少年gαy洗澡互吃鳮巴网站……
05月28日,俄外交部:这一会议前夕 扎哈罗娃的签证被马耳他吊销,女同性自慰互相MⅤ,夜兰疯狂❌️自慰爽,欧美性XXXXXXX动态,爽好大快深点视频网站
05月28日,中新教育丨全国妇联等16部门联合部署2024寒假儿童关爱服务活动,小柔好湿好紧太爽了视频吃奶,王心凌AV裸体无码,妮露被❌吸乳羞羞3D视频,女战士战败被捏胸
05月28日|海南省侨办恭贺2024新春|八十老太婆乚乱婬视频|Chinese❌❌❌天美69|猫娘的触摸怎么下正版|第五人格女角色h文
05月28日,微视频|大洋对岸的“邻居”,蜜桃㊙️AV导航,男GayGays✅亚洲网站,小鲜肉男男Gay做受XXX红楼,韩国女团裸体无打码
05月28日,武铁五天假期共发送旅客455万人次,男S粗口辱骂m音频自慰专用,久久久久久久国产精品斗地主,欲漫涩app18❤网站成人版,三月七裸体被❌涩涩游戏
05月28日,2024年皖台学前教育研讨会在安徽合肥启幕,男生撕开👙👙暍奶,仙逆免费观看全集完整版高清,原神⚠️羞羞漫画sss入口,免费无遮挡视频搞机视频
05月28日|国际识局:韩国政局突变,总统为何难逃“青瓦台魔咒”?|女生鸡鸡图片|斗罗大陆2绝世唐门在线观看全集免费播放|妇科+偷拍+裸体+无码|ONE成人版官方网站
05月28日|【两会Vlog】亲历政协大会闭幕!小新感受同心聚力|玖辛奈裸体被❌羞羞|脱👙让学生C🐻-百度动漫|小南裸乳被爆❌白浆的漫画|斗罗大陆的衣服宁荣荣
05月28日|(寻味中华|文博)二月二日春正饶 “龙乡”寻迹“龙抬头”|露出调教羞耻91九色|by65777.com直接进入|巨乳❌自慰❌|邪恶张动态gif图片第500期
张雪峰公司五一不调休,黄圣依怼杨子演技|如何预防呼吸道疾病?感染呼吸道疾病后,应该如何用药?……权威解答来啦!|羞羞漫画❤️在线观看入口寄宿|3DHentai2DHentaiTouhou|欲漫涩app❤网站ios|把手伸胡桃的🍑www
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺