尊龙游戏人生就是博

首页

下载APP

Meta「轻量级」KernelLLM倾覆GPU内核天生，8B参数碾压GPT-4o

新智元报道

编辑：英智

【新智元导读】Meta推出KernelLLM，这个基于Llama 3.1微调的8B模子，竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示，它的单次推理性能逾越GPT-4o和DeepSeek V3，多次天生时得分飙升。

在AI领域，参数规模曾被视为「性能天花板」。

Meta最新宣布的KernelLLM，却用8B参数的「小身板」，在GPU内核天生使命中把200B的GPT-4o按在地上摩擦。

这是一个基于Llama 3.1 Instruct举行微调的8B参数模子，旨在将PyTorch？樽远晃咝У腡riton GPU内核。

KernelLLM简直是GPU内核开发神器，用更少的参数实现了更强的性能，且简朴易用。

它只有8B参数，可是在KernelBench-Triton Level 1，单次推理性能凌驾了GPT-4o和DeepSeek V3。

通过多次推理，KernelLLM性能优于DeepSeek R1。

这一切都来自一个参数规模比竞争敌手小两个数目级的模子。

@Denis Kanonik吐槽「这又是用测试集训练的吗？」

KernelLLM让内核开发更易上手

KernelLLM是一款基于Llama 3.1 Instruct的8B模子，专门针对用Triton编写GPU内核的使命举行了训练。

它能让GPU编程变得更简朴，实现高性能GPU内核天生的自动化。

KernelLLM通过自动化天生高效的Triton实现，知足对高性能GPU内核日益增添的需求。

随着事情负载的增大和加速器架构的多样化，对定制化内核解决计划的需求显著增添。

现在市面上许多相关工具，要么只能在测试的时间优化，要么就只盯着KernelBench的问题调优，很难应对更普遍的场景。

KernelLLM是首个在外部（PyTorch，Triton）代码对数据上举行微调的LLM。

Triton内核天生事情流程

把PyTorch代码输进去，KernelLLM就会天生Triton内核候选代码。

然后用单位测试来验证这些代码，用随机输入跑一跑，看看输出对差池。要是天生好几个候选代码，还能比比哪个最好，挑出最优的。

KernelLLM的Triton内核天生流程：用KernelLLM把PyTorch代码翻译成Triton内核的候选代码。天生的代码会通过单位测试验证，测试用已知形状的随机输入数据运行内核。这个流程支持天生多个候选代码（通过 pass@k评估），增添候选数目来提高质量，最后选出最好的Triton内核实现作为输出（绿色部分）

为了训练这个模子，团队可是下了大功夫，用了25000多对（PyTorch，Triton）代码示例，尚有合成的样本。

这些数据一部分来自TheStack的过滤代码，一部分是通过torch.compile () 和提醒手艺天生的。

数据集KernelBook，参考链接：https://huggingface.co/datasets/GPUMODE/KernelBook。

训练时用的是Llama3.1-8B-Instruct模子，在自界说数据集上做了监视微调（SFT），测试它在KernelBench-Triton上天生准确Triton内核及挪用代码的能力。

KernelBench-Triton是基于KernelBench[Ouyang et al. 2025]开发的变体，专注Triton内核天生。

训练和评估时，PyTorch代码会设置一个包括名堂示例的提醒模板作为指令。

模子训练了10个epoch，批巨细为32，接纳标准SFT要领，超参数凭证验证集的疑心度（perplexity）来选择。

训练用了16个GPU，共耗时12小时（192 GPU小时），报告了最佳检查点的验证效果。

性能评估

只管模子规模较小，但其性能可与最先进的LLM相媲美。

KernelBench-Triton测试中，8B参数的KernelLLM，单次推理得分20.2，比671B参数的DeepSeek V3（16分）和200B参数的GPT-4o（15分）都高。

要是多天生几个候选代码，得分还能蹭蹭往上涨，天生10个的时间能到51.8分，20个的时间能到57.1分。

KernelLLM推理用temperature=1.0和top_p=0.97运行。

在KernelBench上测试了模子，这是一个开源基准测试，用于评估LLM编写的高效GPU内核的能力。

它包括250个全心挑选的PyTorch？，按负载调解，从简朴的单操作（如Conv2D或Swish，Level 1）到完整的模子架构（Level 3）。

它在差别难度的使命里体现都很稳，不管是简朴的单个操作符，照旧重大的模子架构，都能应对。

测试会同时降低代码的准确性（通过与参考PyTorch输出比照）和性能（通过与基准实现的加速比）。

团队开发了一个新的KernelBench-Triton变体，专门评估LLM天生Triton内核的能力，很是适合测试KernelLLM。

所有测试都在NVIDIA H100 GPU上完成。

KernelLLM在pass@k中体现出近似对数线性的扩展行为

KernelLLM怎么用？

先装几个依赖包：

用的时间，先导入库，挪用generate_triton函数，就能天生优化后的Triton代码啦。

KernelLLM提供了一个简朴的接口，用于从PyTorch代码天生Triton核。

要是不想写剧本，还能直接运行python kernelllm.py，使用内置的REPL接口，翻开交互式界面，实时看效果。

kernelllm.py提供了多种与模子交互的要领。

KernelLLM提供了几种自界说天生历程的要领：

有时它会犯点小过失，好比API引用差池、语法蜕化，有时间还不太能按指令天心理想的内核。

天生的代码结构有点像编译器自动吐出来的，有时在变量命名、张量形状、类型处置惩罚和数值精度这些细节上也容易出问题。

参考资料：

https://x.com/reach_vb/status/1924478755898085552

https://huggingface.co/facebook/KernelLLM

《甘雨被触手怪❌吸乳的》，《w3u7903ejky2ywls》

东北狗儿娘的原著小说

“脱👙让摸🐻91网站”

樱桃控久久AV㊙️一区二区

……

05月30日

“青少年GaYGAYS✅视频”在韩大熊猫福宝4月初返回四川

↓↓↓

薛之谦汕头抢票，是作家琼瑶自杀身亡遗书曝光

05月30日，多地开始40℃高温模式，要做哪些准备？，娼年贞德漫画汉化版免费，茶茶红润脚底lvk，XNXXX中国👙👙，❌❌❌免费裸体拉屎全过程，扒开狂揉难受sm|伸进她的小内裤疯狂揉摸的照片|动漫被❌到爽🔞巨乳视|女性无遮掩裸体㊙️壁纸|精品人妻无码专区在线视频|可以射妹妹脚上

05月30日，湖南怀化国际陆港跨境电商产业园开园，高潮✡️喷水✡️AⅤ，曼珠沙华裸身被❌羞羞照片，furry喵鲨18❌动漫网站的，男男被x❌x到无套

05月30日，新疆巴音布鲁克草原牲畜陆续转入冬季牧场，动漫c黄扒衣服做小电影，女女舌吻互吃奶摸下边，eseoa雅，消防员Gay吊大且硬喷浓精

05月30日，东西问·汉学家丨意汉学家里卡多·波佐：儒学为当今世界带来哪些启示？，乌兰图雅一级毛片看XXXX，少妇自慰喷水www动漫，亚洲AV无码4480私人小说，XXXxX性女HD性爽

05月30日|拜登邀特朗普白宫讨论过渡事宜会面持续约2小时|女性脱👙给我揉🐻的拉屎图片|裸体裸乳被🍑无码打扑克动漫|老师腿开大点我添添公视频|免费看男人吃奶摸捏奶头视频

05月30日|打好能源保供“组合拳” 让居民过冬暖意融融|成人🔞爱爱网站|暴躁少女csgo比赛怎么触发|欧美大群交100%|面具公社网页1网页2

05月30日|去年北京新开业大型商业设施240万平方米消费环境持续优化|弹丸论破裸体❌开腿P图|女的想被❌在线看|揉我⋯啊⋯嗯～出水了视频小玩具|91少萝大🐻被c……

05月30日，汽车之家《新能源超测》：推动共建以用户需求为导向的评测体系，新有菜电影免费观看完整版，偷拍美女撒尿❌❌❌网站，五星视频58星币入口网站，打屁股女隐私从光打到红

05月30日，丁薛祥出席何梁何利基金2024年度颁奖大会并讲话，免費A漫-禁漫天堂，美女全身裸体㊙️无遮挡，学女脱小内内喷水自慰av网站，女人喷水🔥视频

05月30日|（新春见闻）满载年货的特快货物班列进京保供春节市场|再深点灬舒服灬太大了老师|私密按摩高潮10次会得白血病吗|被体育生抱进小树林c个爽|无翼乌☆acg里番本子app

05月30日，聚焦服务精准化陕西多部门联动为民营企业“聚才引智”，免费观看欧美大片的影视软件，XXNX16👙中国免费视频视频，女友荡乳欲伦交换小说，国产强伦姧人妻毛片

05月30日，（巴黎奥运）奥运体操项目收官邹敬园夺男子双杠金牌，媚黑大战系列在线观看，偷窥沟厕女厕白嫩大屁股，巨胸爆乳露双奶头被❌图片，甜蜜日记火影动画免费观看

05月30日，“搭便车”出事故如何担责？最高法解答，美女裸身❌❌免费视频中国，91在线精品㊙️一区二区黄瓜，揉我奶啊岳乱，扭曲的王座成人版剧情简介

05月30日|（经济观察）设“有罪推定” 欧盟惹众怒|岳把我添高潮了A片漫画|成人调教sm影片|忘穿内裤被同桌自慰好爽|🔞🍌进🍑里❌❌❌玩漫画

05月30日|张纪中忆金庸：武林繁华依旧昭昭山水会相逢|男男纯肉gv无码免费播放按摩|王者本子云缨|爽好大快要尿小樱|早晨被肉醒H吃奶1v1视频

05月30日|新疆阿勒泰通往贾登峪道路已抢通滞留的27名游客已顺利下山|女仆被❌羞羞嗯动漫|gangbagng日本|AI聊天成人18禁㊙️|红杏视视频免费网站入口

郝蕾表演课300一节，俄罗斯更换海军司令克宫拒绝置评|澳门“咏春达人”传承红船木人桩一招一式尽显乾坤|女人自慰sficoHD|卡通动漫另类小说区|程潇被❌到爽🔞高潮痉挛|太中r18做❤️图

G2首战不敌蒙古队，为什么要带来小费这种陋习？|方励：人生苦短，及时追梦|窒物者小g白丝震动b丨VK|国产精品㊙️入口swag小说|亚洲国产精品㊙️麻豆蝴蝶传媒|尿孔➕灌➕电击➕调教视频网站

小米，王昶回国要去看JonyJ和GALI演出|河北蔚县开展传统村落古建修缮保护工程|禁止🚫18珍妮模组免费下载|原神希格雯裸体❌开腿|furry涩涩漫画❤网站|国产精品㊙️果冻传媒范可可

长城汽车员工大批离职，伊利否认员工女乒决赛做侮辱性手势|孩子学过的字转眼就忘，该怎么办？|国产重口泻火老女人|宁荣荣脱内衣捏奶头视频网站|❤️爱情岛永久免费线路高清|🌸✿极品国产✿🌸白皙

五一档新片票房破9亿，曹利国晋级决赛|4800余名跑友贺兰山下鸣枪开跑“寻酒香”|井野张开双腿给鸣人矂小说|男人下部隐私㊙️撒尿|无机杀手羞羞黄污|XXNX15👙日本视频。

曼城3比2逆转纽卡，美日中的恐怖片风格区别是什么|广西统战力量建设长者食堂情暖隆安东安村乡亲|爽⋯好大⋯快⋯奶水声音91|男人的伸到里51动漫|美杜莎被❌纯肉高H动漫|亚洲AV㊙️无码三上优亚张婉莹扒开内裤羞羞❌网站

与爱同居，谜探休格第一季|近十年最大规模吴湖帆作品展在上海举办|春野樱被爆❌自慰流水网站|日本人吃胸玩乳30分钟|关晓彤双腿被c到流白浆的作文|ie炒菜在线观看

监制：邓金木

策划：赖晗

主创：唐征宇林箴贺陈佛烘颜亦阳陈林韵

编辑：王家菁、段圣祺

热门视频

Copyright © 2014 福建省广播影视集团版权所有

任何机构或小我私家未经福建省广播影视集团书面授权允许，不得私自转载、摘编或以其他方法商业使用或撒播本网站内容。本网站用字经朴直字库授权允许。

信息网络撒播视听节目允许证号：1307201 网站备案/允许证号: 闽ICP备08011194 互联网新闻信息效劳允许证号：35120170002

Addr：福建省福州市西环南路128号 Post：350004

闽公网安备 35010302000113号

【网站地图】【sitemap】