新智元报道
编辑:Aeneas 犀牛
【新智元导读】就在刚刚,智源研究员联合多所高�?湃钕蛄磕W�,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不必怕了!
检索增强手艺在代码及多模态场景中的施展着主要作用,而向量模子是检索增强系统中的主要组成部分。
针对这一需求,克日,智源研究院联合多所高校研发了三款向量模子,包括代码向量模子BGE-Code-v1,多模态向量模子BGE-VL-v1.5以及视觉化文档向量模子BGE-VL-Screenshot。
这些模子取得了代码及多模态检索的最佳效果,并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。
BGE自2023年8月宣布以来,已成为中国首个登顶Hugging Face榜首的国产AI模子以及2023年所有宣布模子的全球下载量冠军。
现在,BGE-Code-v1、BGE-VL-v1.5、BGE-VL-Screenshot三款模子已向社区周全开放,为相关手艺研究与工业应用提供助力。
BGE-Code-v1:
模子地点:https://huggingface.co/BAAI/bge-code-v1
项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_Coder
论文链接:https://arxiv.org/abs/2505.12697
BGE-VL-v1.5:
模子地点:https://huggingface.co/BAAI/BGE-VL-v1.5-zs
项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_VL
论文链接:https://arxiv.org/abs/2412.14475
BGE-VL-Screenshot:
模子地点:https://huggingface.co/BAAI/BGE-VL-Screenshot
项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_VL_Screenshot
论文链接:https://arxiv.org/abs/2502.11431
由智源研究院主导研发的通用向量模子系列BGE,旨在为种种数据提供高效一站式向量表征与语义检索计划,已推出笼罩中英文、多语言检索及重排模子等多个版本,一连刷新MTEB、C-MTEB、BEIR、MIRACL等主流文本向量评测基准。
BGE依附高性能与开源特征备受业界关注,已普遍应用于RAG、神经搜索等场景,累计下载超6亿次,被海内外多家AI企业集成。
现在,检索增强手艺正从古板的文本场景逐步拓展至涵盖代码与视觉等多模态数据的应用。
然而,相较于文本事域,现有向量模子在代码和视觉模态中的检索效果仍有待提升。
此次智源研究院宣布的三款新模子,为构建更强盛的多模态检索增强系统提供了有力的支持。
BGE-Code-v1
新一代代码优化语义向量模子
随着基础模子代码能力快速生长,Cursor、Copilot等辅助编程工具大幅提升生产力。
在面临百万行级代码库时,代码块检索增强需求凸显,因此检索模子的代码明确能力至关主要。
BGE-Code-v1是以Qwen2.5-Coder-1.5B为基座打造的新一代代码向量模子,专为种种代码检索相关使命而设计,同时配备了强盛的多语言文本明确能力。
模子基于CoIR训练集和大宗高质量代码-文本的合成数据举行训练,并使用课程学习,以BGE-gemma2-multilingual 的retrieval、STS数据为辅助,进一步提升代码与文本的明确能力。
BGE-Code-v1适用于开发文档搜索、代码库语义检索、跨语言信息获取等多种现实应用场景,是面向代码-文本检索使命的最优选择。
CoIR代码检索基准,网络了笼罩14种编程语言的4大类8个子使命,能够有用地评估模子在自然语言和代码的种种混淆场景中的检索能力。
CodeRAG-Bench基准评估了代码检索模子在代码检索增强(RACG)中的体现。
BGE-Code-v1在两个基准上均以显著优势逾越谷歌、Voyage AI、Salesforce、Jina等商业/开源模子,登顶SOTA。
BGE-VL-v1.5
通用多模态检索模子
BGE-VL-v1.5 完成多模态检索使命
BGE-VL-v1.5是基于LLaVA-1.6(7.57B参数)训练的新一代通用多模态检索模子,周全升级了图文明确能力并具有更强盛的检索能力。
BGE-VL-v1.5在MagePairs 300万 (3M) 图文对齐数据基础上又网络了共100万条自然与合成数据(涵盖image-captioning数据、视觉问答数据、分类使命数据)举行多使命训练,显著地提升了模子在种种使命上的泛化性与明确能力。
基于MegaPairs数据,BGE-VL-v1.5在多模态检索使命中性能优势显著,不但在图像检索中体现强劲,更在通用多模态场景中展现高顺应性与准确率,适用于图文匹配、多模态问答、跨模态推荐等场景。
MMEB是目今使用最普遍的多模态向量基准,由:分类、视觉问答、检索、视觉基础知识,四类使命组成。
基于zero-shot设置(未使用MMEB训练集),BGE-VL-v1.5-zs在MMEB基准中刷新zero-shot模子最佳体现;在检索使命上,基于MMEB微调的BGE-VL-v1.5-MMEB以72.16分登顶SOTA。
BGE-VL-Screenshot
适用强盛的视觉化文档向量模子
现实场景中网页、文档等多模态使命常由图文、符号、图表等多元素混淆数据组成,这类使命称为「可视化信息检索」(Vis-IR),因此,多模态模子不但需要具备从重大结构中提取要害信息的视觉能力,还需精准明确文本与视觉语义。
现在,现有检索模子在此类使命中体现欠佳。
BGE-VL-Sc基于截图与文本检索
BGE-VL-Screenshot模子基于Qwen2.5-VL-3B-Instruct,以新闻、商品、论文、文档、项目主页等七类数据源举行训练,网络凌驾1300万张截图和700万组标注截图问答样本。
为了准确评估模子在Vis-IR使命上的体现,团队设计并推出了多模态检索基准MVRB(Massive Visualized IR Benchmark,涵盖截图检索、复合截图检索、截图QA和开放分类4项使命共20个数据集。
MVRB榜单链接:https://huggingface.co/spaces/BAAI/MVRB_leaderboard)
BGE-VL-Screenshot在4项使命中体现精彩,以60.61的综合得分抵达SOTA。
在此基础上,通过少量query2screenshot多语言数据训练,模子实现了在英文之外的多语言使命上的精彩体现。
智源研究院将继续深耕向量模子与检索增强手艺,进一步提升BGE模子系列的能力与通用性。
未来期待与更多科研机构与工业同伴相助,配合推动检索与人工智能生长�=哟泶笱芯空哂肟⒄吖刈⒉⑹褂� BGE 系列模子,共建开放昌盛的开源生态。
蜜桃av秘无码一区三区 | 2天前 |
小舞3D❌禁漫在线看Porn |
91亚洲精品乱码久久久久久蜜桃 | 7天前 |
揉⋯啊⋯嗯~出水了花城 |
美女隐私㊙️免费观看视频 | 1天前 |
椎冰怜 |
女性裸体㊙️无遮放屁 | 6天前 |
免费A片毛片一级二级 |
王雨露孔头大全列表 | 7天前 |
挠美女的隐私㊙️部位VK作文 |
cos被❌到爽羞无码 | 5天前 |
透明内裤被巴撑起的图片 |
re5cc回家通道 | 5天前 |
女子赤裸洗澡视频㊙️ |
后仰深喉尿进嘴 | 8天前 |
JK女高中生裸体被❌哭 |
熟妇人妻中文AV无码6070 | 7天前 |
里番app❤网站成人版 |
秦彻粗大的内捧猛烈进出 | 2天前 |
www深夜成人🔞网站视频 |