2025-05-31 06:14:35 2,711次浏览

新智元报道

编辑:Aeneas 犀牛

【新智元导读】就在刚刚 ,智源研究员联合多所高?湃钕蛄磕W ,以大优势登顶多项测试基准。其中 ,BGE-Code-v1直接击穿代码检索天花板 ,百万行级代码库再也不必怕了!

检索增强手艺在代码及多模态场景中的施展着主要作用 ,而向量模子是检索增强系统中的主要组成部分。

针对这一需求 ,克日 ,智源研究院联合多所高校研发了三款向量模子 ,包括代码向量模子BGE-Code-v1 ,多模态向量模子BGE-VL-v1.5以及视觉化文档向量模子BGE-VL-Screenshot。

这些模子取得了代码及多模态检索的最佳效果 ,并以较大优势登顶CoIR、Code-RAG、MMEB、MVRB等领域内主要测试基准。

BGE自2023年8月宣布以来 ,已成为中国首个登顶Hugging Face榜首的国产AI模子以及2023年所有宣布模子的全球下载量冠军。

现在 ,BGE-Code-v1、BGE-VL-v1.5、BGE-VL-Screenshot三款模子已向社区周全开放 ,为相关手艺研究与工业应用提供助力。

BGE-Code-v1:

模子地点:https://huggingface.co/BAAI/bge-code-v1

项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_Coder

论文链接:https://arxiv.org/abs/2505.12697

BGE-VL-v1.5:

模子地点:https://huggingface.co/BAAI/BGE-VL-v1.5-zs

项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_VL

论文链接:https://arxiv.org/abs/2412.14475

BGE-VL-Screenshot:

模子地点:https://huggingface.co/BAAI/BGE-VL-Screenshot

项目主页:https://github.com/FlagOpen/FlagEmbedding/tree/master/research/BGE_VL_Screenshot

论文链接:https://arxiv.org/abs/2502.11431

由智源研究院主导研发的通用向量模子系列BGE ,旨在为种种数据提供高效一站式向量表征与语义检索计划 ,已推出笼罩中英文、多语言检索及重排模子等多个版本 ,一连刷新MTEB、C-MTEB、BEIR、MIRACL等主流文本向量评测基准。

BGE依附高性能与开源特征备受业界关注 ,已普遍应用于RAG、神经搜索等场景 ,累计下载超6亿次 ,被海内外多家AI企业集成。

现在 ,检索增强手艺正从古板的文本场景逐步拓展至涵盖代码与视觉等多模态数据的应用。

然而 ,相较于文本事域 ,现有向量模子在代码和视觉模态中的检索效果仍有待提升。

此次智源研究院宣布的三款新模子 ,为构建更强盛的多模态检索增强系统提供了有力的支持。

BGE-Code-v1

新一代代码优化语义向量模子

随着基础模子代码能力快速生长 ,Cursor、Copilot等辅助编程工具大幅提升生产力。

在面临百万行级代码库时 ,代码块检索增强需求凸显 ,因此检索模子的代码明确能力至关主要。

BGE-Code-v1是以Qwen2.5-Coder-1.5B为基座打造的新一代代码向量模子 ,专为种种代码检索相关使命而设计 ,同时配备了强盛的多语言文本明确能力。

模子基于CoIR训练集和大宗高质量代码-文本的合成数据举行训练 ,并使用课程学习 ,以BGE-gemma2-multilingual 的retrieval、STS数据为辅助 ,进一步提升代码与文本的明确能力。

BGE-Code-v1适用于开发文档搜索、代码库语义检索、跨语言信息获取等多种现实应用场景 ,是面向代码-文本检索使命的最优选择。

CoIR代码检索基准 ,网络了笼罩14种编程语言的4大类8个子使命 ,能够有用地评估模子在自然语言和代码的种种混淆场景中的检索能力。

CodeRAG-Bench基准评估了代码检索模子在代码检索增强(RACG)中的体现。

BGE-Code-v1在两个基准上均以显著优势逾越谷歌、Voyage AI、Salesforce、Jina等商业/开源模子 ,登顶SOTA。

BGE-VL-v1.5

通用多模态检索模子

BGE-VL-v1.5 完成多模态检索使命

BGE-VL-v1.5是基于LLaVA-1.6(7.57B参数)训练的新一代通用多模态检索模子 ,周全升级了图文明确能力并具有更强盛的检索能力。

BGE-VL-v1.5在MagePairs 300万 (3M) 图文对齐数据基础上又网络了共100万条自然与合成数据(涵盖image-captioning数据、视觉问答数据、分类使命数据)举行多使命训练 ,显著地提升了模子在种种使命上的泛化性与明确能力。

基于MegaPairs数据 ,BGE-VL-v1.5在多模态检索使命中性能优势显著 ,不但在图像检索中体现强劲 ,更在通用多模态场景中展现高顺应性与准确率 ,适用于图文匹配、多模态问答、跨模态推荐等场景。

MMEB是目今使用最普遍的多模态向量基准 ,由:分类、视觉问答、检索、视觉基础知识 ,四类使命组成。

基于zero-shot设置(未使用MMEB训练集) ,BGE-VL-v1.5-zs在MMEB基准中刷新zero-shot模子最佳体现;在检索使命上 ,基于MMEB微调的BGE-VL-v1.5-MMEB以72.16分登顶SOTA。

BGE-VL-Screenshot

适用强盛的视觉化文档向量模子

现实场景中网页、文档等多模态使命常由图文、符号、图表等多元素混淆数据组成 ,这类使命称为「可视化信息检索」(Vis-IR) ,因此 ,多模态模子不但需要具备从重大结构中提取要害信息的视觉能力 ,还需精准明确文本与视觉语义。

现在 ,现有检索模子在此类使命中体现欠佳。

BGE-VL-Sc基于截图与文本检索

BGE-VL-Screenshot模子基于Qwen2.5-VL-3B-Instruct ,以新闻、商品、论文、文档、项目主页等七类数据源举行训练 ,网络凌驾1300万张截图和700万组标注截图问答样本。

为了准确评估模子在Vis-IR使命上的体现 ,团队设计并推出了多模态检索基准MVRB(Massive Visualized IR Benchmark ,涵盖截图检索、复合截图检索、截图QA和开放分类4项使命共20个数据集。

MVRB榜单链接:https://huggingface.co/spaces/BAAI/MVRB_leaderboard)

BGE-VL-Screenshot在4项使命中体现精彩 ,以60.61的综合得分抵达SOTA。

在此基础上 ,通过少量query2screenshot多语言数据训练 ,模子实现了在英文之外的多语言使命上的精彩体现。

智源研究院将继续深耕向量模子与检索增强手艺 ,进一步提升BGE模子系列的能力与通用性。

未来期待与更多科研机构与工业同伴相助 ,配合推动检索与人工智能生长=哟泶笱芯空哂肟⒄吖刈⒉⑹褂 BGE 系列模子 ,共建开放昌盛的开源生态。

尊龙游戏人生就是博

多模态检索大升级!智源三大SOTA模子 ,代码、图文明确能力拉满
多模态检索大升级!智源三大SOTA模子,代码、图文明确能力拉满

多模态检索大升级!智源三大SOTA模子 ,代码、图文明确能力拉满

「统计」w3u7903ejky2ywls

1.29MB
版本V8.1.74
下载抖音网红weme圈免费看装置你想要的应用 更利便 更快捷 发明更多
喜欢 31%好评(42996人)
谈论 76
多模态检索大升级!智源三大SOTA模子,代码、图文明确能力拉满截图0 多模态检索大升级!智源三大SOTA模子,代码、图文明确能力拉满截图1 多模态检索大升级!智源三大SOTA模子,代码、图文明确能力拉满截图2 多模态检索大升级!智源三大SOTA模子,代码、图文明确能力拉满截图3 多模态检索大升级!智源三大SOTA模子,代码、图文明确能力拉满截图4
详细信息
  • 软件巨细: 43035.95329MB
  • 最后更新: 2025-05-31 06:14:35
  • 最新版本: V9.91097.7
  • 文件名堂: apk
  • 应用分类:ios-Android 疯狂做受XXXX高潮A片
  • 使用语言: 中文
  • : 需要联网
  • 系统要求: 1.86300以上
应用先容
一 ,哥哥买了100根棉签 ,朴彩英被c到高潮下不了床网站
二 ,芙宁娜❌暴爽自慰喷水 ,动画埃及猫拔萝卜原创版视频
三 ,99在线无码精品㊙️黑桃 ,猛男GayGay✅视频网站
四 ,t66y.com 永久地址 ,原神温迪被❌到深处喷水视频
五 ,舞蹈生被揉到高潮下不了床 ,连续潮喷失禁小说H
六 ,www.猎奇另类.com,69式互添AAAA片 ,美女被捆绑㊙️
七 ,汤姆维的姐姐电影
【联系尊龙游戏人生就是博】
客服热线:134-2881-646
加载更多
版本更新
V9.8.24
heeljob榨精高跟鞋踩踏

宝可梦狂桶沙奈朵出血 类似软件

猜你喜欢

相关攻略
包括 饿了么 的应用集
包括 饿了么 的应用集
谈论
  • 3D被❌到爽羞羞网站 4天前
    面积最小的三点式大赛视频
  • 男男被❌到爽🔞无 1天前
    18cm男性生勃起殖器官图片
  • /18🈲小泬破白浆啪啪69黑人 2天前
    偷看美女隐私㊙️拉屎
  • 夹道具羞耻play❌哭视频英文 4天前
    亚洲做受❌❌❌高潮深喉小说
  • 光网站免费观看18🈲美女 2天前
    强行扒开腿❌狂揉❌玩各种玩具
  • 停云被❌羞辱打开腿 5天前
    鸣人❌黑土18禁同人无码
  • 国外美女的换装瞬间 4天前
    嫩草研究院❤️永久入口
  • 草莓视频成人网站免费 7天前
    FreeJAV HD Online ✅
  • 砂狼白子屈辱打开双腿自慰 2天前
    看唐舞桐胸㊙️
  • 精品国产❌❌❌国产没封 5天前
    丝袜足控免费视频❌Xx一区