尊龙游戏人生就是博

妖精一级精品无码 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

目今位置:首页专题合集 → w3u7903ejky2ywls

尊龙凯时 - 人生就是搏!

论文秒变海报!开源框架PosterAgent一键天生顶会级学术Poster

论文秒变海报!开源框架PosterAgent一键天生顶会级学术Poster

鹭羽 发自 凹非寺量子位 | 公众号 QbitAI

你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)?

别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。

相比GPT-4o,PosterAgent天生指标更优,同时token使用量镌汰87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。

来自滑铁卢大学的联合研究团队,还全心构建了首个学术海报评估标准Paper2Poster,解决了长上下文、多模态压缩的评估空缺。

话未几说,先给各人展示一波效果,以下面这篇CV论文为例。

先喂给GPT-4o-image,获得的是这样的:

显然学术海报三要素(吸睛问题、重点突出、色彩排版),GPT-4o-image通通都没有。

无妨交给PosterAgent试试:

视觉更连贯、信息还高效,难怪连已经结业了的师兄师姐们都在X上哭诉,凭什么我们昔时没有它。

这下妈妈再也不必担心我做欠好Poster,被老板在群里夺命call了(狗头)。

下面来讲讲它为啥这么好用。

多模态海报自动天生

Poster在学术聚会里的主要性不言而喻,需要让与会者在几分钟内就迅速从中掌握焦点内容,这就很磨练制作者的论文浓缩能力,以及文本和图形的排版功底。

为了帮各人解放双手,以及更一目了然地评估海报效果,研究团队提出了评估基准Paper2Poster以及基于此构建的多智能体框架PosterAgent。

Paper2Poster:首个学术海报评估基准

Paper2Poster的数据包括100对AI领域论文和作者设计的海报,涵盖盘算机视觉(19%)、自然语言处置惩罚(17%)和强化学习(10%)等子领域的280个差别主题,论文平均22页,天生海报的文本压缩比约为14.4倍,图形镌汰比约为2.6倍。

评估指标笼罩四个基本维度:

视觉质量:使用CLIP图像嵌入丈量天生海报与作者设计海报之间的视觉相似度,再盘算图像和文本的相关性,以确保图像属于有用整合。文本连贯性:盘算文本在Llama-2-7b-hf下的标准疑心度(PPL),权衡文字流通度。整体评估:选择一个VLM(如GPT-4o),从美学(元素质量、结构平衡、加入度)信息(清晰度、完整性、逻辑流)两个方面举行1到5分打分。PaperQuiz:这是团队专门设计的评估指标,以模拟作者和读者的交流。让代表差别专业水平(例如学生和教授)的VLMs阅读每张海报并回覆考试,获得最高平均分的海报被以为在转达论文内容方面最有用。

PosterAgent:多阶段自动天生框架

凭证Paper2Poster的要求,团队设计了一个接纳自上而下设计理念的多智能体流程PosterAgent。

首先全局地将整个文档重组为精练、连贯的章节,然后举行局部精炼,以实现颗粒度对齐。

详细包括三个要害组件:

剖析器(Parser):将工具和基于LLM的摘要相连系,提取要害文本和视觉内容,天生结构化摘要库(如各章要点、主要图表)妄想器(Planner):匹配文本与图表,并用二叉树结构战略将其连贯排列,通过放大(zoom-in)机制迭代天生面板;嬷破-谈论器(Painter-Commenter):绘制器将内容转为精练的要点列表和用于渲染的可执行代码,而VLM作为谈论器提供结构反响,确保整体连贯性和阻止溢出。逾越GPT-4o?

眼见为实,为验证PosterAgent天生效果,研究职员用Paper2Poster评估了四类基线要领:

理想化要领(Oracle methods):包括原始PDF和作者设计的海报GT Poster,作为最佳泛起基准。端到端要领(End-to-end methods):使用GPT-4o多智能体事情流(Multi-agent work flows):使用OWLPPTAgentPosterAgent:框架变体分两种,PosterAgent-4o在内部LLM 和VLM谈论器均使用GPT-4o,PosterAgent-Qwen的文本天生使用Qwen-2.5-7B,谈论器则使用Qwen-2.5-VL-7B。

实验效果批注,在视觉质量和文本连贯性上,虽然4o-Image抵达了最高的视觉相似度,但它也纪录了最差的疑心度,说明天生的海报可能乍一看吸引人,但现实细看全是嘈杂或不连贯的文本。

PosterAgent则实现了最高的图形相关性,在视觉相似度上也紧随人类设计的海报。

当VLM评判时,PosterAgent-4o的平均得分为3.72,抵达了与人类设计海报相当的水平,而PPTAgent由于经常天生无意义的文本或大片空缺区域,因此得分都较低。

在PaperQuiz上,也能发明PosterAgent变体始终取得最佳分数。

值得注重的是,PosterAgent-4o虽然依据GPT-4o实现了冗长输出,但基于开源的Qwen-2.5系统变体在原始准确率上更胜一筹,说明PaperQuiz在评估时,内容量很主要,但泛起质量更主要。

团队还盘算了差别要领下的平均token本钱,PosterAgent仅使用101.1K和47.6Ktoken,相较于OWL-4o本钱降低了60%-87%,相当于每张海报只需要0.55美元(基于4o)或0.0045美元(基于Qwen)。

最后为了利便各人更直观地相识几种要领的海报天生效果,咱再举个例子。

这是论文作者自己做的,主题明确,重点突出,色彩搭配也协调。

这张来自GPT-4o-image,看起来似乎还行?可是仔细看文字,内里照旧有不少乱码。

这张由GPT-4o-html天生,图片嵌入失败,文本也缺少排版。

这张出自PPTAgent,天生了大宗空缺区域。

下面这张来自OWL,同样缺少图像,甚至没有多余色彩填充。

最后是咱们的PostAgent,比照下来,海报结构清晰明晰,图表与文字匹配度也相当高,在视觉效果上更靠近作者设计的海报。

扩展一下思绪,也许PosterAgent还可以用于制作课程学习资料。

公司里的PPT也未尝不可一试。

以是感兴趣的小同伴们速速珍藏起来这个海报神器~接下来的CVPR、ACL恰恰都可以用上。

论文链接:https://arxiv.org/abs/2505.21497代码链接:https://github.com/Paper2Poster/Paper2Poster项目链接:https://paper2poster.github.io/

参考链接:[1]https://x.com/real_weipang/status/1927797168171254006[2]https://x.com/_akhaliq/status/1927721150584390129

相关推荐:AI换脸王鹤棣喷水视频无码 银狼裸体被❌黄漫 原神胡桃裸体❌开腿自慰应用

分享: 2025-06-06 13:37:41 共81款

电脑

安卓

苹果

相关合集

网友谈论 审查所有谈论>>

揭晓谈论

(您的谈论需要经由审核才华显示) 网友粉丝QQ群号:766969941

审查所有0条谈论>>

【网站地图】【sitemap】