论文秒变海报!开源框架PosterAgent一键天生顶会级学术Poster
鹭羽 发自 凹非寺量子位 | 公众号 QbitAI
你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)?
别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。
相比GPT-4o,PosterAgent天生指标更优,同时token使用量镌汰87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。
来自滑铁卢大学的联合研究团队,还全心构建了首个学术海报评估标准Paper2Poster,解决了长上下文、多模态压缩的评估空缺。
话未几说,先给各人展示一波效果,以下面这篇CV论文为例。
先喂给GPT-4o-image,获得的是这样的:
显然学术海报三要素(吸睛问题、重点突出、色彩排版),GPT-4o-image通通都没有。
无妨交给PosterAgent试试:
视觉更连贯、信息还高效,难怪连已经结业了的师兄师姐们都在X上哭诉,凭什么我们昔时没有它。
这下妈妈再也不必担心我做欠好Poster,被老板在群里夺命call了(狗头)。
下面来讲讲它为啥这么好用。
多模态海报自动天生
Poster在学术聚会里的主要性不言而喻,需要让与会者在几分钟内就迅速从中掌握焦点内容,这就很磨练制作者的论文浓缩能力,以及文本和图形的排版功底。
为了帮各人解放双手,以及更一目了然地评估海报效果,研究团队提出了评估基准Paper2Poster以及基于此构建的多智能体框架PosterAgent。
Paper2Poster:首个学术海报评估基准
Paper2Poster的数据包括100对AI领域论文和作者设计的海报,涵盖盘算机视觉(19%)、自然语言处置惩罚(17%)和强化学习(10%)等子领域的280个差别主题,论文平均22页,天生海报的文本压缩比约为14.4倍,图形镌汰比约为2.6倍。
评估指标笼罩四个基本维度:
视觉质量:使用CLIP图像嵌入丈量天生海报与作者设计海报之间的视觉相似度,再盘算图像和文本的相关性,以确保图像属于有用整合。文本连贯性:盘算文本在Llama-2-7b-hf下的标准疑心度(PPL),权衡文字流通度。整体评估:选择一个VLM(如GPT-4o),从美学(元素质量、结构平衡、加入度)信息(清晰度、完整性、逻辑流)两个方面举行1到5分打分。PaperQuiz:这是团队专门设计的评估指标,以模拟作者和读者的交流。让代表差别专业水平(例如学生和教授)的VLMs阅读每张海报并回覆考试,获得最高平均分的海报被以为在转达论文内容方面最有用。
PosterAgent:多阶段自动天生框架
凭证Paper2Poster的要求,团队设计了一个接纳自上而下设计理念的多智能体流程PosterAgent。
首先全局地将整个文档重组为精练、连贯的章节,然后举行局部精炼,以实现颗粒度对齐。
详细包括三个要害组件:
剖析器(Parser):将工具和基于LLM的摘要相连系,提取要害文本和视觉内容,天生结构化摘要库(如各章要点、主要图表)妄想器(Planner):匹配文本与图表,并用二叉树结构战略将其连贯排列,通过放大(zoom-in)机制迭代天生面板;嬷破-谈论器(Painter-Commenter):绘制器将内容转为精练的要点列表和用于渲染的可执行代码,而VLM作为谈论器提供结构反响,确保整体连贯性和阻止溢出。逾越GPT-4o?
眼见为实,为验证PosterAgent天生效果,研究职员用Paper2Poster评估了四类基线要领:
理想化要领(Oracle methods):包括原始PDF和作者设计的海报GT Poster,作为最佳泛起基准。端到端要领(End-to-end methods):使用GPT-4o多智能体事情流(Multi-agent work flows):使用OWLPPTAgentPosterAgent:框架变体分两种,PosterAgent-4o在内部LLM 和VLM谈论器均使用GPT-4o,PosterAgent-Qwen的文本天生使用Qwen-2.5-7B,谈论器则使用Qwen-2.5-VL-7B。
实验效果批注,在视觉质量和文本连贯性上,虽然4o-Image抵达了最高的视觉相似度,但它也纪录了最差的疑心度,说明天生的海报可能乍一看吸引人,但现实细看全是嘈杂或不连贯的文本。
PosterAgent则实现了最高的图形相关性,在视觉相似度上也紧随人类设计的海报。
当VLM评判时,PosterAgent-4o的平均得分为3.72,抵达了与人类设计海报相当的水平,而PPTAgent由于经常天生无意义的文本或大片空缺区域,因此得分都较低。
在PaperQuiz上,也能发明PosterAgent变体始终取得最佳分数。
值得注重的是,PosterAgent-4o虽然依据GPT-4o实现了冗长输出,但基于开源的Qwen-2.5系统变体在原始准确率上更胜一筹,说明PaperQuiz在评估时,内容量很主要,但泛起质量更主要。
团队还盘算了差别要领下的平均token本钱,PosterAgent仅使用101.1K和47.6Ktoken,相较于OWL-4o本钱降低了60%-87%,相当于每张海报只需要0.55美元(基于4o)或0.0045美元(基于Qwen)。
最后为了利便各人更直观地相识几种要领的海报天生效果,咱再举个例子。
这是论文作者自己做的,主题明确,重点突出,色彩搭配也协调。
这张来自GPT-4o-image,看起来似乎还行?可是仔细看文字,内里照旧有不少乱码。
这张由GPT-4o-html天生,图片嵌入失败,文本也缺少排版。
这张出自PPTAgent,天生了大宗空缺区域。
下面这张来自OWL,同样缺少图像,甚至没有多余色彩填充。
最后是咱们的PostAgent,比照下来,海报结构清晰明晰,图表与文字匹配度也相当高,在视觉效果上更靠近作者设计的海报。
扩展一下思绪,也许PosterAgent还可以用于制作课程学习资料。
公司里的PPT也未尝不可一试。
以是感兴趣的小同伴们速速珍藏起来这个海报神器~接下来的CVPR、ACL恰恰都可以用上。
论文链接:https://arxiv.org/abs/2505.21497代码链接:https://github.com/Paper2Poster/Paper2Poster项目链接:https://paper2poster.github.io/
参考链接:[1]https://x.com/real_weipang/status/1927797168171254006[2]https://x.com/_akhaliq/status/1927721150584390129
嗯~用力啊~嗯~c我~白洁视频
中国美女做浣肠㊙️视频
博人扒开雏田屁股桶爽小说
XXNX👙老帅免费
女人自慰✅免费观看
伽罗太华被X哭还
新娘伴娘双飞免费观看
SPARK实践拍击视频OTK
女警冰奴裸体调教乳环视频
明星被❌免费网站视频在线
女人C交ZOOZOOZXX3O
爱情岛❤️论坛成人AV
国产精品🈲719.cc
肥岳啊~啊你tm别了小说男男
免费无遮挡🔞视频网站色大师
美女🔞男女激情晚上看电影
女班主任脱了衣服让男学生摸
小东西好久都没你了
青青子衿在线观看免费完整版
茄子成人看A∨片免费软件
gb四爱小狗爆炒视频
照美冥的自拍方式
大雷擦狙网站免费不下载
东北农村大炕偷乱视频
女生㊙️裸体免费视频
18中国🍆🍑🔞霉霉
成人扒开伸进香蕉
男生撒尿大全㊙️
♥草莓视频app❤18在线软件
星野vs光头原视频
国产女黄A片AA片夜玫瑰
咬儿媳妇奶头舔她屁眼
无遮挡🔞游戏
触手魅魔产卵榨乳H漫画在线阅读
碧蓝航线黄改版下载
▇无码精品国产AV在线观看
欧美肥大BBBBBBBBB
大雷擦大狙官网免费入口
原神芙宁娜裸体被❌羞羞网站
奇优影院❤手机在线
软萌白丝自慰喷水
蜜桃秘视频被男人
主奴sm跪趴调教老师与学生
色欲多多精品亚洲Av无码一区
女同做爰HD片免费看
m3u8免费看成人影视软件
芥敦r18道具车
🌸国产极品🌸白皙爆乳
少司缘裸体开腿裸体视频
在线精品㊙️比基尼
免费🔞成人❌❌软件
星空无限传媒官网免费观看电视剧
女性脱👙给我揉🐻蓝莓
周于希视频绝版在线观看
Free❌❌❌国产天美MD
小武与妈妈1~9节内容概括
老师让我❌了一天在线观看
男模隐私㊙️网站不遮挡无内裤
七海千秋被❌自慰爽死
欧美做爱4777cos
被爆🌿18禁止🚫久久影视
靓女慧娘电影完整版在线观看
开心鲁鲁婷婷
男男🈲🈲❌❌❌
用力挤压夹男人的🍌图片
成人纯H有声小说网站
ai迪丽热巴被出水来
🔞🍌进去里❌❌❌又大又黄
欲漫涩app❤网站无删减
《变态作文》
少妇喷潮❌❌⭕⭕游戏
姐姐帮你打脚枪
男同Gay打屁股SpanK
三月七裸体无遮挡
纲手裸乳被爆❌白浆的游戏
黑客家庭破解在线观看免费版
国产91♥️丝袜在线观看
风流中国少妇拳交
一级A片黄女人高潮公交车网站
小樱同意让博人吃饺子
脱裤子❌打屁屁免费网站
网友谈论 审查所有谈论>>