论文秒变海报!开源框架PosterAgent一键天生顶会级学术Poster
鹭羽 发自 凹非寺量子位 | 公众号 QbitAI
你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)?
别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。
相比GPT-4o,PosterAgent天生指标更优,同时token使用量镌汰87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。
来自滑铁卢大学的联合研究团队,还全心构建了首个学术海报评估标准Paper2Poster,解决了长上下文、多模态压缩的评估空缺。
话未几说,先给各人展示一波效果,以下面这篇CV论文为例。
先喂给GPT-4o-image,获得的是这样的:
显然学术海报三要素(吸睛问题、重点突出、色彩排版),GPT-4o-image通通都没有。
无妨交给PosterAgent试试:
视觉更连贯、信息还高效,难怪连已经结业了的师兄师姐们都在X上哭诉,凭什么我们昔时没有它。
这下妈妈再也不必担心我做欠好Poster,被老板在群里夺命call了(狗头)。
下面来讲讲它为啥这么好用。
多模态海报自动天生
Poster在学术聚会里的主要性不言而喻,需要让与会者在几分钟内就迅速从中掌握焦点内容,这就很磨练制作者的论文浓缩能力,以及文本和图形的排版功底。
为了帮各人解放双手,以及更一目了然地评估海报效果,研究团队提出了评估基准Paper2Poster以及基于此构建的多智能体框架PosterAgent。
Paper2Poster:首个学术海报评估基准
Paper2Poster的数据包括100对AI领域论文和作者设计的海报,涵盖盘算机视觉(19%)、自然语言处置惩罚(17%)和强化学习(10%)等子领域的280个差别主题,论文平均22页,天生海报的文本压缩比约为14.4倍,图形镌汰比约为2.6倍。
评估指标笼罩四个基本维度:
视觉质量:使用CLIP图像嵌入丈量天生海报与作者设计海报之间的视觉相似度,再盘算图像和文本的相关性,以确保图像属于有用整合。文本连贯性:盘算文本在Llama-2-7b-hf下的标准疑心度(PPL),权衡文字流通度。整体评估:选择一个VLM(如GPT-4o),从美学(元素质量、结构平衡、加入度)信息(清晰度、完整性、逻辑流)两个方面举行1到5分打分。PaperQuiz:这是团队专门设计的评估指标,以模拟作者和读者的交流。让代表差别专业水平(例如学生和教授)的VLMs阅读每张海报并回覆考试,获得最高平均分的海报被以为在转达论文内容方面最有用。
PosterAgent:多阶段自动天生框架
凭证Paper2Poster的要求,团队设计了一个接纳自上而下设计理念的多智能体流程PosterAgent。
首先全局地将整个文档重组为精练、连贯的章节,然后举行局部精炼,以实现颗粒度对齐。
详细包括三个要害组件:
剖析器(Parser):将工具和基于LLM的摘要相连系,提取要害文本和视觉内容,天生结构化摘要库(如各章要点、主要图表)妄想器(Planner):匹配文本与图表,并用二叉树结构战略将其连贯排列,通过放大(zoom-in)机制迭代天生面板;嬷破-谈论器(Painter-Commenter):绘制器将内容转为精练的要点列表和用于渲染的可执行代码,而VLM作为谈论器提供结构反响,确保整体连贯性和阻止溢出。逾越GPT-4o?
眼见为实,为验证PosterAgent天生效果,研究职员用Paper2Poster评估了四类基线要领:
理想化要领(Oracle methods):包括原始PDF和作者设计的海报GT Poster,作为最佳泛起基准。端到端要领(End-to-end methods):使用GPT-4o多智能体事情流(Multi-agent work flows):使用OWLPPTAgentPosterAgent:框架变体分两种,PosterAgent-4o在内部LLM 和VLM谈论器均使用GPT-4o,PosterAgent-Qwen的文本天生使用Qwen-2.5-7B,谈论器则使用Qwen-2.5-VL-7B。
实验效果批注,在视觉质量和文本连贯性上,虽然4o-Image抵达了最高的视觉相似度,但它也纪录了最差的疑心度,说明天生的海报可能乍一看吸引人,但现实细看全是嘈杂或不连贯的文本。
PosterAgent则实现了最高的图形相关性,在视觉相似度上也紧随人类设计的海报。
当VLM评判时,PosterAgent-4o的平均得分为3.72,抵达了与人类设计海报相当的水平,而PPTAgent由于经常天生无意义的文本或大片空缺区域,因此得分都较低。
在PaperQuiz上,也能发明PosterAgent变体始终取得最佳分数。
值得注重的是,PosterAgent-4o虽然依据GPT-4o实现了冗长输出,但基于开源的Qwen-2.5系统变体在原始准确率上更胜一筹,说明PaperQuiz在评估时,内容量很主要,但泛起质量更主要。
团队还盘算了差别要领下的平均token本钱,PosterAgent仅使用101.1K和47.6Ktoken,相较于OWL-4o本钱降低了60%-87%,相当于每张海报只需要0.55美元(基于4o)或0.0045美元(基于Qwen)。
最后为了利便各人更直观地相识几种要领的海报天生效果,咱再举个例子。
这是论文作者自己做的,主题明确,重点突出,色彩搭配也协调。
这张来自GPT-4o-image,看起来似乎还行?可是仔细看文字,内里照旧有不少乱码。
这张由GPT-4o-html天生,图片嵌入失败,文本也缺少排版。
这张出自PPTAgent,天生了大宗空缺区域。
下面这张来自OWL,同样缺少图像,甚至没有多余色彩填充。
最后是咱们的PostAgent,比照下来,海报结构清晰明晰,图表与文字匹配度也相当高,在视觉效果上更靠近作者设计的海报。
扩展一下思绪,也许PosterAgent还可以用于制作课程学习资料。
公司里的PPT也未尝不可一试。
以是感兴趣的小同伴们速速珍藏起来这个海报神器~接下来的CVPR、ACL恰恰都可以用上。
论文链接:https://arxiv.org/abs/2505.21497代码链接:https://github.com/Paper2Poster/Paper2Poster项目链接:https://paper2poster.github.io/
参考链接:[1]https://x.com/real_weipang/status/1927797168171254006[2]https://x.com/_akhaliq/status/1927721150584390129
相关推荐:海角社区真实偷伦V视频 免费黄片网站 咒术回战野蔷薇18+🔞
工口崩坏3rd空之律者
白丝JK裸体被出水视频
明日方舟R18❌羞羞漫画
男男18🈲欧美呻吟GV小说
女奥特曼疯狂喷水❌自慰
中国老太太的毛耳耳
男女做㊙️视频入口
∏OPHO HD 720
女同❌裸乳❌❌
高清乱码免费观看
肉H边做边尿镜子失禁视频
小柔被体育老师c到流白浆作文
内射W91少妇
美女裸体秘撒尿免费看
八尺大人动漫18禁无码
埃及猫动画完整在线观看全集
爽躁多水快深点三p文章
王牌竞速❌18同人禁网站免费
男人的🍌伸到🍑里擼擼
女性自慰✅免费网站女同
91九色丨PORNY丨极品女神
㊙️黄漫免费网站H漫画网站
强制高潮H调教麻豆
蛋小绿尿牛奶
扒开警花湿润小泬喷白浆作文
SweetieFox合集全解锁版
镜躺在床上流白色分泌物
69❌❌❌❌老师视频-百度
失禁+抹春药+哭喊+刺激燃晚
扒开美女❌狂揉❌下部网站
白丝女仆被免费网站
You亅IZZXXXX18HD
薛凯琪吃黑肠原著
免费看㊙️美女隐私96视频
两男一女3p双龙h调教h
动漫❌大胸❌动漫看视频
按摩在线观看
办公室扒开奶罩揉吮奶头无码视频
生命女神紧紧的夹住霍雨浩的腰
啪啪视频
老头囗交456视频
扒开雏田❌狂揉❌3d动漫
鹿晗关晓彤感情状况
美女裸体被❌爆乳
宁红夜被啪到深处喷水漫画
俄罗斯肥婆大BBBBBB图片
两性裸交图交
asmr专区成人网站
别揉我奶头嗯好爽同桌的动漫
撕开灰原哀的内裤挺进去动漫
女学生洗澡偷拍换衣服免费看
老师又爽❌又黄❌免费动漫
女人被c🐻❌抓衣服视频
纲手被扒开腿坐做❌视频
女女les🈲🔞
део10جىنسىي
大肉大捧一进一出两腿间小说
荧裸体被❌涩涩在线观看
免费做爰XXXⅩ性直播
紫悦被狂❌爆乳被揉胸
性爆乳natiao
XXXX🍑🍆男女免费
六年级小女孩的胸怎样揉才能变大
少女たちよ观看动漫第二季第5集
97亚洲AV无码㊙️蜜桃网
痴梦少女免费观看全集完整版
yaoi❤♂Manga漫画蓝颜
Gay军人警察雄精自慰网址
国产人妻子无码
美女被附身揉自己的胸
护士脱了精光让人吃㊙️奶小说
千仞雪被坏人调教
人妻温泉~婬辱の教室
OVAみだれうち无删减
🔞少妇❌❌❌cg搔首弄姿
伸进女同桌乳沟里摸爽了作文
一级A片女人与公狍交酡全过
成人🔞高潮片免费视频苹果
揉我胸⋯啊⋯嗯~下面出知乎
亚洲AV无码国产精品妖精
熊出没纳雅劈开腿被❌高潮
网友谈论 审查所有谈论>>