论文秒变海报!开源框架PosterAgent一键天生顶会级学术Poster
鹭羽 发自 凹非寺量子位 | 公众号 QbitAI
你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)?
别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。
相比GPT-4o,PosterAgent天生指标更优,同时token使用量镌汰87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。
来自滑铁卢大学的联合研究团队,还全心构建了首个学术海报评估标准Paper2Poster,解决了长上下文、多模态压缩的评估空缺。
话未几说,先给各人展示一波效果,以下面这篇CV论文为例。
先喂给GPT-4o-image,获得的是这样的:
显然学术海报三要素(吸睛问题、重点突出、色彩排版),GPT-4o-image通通都没有。
无妨交给PosterAgent试试:
视觉更连贯、信息还高效,难怪连已经结业了的师兄师姐们都在X上哭诉,凭什么我们昔时没有它。
这下妈妈再也不必担心我做欠好Poster,被老板在群里夺命call了(狗头)。
下面来讲讲它为啥这么好用。
多模态海报自动天生
Poster在学术聚会里的主要性不言而喻,需要让与会者在几分钟内就迅速从中掌握焦点内容,这就很磨练制作者的论文浓缩能力,以及文本和图形的排版功底。
为了帮各人解放双手,以及更一目了然地评估海报效果,研究团队提出了评估基准Paper2Poster以及基于此构建的多智能体框架PosterAgent。
Paper2Poster:首个学术海报评估基准
Paper2Poster的数据包括100对AI领域论文和作者设计的海报,涵盖盘算机视觉(19%)、自然语言处置惩罚(17%)和强化学习(10%)等子领域的280个差别主题,论文平均22页,天生海报的文本压缩比约为14.4倍,图形镌汰比约为2.6倍。
评估指标笼罩四个基本维度:
视觉质量:使用CLIP图像嵌入丈量天生海报与作者设计海报之间的视觉相似度,再盘算图像和文本的相关性,以确保图像属于有用整合。文本连贯性:盘算文本在Llama-2-7b-hf下的标准疑心度(PPL),权衡文字流通度。整体评估:选择一个VLM(如GPT-4o),从美学(元素质量、结构平衡、加入度)信息(清晰度、完整性、逻辑流)两个方面举行1到5分打分。PaperQuiz:这是团队专门设计的评估指标,以模拟作者和读者的交流。让代表差别专业水平(例如学生和教授)的VLMs阅读每张海报并回覆考试,获得最高平均分的海报被以为在转达论文内容方面最有用。
PosterAgent:多阶段自动天生框架
凭证Paper2Poster的要求,团队设计了一个接纳自上而下设计理念的多智能体流程PosterAgent。
首先全局地将整个文档重组为精练、连贯的章节,然后举行局部精炼,以实现颗粒度对齐。
详细包括三个要害组件:
剖析器(Parser):将工具和基于LLM的摘要相连系,提取要害文本和视觉内容,天生结构化摘要库(如各章要点、主要图表)妄想器(Planner):匹配文本与图表,并用二叉树结构战略将其连贯排列,通过放大(zoom-in)机制迭代天生面板;嬷破-谈论器(Painter-Commenter):绘制器将内容转为精练的要点列表和用于渲染的可执行代码,而VLM作为谈论器提供结构反响,确保整体连贯性和阻止溢出。逾越GPT-4o?
眼见为实,为验证PosterAgent天生效果,研究职员用Paper2Poster评估了四类基线要领:
理想化要领(Oracle methods):包括原始PDF和作者设计的海报GT Poster,作为最佳泛起基准。端到端要领(End-to-end methods):使用GPT-4o多智能体事情流(Multi-agent work flows):使用OWLPPTAgentPosterAgent:框架变体分两种,PosterAgent-4o在内部LLM 和VLM谈论器均使用GPT-4o,PosterAgent-Qwen的文本天生使用Qwen-2.5-7B,谈论器则使用Qwen-2.5-VL-7B。
实验效果批注,在视觉质量和文本连贯性上,虽然4o-Image抵达了最高的视觉相似度,但它也纪录了最差的疑心度,说明天生的海报可能乍一看吸引人,但现实细看全是嘈杂或不连贯的文本。
PosterAgent则实现了最高的图形相关性,在视觉相似度上也紧随人类设计的海报。
当VLM评判时,PosterAgent-4o的平均得分为3.72,抵达了与人类设计海报相当的水平,而PPTAgent由于经常天生无意义的文本或大片空缺区域,因此得分都较低。
在PaperQuiz上,也能发明PosterAgent变体始终取得最佳分数。
值得注重的是,PosterAgent-4o虽然依据GPT-4o实现了冗长输出,但基于开源的Qwen-2.5系统变体在原始准确率上更胜一筹,说明PaperQuiz在评估时,内容量很主要,但泛起质量更主要。
团队还盘算了差别要领下的平均token本钱,PosterAgent仅使用101.1K和47.6Ktoken,相较于OWL-4o本钱降低了60%-87%,相当于每张海报只需要0.55美元(基于4o)或0.0045美元(基于Qwen)。
最后为了利便各人更直观地相识几种要领的海报天生效果,咱再举个例子。
这是论文作者自己做的,主题明确,重点突出,色彩搭配也协调。
这张来自GPT-4o-image,看起来似乎还行?可是仔细看文字,内里照旧有不少乱码。
这张由GPT-4o-html天生,图片嵌入失败,文本也缺少排版。
这张出自PPTAgent,天生了大宗空缺区域。
下面这张来自OWL,同样缺少图像,甚至没有多余色彩填充。
最后是咱们的PostAgent,比照下来,海报结构清晰明晰,图表与文字匹配度也相当高,在视觉效果上更靠近作者设计的海报。
扩展一下思绪,也许PosterAgent还可以用于制作课程学习资料。
公司里的PPT也未尝不可一试。
以是感兴趣的小同伴们速速珍藏起来这个海报神器~接下来的CVPR、ACL恰恰都可以用上。
论文链接:https://arxiv.org/abs/2505.21497代码链接:https://github.com/Paper2Poster/Paper2Poster项目链接:https://paper2poster.github.io/
参考链接:[1]https://x.com/real_weipang/status/1927797168171254006[2]https://x.com/_akhaliq/status/1927721150584390129
furry同性狼狼榨精网站
绝区零黄化外网
16青少年裸体洗澡自慰小说
火影小樱大胸被❌爆乳
女帝被路飞❌❌羞羞漫画
别让妈妈知道
白咲花CODM美化包
911在线无码精品秘鸭子TV
户外美女撒尿㊙️
女女🔞被一堆玩具玩哭动漫
PORNO93HD😍😍 - 百度
3D免费强㢨app模拟器游戏
中国妇被黑人XXX猛交
女同♥禁漫gl网站入口
小舞脱免费看尿囗下载软件
中国女人缸交一级A片
3d原神裸体啪啪❌动漫
宝贝c我想摸你奶让我揉揉
云缨张开双腿被强❌
瑶美人紧身内衣
裸体女性生殖扒开
杨晨晨打开双腿❌露隐私
国产美女无套内谢
1000部啪啪未满十八勿入进
妮可裸乳被爆❌白浆的图片
鬼方佳代子裸体被❌涩涩
扒开❌狂揉❌喷水视频免费看
Chieee老亂伦tube
裸体❌开腿网站
野原美伢被强❌禁欲漫画黄
坤坤浏览器老司机模式下载
奶头又大又❌又白挤奶韩国
美女裸体㊙️无遮挡隐私
偶像堕落女友全集免费观看
亚洲成人?√az在线禁
性裸交❌❌❌❌❌磨菇视频
南山兵1609新图片
精品人妻无码一二三区美玉挴视频
高跟鞋脚交shoefootjob
路易斯拔萝卜无遮挡
国产做受❌❌❌入口竹菊动漫
杨钰莹裸体实干12次
按摩在线观看
黄色,特级大,毛片
日本裸体做爰XXXⅩ
欧美欧美老妇人❌❌❌❌免费老师
扒掉乳罩㊙️鞭打奶头
小舞脱👙让学生摸🐻
小舞3D❌禁漫在线观看
小学女生穿白色制服舞蹈视频
https://www.4399.com
ceкес日本видео
70老太肥大BBwBBw高清
云曦张开双腿求调教h文
无码自慰成人游戏
欧美精品㊙️一区二区三区蜜臀
穿JK白丝被❌裸体网站
海滩XXXX裸体ⅩXXX沙滩
成人黄漫画❌免费涩漫APP
男人的🍌伸到🍑屁股广告
潘甜甜AV在线观看
女人洗澡㊙️视频网站
www.主播视频.com
我和亲女作爱全过
原神的裸体㊙️无遮
女人㴬精XXXⅩXx喷潮视频
俄罗斯做爰露性器50部
朱竹清被到爽高潮痉挛
人与拘做受XXXXⅩXX
局长巨粗进入警花疼哭高视频
少妇被❌到爽🔞流爽挤奶
xart官网登录入口地址
三年片在线播放免费观看大全三幻
宝可梦的迷之规则汉化版
玖辛奈被啪❌漫画羞羞漫画
国产又粗又猛又色又黃
动漫被❌到爽🔞巨乳原神
初二好看女生的jiojio简介
国产婬妇❌❌❌❌❌x88
妙龄少女开网钻最新版本更新内容
迪丽热巴黄片
网友谈论 审查所有谈论>>