PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

该论文提出了 PromptDLA,一种利用描述性知识作为线索、通过定制化提示将领域先验融入文档布局分析(DLA)的框架,有效解决了跨域数据直接合并训练导致的性能瓶颈,并在多个主流数据集上取得了最先进(SOTA)的泛化性能。

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

该论文提出了一种基于隐式最大似然估计(IMLE)的分布蒸馏框架,通过将条件流匹配(CFM)专家模型蒸馏为单步学生模型,在保留多模态动作分布的同时消除了迭代积分带来的延迟,实现了融合多模态感知的高频实时机器人轨迹控制。

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

该论文提出了一种开放、透明且可复现的方法,利用领域知识与大语言模型构建了首个针对欧盟《人工智能法案》的评估数据集,涵盖风险分类、条款检索、义务生成及问答等任务,旨在解决 NLP 和 RAG 系统在合规性评估中缺乏自动化资源的问题。

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis KarkaletsisWed, 11 Ma🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

本文提出了一种名为 OncoAgent 的新型指南感知 AI 代理框架,它能够将文本临床指南直接转化为三维靶区轮廓,在无需重新训练的情况下实现了食管癌等病例的零-shot 自动勾画,其性能媲美全监督基线模型且更受临床医生在指南依从性和可接受性方面的青睐。

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung KimWed, 11 Ma🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

本文提出了 EvoDriveVLA,一种通过自锚点感知蒸馏和神谕引导轨迹蒸馏实现感知与规划协同优化的新型视觉 - 语言 - 动作模型,有效解决了自动驾驶中视觉编码器解冻后的感知退化及长期规划累积不稳定问题,并在开环和闭环评估中取得了最先进性能。

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang ZhangWed, 11 Ma🤖 cs.AI