PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

O artigo apresenta o PromptDLA, um framework inovador de Análise de Layout de Documentos que utiliza um prompter sensível ao domínio e conhecimento descritivo como pistas para integrar priores específicos de cada domínio, superando as limitações da fusão direta de datasets e alcançando desempenho state-of-the-art em múltiplos benchmarks.

Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing ZongWed, 11 Ma🤖 cs.AI

From Flow to One Step: Real-Time Multi-Modal Trajectory Policies via Implicit Maximum Likelihood Estimation-based Distribution Distillation

Este trabalho propõe um framework que distila uma política expert Conditional Flow Matching em uma rede estudante de passo único via IMLE e uma função de perda baseada na distância de Chamfer, permitindo a geração de trajetórias multi-modais de alta frequência e precisão para controle robótico em tempo real.

Ju Dong, Liding Zhang, Lei Zhang, Yu Fu, Kaixin Bai, Zoltan-Csaba Marton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei ZhangWed, 11 Ma🤖 cs.AI

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Este estudo investiga como os Modelos de Linguagem de Grande Escala (LLMs) perpetuam estereótipos de gênero em registros de pacientes franceses ao analisar as interações entre o gênero e outros determinantes sociais da saúde, demonstrando que a avaliação dessas interações é essencial para complementar as abordagens existentes de detecção de viés.

Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel MorinWed, 11 Ma🤖 cs.AI

Open-World Motion Forecasting

Este trabalho introduz o "Open-World Motion Forecasting", um novo cenário e framework de ponta a ponta para previsão de trajetória que supera as limitações de taxonomia fixa e percepção perfeita ao aprender continuamente novas classes de objetos a partir de imagens de câmera, mitigando o esquecimento catastrófico através de pseudo-rotulagem filtrada por modelos de linguagem visual e amostragem de replay baseada em variância de características.

Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav ValadaWed, 11 Ma🤖 cs.AI

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Este trabalho identifica uma limitação crítica em Grandes Modelos de Linguagem (LLMs), que tendem a priorizar o raciocínio moral em detrimento do senso comum, revelando um viés de foco narrativo onde a detecção de contradições de senso comum é significativamente mais difícil quando atribuída ao personagem principal em comparação com personagens secundários.

Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya PurkayasthaWed, 11 Ma🤖 cs.AI

AI Act Evaluation Benchmark: An Open, Transparent, and Reproducible Evaluation Dataset for NLP and RAG Systems

Este artigo apresenta um conjunto de dados aberto e reprodutível para avaliar a conformidade de sistemas NLP e RAG com o Regulamento de IA da UE, utilizando modelos de linguagem para gerar tarefas de classificação de risco e recuperação de artigos que superam as limitações de definição das categorias de risco e alcançam altos índices de precisão.

Athanasios Davvetas, Michael Papademas, Xenia Ziouvelou, Vangelis KarkaletsisWed, 11 Ma🤖 cs.AI

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

O artigo apresenta o OncoAgent, um agente de IA inovador que converte diretrizes clínicas textuais em contornos tridimensionais de volumes-alvo para radioterapia de forma zero-shot e sem treinamento, demonstrando desempenho superior e maior aceitação clínica em comparação a modelos supervisionados tradicionais.

Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung KimWed, 11 Ma🤖 cs.AI

Variational Routing: A Scalable Bayesian Framework for Calibrated Mixture-of-Experts Transformers

Este trabalho apresenta o VMoER, uma abordagem bayesiana estruturada que confere quantificação de incerteza calibrada e escalável aos modelos de mistura de especialistas (MoE) ao aplicar inferência variacional apenas na etapa de roteamento, melhorando significativamente a estabilidade, a calibração e a detecção de dados fora da distribuição com um custo computacional marginal.

Albus Yizhuo Li, Matthew WickerWed, 11 Ma🤖 cs.AI

An Empirical Study and Theoretical Explanation on Task-Level Model-Merging Collapse

Este artigo investiga o colapso no mesclagem de modelos, demonstrando empiricamente que a incompatibilidade representacional entre tarefas, e não conflitos no espaço de parâmetros, é a principal causa da degradação de desempenho, e oferece uma explicação teórica baseada na teoria taxa-distorção que estabelece limites fundamentais para a mesclabilidade de tarefas.

Yuan Cao, Dezhi Ran, Yuzhe Guo, Mengzhou Wu, Simin Chen, Linyi Li, Wei Yang, Tao XieWed, 11 Ma🤖 cs.AI

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

O artigo apresenta o EvoDriveVLA, um novo framework de destilação colaborativa entre percepção e planejamento que supera as limitações de modelos Vision-Language-Action para condução autônoma ao integrar restrições perceptivas autoancoradas e otimização de trajetória guiada por oráculos, alcançando desempenho superior em avaliações de circuito aberto e fechado.

Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang ZhangWed, 11 Ma🤖 cs.AI

GenePlan: Evolving Better Generalized PDDL Plans using Large Language Models

O GenePlan é um novo framework que utiliza algoritmos evolutivos assistidos por modelos de linguagem de grande escala para gerar planejadores generalizados em Python, alcançando desempenho comparável aos planejadores de última geração e superando significativamente outras abordagens baseadas em LLMs em tarefas de planejamento clássico PDDL.

Andrew Murray, Danial Dervovic, Alberto Pozanco, Michael CashmoreWed, 11 Ma🤖 cs.AI

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Este artigo apresenta os Fluxos Normalizadores Condicionados Temporalmente (tcNF), uma nova estrutura para detecção de anomalias em séries temporais multivariadas que modela com precisão as dependências temporais e a incerteza ao condicionar o fluxo a observações anteriores, demonstrando robustez e precisão superiores em comparação com métodos existentes.

David Baumgartner, Helge Langseth, Kenth Engø-Monsen, Heri RamampiaroWed, 11 Ma🤖 cs.AI

Evolving Prompt Adaptation for Vision-Language Models

O artigo propõe o EvoPrompt, um novo framework que utiliza um projetor de prompts compartilhado entre modalidades e uma estratégia evolutiva de treinamento para adaptar modelos visão-linguagem a tarefas com poucos dados sem esquecer o conhecimento pré-treinado, alcançando desempenho state-of-the-art em aprendizado com poucos exemplos enquanto preserva as capacidades zero-shot originais.

Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang LiWed, 11 Ma🤖 cs.AI

Efficiently Aligning Draft Models via Parameter- and Data-Efficient Adaptation

O artigo apresenta o EDA, um framework eficiente em parâmetros e dados que adapta modelos de rascunho para modelos-alvo ajustados a domínios específicos, restaurando o desempenho da decodificação especulativa com custos de treinamento reduzidos através de uma arquitetura desacoplada, regeneração de dados e seleção de amostras.

Luxi Lin, Zhihang Lin, Zhanpeng Zeng, Yuhao Chen, Qingyu Zhang, Jixiang Luo, Xuelong Li, Rongrong JiWed, 11 Ma🤖 cs.AI

Enhancing Debunking Effectiveness through LLM-based Personality Adaptation

Este estudo propõe uma metodologia inovadora que utiliza Grandes Modelos de Linguagem (LLMs) para adaptar mensagens de desmentido de fake news aos traços de personalidade do Big Five, demonstrando que a personalização aumenta a persuasão e oferecendo uma avaliação automatizada que levanta questões éticas sobre o uso dessa tecnologia.

Pietro Dell'Oglio, Alessandro Bondielli, Francesco Marcelloni, Lucia C. PassaroWed, 11 Ma🤖 cs.AI