MAPO: Mixed Advantage Policy Optimization for Long-Horizon Multi-Turn Dialogue

O artigo apresenta o MAPO, um algoritmo de otimização de política sem crítico que utiliza feedback denso de um modelo avaliador e um estimador de vantagem misto para superar os desafios de atribuição de crédito em diálogos multi-turno subjetivos de longo prazo, demonstrando melhorias significativas e generalização em diversos benchmarks de inteligência emocional.

Naifan Zhang, Ruihan Sun, Jinwei Su, Hengjie Yang, Zhengyuan Pan, Zhaohan Chen, Xiaofan Zhang2026-03-09🤖 cs.AI

FlashPrefill: Instantaneous Pattern Discovery and Thresholding for Ultra-Fast Long-Context Prefilling

O artigo apresenta o FlashPrefill, um framework que acelera drasticamente a fase de prefilling de modelos de linguagem de longo contexto ao utilizar uma busca rápida de blocos para identificar padrões de atenção esparsos e um mecanismo de thresholding dinâmico, alcançando um speedup de até 27,78x em sequências de 256K tokens sem degradar o desempenho em contextos mais curtos.

Qihang Fan, Huaibo Huang, Zhiying Wu, Juqiu Wang, Bingning Wang, Ran He2026-03-09🤖 cs.AI

Conversational Demand Response: Bidirectional Aggregator-Prosumer Coordination through Agentic AI

Este artigo apresenta a Resposta à Demanda Conversacional (CDR), um mecanismo de coordenação bidirecional entre agregadores e prosumidores baseado em IA agêntica que utiliza linguagem natural para equilibrar escalabilidade automatizada com transparência e agência do usuário, permitindo decisões informadas e comunicação em tempo real.

Reda El Makroum, Sebastian Zwickl-Bernhard, Lukas Kranzl, Hans Auer2026-03-09🤖 cs.AI

TaPD: Temporal-adaptive Progressive Distillation for Observation-Adaptive Trajectory Forecasting in Autonomous Driving

O artigo apresenta o TaPD, um framework unificado e plug-and-play que utiliza destilação de conhecimento progressiva e um módulo de preenchimento temporal para melhorar significativamente a previsão de trajetórias em veículos autônomos, especialmente em cenários com históricos de observação variáveis ou extremamente curtos.

Mingyu Fan, Yi Liu, Hao Zhou, Deheng Qian, Mohammad Haziq Khan, Matthias Raetsch2026-03-09🤖 cs.AI

GazeMoE: Perception of Gaze Target with Mixture-of-Experts

O artigo apresenta o GazeMoE, um novo framework end-to-end que utiliza módulos de Mistura de Especialistas (MoE) para selecionar adaptativamente pistas de um modelo de fundação congelado e estimar com estado da arte o alvo do olhar humano, abordando desafios como desequilíbrio de classes e a necessidade de integrar múltiplas pistas multimodais.

Zhuangzhuang Dai, Zhongxi Lu, Vincent G. Zakka, Luis J. Manso, Jose M Alcaraz Calero, Chen Li2026-03-09🤖 cs.AI

HiPP-Prune: Hierarchical Preference-Conditioned Structured Pruning for Vision-Language Models

O artigo apresenta o HiPP-Prune, um framework de poda estruturada hierárquica para modelos visão-linguagem que utiliza otimização de política baseada em preferências do usuário para gerenciar o trade-off entre eficiência, utilidade da tarefa e robustez contra alucinações, preservando a sensibilidade visual crítica durante a compressão.

Lincen Bai, Hedi Tabia, Raul Santos-Rodriguez2026-03-09🤖 cs.AI

Agentic retrieval-augmented reasoning reshapes collective reliability under model variability in radiology question answering

Este estudo demonstra que pipelines de raciocínio agênico com recuperação aumentada melhoram a robustez e o consenso entre modelos de linguagem variados em perguntas de radiologia, embora a concordância elevada não garanta necessariamente a correção e muitos erros permaneçam clinicamente graves.

Mina Farajiamiri, Jeta Sopa, Saba Afza, Lisa Adams, Felix Barajas Ordonez, Tri-Thien Nguyen, Mahshad Lotfinia, Sebastian Wind, Keno Bressem, Sven Nebelung, Daniel Truhn, Soroosh Tayebi Arasteh2026-03-09🤖 cs.AI

Stem: Rethinking Causal Information Flow in Sparse Attention

O artigo apresenta o Stem, um módulo de esparsidade plug-and-play que otimiza o fluxo de informação em mecanismos de atenção causal ao empregar uma seleção top-k dependente da posição e uma métrica consciente da saída, superando o gargalo computacional de modelos de linguagem grandes em contextos longos com maior precisão e menor latência.

Lin Niu, Xin Luo, Linchuan Xie, Yifu Sun, Guanghua Yu, Jianchen Zhu, S Kevin Zhou2026-03-09🤖 cs.AI

Artificial Intelligence for Climate Adaptation: Reinforcement Learning for Climate Change-Resilient Transport

Este artigo propõe um novo quadro de apoio à decisão baseado em aprendizagem por reforço que integra projeções climáticas, modelagem de inundações e simulação de transportes para otimizar estratégias de adaptação de longo prazo, demonstrando em um estudo de caso em Copenhague que essa abordagem supera os métodos tradicionais ao descobrir caminhos adaptativos coordenados que equilibram custos de investimento e impactos evitados sob incerteza climática.

Miguel Costa, Arthur Vandervoort, Carolin Schmidt, João Miranda, Morten W. Petersen, Martin Drews, Karyn Morrisey, Francisco C. Pereira2026-03-09🤖 cs.AI

Learning Where the Physics Is: Probabilistic Adaptive Sampling for Stiff PDEs

O artigo apresenta o GMM-PIELM, um framework probabilístico que aprimora as Máquinas de Aprendizado Extremo Informadas pela Física (PIELMs) ao utilizar um algoritmo de Expectativa-Maximização ponderado para adaptar automaticamente a amostragem de funções de base radial às regiões de alta complexidade física, resolvendo com precisão equações diferenciais parciais rígidas com erros significativamente menores e mantendo a velocidade de treinamento superior das PIELMs.

Akshay Govind Srinivasan, Balaji Srinivasan2026-03-09🤖 cs.AI

The EpisTwin: A Knowledge Graph-Grounded Neuro-Symbolic Architecture for Personal AI

O artigo apresenta o EpisTwin, uma arquitetura neuro-simbólica que fundamenta a inteligência artificial pessoal em um Grafo de Conhecimento Pessoal verificável para superar as limitações da similaridade vetorial não estruturada, permitindo raciocínio complexo e refinamento visual dinâmico sobre dados do usuário.

Giovanni Servedio, Potito Aghilar, Alessio Mattiace, Gianni Carmosino, Francesco Musicco, Gabriele Conte, Vito Walter Anelli, Tommaso Di Noia, Francesco Maria Donini2026-03-09🤖 cs.AI

DEX-AR: A Dynamic Explainability Method for Autoregressive Vision-Language Models

O artigo apresenta o DEX-AR, um novo método de explicabilidade dinâmica para modelos de linguagem e visão autoregressivos que gera mapas de calor 2D para interpretar a geração de tokens, distinguindo entre informações visuais e linguísticas por meio de filtragem dinâmica de cabeças de atenção e agregação em nível de sequência.

Walid Bousselham, Angie Boggust, Hendrik Strobelt, Hilde Kuehne2026-03-09🤖 cs.AI

From Entropy to Calibrated Uncertainty: Training Language Models to Reason About Uncertainty

O artigo propõe um pipeline de três etapas para pós-treinar Modelos de Linguagem Grandes (LLMs) a inferir estimativas de incerteza calibradas e interpretáveis de forma eficiente, combinando pontuações de entropia, calibração via Platt scaling e aprendizado por reforço para superar as limitações computacionais e de precisão dos métodos pós-hoc existentes.

Azza Jenane, Nassim Walha, Lukas Kuhn, Florian Buettner2026-03-09🤖 cs.AI

Structured Exploration vs. Generative Flexibility: A Field Study Comparing Bandit and LLM Architectures for Personalised Health Behaviour Interventions

Um estudo de campo comparando abordagens de bandit contextual e modelos de linguagem (LLM) para intervenções de saúde revelou que, embora os LLMs sejam percebidos como mais úteis do que modelos baseados em templates, a otimização estatística de técnicas de mudança de comportamento não adicionou valor percebido, destacando que o reconhecimento contextual do usuário é mais crítico do que a exploração estruturada ou a flexibilidade generativa isolada.

Dominik P. Hofer, Haochen Song, Rania Islambouli, Laura Hawkins, Ananya Bhattacharjee, Meredith Franklin, Joseph Jay Williams, Jan D. Smeddinck2026-03-09🤖 cs.AI

SAHOO: Safeguarded Alignment for High-Order Optimization Objectives in Recursive Self-Improvement

O artigo apresenta o SAHOO, um framework prático que utiliza três mecanismos de segurança para monitorar e controlar a deriva de alinhamento durante a autoaperfeiçoamento recursivo de sistemas de IA, resultando em ganhos significativos de qualidade em tarefas de código e raciocínio sem comprometer a segurança ou a veracidade.

Subramanyam Sahoo, Aman Chadha, Vinija Jain, Divya Chaudhary2026-03-09🤖 cs.AI

AI End-to-End Radiation Treatment Planning Under One Second

O artigo apresenta o AIRT, um framework de aprendizado profundo de ponta a ponta capaz de gerar planos de radioterapia VMAT para próstata em menos de um segundo, demonstrando qualidade não inferior aos planos convencionais do RapidPlan Eclipse.

Simon Arberet, Riqiang Gao, Martin Kraus, Florin C. Ghesu, Wilko Verbakel, Mamadou Diallo, Anthony Magliari, Venkatesan Karuppusamy, Sushil Beriwal, REQUITE Consortium, Ali Kamen, Dorin Comaniciu2026-03-09🤖 cs.AI

K-MaT: Knowledge-Anchored Manifold Transport for Cross-Modal Prompt Learning in Medical Imaging

O artigo apresenta o K-MaT, um framework de aprendizado de prompts que utiliza transporte ótimo para alinhar representações de modelos de visão-linguagem biomédica de alta resolução a modalidades de baixa resolução sem necessidade de dados de treinamento, alcançando resultados superiores e mitigando o esquecimento catastrófico em tarefas de imagem médica.

Jiajun Zeng, Shadi Albarqouni2026-03-09🤖 cs.AI