SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

O artigo apresenta o SCENEBench, um conjunto de benchmarks para avaliar a compreensão de áudio além da transcrição de fala, focando em cenários de acessibilidade e industriais como a compreensão de sons ambientes, localização de ruído e reconhecimento de características vocais, e revela lacunas críticas no desempenho de modelos de linguagem de áudio de última geração.

Laya Iyer, Angelina Wang, Sanmi Koyejo2026-03-11🤖 cs.AI

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Este artigo apresenta o framework DAPL, que utiliza modelagem de mundo explícita para aprender representações de dinâmicas induzidas por contato, permitindo que a destreza extrínseca em cenas desordenadas surja naturalmente sem heurísticas manuais e superando métodos existentes tanto em simulação quanto em aplicações do mundo real.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

O artigo apresenta o MedMASLab, um framework unificado e plataforma de benchmarking para sistemas de agentes médicos multimodais que estabelece um protocolo de comunicação padronizado, um avaliador de raciocínio clínico automatizado e o maior conjunto de testes até a data, revelando lacunas críticas de desempenho na transição entre subdomínios médicos especializados.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

O artigo apresenta o ACADiff, um framework baseado em difusão latente que utiliza dados clínicos e metadados para sintetizar modalidades de imagem cerebral ausentes e realizar a imputação de dados multimodais, demonstrando desempenho superior na geração de imagens e na manutenção da precisão diagnóstica para a doença de Alzheimer mesmo em cenários com até 80% de dados faltantes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

O artigo apresenta o PathMem, um framework multimodal centrado na memória que, inspirado no processo cognitivo de patologistas humanos, organiza o conhecimento estruturado em memória de longo prazo e utiliza um Transformer de Memória para integrá-lo dinamicamente à memória de trabalho, resultando em desempenho superior na geração de laudos e diagnósticos abertos em patologia computacional.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

O artigo apresenta o k-MTR, um framework de aprendizado de representação no espaço k que elimina a necessidade de reconstrução de imagens ao alinhar dados subamostrados diretamente com rótulos fisiológicos, permitindo uma análise cardíaca multi-tarefa precisa e eficiente sem passar pelo passo intermediário de formação de imagem.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Este artigo estabelece que a abstenção baseada em confiança em sistemas de decisão ranqueada só melhora consistentemente a qualidade quando as condições de alinhamento de rank e ausência de zonas de inversão são atendidas, demonstrando empiricamente que a incerteza estrutural favorece esse ganho, enquanto a incerteza contextual (como deriva de distribuição) frequentemente viola a monotonicidade e exige sinais de confiança específicos para mitigar falhas.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Este artigo apresenta o Indicador de Superajuste-Subajuste (OUI) como um sinal estrutural precoce e eficiente para identificar taxas de aprendizado ideais em algoritmos PPO, demonstrando que a análise das ativações neuronais permite descartar execuções promissoras muito antes do término do treinamento com maior precisão do que métricas tradicionais.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI