Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Este artigo apresenta o framework DAPL, que utiliza modelagem de mundo explícita para aprender representações de dinâmicas induzidas por contato, permitindo que a destreza extrínseca em cenas desordenadas surja naturalmente sem heurísticas manuais e superando métodos existentes tanto em simulação quanto em aplicações do mundo real.

Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang2026-03-11🤖 cs.AI

MedMASLab: A Unified Orchestration Framework for Benchmarking Multimodal Medical Multi-Agent Systems

O artigo apresenta o MedMASLab, um framework unificado e plataforma de benchmarking para sistemas de agentes médicos multimodais que estabelece um protocolo de comunicação padronizado, um avaliador de raciocínio clínico automatizado e o maior conjunto de testes até a data, revelando lacunas críticas de desempenho na transição entre subdomínios médicos especializados.

Yunhang Qian, Xiaobin Hu, Jiaquan Yu, Siyang Xin, Xiaokun Chen, Jiangning Zhang, Peng-Tao Jiang, Jiawei Liu, Hongwei Bran Li2026-03-11🤖 cs.AI

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

O artigo apresenta o ACADiff, um framework baseado em difusão latente que utiliza dados clínicos e metadados para sintetizar modalidades de imagem cerebral ausentes e realizar a imputação de dados multimodais, demonstrando desempenho superior na geração de imagens e na manutenção da precisão diagnóstica para a doença de Alzheimer mesmo em cenários com até 80% de dados faltantes.

Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative2026-03-11🤖 cs.AI

PathMem: Toward Cognition-Aligned Memory Transformation for Pathology MLLMs

O artigo apresenta o PathMem, um framework multimodal centrado na memória que, inspirado no processo cognitivo de patologistas humanos, organiza o conhecimento estruturado em memória de longo prazo e utiliza um Transformer de Memória para integrá-lo dinamicamente à memória de trabalho, resultando em desempenho superior na geração de laudos e diagnósticos abertos em patologia computacional.

Jinyue Li, Yuci Liang, Qiankun Li, Xinheng Lyu, Jiayu Qian, Huabao Chen, Kun Wang, Zhigang Zeng, Anil Anthony Bharath, Yang Liu2026-03-11🤖 cs.AI

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

O artigo apresenta o k-MTR, um framework de aprendizado de representação no espaço k que elimina a necessidade de reconstrução de imagens ao alinhar dados subamostrados diretamente com rótulos fisiológicos, permitindo uma análise cardíaca multi-tarefa precisa e eficiente sem passar pelo passo intermediário de formação de imagem.

Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan2026-03-11🤖 cs.AI

The Confidence Gate Theorem: When Should Ranked Decision Systems Abstain?

Este artigo estabelece que a abstenção baseada em confiança em sistemas de decisão ranqueada só melhora consistentemente a qualidade quando as condições de alinhamento de rank e ausência de zonas de inversão são atendidas, demonstrando empiricamente que a incerteza estrutural favorece esse ganho, enquanto a incerteza contextual (como deriva de distribuição) frequentemente viola a monotonicidade e exige sinais de confiança específicos para mitigar falhas.

Ronald Doku2026-03-11🤖 cs.AI

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Este artigo apresenta o Indicador de Superajuste-Subajuste (OUI) como um sinal estrutural precoce e eficiente para identificar taxas de aprendizado ideais em algoritmos PPO, demonstrando que a análise das ativações neuronais permite descartar execuções promissoras muito antes do término do treinamento com maior precisão do que métricas tradicionais.

Alberto Fernández-Hernández, Cristian Pérez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí2026-03-11🤖 cs.AI

Think Before You Lie: How Reasoning Improves Honesty

O estudo demonstra que, ao contrário do comportamento humano, o raciocínio em modelos de linguagem aumenta consistentemente a honestidade, não apenas pelo conteúdo do pensamento, mas porque o processo de geração de tokens deliberativos navega por um espaço representacional onde as respostas enganosas são metaestáveis e mais facilmente destabilizadas do que as honestas.

Ann Yuan, Asma Ghandeharioun, Carter Blum, Alicia Machado, Jessica Hoffmann, Daphne Ippolito, Martin Wattenberg, Lucas Dixon, Katja Filippova2026-03-11🤖 cs.AI

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

O artigo apresenta o BEACON, um método que supera as limitações de navegação baseada em linguagem em cenários com oclusão ao prever um mapa de calor de affordance em visão de pássaro (BEV) a partir de observações multiview, alcançando uma melhoria significativa de 22,74 pontos percentuais em relação às abordagens de estado da arte baseadas em espaço de imagem.

Xinyu Gao, Gang Chen, Javier Alonso-Mora2026-03-11🤖 cs.AI

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

Este estudo avalia um guia virtual baseado em modelos de linguagem de grande escala para pessoas cegas ou com baixa visão, revelando que, embora os participantes o tratem como uma ferramenta quando sozinhos, eles o adotam como um companheiro social em ambientes virtuais compartilhados, gerando recomendações de design para futuras implementações.

Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot2026-03-11🤖 cs.AI

From Data Statistics to Feature Geometry: How Correlations Shape Superposition

Este artigo demonstra que, em cenários de dados realistas com características correlacionadas, a superposição em redes neurais pode organizar-se de forma a transformar interferências em efeitos construtivos, gerando agrupamentos semânticos e estruturas cíclicas que não são explicadas pelo modelo tradicional de superposição baseado em características não correlacionadas.

Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano2026-03-11🤖 cs.AI