MMTA: Multi Membership Temporal Attention for Fine-Grained Stroke Rehabilitation Assessment

O artigo apresenta o MMTA, um modelo de atenção temporal que permite a cada quadro assistir a múltiplas janelas temporais simultaneamente, melhorando significativamente a precisão na segmentação de micro-movimentos e transições de fase para a avaliação de reabilitação de AVC, tanto em vídeos quanto em dados de sensores vestíveis.

Halil Ismail Helvaci, Justin Huber, Jihye Bae + 1 more2026-03-03💻 cs

Solving a Nonlinear Blind Inverse Problem for Tagged MRI with Physics and Deep Generative Priors

Este artigo apresenta um novo quadro de inversão não linear e cego que unifica pela primeira vez a recuperação da anatomia, a síntese de imagens cine de alta resolução e a estimativa de movimento em ressonância magnética com marcação, combinando física de MR e priores generativos profundos para superar desafios como o desvanecimento das marcas e a entrelaçamento entre anatomia e movimento.

Zhangxing Bian, Shuwen Wei, Samuel W. Remedios + 4 more2026-03-03⚡ eess

VEMamba: Efficient Isotropic Reconstruction of Volume Electron Microscopy with Axial-Lateral Consistent Mamba

O artigo apresenta o VEMamba, um framework eficiente que utiliza um novo paradigma de reordenação de dependências 3D e simulação realista de degradação para realizar reconstrução isotrópica de microscopia eletrônica volumétrica, superando as limitações de métodos existentes ao garantir consistência axial-lateral com menor custo computacional.

Longmi Gao, Pan Gao2026-03-03💻 cs

pySpatial: Generating 3D Visual Programs for Zero-Shot Spatial Reasoning

O artigo apresenta o pySpatial, uma estrutura de programação visual que capacita modelos de linguagem multimodais a realizar raciocínio espacial zero-shot em 3D através da geração de código Python para interagir com ferramentas espaciais, superando significativamente os modelos de base em benchmarks desafiadores e demonstrando eficácia em navegação robótica real.

Zhanpeng Luo, Ce Zhang, Silong Yong + 6 more2026-03-03💻 cs

On the Exact Algorithmic Extraction of Finite Tesselations Through Prime Extraction of Minimal Representative Forms

Este artigo propõe um algoritmo determinístico hierárquico que extrai exata e eficientemente tesselações retangulares finitas em grades planas através da descoberta de padrões compostos, normalização para formas representativas mínimas e extração de primos, preenchendo uma lacuna na análise simbólica de estruturas repetitivas para aplicações como resolução de quebra-cabeças.

Sushish Baral, Paulo Garcia, Warisa Sritriratanarak2026-03-03💻 cs

VGGT-Det: Mining VGGT Internal Priors for Sensor-Geometry-Free Multi-View Indoor 3D Object Detection

O artigo apresenta o VGGT-Det, o primeiro framework para detecção 3D de objetos em ambientes internos multi-visão sem geometria de sensores, que integra um encoder VGGT em um pipeline baseado em transformer com mecanismos de geração de consultas guiada por atenção e agregação de características orientada por consultas para explorar priores semânticos e geométricos internos, superando significativamente os métodos existentes.

Yang Cao, Feize Wu, Dave Zhenyu Chen + 3 more2026-03-03💻 cs

The Aftermath of DrawEduMath: Vision Language Models Underperform with Struggling Students and Misdiagnose Errors

O estudo revela que os modelos de linguagem e visão (VLMs) falham ao analisar erros de alunos com dificuldades no benchmark DrawEduMath, indicando que, embora sejam competentes na resolução de problemas matemáticos, carecem de incentivos de desenvolvimento adequados para apoiar efetivamente aplicações pedagógicas.

Li Lucy, Albert Zhang, Nathan Anderson + 2 more2026-03-03💬 cs.CL

When Does Margin Clamping Affect Training Variance? Dataset-Dependent Effects in Contrastive Forward-Forward Learning

O artigo demonstra que o uso de clamping de margem no aprendizado Contrastivo Forward-Forward pode inflacionar significativamente a variância do treinamento em cenários específicos (como CIFAR-10) devido à saturação de gradientes, mas esse efeito é dependente do conjunto de dados e pode ser mitigado substituindo o clamping por uma subtração de margem neutra em relação ao gradiente.

Joshua Steier2026-03-03🤖 cs.LG

EraseAnything++: Enabling Concept Erasure in Rectified Flow Transformers Leveraging Multi-Object Optimization

O artigo apresenta o EraseAnything++, um framework unificado que utiliza otimização multi-objetivo e técnicas de ajuste de parâmetros para remover conceitos indesejados de modelos de difusão baseados em fluxo e transformadores para geração de imagens e vídeos, garantindo simultaneamente a preservação da qualidade generativa e da consistência temporal.

Zhaoxin Fan, Nanxiang Jiang, Daiheng Gao + 2 more2026-03-03🤖 cs.AI

Fake It Right: Injecting Anatomical Logic into Synthetic Supervised Pre-training for Medical Segmentation

Este artigo propõe um framework de pré-treinamento supervisionado sintético que integra lógica anatômica realista e restrições topológicas para superar as limitações de métodos baseados em formas genéricas, resultando em um desempenho superior e escalável para segmentação médica 3D sem violar a privacidade dos dados.

Jiaqi Tang, Mengyan Zheng, Shu Zhang + 2 more2026-03-03💻 cs