FermatSyn: SAM2-Enhanced Bidirectional Mamba with Isotropic Spiral Scanning for Multi-Modal Medical Image Synthesis

O artigo apresenta o FermatSyn, um novo método para síntese de imagens médicas multimodais que combina um codificador baseado no SAM2, um módulo de downsampling residual hierárquico e uma estratégia de varredura em espiral de Fermat bidirecional para superar as limitações de consistência anatômica global e detalhe local, demonstrando desempenho superior e utilidade clínica em diversos conjuntos de dados.

Feng Yuan2026-03-02⚡ eess

On the use of Graphs for Satellite Image Time Series

Este artigo examina a integração de métodos baseados em grafos na análise de séries temporais de imagens de satélite, apresentando um pipeline versátil para modelar interações espaciais e temporais em nível de objeto, com revisões abrangentes e estudos de caso que demonstram seu potencial para mapeamento de cobertura do solo e previsão de recursos hídricos.

Corentin Dufourg, Charlotte Pelletier, Stéphane May + 1 more2026-03-02💻 cs

OmniFall: From Staged Through Synthetic to Wild, A Unified Multi-Domain Dataset for Robust Fall Detection

O artigo apresenta o OmniFall, um benchmark unificado e multi-domínio que combina dados de quedas encenadas, sintéticas e reais (in-the-wild) com anotações densas padronizadas, permitindo o desenvolvimento e avaliação de modelos robustos de detecção de quedas que generalizam para ambientes não controlados enquanto preservam a privacidade.

David Schneider, Zdravko Marinov, Zeyun Zhong + 5 more2026-03-02💻 cs

LLM-Enhanced Multimodal Fusion for Cross-Domain Sequential Recommendation

O artigo propõe o LLM-EMF, uma abordagem inovadora para recomendação sequencial multodomínio que integra conhecimento de Grandes Modelos de Linguagem e dados multimodais (texto e imagem) por meio de um mecanismo de atenção múltipla, demonstrando superioridade em quatro conjuntos de dados de comércio eletrônico ao capturar preferências complexas de usuários.

Wangyu Wu, Zhenhong Chen, Wenqiao Zhang + 5 more2026-03-02💻 cs

Knowledge-Guided Machine Learning: Illustrating the use of Explainable Boosting Machines to Identify Overshooting Tops in Satellite Imagery

Este trabalho demonstra o uso de Máquinas de Reforço Explicáveis (EBMs) em uma colaboração humano-máquina para identificar topos de nuvens penetrantes em imagens de satélite, utilizando técnicas de aprendizado de máquina guiado por conhecimento para extrair características escalares e criar um modelo meteorológico totalmente interpretável que incorpora estratégias humanas, mesmo que com uma precisão ligeiramente inferior a abordagens mais complexas.

Nathan Mitchell, Lander Ver Hoef, Imme Ebert-Uphoff + 4 more2026-03-02🤖 cs.LG

DA-Occ: Direction-Aware 2D Convolution for Efficient and Geometry-Preserving 3D Occupancy Prediction in Autonomous Driving

O artigo apresenta o DA-Occ, um novo método de previsão de ocupação 3D para direção autônoma que combina projeção de altura complementar e convolução direcional para superar as limitações de precisão e eficiência dos métodos existentes, alcançando um equilíbrio ideal entre detalhe geométrico e velocidade de inferência.

Yuchen Zhou, Yan Luo, Xiaogang Wang + 3 more2026-03-02💻 cs

AutoDebias: Automated Framework for Debiasing Text-to-Image Models

O artigo apresenta o AutoDebias, um framework automatizado que utiliza modelos visão-linguagem e prompts de neutralização para identificar e mitigar com eficácia ataques de backdoor maliciosos e sutis em modelos de texto-para-imagem, reduzindo drasticamente a taxa de sucesso desses ataques sem comprometer a qualidade ou a diversidade das imagens geradas.

Hongyi Cai, Mohammad Mahdinur Rahman, Mingkang Dong + 7 more2026-03-02💻 cs