HoloLLM: Multisensory Foundation Model for Language-Grounded Human Sensing and Reasoning

O artigo apresenta o HoloLLM, um modelo de linguagem multimodal que integra sensores incomuns como LiDAR, infravermelho, radar mmWave e WiFi para superar as limitações da visão em ambientes reais, utilizando um projetor universal de injeção de modalidades e uma pipeline de curadoria de dados colaborativa para alcançar uma percepção e raciocínio humanos significativamente mais precisos e robustos.

Chuhao Zhou, Jianfei Yang2026-02-25💬 cs.CL

Addressing Camera Sensors Faults in Vision-Based Navigation: Simulation and Dataset Development

Este estudo aborda os desafios da navegação baseada em visão em missões espaciais ao caracterizar falhas de sensores, desenvolver um framework de simulação para gerar imagens defeituosas sintéticas e criar um conjunto de dados essencial para treinar e testar algoritmos de Inteligência Artificial na detecção dessas falhas.

Riccardo Gallon, Fabian Schiemenz, Alessandra Menicucci + 1 more2026-02-25🤖 cs.AI

NRSeg: Noise-Resilient Learning for BEV Semantic Segmentation via Driving World Models

O artigo apresenta o NRSeg, um framework de aprendizado resiliente a ruídos para segmentação semântica em visão de pássaro (BEV) que utiliza dados sintéticos de modelos de mundo de direção, combinando métricas de consistência geométrica, previsão paralela de distribuições e exclusão semântica hierárquica para alcançar desempenho superior em tarefas não supervisionadas e semi-supervisionadas.

Siyu Li, Fei Teng, Yihong Cao + 3 more2026-02-25⚡ eess

FedGIN: Federated Learning with Dynamic Global Intensity Non-linear Augmentation for Organ Segmentation using Multi-modal Images

O artigo apresenta o FedGIN, um framework de aprendizado federado que utiliza uma augmentação não-linear dinâmica de intensidade global para superar desafios de privacidade e variabilidade entre modalidades, permitindo uma segmentação robusta de órgãos em imagens médicas multimodais (MRI e CT) sem a necessidade de compartilhar dados brutos.

Sachin Dudda Nagaraju, Ashkan Moradi, Bendik Skarre Abrahamsen + 1 more2026-02-25🤖 cs.AI

Seeing Through the Noise: Improving Infrared Small Target Detection and Segmentation from Noise Suppression Perspective

Este artigo propõe a NS-FPN, uma rede de pirâmide de características leve e eficaz que, ao adotar uma perspectiva de supressão de ruído no domínio da frequência através dos módulos LFP e SFS, melhora significativamente a detecção e segmentação de alvos pequenos no infravermelho, reduzindo falsos alarmes em cenários com ruído intenso.

Maoxun Yuan, Duanni Meng, Ziteng Xi + 4 more2026-02-25🤖 cs.AI

Decouple, Reorganize, and Fuse: A Multimodal Framework for Cancer Survival Prediction

Este artigo apresenta o framework DeReF, uma abordagem multimodal inovadora para previsão de sobrevivência ao câncer que supera as limitações de fusão estática e isolamento de informações em métodos existentes, integrando uma estratégia de reorganização aleatória de características e atenção cruzada regional para melhorar a generalização e a interação entre modalidades, conforme validado em conjuntos de dados de câncer de fígado e TCGA.

Huayi Wang, Haochao Ying, Yuyang Xu + 5 more2026-02-25💻 cs

Learning Unified Representations from Heterogeneous Data for Robust Heart Rate Modeling

Este artigo propõe um novo framework que supera os desafios da heterogeneidade de dados na modelagem de frequência cardíaca, combinando dropout de recursos aleatórios, atenção histórica e aprendizado contrastivo para gerar representações unificadas e robustas, validadas pelo desempenho superior em um novo conjunto de dados benchmark chamado PARROTAO.

Zhengdong Huang, Zicheng Xie, Wentao Tian + 3 more2026-02-25🤖 cs.LG