DriveMamba: Task-Centric Scalable State Space Model for Efficient End-to-End Autonomous Driving

El artículo presenta DriveMamba, un modelo de espacio de estado escalable centrado en tareas que utiliza un decodificador unificado Mamba con complejidad lineal y un escaneo bidireccional guiado por trayectorias para superar las limitaciones de eficiencia y pérdida de información de los sistemas de conducción autónoma de extremo a extremo existentes, demostrando un rendimiento superior en conjuntos de datos como nuScenes y Bench2Drive.

Haisheng Su, Wei Wu, Feixiang Song + 3 more2026-02-25💻 cs

Sim2Radar: Toward Bridging the Radar Sim-to-Real Gap with VLM-Guided Scene Reconstruction

Sim2Radar es un marco de trabajo que cierra la brecha entre la simulación y la realidad en la percepción por radar de ondas milimétricas al sintetizar datos de entrenamiento a partir de imágenes RGB utilizando reconstrucción de escenas guiada por visión artificial y modelos físicos, logrando así mejoras significativas en la detección de objetos 3D mediante aprendizaje por transferencia.

Emily Bejerano, Federico Tondolo, Ayaan Qayyum + 2 more2026-02-25🤖 cs.AI

Tree crop mapping of South America reveals links to deforestation and conservation

Este estudio presenta el primer mapa de cultivos leñosos de 10 metros de resolución para Sudamérica, generado mediante aprendizaje profundo, que revela vínculos con la deforestación y corrige errores en los mapas regulatorios actuales que clasifican erróneamente la agricultura establecida como bosque, protegiendo así a los pequeños agricultores.

Yuchang Jiang, Anton Raichuk, Xiaoye Tong + 6 more2026-02-25💻 cs

Probability-Invariant Random Walk Learning on Gyral Folding-Based Cortical Similarity Networks for Alzheimer's and Lewy Body Dementia Diagnosis

Este artículo propone un marco de aprendizaje basado en paseos aleatorios invariables a la probabilidad que clasifica redes de similitud cortical individualizadas utilizando pliegues giroideos, superando las limitaciones de alineación de nodos de los métodos existentes para mejorar el diagnóstico de la enfermedad de Alzheimer y la demencia con cuerpos de Lewy.

Minheng Chen, Tong Chen, Chao Cao + 4 more2026-02-25🧬 q-bio

TraceVision: Trajectory-Aware Vision-Language Model for Human-Like Spatial Understanding

El artículo presenta TraceVision, un modelo unificado visión-lenguaje que integra la comprensión espacial consciente de trayectorias mediante un módulo de percepción visual bidireccional y un nuevo conjunto de datos, logrando un rendimiento superior en tareas de generación de descripciones, localización y segmentación al simular la atención visual humana.

Fan Yang, Shurong Zheng, Hongyin Zhao + 5 more2026-02-25💻 cs

Mobile-O: Unified Multimodal Understanding and Generation on Mobile Device

Mobile-O es un modelo multimodal unificado compacto que, gracias a su innovador Proyectador de Condicionamiento Móvil (MCP) y una eficiente estrategia de entrenamiento, permite la comprensión y generación de imágenes en tiempo real directamente en dispositivos móviles, superando en rendimiento y velocidad a modelos existentes como Show-O y JanusFlow.

Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad + 8 more2026-02-25💻 cs

VISION-ICE: Video-based Interpretation and Spatial Identification of Arrhythmia Origins via Neural Networks in Intracardiac Echocardiography

El estudio presenta VISION-ICE, un marco basado en inteligencia artificial que utiliza redes neuronales convolucionales tridimensionales sobre videos de ecocardiografía intracardíaca (ICE) para localizar automáticamente el origen de las arritmias, demostrando una viabilidad clínica prometedora para reducir el tiempo y la carga de los procedimientos de ablación cardíaca.

Dorsa EPMoghaddam, Feng Gao, Drew Bernard + 3 more2026-02-25🤖 cs.LG

Global Prior Meets Local Consistency: Dual-Memory Augmented Vision-Language-Action Model for Efficient Robotic Manipulation

OptimusVLA es un modelo de visión-lenguaje-acción jerárquico que introduce una memoria de prioridad global y una memoria de consistencia local para mejorar la eficiencia de inferencia y la robustez en la manipulación robótica, logrando tasas de éxito superiores y una aceleración de 2.9 veces en comparación con modelos de referencia en diversos entornos de simulación y del mundo real.

Zaijing Li, Bing Hu, Rui Shao + 5 more2026-02-25🤖 cs.AI

GSNR: Graph Smooth Null-Space Representation for Inverse Problems

El artículo propone GSNR, un método que mejora la resolución de problemas inversos en imágenes al incorporar información estructurada del espacio nulo mediante una representación de grafo suave, logrando mejoras significativas en la convergencia y la calidad de la reconstrucción en comparación con enfoques basados en priores generales o modelos aprendidos.

Romario Gualdrón-Hurtado, Roman Jacome, Rafael S. Suarez + 1 more2026-02-25⚡ eess