Attentive Feature Aggregation or: How Policies Learn to Stop Worrying about Robustness and Attend to Task-Relevant Visual Cues

Este trabajo presenta la Agregación de Características Atenta (AFA), un mecanismo de agrupamiento ligero que mejora la robustez de las políticas visuomotoras al aprender a ignorar distracciones visuales y centrarse únicamente en las señales relevantes para la tarea, sin necesidad de costosas aumentaciones de datos o ajuste fino de los modelos de visión preentrenados.

Nikolaos Tsagkas, Andreas Sochopoulos, Duolikun Danier + 4 more2026-03-02💻 cs

General vs Domain-Specific CNNs: Understanding Pretraining Effects on Brain MRI Tumor Classification

Este estudio demuestra que, en la clasificación de tumores cerebrales mediante MRI con datos limitados, las arquitecturas CNN de propósito general preentrenadas (como ConvNeXt-Tiny) superan en rendimiento a las preentrenadas específicamente en datos médicos (como RadImageNet DenseNet121), desafiando la noción de que el preentrenamiento especializado garantiza mejores resultados en escenarios de escasez de datos.

Helia Abedini, Saba Rahimi, Reza Vaziri2026-03-02🤖 cs.AI

TARDis: Time Attenuated Representation Disentanglement for Incomplete Multi-Modal Tumor Segmentation and Classification

El artículo presenta TARDis, un marco de aprendizaje profundo consciente de la física que descompone las características latentes en componentes anatómicos estáticos y dinámicos de perfusión para inferir fases de contraste faltantes en tomografías computarizadas, logrando así una segmentación y clasificación precisa de tumores incluso con datos temporales incompletos.

Zishuo Wan, Qinqin Kang, Na Li + 6 more2026-03-02💻 cs

ColaVLA: Leveraging Cognitive Latent Reasoning for Hierarchical Parallel Trajectory Planning in Autonomous Driving

El artículo presenta ColaVLA, un marco unificado de visión-lenguaje-acción que supera las limitaciones de latencia y desajuste de los planificadores basados en modelos de lenguaje visual mediante un razonador latente cognitivo y un planificador paralelo jerárquico, logrando un rendimiento de vanguardia en la planificación de trayectorias para la conducción autónoma.

Qihang Peng, Xuesong Chen, Chenye Yang + 2 more2026-03-02💻 cs

CPiRi: Channel Permutation-Invariant Relational Interaction for Multivariate Time Series Forecasting

CPiRi es un marco de predicción de series temporales multivariadas que combina una arquitectura de desacoplamiento espaciotemporal con una estrategia de entrenamiento regularizada por permutación para lograr invariancia al orden de los canales, superando así las limitaciones de los modelos dependientes e independientes de canales y logrando un rendimiento superior, generalización inductiva a canales no vistos y eficiencia práctica.

Jiyuan Xu, Wenyu Zhang, Xin Jing + 3 more2026-03-02💻 cs

Imagine a City: CityGenAgent for Procedural 3D City Generation

El artículo presenta CityGenAgent, un marco impulsado por lenguaje natural que utiliza una estrategia de aprendizaje en dos etapas (ajuste fino supervisado y aprendizaje por refuerzo) para generar y editar ciudades 3D procedurales de alta calidad mediante programas jerárquicos interpretables, superando a los métodos existentes en alineación semántica, calidad visual y controlabilidad.

Zishan Liu, Zecong Tang, RuoCheng Wu + 6 more2026-03-02💻 cs

Erase at the Core: Representation Unlearning for Machine Unlearning

El artículo presenta "Erase at the Core" (EC), un marco modelo-agnóstico que aborda el olvido superficial en el aprendizaje automático al aplicar desaprendizaje contrastivo y aprendizaje supervisado profundo en todas las capas intermedias de la red, logrando así un borrado efectivo tanto a nivel de logits como de representaciones internas sin comprometer el rendimiento en el conjunto de retención.

Jaewon Lee, Yongwoo Kim, Donghyun Kim2026-03-02🤖 cs.LG