FOCUS on Contamination: Hydrology-Informed Noise-Aware Learning for Geospatial PFAS Mapping

El artículo presenta FOCUS, un marco de aprendizaje profundo geoespacial que integra datos ambientales y observaciones escasas de PFAS mediante un prior hidrológico y una función de pérdida ruidosa para generar mapas de contaminación escalables y coherentes que superan a los métodos tradicionales y guían la toma de decisiones en la ausencia de modelos físicos completos.

Jowaria Khan, Alexa Friedman, Sydney Evans + 6 more2026-02-19🤖 cs.LG

CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis

El artículo presenta CARL, un modelo de aprendizaje de representaciones agnóstico a la cámara que utiliza un codificador espectral novedoso y pre-entrenamiento auto-supervisado para unificar imágenes RGB, multiespectrales e hiperespectrales, superando así las limitaciones de generalización causadas por la variabilidad de los sensores en dominios como la medicina, la conducción autónoma y la teledetección.

Alexander Baumann, Leonardo Ayala, Silvia Seidlitz + 5 more2026-02-19🤖 cs.LG

Label-Consistent Dataset Distillation with Detector-Guided Refinement

Este artículo presenta un marco de destilación de conjuntos de datos guiado por un detector que utiliza un modelo de detección preentrenado para identificar y refinar muestras sintéticas anómalas mediante un modelo de difusión, garantizando así la consistencia de las etiquetas y mejorando la calidad de las imágenes para lograr un rendimiento superior al estado del arte.

Yawen Zou, Guang Li, Zi Wang + 2 more2026-02-19💻 cs

MedVLThinker: Simple Baselines for Multimodal Medical Reasoning

El artículo presenta MedVLThinker, un conjunto de líneas base de código abierto que demuestra que el aprendizaje por refuerzo con recompensas verificables (RLVR) sobre datos de razonamiento puramente textuales supera significativamente al ajuste fino supervisado y a los datos multimodales, logrando un nuevo estado del arte en benchmarks médicos y rivalizando con modelos propietarios como GPT-4o.

Xiaoke Huang, Juncheng Wu, Hui Liu + 2 more2026-02-19💻 cs

COGITAO: A Visual Reasoning Framework To Study Compositionality & Generalization

El artículo presenta COGITAO, un marco de generación de datos y un conjunto de pruebas de código abierto diseñado para estudiar sistemáticamente la composición y la generalización en dominios visuales mediante la creación de millones de tareas únicas basadas en reglas, revelando así las limitaciones actuales de los modelos de visión más avanzados para generalizar a combinaciones novedosas.

Yassine Taoudi-Benchekroun, Klim Troyan, Pascal Sager + 3 more2026-02-19🤖 cs.AI

Melanoma Classification Through Deep Ensemble Learning and Explainable AI

Este artículo propone un modelo de aprendizaje profundo basado en un conjunto de tres redes de transferencia de estado del arte, combinado con técnicas de Inteligencia Artificial Explicable (XAI), para mejorar la precisión y la confianza en el diagnóstico temprano del melanoma al superar las limitaciones de opacidad de los modelos tradicionales.

Wadduwage Shanika Perera, ABM Islam, Van Vung Pham + 1 more2026-02-19🤖 cs.LG

Language-Guided Invariance Probing of Vision-Language Models

Este artículo presenta LGIP, un nuevo benchmark que evalúa la robustez lingüística de los modelos visión-idioma midiendo su invariancia ante parafraseos y su sensibilidad a cambios semánticos, revelando que, aunque algunos modelos como EVA02-CLIP muestran un buen equilibrio, otros como SigLIP fallan en distinguir descripciones originales de alteraciones semánticas, un problema que las métricas de recuperación estándar no detectan.

Jae Joong Lee2026-02-19🤖 cs.AI