Label-Consistent Dataset Distillation with Detector-Guided Refinement

Este artículo presenta un marco de destilación de conjuntos de datos guiado por un detector que utiliza un modelo de detección preentrenado para identificar y refinar muestras sintéticas anómalas mediante un modelo de difusión, garantizando así la consistencia de las etiquetas y mejorando la calidad de las imágenes para lograr un rendimiento superior al estado del arte.

Yawen Zou, Guang Li, Zi Wang + 2 more2026-02-19💻 cs

MedVLThinker: Simple Baselines for Multimodal Medical Reasoning

El artículo presenta MedVLThinker, un conjunto de líneas base de código abierto que demuestra que el aprendizaje por refuerzo con recompensas verificables (RLVR) sobre datos de razonamiento puramente textuales supera significativamente al ajuste fino supervisado y a los datos multimodales, logrando un nuevo estado del arte en benchmarks médicos y rivalizando con modelos propietarios como GPT-4o.

Xiaoke Huang, Juncheng Wu, Hui Liu + 2 more2026-02-19💻 cs

COGITAO: A Visual Reasoning Framework To Study Compositionality & Generalization

El artículo presenta COGITAO, un marco de generación de datos y un conjunto de pruebas de código abierto diseñado para estudiar sistemáticamente la composición y la generalización en dominios visuales mediante la creación de millones de tareas únicas basadas en reglas, revelando así las limitaciones actuales de los modelos de visión más avanzados para generalizar a combinaciones novedosas.

Yassine Taoudi-Benchekroun, Klim Troyan, Pascal Sager + 3 more2026-02-19🤖 cs.AI

Melanoma Classification Through Deep Ensemble Learning and Explainable AI

Este artículo propone un modelo de aprendizaje profundo basado en un conjunto de tres redes de transferencia de estado del arte, combinado con técnicas de Inteligencia Artificial Explicable (XAI), para mejorar la precisión y la confianza en el diagnóstico temprano del melanoma al superar las limitaciones de opacidad de los modelos tradicionales.

Wadduwage Shanika Perera, ABM Islam, Van Vung Pham + 1 more2026-02-19🤖 cs.LG

Language-Guided Invariance Probing of Vision-Language Models

Este artículo presenta LGIP, un nuevo benchmark que evalúa la robustez lingüística de los modelos visión-idioma midiendo su invariancia ante parafraseos y su sensibilidad a cambios semánticos, revelando que, aunque algunos modelos como EVA02-CLIP muestran un buen equilibrio, otros como SigLIP fallan en distinguir descripciones originales de alteraciones semánticas, un problema que las métricas de recuperación estándar no detectan.

Jae Joong Lee2026-02-19🤖 cs.AI

Scalable Residual Feature Aggregation Framework with Hybrid Metaheuristic Optimization for Robust Early Pancreatic Neoplasm Detection in Multimodal CT Imaging

Este estudio propone un marco escalable de agregación de características residuales con optimización metaheurística híbrida que integra segmentación avanzada, extracción de características profundas y un clasificador híbrido ViT-EfficientNet para lograr una detección temprana y robusta de neoplasias pancreáticas en imágenes TC multimodales con una precisión superior al 96%.

Janani Annur Thiruvengadam, Kiran Mayee Nabigaru, Anusha Kovi2026-02-19💻 cs

GEPC: Group-Equivariant Posterior Consistency for Out-of-Distribution Detection in Diffusion Models

Este artículo presenta GEPC, un método libre de entrenamiento que detecta datos fuera de distribución en modelos de difusión midiendo la inconsistencia de las transformaciones de la función de puntuación bajo grupos de simetría, logrando un rendimiento competitivo y mapas interpretables sin depender de la magnitud de la puntuación.

Yadang Alexis Rouzoumka, Jean Pinsolle, Eugénie Terreaux + 3 more2026-02-19🤖 cs.LG

Vision and Language: Novel Representations and Artificial intelligence for Driving Scene Safety Assessment and Autonomous Vehicle Planning

Este artículo investiga cómo los modelos de visión y lenguaje pueden mejorar la seguridad en la conducción autónoma mediante tres enfoques complementarios: detección de riesgos semánticos, integración en la planificación de trayectorias y el uso de instrucciones en lenguaje natural como restricciones de comportamiento, concluyendo que el éxito depende de un diseño de sistema cuidadoso y una fundamentación estructurada más que de la inyección directa de características.

Ross Greer, Maitrayee Keskar, Angel Martinez-Sanchez + 3 more2026-02-19🤖 cs.AI