Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems

Este artículo presenta un método novedoso para la optimización de trayectorias robusta y libre de distribuciones en sistemas estocásticos no gaussianos, que utiliza inferencia conforme para garantizar el cumplimiento de restricciones de probabilidad mediante la reformulación de estas en restricciones deterministas tratables, permitiendo así la aplicación segura de planificadores de movimiento basados en aprendizaje.

Rihan Aaron D'Silva, Hiroyasu Tsukamoto2026-03-10🤖 cs.LG

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

Este artículo propone DualAdam, un optimizador que combina los mecanismos de actualización de Adam y su variante inversa (InvAdam) para garantizar la convergencia mientras mejora la generalización al ayudar a los modelos a escapar de mínimos agudos y encontrar mínimos planos, lo cual se valida mediante teoría de difusión y experimentos en clasificación de imágenes y ajuste fino de modelos de lenguaje grande.

Tao Shi, Liangming Chen, Long Jin, Mengchu Zhou2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

Este trabajo presenta un marco de aprendizaje por refuerzo fuera de línea que utiliza planificación agéntica con razonamiento de cadena de pensamiento y una biblioteca de herramientas de edición composicional para superar las limitaciones de la edición directa por prompts, logrando mejoras significativas en la calidad visual y el seguimiento de instrucciones complejas.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

Este artículo presenta MSKernelBench, un nuevo estándar de evaluación para múltiples escenarios, y CUDAMaster, un sistema multiagente que optimiza automáticamente kernels CUDA en diversos dominios (desde operaciones algebraicas hasta computación científica), logrando aceleraciones significativas que superan a métodos existentes y rivalizan con bibliotecas de alto rendimiento como cuBLAS.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

Este trabajo presenta un sustituto basado en una red neuronal de grafos espaciotemporal dual que aproxima de manera eficiente y precisa las respuestas no lineales de vigas de hormigón armado bajo flexión de cuatro puntos, superando las limitaciones de las simulaciones de elementos finitos tradicionales al predecir simultáneamente desplazamientos nodales, tensiones y deformaciones plásticas mediante un enfoque multi-tarea acoplado.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

El artículo presenta wDPO, un enfoque de alineación robusto para modelos de lenguaje grande que utiliza una estrategia de winsorización jerárquica para identificar y tratar de manera diferenciada distintos tipos de ruido en los datos de preferencia, mejorando así la calidad y robustez de la alineación sin depender de modelos de recompensa externos.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Este estudio presenta un sistema automatizado basado en sensores acústicos portátiles y modelos de aprendizaje profundo que segmenta y clasifica los sonidos intestinales con alta precisión, reduciendo significativamente el tiempo de etiquetado manual y ofreciendo a los clínicos una herramienta objetiva para la evaluación cuantitativa de la función gastrointestinal.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Este artículo propone y valida un método mejorado de regresión rango-rango condicional (CRRR) mediante modelos de transformación condicional profundos (DCTM) y cross-fitting para estimar la movilidad intergeneracional con mayor precisión en escenarios no lineales y con resultados discretos, demostrando su eficacia tanto en simulaciones como en aplicaciones empíricas sobre ingresos en EE. UU. y movilidad educativa en la India.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

El artículo presenta PT-RAG, un marco novedoso de generación aumentada por recuperación que utiliza un proceso de dos etapas con recuperación diferenciable y consciente del tipo celular para superar las limitaciones de generalización de los enfoques actuales y predecir con mayor precisión las respuestas celulares a las perturbaciones genéticas.

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

El artículo presenta WeDas, un marco que mejora a los agentes de investigación profunda al integrar las características estructurales de la distribución de contenido web y utilizar un mecanismo de sondeo para alinear dinámicamente las intenciones de razonamiento con los resultados de búsqueda, superando así las limitaciones de los enfoques actuales.

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Este artículo propone dos métodos de aprendizaje simbólico, SyNF y SyTF, que generan ecuaciones algebraicas interpretables para pronosticar series temporales caóticas con una precisión competitiva frente a modelos de caja negra, permitiendo así una comprensión transparente de las dinámicas subyacentes en aplicaciones como la incidencia de dengue y el índice Niño 3.4.

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Este artículo propone un marco de aprendizaje por refuerzo multiobjetivo adaptativo que integra la predicción individualizada de ausencias con un mecanismo de coevolución de políticas para optimizar dinámicamente las decisiones de doble reserva en clínicas ambulatorias, mejorando así la eficiencia operativa y la equidad en la atención.

Ninda Nurseha Amalina, Heungjo An2026-03-10🤖 cs.LG

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

El artículo presenta los Mapas de Flujo Variacionales (VFMs), un marco que permite la generación condicional de imágenes de alta calidad en un solo paso mediante el aprendizaje de una distribución de ruido inicial adaptada a la observación, superando así las limitaciones de los modelos iterativos tradicionales.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG