cs.LG artículos | Gist.Science

Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems

Este artículo presenta un método novedoso para la optimización de trayectorias robusta y libre de distribuciones en sistemas estocásticos no gaussianos, que utiliza inferencia conforme para garantizar el cumplimiento de restricciones de probabilidad mediante la reformulación de estas en restricciones deterministas tratables, permitiendo así la aplicación segura de planificadores de movimiento basados en aprendizaje.

Rihan Aaron D'Silva, Hiroyasu Tsukamoto2026-03-10🤖 cs.LG

Deep Generative Spatiotemporal Engression for Probabilistic Forecasting of Epidemics

Este artículo presenta un nuevo método de regresión espacio-temporal generativa profunda que, mediante arquitecturas ligeras y ruido pre-aditivo, ofrece pronósticos probabilísticos precisos y confiables para epidemias, superando a los modelos existentes en múltiples conjuntos de datos y mejorando la toma de decisiones en salud pública.

Rajdeep Pathak, Tanujit Chakraborty2026-03-10🤖 cs.LG

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

Este artículo propone DualAdam, un optimizador que combina los mecanismos de actualización de Adam y su variante inversa (InvAdam) para garantizar la convergencia mientras mejora la generalización al ayudar a los modelos a escapar de mínimos agudos y encontrar mínimos planos, lo cual se valida mediante teoría de difusión y experimentos en clasificación de imágenes y ajuste fino de modelos de lenguaje grande.

Tao Shi, Liangming Chen, Long Jin, Mengchu Zhou2026-03-10🤖 cs.LG

Agentic Planning with Reasoning for Image Styling via Offline RL

Este trabajo presenta un marco de aprendizaje por refuerzo fuera de línea que utiliza planificación agéntica con razonamiento de cadena de pensamiento y una biblioteca de herramientas de edición composicional para superar las limitaciones de la edición directa por prompts, logrando mejoras significativas en la calidad visual y el seguimiento de instrucciones complejas.

Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee2026-03-10🤖 cs.LG

Spectral Conditioning of Attention Improves Transformer Performance

El artículo presenta un método teórico y empírico que mejora el rendimiento de los transformadores al modificar las propiedades espectrales de las capas de atención para reducir el número de condición del Jacobiano, logrando así una integración sencilla y mejoras consistentes en diversas arquitecturas y tareas.

Hemanth Saratchandran, Simon Lucey2026-03-10🤖 cs.LG

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

Este artículo presenta MSKernelBench, un nuevo estándar de evaluación para múltiples escenarios, y CUDAMaster, un sistema multiagente que optimiza automáticamente kernels CUDA en diversos dominios (desde operaciones algebraicas hasta computación científica), logrando aceleraciones significativas que superan a métodos existentes y rivalizan con bibliotecas de alto rendimiento como cuBLAS.

Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu2026-03-10🤖 cs.LG

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

Este artículo presenta SPCP, un método que mejora la detección de datos fuera de distribución al fomentar patrones de contribución de parámetros más densos y orientados a los límites durante el entrenamiento, evitando así las predicciones excesivamente confiables causadas por la dependencia de unos pocos parámetros dominantes.

Haonan Xu, Yang Yang2026-03-10🤖 cs.LG

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

Este trabajo presenta un sustituto basado en una red neuronal de grafos espaciotemporal dual que aproxima de manera eficiente y precisa las respuestas no lineales de vigas de hormigón armado bajo flexión de cuatro puntos, superando las limitaciones de las simulaciones de elementos finitos tradicionales al predecir simultáneamente desplazamientos nodales, tensiones y deformaciones plásticas mediante un enfoque multi-tarea acoplado.

Zhaoyang Ren, Qilin Li2026-03-10🤖 cs.LG

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

El artículo presenta wDPO, un enfoque de alineación robusto para modelos de lenguaje grande que utiliza una estrategia de winsorización jerárquica para identificar y tratar de manera diferenciada distintos tipos de ruido en los datos de preferencia, mejorando así la calidad y robustez de la alineación sin depender de modelos de recompensa externos.

Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong2026-03-10🤖 cs.LG

Towards Objective Gastrointestinal Auscultation: Automated Segmentation and Annotation of Bowel Sound Patterns

Este estudio presenta un sistema automatizado basado en sensores acústicos portátiles y modelos de aprendizaje profundo que segmenta y clasifica los sonidos intestinales con alta precisión, reduciendo significativamente el tiempo de etiquetado manual y ofreciendo a los clínicos una herramienta objetiva para la evaluación cuantitativa de la función gastrointestinal.

Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff2026-03-10🤖 cs.LG

Margin in Abstract Spaces

Este artículo demuestra que el aprendizaje basado en márgenes es posible en cualquier espacio métrico cuando el margen es suficientemente grande, revelando que este fenómeno depende únicamente de la desigualdad triangular y no de una estructura lineal, al tiempo que establece una taxonomía estructural que limita la complejidad de muestra en espacios de Banach.

Yair Ashlagi, Roi Livni, Shay Moran, Tom Waknine2026-03-10🤖 cs.LG

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Este estudio presenta un marco de entrenamiento centrado en datos de alta calidad y verificación de dificultad que, mediante destilación y ajuste fino, permite que el modelo ODA-Fin-RL-8B supere a los modelos financieros de código abierto más avanzados en diversas tareas financieras.

Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu2026-03-10🤖 cs.LG

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

LightMedSeg es una arquitectura de segmentación médica 3D ligera y eficiente que integra priores anatómicos y mecanismos de modulación adaptativa para lograr una precisión comparable a los modelos basados en transformadores, pero con una fracción de los parámetros y costos computacionales.

Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal2026-03-10🤖 cs.LG

Conditional Rank-Rank Regression via Deep Conditional Transformation Models

Este artículo propone y valida un método mejorado de regresión rango-rango condicional (CRRR) mediante modelos de transformación condicional profundos (DCTM) y cross-fitting para estimar la movilidad intergeneracional con mayor precisión en escenarios no lineales y con resultados discretos, demostrando su eficacia tanto en simulaciones como en aplicaciones empíricas sobre ingresos en EE. UU. y movilidad educativa en la India.

Xiaoyi Wang, Long Feng, Zhaojun Wang2026-03-10🤖 cs.LG

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

El artículo presenta PT-RAG, un marco novedoso de generación aumentada por recuperación que utiliza un proceso de dos etapas con recuperación diferenciable y consciente del tipo celular para superar las limitaciones de generalización de los enfoques actuales y predecir con mayor precisión las respuestas celulares a las perturbaciones genéticas.

Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Liò2026-03-10🤖 cs.LG

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

El artículo presenta WeDas, un marco que mejora a los agentes de investigación profunda al integrar las características estructurales de la distribución de contenido web y utilizar un mecanismo de sondeo para alinear dinámicamente las intenciones de razonamiento con los resultados de búsqueda, superando así las limitaciones de los enfoques actuales.

Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han2026-03-10🤖 cs.LG

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Este estudio presenta el marco LF2L, un enfoque de aprendizaje federado horizontal con fusión de pérdidas que integra datos heterogéneos de Taiwan y EE. UU. para predecir eficazmente el cáncer secundario primario preservando la privacidad y superando a los métodos tradicionales.

Chia-Fu Lin, Yi-Ju Tseng2026-03-10🤖 cs.LG

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Este artículo propone dos métodos de aprendizaje simbólico, SyNF y SyTF, que generan ecuaciones algebraicas interpretables para pronosticar series temporales caóticas con una precisión competitiva frente a modelos de caja negra, permitiendo así una comprensión transparente de las dinámicas subyacentes en aplicaciones como la incidencia de dengue y el índice Niño 3.4.

Madhurima Panja, Grace Younes, Tanujit Chakraborty2026-03-10🤖 cs.LG

Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Este artículo propone un marco de aprendizaje por refuerzo multiobjetivo adaptativo que integra la predicción individualizada de ausencias con un mecanismo de coevolución de políticas para optimizar dinámicamente las decisiones de doble reserva en clínicas ambulatorias, mejorando así la eficiencia operativa y la equidad en la atención.

Ninda Nurseha Amalina, Heungjo An2026-03-10🤖 cs.LG

Variational Flow Maps: Make Some Noise for One-Step Conditional Generation

El artículo presenta los Mapas de Flujo Variacionales (VFMs), un marco que permite la generación condicional de imágenes de alta calidad en un solo paso mediante el aprendizaje de una distribución de ruido inicial adaptada a la observación, superando así las limitaciones de los modelos iterativos tradicionales.

Abbas Mammadov, So Takao, Bohan Chen, Ricardo Baptista, Morteza Mardani, Yee Whye Teh, Julius Berner2026-03-10🤖 cs.LG

← Anterior Siguiente →