cs.LG artículos | Gist.Science

Improving Conditional VAE with Non-Volume Preserving transformations

Este trabajo propone mejorar los Autoencoders Variacionales Condicionales (CVAE) mediante transformaciones no conservadoras de volumen (NVP) para modelar con precisión la distribución latente condicional y tratar la varianza del decodificador como un parámetro aprendible, logrando así generar imágenes de mayor calidad y diversidad que superan a los métodos anteriores.

Tuhin Subhra De2026-03-10🤖 cs.LG

Tight Robustness Certification Through the Convex Hull of $\ell_0$ Attacks

Este artículo presenta un método de propagación de límites lineales que calcula con precisión la envolvente convexa de los ataques $\ell_0$ , logrando certificar la robustez de forma más ajustada y escalando significativamente los verificadores de estado del arte en comparación con las aproximaciones existentes.

Yuval Shapira, Dana Drachsler-Cohen2026-03-10🤖 cs.LG

Angular Gradient Sign Method: Uncovering Vulnerabilities in Hyperbolic Networks

Este trabajo propone un nuevo método de ataque adversarial para redes hiperbólicas que, al aplicar perturbaciones exclusivamente en la dirección angular del espacio tangente, logra tasas de engaño superiores y revela vulnerabilidades específicas de las representaciones jerárquicas en geometrías no euclidianas.

Minsoo Jo, Dongyoon Yang, Taesup Kim2026-03-10🤖 cs.LG

Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM

Este trabajo mejora la certificación de seguridad de SmoothLLM frente a ataques de jailbreaking al reemplazar la estricta suposición de "k-inestabilidad" con un marco probabilístico más realista "(k, $\varepsilon$ )-inestable" que incorpora modelos empíricos de éxito del ataque para ofrecer garantías de defensa más confiables y prácticas.

Adarsh Kumarappan, Ayushi Mehrotra2026-03-10🤖 cs.LG

Automating Deception: Scalable Multi-Turn LLM Jailbreaks

Este artículo presenta un pipeline automatizado para generar a gran escala ataques de jailbreak multi-turno basados en el principio psicológico "Pie en la Puerta", revelando que la historia conversacional aumenta drásticamente la vulnerabilidad de los modelos de la familia GPT, mientras que Gemini 2.5 Flash demuestra una resistencia excepcional.

Adarsh Kumarappan, Ananya Mujoo2026-03-10🤖 cs.LG

Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space

Este artículo propone un método de regularización direccional en el espacio latente que mitiga el aprendizaje de atajos y mejora la generalización fuera de distribución al identificar ejes correlacionados con etiquetas y reducir la sensibilidad del clasificador hacia ellos mediante la inyección de ruido anisotrópico, sin requerir etiquetas de atajos ni ejemplos conflictivos.

Shivam Pal, Sakshi Varshney, Piyush Rai2026-03-10🤖 cs.LG

Crowdsourcing the Frontier: Advancing Hybrid Physics-ML Climate Simulation via a $50,000 Kaggle Competition

Este artículo demuestra que la participación de la comunidad de ciencia de datos a través de una competencia de Kaggle para desarrollar parametrizaciones de aprendizaje automático ha permitido lograr estabilidad en línea en simulaciones climáticas híbridas, superando obstáculos históricos y alcanzando resultados de vanguardia.

Jerry Lin, Zeyuan Hu, Tom Beucler, Katherine Frields, Hannah Christensen, Walter Hannah, Helge Heuer, Peter Ukkonnen, Laura A. Mansfield, Tian Zheng, Liran Peng, Ritwik Gupta, Pierre Gentine, Yusef Al-Naher, Mingjiang Duan, Kyo Hattori, Weiliang Ji, Chunhan Li, Kippei Matsuda, Naoki Murakami, Shlomo Ron, Marec Serlin, Hongjian Song, Yuma Tanabe, Daisuke Yamamoto, Jianyao Zhou, Mike Pritchard2026-03-10🤖 cs.LG

CRAwDAD: Causal Reasoning Augmentation with Dual-Agent Debate

El artículo presenta CRAwDAD, un marco de debate entre dos agentes que mejora significativamente la precisión de los modelos de razonamiento en inferencia causal al simular un diálogo crítico entre hipótesis alternativas, logrando aumentos notables en la exactitud tanto en preguntas contrafactuales como generales.

Finn G. Vamosi, Nils D. Forkert2026-03-10🤖 cs.LG

ForamDeepSlice: A High-Accuracy Deep Learning Framework for Foraminifera Species Classification from 2D Micro-CT Slices

Este estudio presenta ForamDeepSlice, un marco de aprendizaje profundo basado en un ensemble de redes neuronales convolucionales que logra una precisión del 95,64% en la clasificación automática de especies de foraminíferos a partir de rebanadas 2D de micro-TC, ofreciendo además una herramienta interactiva para su despliegue práctico en geociencias.

Abdelghafour Halimi, Ali Alibrahim, Didier Barradas-Bautista, Ronell Sicat, Abdulkader M. Afifi2026-03-10🤖 cs.LG

AltNet: Addressing the Plasticity-Stability Dilemma in Reinforcement Learning

El artículo presenta AltNet, un enfoque basado en redes gemelas que resuelve el dilema de plasticidad-estabilidad en el aprendizaje por refuerzo al permitir la restauración periódica de la plasticidad mediante el intercambio de roles entre dos redes, logrando así una mayor eficiencia y rendimiento sin sufrir caídas temporales en el desempeño.

Mansi Maheshwari, John C. Raisbeck, Bruno Castro da Silva2026-03-10🤖 cs.LG

MSPT: Efficient Large-Scale Physical Modeling via Parallelized Multi-Scale Attention

El artículo presenta MSPT, un transformador de parches multi-escala que utiliza árboles de bolas para dividir dominios irregulares en parches, permitiendo modelar física a gran escala con millones de puntos en una sola GPU mediante una atención local y global eficiente que supera el estado del arte en precisión y eficiencia computacional.

Pedro M. P. Curvo, Jan-Willem van de Meent, Maksim Zhdanov2026-03-10🤖 cs.LG

Dual Randomized Smoothing: Beyond Global Noise Variance

El artículo propone un marco de "Suavizado Aleatorio Dual" que supera las limitaciones de la varianza de ruido global al utilizar un estimador de varianza dependiente de la entrada para lograr un rendimiento robusto superior tanto en radios pequeños como grandes, superando a los métodos anteriores en CIFAR-10 e ImageNet.

Chenhao Sun, Yuhao Mao, Martin Vechev2026-03-10🤖 cs.LG

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

Este artículo presenta DROCO, un algoritmo de aprendizaje por refuerzo offline cruzado que garantiza la robustez tanto en entrenamiento como en prueba frente a cambios en la dinámica mediante un nuevo operador de Bellman robusto, penalización de valor dinámica y pérdida de Huber.

Zhongjian Qiao, Rui Yang, Jiafei Lyu, Xiu Li, Zhongxiang Dai, Zhuoran Yang, Siyang Gao, Shuang Qiu2026-03-10🤖 cs.LG

Evolving Diffusion and Flow Matching Policies for Online Reinforcement Learning

El artículo presenta GoRL, un marco de aprendizaje por refuerzo en línea que resuelve la tensión entre la estabilidad de la optimización y la expresividad de las políticas mediante la decouplaje de la optimización en un espacio latente tratable y la síntesis de acciones en un espacio generativo, logrando un rendimiento superior en tareas de control continuo.

Chubin Zhang, Zhenglin Wan, Feng Chen, Fuchao Yang, Lang Feng, Yaxin Zhou, Xingrui Yu, Yang You, Ivor Tsang, Bo An2026-03-10🤖 cs.LG

Beyond Additivity: Sparse Isotonic Shapley Regression toward Nonlinear Explainability

Este artículo presenta la Regresión Isotónica Shapley Escasa (SISR), un marco unificado de explicación no lineal que aprende simultáneamente una transformación monótona para restaurar la aditividad y aplica una restricción de escasez L0 para identificar características relevantes de manera eficiente, superando así las limitaciones de distorsión y costo computacional de los valores Shapley estándar en escenarios de alta dimensionalidad y dependencias complejas.

Jialai She2026-03-10🤖 cs.LG

Two-Step Data Augmentation for Masked Face Detection and Recognition: Turning Fake Masks to Real

Este trabajo propone un marco de aumento de datos generativo de dos pasos que combina deformación de máscaras basada en reglas y traducción de imágenes mediante GANs para generar muestras de rostros con mascarilla, logrando mejoras consistentes con una fracción mínima de los datos de entrenamiento utilizados por métodos anteriores, a pesar de haber sido desarrollado bajo severas restricciones de recursos y tiempo.

Yan Yang, George Bebis, Mircea Nicolescu2026-03-10🤖 cs.LG

SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks

El artículo presenta SALVE, un marco unificado que combina autoencoders dispersos y mapeo de saliencia para descubrir, validar y controlar de manera interpretable y permanente el comportamiento de redes neuronales mediante la edición de vectores latentes.

Vegard Flovik2026-03-10🤖 cs.LG

Meta-RL Induces Exploration in Language Agents

El artículo presenta LaMer, un marco de Meta-RL que permite a los agentes de lenguaje aprender y explorar activamente en tiempo de prueba mediante un entrenamiento cruzado de episodios y la adaptación de políticas en contexto, logrando mejoras significativas en el rendimiento y la generalización frente a métodos de RL tradicionales.

Yulun Jiang, Liangze Jiang, Damien Teney, Michael Moor, Maria Brbic2026-03-10🤖 cs.LG

ReDepth Anything: Test-Time Depth Refinement via Self-Supervised Re-lighting

El artículo presenta "Re-Depth Anything", un marco de auto-supervisión en tiempo de prueba que mejora la estimación de profundidad monoculosa al fusionar modelos fundacionales con priores de modelos de difusión 2D a gran escala mediante un refinamiento basado en re-iluminación y muestreo de distorsión de puntuación (SDS), logrando resultados de vanguardia sin necesidad de etiquetas.

Ananta R. Bhattarai, Helge Rhodin2026-03-10🤖 cs.LG

Concurrent training methods for Kolmogorov-Arnold networks: Disjoint datasets and FPGA implementation

Este artículo presenta tres estrategias complementarias para acelerar el entrenamiento de redes Kolmogorov-Arnold (KAN) basadas en el método Newton-Kaczmarz: un procedimiento de preentrenamiento, el entrenamiento en subconjuntos de datos disjuntos con fusión posterior de modelos y una técnica de paralelización implementada y validada en hardware FPGA.

Andrew Polar, Michael Poluektov2026-03-10🤖 cs.LG

← Anterior Siguiente →

cs.LG