cs.LG artículos | Gist.Science

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Este trabajo presenta RAD, un marco de alineación que reemplaza las restricciones de costo esperado tradicionales por restricciones de dominancia estocástica de primer orden dentro de un marco de transporte óptimo, permitiendo un control universal de medidas de riesgo espectral y mejorando la robustez ante eventos catastróficos y distribuciones fuera de contexto en el Aprendizaje por Refuerzo a partir de Feedback Humano (RLHF).

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

When should we trust the annotation? Selective prediction for molecular structure retrieval from mass spectra

Este artículo presenta un marco de predicción selectiva para la recuperación de estructuras moleculares a partir de espectros de masas que, mediante la cuantificación de incertidumbre a nivel de recuperación, permite a los modelos abstenerse de hacer predicciones dudosas para garantizar un control riguroso de la tasa de error en aplicaciones de alto riesgo.

Mira Jürgens, Gaetan De Waele, Morteza Rakhshaninejad, Willem Waegeman2026-03-12📊 stat

Ranking Reasoning LLMs under Test-Time Scaling

El artículo presenta Scorio, una biblioteca de código abierto que formaliza y evalúa métodos estadísticos para clasificar modelos de lenguaje de razonamiento bajo escalado de tiempo de prueba, demostrando que ciertas técnicas logran concordancia casi perfecta con un estándar de referencia bayesiano tanto en regímenes de múltiples intentos como de intento único.

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary2026-03-12📊 stat

Bio-Inspired Self-Supervised Learning for Wrist-worn IMU Signals

Este trabajo propone un método de aprendizaje auto-supervisido bioinspirado para señales IMU de muñeca que, al tokenizar el movimiento en segmentos basados en la teoría de submovimientos y preentrenar un Transformer, logra representaciones superiores para el reconocimiento de actividades humanas en comparación con enfoques existentes.

Prithviraj Tarale, Kiet Chu, Abhishek Varghese, Kai-Chun Liu, Maxwell A Xu, Mohit Iyyer, Sunghoon I. Lee2026-03-12🤖 cs.LG

Pointy - A Lightweight Transformer for Point Cloud Foundation Models

El artículo presenta "Pointy", una arquitectura ligera basada en transformadores para modelos fundamentales de nubes de puntos que, a pesar de entrenarse con solo 39.000 muestras, supera a modelos más grandes y alcanza resultados cercanos al estado del arte, demostrando la eficacia de un diseño arquitectónico cuidadoso y un régimen de entrenamiento estandarizado.

Konrad Szafer, Marek Kraft, Dominik Belter2026-03-12🤖 cs.LG

TOSSS: a CVE-based Software Security Benchmark for Large Language Models

El artículo presenta TOSSS, un nuevo benchmark basado en la base de datos CVE que evalúa la capacidad de los modelos de lenguaje grandes para seleccionar fragmentos de código seguros frente a vulnerables, ofreciendo una métrica de seguridad complementaria a las puntuaciones existentes.

Marc Damie, Murat Bilgehan Ertan, Domenico Essoussi, Angela Makhanu, Gaëtan Peter, Roos Wensveen2026-03-12🤖 cs.LG

FRIEND: Federated Learning for Joint Optimization of multi-RIS Configuration and Eavesdropper Intelligent Detection in B5G Networks

Este trabajo presenta un marco de aprendizaje federado para redes B5G que optimiza conjuntamente la configuración de superficies inteligentes reconfigurables (RIS) y la detección de eavesdroppers mediante una red neuronal convolucional con salida temprana, logrando un aumento del 30% en la tasa de secreto y preservando la privacidad de los datos en entornos industriales.

Maria Lamprini A. Bartsioka, Ioannis A. Bartsiokas, Anastasios K. Papazafeiropoulos, Maria A. Seimeni, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🤖 cs.LG

Federated Learning-driven Beam Management in LEO 6G Non-Terrestrial Networks

Este trabajo investiga la gestión de haces en redes no terrestres LEO mediante aprendizaje federado, demostrando que un modelo de red neuronal gráfica (GNN) supera a un perceptrón multicapa (MLP) en precisión y estabilidad para la selección de haces, especialmente en ángulos de elevación bajos.

Maria Lamprini Bartsioka, Ioannis A. Bartsiokas, Athanasios D. Panagopoulos, Dimitra I. Kaklamani, Iakovos S. Venieris2026-03-12🔬 physics

The Discrete Charm of the MLP: Binary Routing of Continuous Signals in Transformer Feed-Forward Layers

El artículo demuestra que las capas MLP en los modelos de transformadores realizan una enrutamiento binario de señales continuas, donde neuronas específicas actúan como interruptores de consenso y excepciones para dirigir el procesamiento no lineal, una estructura funcional que explica por qué las aproximaciones polinómicas suaves fallan al capturar la naturaleza discreta de estas decisiones.

Peter Balogh2026-03-12🤖 cs.LG

MCMC Informed Neural Emulators for Uncertainty Quantification in Dynamical Systems

Este artículo presenta un método que desacopla la cuantificación de incertidumbre de la arquitectura de la red neuronal mediante la incorporación de la distribución de parámetros del modelo como entrada entrenada con MCMC, logrando así emuladores precisos y computacionalmente eficientes para sistemas dinámicos sin necesidad de muestreo exhaustivo.

Heikki Haario, Zhi-Song Liu, Martin Simon, Hendrik Weichel2026-03-12🤖 cs.LG

ForwardFlow: Simulation only statistical inference using deep learning

El artículo presenta ForwardFlow, un enfoque de inferencia estadística basado únicamente en simulaciones que utiliza una red neuronal profunda con estructura ramificada para resolver el problema inverso de estimación de parámetros, demostrando propiedades deseables como exactitud en muestras finitas, robustez ante contaminación de datos y la capacidad de aproximar algoritmos complejos como el EM.

Stefan Böhringer2026-03-12📊 stat

Bayesian Optimization with Gaussian Processes to Accelerate Stationary Point Searches

Este artículo presenta un marco unificado de optimización bayesiana mediante procesos gaussianos que acelera la búsqueda de puntos estacionarios en superficies de energía potencial mediante un bucle de seis pasos, extensiones avanzadas de kernels y regularización, y una implementación práctica en Rust que demuestra la viabilidad de este enfoque para sistemas de alta dimensión.

Rohit Goswami (Institute IMX and Lab-COSMO, École polytechnique fédérale de Lausanne)2026-03-12📊 stat

Factorized Neural Implicit DMD for Parametric Dynamics

Este trabajo propone un enfoque de aprendizaje automático basado en campos neuronales implícitos factorizados para modelar la evolución temporal de sistemas físicos paramétricos, permitiendo predicciones estables a largo plazo, generalización a parámetros no vistos y análisis espectral sin depender de ecuaciones gobernantes explícitas.

Siyuan Chen, Zhecheng Wang, Yixin Chen, Yue Chang, Peter Yichen Chen, Eitan Grinspun, Jonathan Panuelos2026-03-12🤖 cs.LG

Cross-Species Transfer Learning for Electrophysiology-to-Transcriptomics Mapping in Cortical GABAergic Interneurons

Este estudio valida la reproducibilidad del marco de mapeo de electrofisiología a transcriptómica en interneuronas GABAérgicas, demuestra que los modelos de secuencia basados en atención pueden igualar a los baselines tradicionales y confirma que el aprendizaje por transferencia de datos de ratón a humano mejora la predicción de subclases en el cerebro humano.

Theo Schwider, Ramin Ramezani2026-03-12🧬 q-bio

Leech Lattice Vector Quantization for Efficient LLM Compression

Este artículo presenta la Cuantización Vectorial de la Red Leech (LLVQ), un método práctico que aprovecha las propiedades óptimas de empaquetado de la red Leech en 24 dimensiones para lograr una compresión de modelos de lenguaje grande (LLM) con un rendimiento superior al estado del arte, superando a técnicas recientes como Quip#, QTIP y PVQ sin necesidad de costosos mecanismos de búsqueda o almacenamiento de libros de códigos.

Tycho F. A. van der Ouderaa, Mart van Baalen, Paul Whatmough, Markus Nagel2026-03-12🤖 cs.LG

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

El paper presenta V2M-Zero, un enfoque de generación de música a partir de video sin pares de datos que logra una alineación temporal precisa al extraer y transferir estructuras de cambio temporal independientes dentro de cada modalidad mediante curvas de eventos, superando significativamente a los métodos basados en datos pareados.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

El artículo presenta NeFTY, un marco de física diferenciable que reconstruye cuantitativamente propiedades materiales en 3D y localiza defectos subsuperficiales mediante la parametrización de un campo de difusividad continuo optimizado con un solver numérico riguroso, superando las limitaciones de las aproximaciones tradicionales y las redes neuronales informadas por física en escenarios de difusión transitoria.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci

XConv: Low-memory stochastic backpropagation for convolutional layers

El artículo presenta XConv, un método de sustitución directa para capas convolucionales que reduce significativamente el uso de memoria mediante el almacenamiento de activaciones comprimidas y la estimación estocástica de gradientes, manteniendo al mismo tiempo el rendimiento, la convergencia y la compatibilidad con arquitecturas existentes sin imponer restricciones adicionales.

Anirudh Thatipelli, Jeffrey Sam, Mathias Louboutin, Ali Siahkoohi, Rongrong Wang, Felix J. Herrmann2026-03-11🤖 cs.LG

A Survey on Decentralized Federated Learning

Esta encuesta revisa sistemáticamente los métodos de aprendizaje federado descentralizado (DFL) desde 2018 hasta principios de 2026, proponiendo una taxonomía unificada basada en desafíos que clasifica las arquitecturas tradicionales y basadas en blockchain, al tiempo que identifica limitaciones en las prácticas de evaluación y define direcciones futuras de investigación.

Edoardo Gabrielli, Anthony Di Pietro, Dario Fenoglio, Giovanni Pica, Gabriele Tolomei2026-03-11🤖 cs.LG

Polynomially Over-Parameterized Convolutional Neural Networks Contain Structured Strong Winning Lottery Tickets

Este artículo demuestra que las redes neuronales convolucionales sobredimensionadas contienen subredes estructuradas que pueden aproximar redes más pequeñas sin entrenamiento, superando las limitaciones matemáticas previas mediante una generalización del problema de la suma de subconjuntos aleatorios para abordar la poda estructurada.

Arthur da Cunha, Francesco d'Amore, Emanuele Natale2026-03-11🤖 cs.LG

← Anterior Siguiente →