cs.LG artículos | Gist.Science

Hyperspherical Latents Improve Continuous-Token Autoregressive Generation

El artículo presenta SphereAR, un modelo de generación de imágenes autoregresivo que utiliza latentes hiperesféricos para estabilizar la decodificación y eliminar el colapso de varianza, logrando así un nuevo estado del arte en la generación de imágenes de ImageNet que supera a modelos de difusión y generación enmascarada en escalas comparables.

Guolin Ke, Hui Xue2026-03-06💻 cs

Quantitative convergence of trained single layer neural networks to Gaussian processes

Este artículo establece cotas superiores explícitas para la distancia de Wasserstein cuadrática entre las salidas de redes neuronales de una sola capa entrenadas con descenso de gradiente y sus aproximaciones de procesos gaussianos, demostrando una convergencia cuantitativa con decaimiento polinómico en función del ancho de la red.

Eloy Mosig, Andrea Agazzi, Dario Trevisan2026-03-06🔢 math

Pretraining Large Language Models with NVFP4

Este estudio presenta un método innovador para el preentrenamiento estable y preciso de modelos de lenguaje grandes en formato NVFP4, que mediante transformaciones de Hadamard aleatorias, esquemas de cuantización bidimensionales y redondeo estocástico, logra un rendimiento comparable al de la precisión FP8 en un modelo de 12 mil millones de parámetros entrenado con 10 billones de tokens.

NVIDIA, Felix Abecassis, Anjulie Agrusa + 87 more2026-03-06💻 cs

OPPO: Accelerating PPO-based RLHF via Pipeline Overlap

El marco OPPO acelera el entrenamiento de RLHF basado en PPO mediante la superposición de la ejecución de la tubería, utilizando técnicas de solapamiento intra e inter-paso para mitigar las ineficiencias causadas por dependencias secuenciales y latencias de cola, logrando mejoras de rendimiento de 1.8x a 2.8x sin comprometer la convergencia.

Kaizhuo Yan, Yingjie Yu, Yifan Yu + 2 more2026-03-06💻 cs

VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

El artículo presenta VidGuard-R1, el primer detector de videos generado por IA que utiliza optimización de políticas relativas grupales (GRPO) y modelos de lenguaje multimodal de razonamiento para superar las limitaciones de los métodos supervisados tradicionales, ofreciendo un rendimiento superior en cero disparos y explicaciones forenses basadas en la física.

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

Non-Asymptotic Analysis of Efficiency in Conformalized Regression

Este trabajo establece límites no asintóticos que cuantifican la eficiencia de la regresión conformalizada mediante SGD, revelando cómo la longitud de los conjuntos de predicción depende conjuntamente del tamaño de los conjuntos de entrenamiento y calibración, así como del nivel de cobertura, e identificando transiciones de fase en las tasas de convergencia.

Yunzhen Yao, Lie He, Michael Gastpar2026-03-06💻 cs

Do We Really Need Permutations? Impact of Model Width on Linear Mode Connectivity

Este trabajo demuestra empíricamente que simplemente aumentar el ancho de los modelos, junto con una calibración adecuada de la temperatura del softmax, es suficiente para lograr la conectividad lineal de modos sin necesidad de permutaciones de parámetros, explicando este fenómeno mediante la conectividad exponencialmente ponderada por capas (LEWC) que iguala la salida del modelo fusionado con la de un ensemble.

Akira Ito, Masanori Yamada, Daiki Chijiwa + 1 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

Este artículo presenta XFactor, el primer modelo auto-supervisado sin geometría capaz de sintetizar nuevas vistas de forma verdaderamente transferible al desvincular la pose de la cámara del contenido de la escena mediante un esquema de aumento, demostrando que la transferibilidad es el criterio clave para validar la síntesis de nuevas vistas sin necesidad de sesgos inductivos 3D.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

Este artículo presenta CBF-RL, un marco que integra Funciones de Barrera de Control (CBF) directamente en el entrenamiento de aprendizaje por refuerzo para internalizar restricciones de seguridad en la política aprendida, permitiendo un despliegue seguro y robusto en robots reales sin necesidad de filtros de seguridad en tiempo de ejecución.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

Este trabajo presenta B-ODIL, una extensión bayesiana del método de optimización de una pérdida discreta (ODIL) para resolver problemas inversos basados en ecuaciones diferenciales parciales, permitiendo inferir soluciones con incertidumbre cuantificada y demostrando su eficacia en simulaciones multidimensionales y en la estimación de la concentración de tumores cerebrales a partir de resonancias magnéticas.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Schrödinger Bridge Mamba for One-Step Speech Enhancement

El artículo presenta Schrödinger Bridge Mamba (SBM), un modelo innovador que combina el paradigma de puente de Schrödinger con la arquitectura Mamba para lograr una mejora de voz de alta calidad en un solo paso de inferencia, superando a los métodos existentes en tareas de eliminación de ruido y reverberación con alta eficiencia en tiempo real.

Jing Yang, Sirui Wang, Chao Wu + 2 more2026-03-06💻 cs

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Este artículo demuestra que las defensas actuales contra el secuestro del flujo de control en sistemas multiagente son vulnerables debido a conflictos inherentes entre seguridad y funcionalidad, y propone ControlValve, un nuevo mecanismo que combina la integridad del flujo de control y el principio de menor privilegio para garantizar ejecuciones seguras.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

Generalization Below the Edge of Stability: The Role of Data Geometry

Este artículo demuestra teóricamente que la geometría de los datos determina el sesgo implícito en redes neuronales ReLU sobreparametrizadas entrenadas por debajo del umbral de estabilidad, donde distribuciones difíciles de "fragmentar" favorecen la generalización al capturar patrones compartidos, mientras que aquellas fácilmente fragmentables (como las apoyadas en la esfera) conducen a la memorización.

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

Testing Most Influential Sets

Este artículo presenta un marco riguroso para probar estadísticamente si los conjuntos de datos más influyentes en modelos de mínimos cuadrados tienen un impacto excesivo, derivando fórmulas exactas y distribuciones de valores extremos que permiten realizar pruebas de hipótesis formales en lugar de depender de heurísticas ad hoc.

Lucas Darius Konrad, Nikolas Kuschnig2026-03-06🔢 math

LLEMA: Evolutionary Search with LLMs for Multi-Objective Materials Discovery

LLEMA es un marco unificado que combina el conocimiento de modelos de lenguaje grandes con reglas evolutivas y refinamiento basado en memoria para descubrir materiales novedosos que satisfacen múltiples objetivos y son químicamente plausibles, superando a los enfoques basales en diversas aplicaciones científicas.

Nikhil Abhyankar, Sanchit Kabra, Saaketh Desai + 1 more2026-03-06🔬 cond-mat.mtrl-sci

Auto-Adaptive PINNs with Applications to Phase Transitions

Este artículo propone un método de muestreo adaptativo para el entrenamiento de Redes Neuronales Informadas por Física (PINNs) que, utilizando heurísticas específicas del problema, logra resolver con precisión las regiones interfaciales en ecuaciones de Allen-Cahn sin necesidad de remuestreo posterior, superando a los enfoques adaptativos basados en residuos.

Kevin Buck, Woojeong Kim2026-03-06🔢 math

FMint-SDE: A Multimodal Foundation Model for Accelerating Numerical Simulation of SDEs via Error Correction

El artículo presenta FMint-SDE, un modelo fundacional multimodal basado en transformadores que acelera la simulación de ecuaciones diferenciales estocásticas mediante un esquema universal de corrección de errores, logrando una superior relación entre precisión y eficiencia en comparación con los métodos tradicionales.

Jiaxin Yuan, Haizhao Yang, Maria Cameron2026-03-06🔢 math

MotionStream: Real-Time Video Generation with Interactive Motion Controls

MotionStream es un sistema de generación de video en tiempo real que, mediante la destilación de un modelo bidireccional en un estudiante causal y el uso de atención deslizante con *attention sinks*, permite la creación de videos de duración ilimitada con control interactivo de movimiento a 29 FPS en una sola GPU, superando las limitaciones de latencia y acumulación de errores de los métodos anteriores.

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs

CytoNet: A Foundation Model for the Human Cerebral Cortex at Cellular Resolution

El artículo presenta CytoNet, un modelo fundacional auto-supervisado entrenado con un millón de parches de imágenes histológicas de cerebros humanos que permite el análisis escalable de la arquitectura celular cortical y vincula dicha microarquitectura con la organización estructural y funcional del cerebro.

Christian Schiffer, Zeynep Boztoprak, Jan-Oliver Kropp + 5 more2026-03-06💻 cs

CoRPO: Adding a Correctness Bias to GRPO Improves Generalization

El artículo presenta CoRPO, una modificación del algoritmo GRPO que introduce un umbral de corrección en la estimación de ventajas para evitar reforzar soluciones incorrectas, logrando así una mejor generalización y capacidades de razonamiento transferible entre diferentes dominios.

Anisha Garg, Claire Zhang, Nishit Neema + 3 more2026-03-06💻 cs

← Anterior Siguiente →