Pretraining Large Language Models with NVFP4

Este estudio presenta un método innovador para el preentrenamiento estable y preciso de modelos de lenguaje grandes en formato NVFP4, que mediante transformaciones de Hadamard aleatorias, esquemas de cuantización bidimensionales y redondeo estocástico, logra un rendimiento comparable al de la precisión FP8 en un modelo de 12 mil millones de parámetros entrenado con 10 billones de tokens.

NVIDIA, Felix Abecassis, Anjulie Agrusa + 87 more2026-03-06💻 cs

VidGuard-R1: AI-Generated Video Detection and Explanation via Reasoning MLLMs and RL

El artículo presenta VidGuard-R1, el primer detector de videos generado por IA que utiliza optimización de políticas relativas grupales (GRPO) y modelos de lenguaje multimodal de razonamiento para superar las limitaciones de los métodos supervisados tradicionales, ofreciendo un rendimiento superior en cero disparos y explicaciones forenses basadas en la física.

Kyoungjun Park, Yifan Yang, Juheon Yi + 6 more2026-03-06💻 cs

Do We Really Need Permutations? Impact of Model Width on Linear Mode Connectivity

Este trabajo demuestra empíricamente que simplemente aumentar el ancho de los modelos, junto con una calibración adecuada de la temperatura del softmax, es suficiente para lograr la conectividad lineal de modos sin necesidad de permutaciones de parámetros, explicando este fenómeno mediante la conectividad exponencialmente ponderada por capas (LEWC) que iguala la salida del modelo fusionado con la de un ensemble.

Akira Ito, Masanori Yamada, Daiki Chijiwa + 1 more2026-03-06💻 cs

True Self-Supervised Novel View Synthesis is Transferable

Este artículo presenta XFactor, el primer modelo auto-supervisado sin geometría capaz de sintetizar nuevas vistas de forma verdaderamente transferible al desvincular la pose de la cámara del contenido de la escena mediante un esquema de aumento, demostrando que la transferibilidad es el criterio clave para validar la síntesis de nuevas vistas sin necesidad de sesgos inductivos 3D.

Thomas W. Mitchel, Hyunwoo Ryu, Vincent Sitzmann2026-03-06💻 cs

CBF-RL: Safety Filtering Reinforcement Learning in Training with Control Barrier Functions

Este artículo presenta CBF-RL, un marco que integra Funciones de Barrera de Control (CBF) directamente en el entrenamiento de aprendizaje por refuerzo para internalizar restricciones de seguridad en la política aprendida, permitiendo un despliegue seguro y robusto en robots reales sin necesidad de filtros de seguridad en tiempo de ejecución.

Lizhi Yang, Blake Werner, Massimiliano de Sa + 1 more2026-03-06💻 cs

Bayesian Inference for PDE-based Inverse Problems using the Optimization of a Discrete Loss

Este trabajo presenta B-ODIL, una extensión bayesiana del método de optimización de una pérdida discreta (ODIL) para resolver problemas inversos basados en ecuaciones diferenciales parciales, permitiendo inferir soluciones con incertidumbre cuantificada y demostrando su eficacia en simulaciones multidimensionales y en la estimación de la concentración de tumores cerebrales a partir de resonancias magnéticas.

Lucas Amoudruz, Sergey Litvinov, Costas Papadimitriou + 1 more2026-03-06🔬 physics

Breaking and Fixing Defenses Against Control-Flow Hijacking in Multi-Agent Systems

Este artículo demuestra que las defensas actuales contra el secuestro del flujo de control en sistemas multiagente son vulnerables debido a conflictos inherentes entre seguridad y funcionalidad, y propone ControlValve, un nuevo mecanismo que combina la integridad del flujo de control y el principio de menor privilegio para garantizar ejecuciones seguras.

Rishi Jha, Harold Triedman, Justin Wagle, Vitaly Shmatikov2026-03-06🔒 cs.CR

Generalization Below the Edge of Stability: The Role of Data Geometry

Este artículo demuestra teóricamente que la geometría de los datos determina el sesgo implícito en redes neuronales ReLU sobreparametrizadas entrenadas por debajo del umbral de estabilidad, donde distribuciones difíciles de "fragmentar" favorecen la generalización al capturar patrones compartidos, mientras que aquellas fácilmente fragmentables (como las apoyadas en la esfera) conducen a la memorización.

Tongtong Liang, Alexander Cloninger, Rahul Parhi + 1 more2026-03-06💻 cs

MotionStream: Real-Time Video Generation with Interactive Motion Controls

MotionStream es un sistema de generación de video en tiempo real que, mediante la destilación de un modelo bidireccional en un estudiante causal y el uso de atención deslizante con *attention sinks*, permite la creación de videos de duración ilimitada con control interactivo de movimiento a 29 FPS en una sola GPU, superando las limitaciones de latencia y acumulación de errores de los métodos anteriores.

Joonghyuk Shin, Zhengqi Li, Richard Zhang + 4 more2026-03-06💻 cs