Observer-Actor: Active Vision Imitation Learning with Sparse-View Gaussian Splatting

El artículo presenta ObAct, un marco novedoso de aprendizaje por imitación con visión activa que utiliza un sistema robótico de doble brazo con cámaras en la muñeca para construir dinámicamente una representación 3DGS, explorar virtualmente y mover el brazo observador a la posición óptima, logrando así políticas más robustas y eficaces que superan significativamente a los enfoques con cámaras estáticas.

Yilong Wang, Cheng Qian, Ruomeng Fan + 1 more2026-03-06💻 cs

A physics-informed U-Net-LSTM network for nonlinear structural response under seismic excitation

Este artículo propone un marco innovador de red U-Net-LSTM informada por física que integra leyes físicas con aprendizaje profundo para predecir con mayor precisión y eficiencia la respuesta sísmica no lineal de estructuras, superando las limitaciones computacionales del método de elementos finitos y la falta de generalización de los modelos puramente basados en datos.

Sutirtha Biswas, Kshitij Kumar Yadav2026-03-06💻 cs

DPAC: Distribution-Preserving Adversarial Control for Diffusion Sampling

El artículo presenta DPAC, un método de control adversarial para el muestreo de difusión que proyecta los gradientes sobre el espacio tangente definido por la geometría de la puntuación generativa para minimizar la divergencia KL en el espacio de trayectorias, preservando así la calidad de las muestras y mejorando métricas como el FID sin comprometer la tasa de éxito del ataque.

Han-Jin Lee, Han-Ju Lee, Jin-Seong Kim + 1 more2026-03-06💻 cs

An AI Implementation Science Study to Improve Trustworthy Data in a Large Healthcare System

Este estudio presenta una implementación de ciencia de la IA en el sistema pediátrico Shriners Childrens que moderniza su almacén de datos a OMOP CDM v5.4 en un entorno seguro de Microsoft Fabric, introduciendo una herramienta de evaluación de calidad de datos basada en Python que integra principios de IA confiable mediante el marco METRIC y compara estrategias de implementación para la microsomía craneofacial.

Benoit L. Marteau, Andrew Hornback, Shaun Q. Tan + 3 more2026-03-06💻 cs

GRAND: Guidance, Rebalancing, and Assignment for Networked Dispatch in Multi-Agent Path Finding

El artículo presenta GRAND, un algoritmo híbrido que combina una política de redes neuronales gráficas entrenada por aprendizaje por refuerzo con optimización de flujo mínimo y asignación local para mejorar el rendimiento y reducir la congestión en la programación de flotas de robots en almacenes, superando a los métodos actuales en benchmarks de gran escala.

Johannes Gaber, Meshal Alharbi, Daniele Gammelli + 1 more2026-03-06💻 cs

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

El artículo presenta Guided Flow Policy (GFP), un enfoque de aprendizaje por refuerzo offline que combina un actor distilado con un flujo de políticas guiado para priorizar la clonación de acciones de alto valor, logrando así un rendimiento superior en múltiples benchmarks al superar las limitaciones de la regularización conductual tradicional.

Franki Nguimatsia Tiofack, Théotime Le Hellard, Fabian Schramm + 2 more2026-03-06💻 cs

Bootstrapped Mixed Rewards for RL Post-Training: Injecting Canonical Action Order

Este artículo demuestra que en el entrenamiento post-RL de un Transformer para resolver acertijos tipo Zebra, la combinación de una recompensa de tarea con una señal de ordenamiento canónico mediante un enfoque de recompensas mixtas y escalado *bootstrapped* mejora el rendimiento en comparación con la optimización basada únicamente en la tarea, incluso cuando el modelo se entrena con secuencias de soluciones aleatorizadas.

Prakhar Gupta, Vaibhav Gupta2026-03-06💻 cs

Revolutionizing Mixed Precision Quantization: Towards Training-free Automatic Proxy Discovery via Large Language Models

Este artículo presenta TAP, un marco innovador impulsado por modelos de lenguaje grandes (LLM) y estrategias evolutivas que descubre automáticamente proxies de búsqueda de cuantización de precisión mixta sin necesidad de entrenamiento ni intervención humana, superando a los métodos convencionales mediante un controlador de optimización directa de preferencias (DPO) que refina dinámicamente la generación de proxies.

Haidong Kang, Jun Du, Lihong Lin2026-03-06💻 cs

ReFusion: A Diffusion Large Language Model with Parallel Autoregressive Decoding

El artículo presenta ReFusion, un modelo de difusión enmascarada que integra la reorganización de secuencias en un marco de atención causal para habilitar la decodificación paralela a nivel de bloques, logrando así una aceleración significativa y un rendimiento superior al de los modelos autoregresivos tradicionales mediante la reutilización completa de la caché KV y la reducción de la complejidad de aprendizaje.

Jia-Nan Li, Jian Guan, Wei Wu + 1 more2026-03-06💻 cs