CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

El artículo presenta CARE, un marco de post-entrenamiento centrado en el fracaso para el razonamiento multimodal que transforma errores en señales de supervisión mediante un objetivo de contraste anclado y una re-muestreo guiado por reflexión, logrando mejoras significativas en precisión y suavidad de entrenamiento en comparación con métodos existentes como GRPO.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Este artículo presenta LLMTM, un benchmark integral para evaluar y optimizar el rendimiento de los modelos de lenguaje grandes (LLM) en el análisis de motivos temporales en grafos dinámicos, proponiendo un agente aumentado con herramientas y un distribuidor consciente de la estructura que equilibra la alta precisión con la reducción de costos computacionales.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

Este trabajo propone un marco de reconocimiento de habla audiovisual (AVSR) robusto y sin máscaras que integra un módulo de fusión basado en Conformer para refinar implícitamente las características de audio ruidosas mediante asistencia visual, preservando la integridad semántica y superando a los métodos basados en máscaras en el benchmark LRS3.

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

Beyond Mapping : Domain-Invariant Representations via Spectral Embedding of Optimal Transport Plans

Este trabajo propone un enfoque de adaptación de dominio no supervisada que genera representaciones invariantes al dominio mediante la inmersión espectral de planes de transporte óptico suavizados, interpretados como matrices de adyacencia de grafos bipartitos, logrando un alto rendimiento en tareas de reconocimiento de género musical, discriminación de voz-música y detección de defectos en cables eléctricos.

Abdel Djalil Sad Saoud, Fred Maurice Ngolè Mboula, Hanane Slimani2026-03-09🤖 cs.LG

Laser interferometry as a robust neuromorphic platform for machine learning

Este artículo presenta un método para implementar redes neuronales ópticas utilizando exclusivamente recursos lineales y estados coherentes de luz, donde la no linealidad necesaria para el aprendizaje se logra mediante codificación de fase, lo que permite un entrenamiento y una inferencia *in situ* más sencillos y demuestra una notable resiliencia ante la pérdida de fotones.

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Online unsupervised Hebbian learning in deep photonic neuromorphic networks

Este trabajo presenta y demuestra experimentalmente una red neuronal fotónica profunda que logra un aprendizaje no supervisado en línea mediante un mecanismo de retroalimentación local totalmente óptico y sinapsis de materiales de cambio de fase, logrando un reconocimiento de letras perfecto sin conversiones eléctricas intermedias.

Xi Li, Disha Biswas, Peng Zhou, Wesley H. Brigner, Anna Capuano, Joseph S. Friedman, Qing Gu2026-03-09🔬 physics.optics

ZK-HybridFL: Zero-Knowledge Proof-Enhanced Hybrid Ledger for Federated Learning

El artículo presenta ZK-HybridFL, un marco de aprendizaje federado descentralizado que integra un libro mayor de grafos acíclicos dirigidos, pruebas de conocimiento cero y cadenas laterales para garantizar la privacidad, la validación segura de actualizaciones de modelos y la robustez ante ataques adversarios, superando en rendimiento y eficiencia a enfoques existentes.

Amirhossein Taherpour, Xiaodong Wang2026-03-09🤖 cs.LG

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

Este artículo presenta la Decodificación de Exploración Latente (LED), una estrategia de decodificación que aprovecha la asimetría de entropía entre las capas intermedias y finales de los Modelos de Razonamiento a Gran Escala (LRM) para recuperar la exploración perdida tras el entrenamiento por refuerzo y mejorar el rendimiento en tareas de razonamiento sin necesidad de reentrenamiento.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception

Este artículo presenta una tubería automatizada de "red team" que demuestra que los métodos actuales de auditoría de alineación, tanto de caja negra como de caja blanca, pueden ser engañados mediante estrategias de ocultamiento de objetivos generadas a nivel de prompt, revelando así una vulnerabilidad crítica ante modelos mal alineados y situacionalmente conscientes.

Oliver Daniels, Perusha Moodley, Benjamin M. Marlin, David Lindner2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

El artículo presenta a Aletheia, un agente de investigación matemática autónomo que, potenciado por modelos avanzados de razonamiento y herramientas especializadas, demuestra capacidades que van desde la resolución de problemas olímpicos hasta la generación de artículos de investigación y la solución de problemas abiertos, marcando hitos significativos en la colaboración humano-IA en matemáticas.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

El artículo presenta SWE-MiniSandbox, un método ligero y sin contenedores que utiliza mecanismos a nivel de kernel y técnicas de precaché para reducir drásticamente el uso de disco y el tiempo de preparación de entornos en el entrenamiento de agentes de ingeniería de software mediante aprendizaje por refuerzo, manteniendo al mismo tiempo un rendimiento comparable al de las pipelines basadas en contenedores.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

El artículo presenta MiDAS, un sistema de código abierto y agnóstico a la plataforma que permite la adquisición multimodal no invasiva y sincronizada de datos en cirugía mínimamente invasiva asistida por robot, superando las barreras de acceso a la telemetría propietaria mediante la validación en robots Raven-II y da Vinci Xi con conjuntos de datos anotados que incluyen tareas de sutura de reparación de hernias.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Este estudio presenta AHSIV, un marco de selección de modelos adaptativo que aborda la inestabilidad en la clasificación de pronósticos causada por el horizonte temporal y la variabilidad de la demanda, integrando métricas de error ajustadas y clasificación estructural para optimizar la toma de decisiones operativas y estratégicas en entornos comerciales complejos.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

GaiaFlow es un marco innovador que utiliza ajuste de difusión guiado semánticamente, dinámicas de Langevin y cuantización adaptativa para lograr una búsqueda neuronal sostenible que equilibra la precisión de recuperación con la eficiencia energética y la reducción de la huella de carbono.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG