cs.LG artículos | Gist.Science

CARE What Fails: Contrastive Anchored-REflection for Verifiable Multimodal

El artículo presenta CARE, un marco de post-entrenamiento centrado en el fracaso para el razonamiento multimodal que transforma errores en señales de supervisión mediante un objetivo de contraste anclado y una re-muestreo guiado por reflexión, logrando mejoras significativas en precisión y suavidad de entrenamiento en comparación con métodos existentes como GRPO.

Yongxin Wang, Zhicheng Yang, Meng Cao, Mingfei Han, Haokun Lin, Yingying Zhu, Xiaojun Chang, Xiaodan Liang2026-03-09🤖 cs.AI

LLMTM: Benchmarking and Optimizing LLMs for Temporal Motif Analysis in Dynamic Graphs

Este artículo presenta LLMTM, un benchmark integral para evaluar y optimizar el rendimiento de los modelos de lenguaje grandes (LLM) en el análisis de motivos temporales en grafos dinámicos, proponiendo un agente aumentado con herramientas y un distribuidor consciente de la estructura que equilibra la alta precisión con la reducción de costos computacionales.

Bing Hao, Minglai Shao, Zengyi Wo, Yunlong Chu, Yuhang Liu, Ruijie Wang2026-03-09🤖 cs.AI

Bayesian Monocular Depth Refinement via Neural Radiance Fields

El artículo presenta MDENeRF, un marco iterativo que refina los mapas de profundidad monoculares mediante la fusión bayesiana de estimaciones globales y detalles geométricos de alta frecuencia derivados de campos de radiación neuronal (NeRF) con incertidumbre, mejorando así la comprensión de escenas en entornos interiores.

Arun Muthukkumar2026-03-09🤖 cs.LG

Purification Before Fusion: Toward Mask-Free Speech Enhancement for Robust Audio-Visual Speech Recognition

Este trabajo propone un marco de reconocimiento de habla audiovisual (AVSR) robusto y sin máscaras que integra un módulo de fusión basado en Conformer para refinar implícitamente las características de audio ruidosas mediante asistencia visual, preservando la integridad semántica y superando a los métodos basados en máscaras en el benchmark LRS3.

Linzhi Wu, Xingyu Zhang, Hao Yuan, Yakun Zhang, Changyan Zheng, Liang Xie, Tiejun Liu, Erwei Yin2026-03-09🤖 cs.AI

Beyond Mapping : Domain-Invariant Representations via Spectral Embedding of Optimal Transport Plans

Este trabajo propone un enfoque de adaptación de dominio no supervisada que genera representaciones invariantes al dominio mediante la inmersión espectral de planes de transporte óptico suavizados, interpretados como matrices de adyacencia de grafos bipartitos, logrando un alto rendimiento en tareas de reconocimiento de género musical, discriminación de voz-música y detección de defectos en cables eléctricos.

Abdel Djalil Sad Saoud, Fred Maurice Ngolè Mboula, Hanane Slimani2026-03-09🤖 cs.LG

Laser interferometry as a robust neuromorphic platform for machine learning

Este artículo presenta un método para implementar redes neuronales ópticas utilizando exclusivamente recursos lineales y estados coherentes de luz, donde la no linealidad necesaria para el aprendizaje se logra mediante codificación de fase, lo que permite un entrenamiento y una inferencia *in situ* más sencillos y demuestra una notable resiliencia ante la pérdida de fotones.

Amanuel Anteneh, Kyungeun Kim, J. M. Schwarz, Israel Klich, Olivier Pfister2026-03-09🔬 physics.optics

Neural Signals Generate Clinical Notes in the Wild

Este artículo presenta CELM, el primer modelo fundacional de EEG a lenguaje que genera informes clínicos automatizados a partir de grabaciones de EEG de larga duración, logrando mejoras significativas en métricas de generación al integrar modelos de EEG preentrenados con modelos de lenguaje.

Jathurshan Pradeepkumar, Zheng Chen, Jimeng Sun2026-03-09🤖 cs.AI

Online unsupervised Hebbian learning in deep photonic neuromorphic networks

Este trabajo presenta y demuestra experimentalmente una red neuronal fotónica profunda que logra un aprendizaje no supervisado en línea mediante un mecanismo de retroalimentación local totalmente óptico y sinapsis de materiales de cambio de fase, logrando un reconocimiento de letras perfecto sin conversiones eléctricas intermedias.

Xi Li, Disha Biswas, Peng Zhou, Wesley H. Brigner, Anna Capuano, Joseph S. Friedman, Qing Gu2026-03-09🔬 physics.optics

ZK-HybridFL: Zero-Knowledge Proof-Enhanced Hybrid Ledger for Federated Learning

El artículo presenta ZK-HybridFL, un marco de aprendizaje federado descentralizado que integra un libro mayor de grafos acíclicos dirigidos, pruebas de conocimiento cero y cadenas laterales para garantizar la privacidad, la validación segura de actualizaciones de modelos y la robustez ante ataques adversarios, superando en rendimiento y eficiencia a enfoques existentes.

Amirhossein Taherpour, Xiaodong Wang2026-03-09🤖 cs.LG

EDIS: Diagnosing LLM Reasoning via Entropy Dynamics

El artículo presenta EDIS, una métrica que diagnostica y mejora el razonamiento de los modelos de lenguaje analizando la evolución temporal de la entropía durante la generación, identificando patrones de inestabilidad característicos de los errores que las medidas estáticas tradicionales pasan por alto.

Chenghua Zhu, Siyan Wu, Xiangkang Zeng, Zishan Xu, Zhaolu Kang, Yifu Guo, Yuquan Lu, Junduan Huang, Guojing Zhou2026-03-09🤖 cs.LG

Restoring Exploration after Post-Training: Latent Exploration Decoding for Large Reasoning Models

Este artículo presenta la Decodificación de Exploración Latente (LED), una estrategia de decodificación que aprovecha la asimetría de entropía entre las capas intermedias y finales de los Modelos de Razonamiento a Gran Escala (LRM) para recuperar la exploración perdida tras el entrenamiento por refuerzo y mejorar el rendimiento en tareas de razonamiento sin necesidad de reentrenamiento.

Wenhui Tan, Fiorenzo Parascandolo, Enver Sangineto, Jianzhong Ju, Zhenbo Luo, Qian Cao, Rita Cucchiara, Ruihua Song, Jian Luan2026-03-09🤖 cs.LG

Stress-Testing Alignment Audits With Prompt-Level Strategic Deception

Este artículo presenta una tubería automatizada de "red team" que demuestra que los métodos actuales de auditoría de alineación, tanto de caja negra como de caja blanca, pueden ser engañados mediante estrategias de ocultamiento de objetivos generadas a nivel de prompt, revelando así una vulnerabilidad crítica ante modelos mal alineados y situacionalmente conscientes.

Oliver Daniels, Perusha Moodley, Benjamin M. Marlin, David Lindner2026-03-09🤖 cs.LG

Latent Poincaré Shaping for Agentic Reinforcement Learning

El artículo presenta LaPha, un método que entrena agentes de IA similares a AlphaZero en un espacio latente hiperbólico de Poincaré para mejorar la búsqueda y la precisión en tareas matemáticas complejas mediante recompensas de proceso densas y un cabezal de valor compartido.

Hanchen Xia, Baoyou Chen, Zelin Zang, Yutang Ge, Guojiang Zhao, Siyu Zhu2026-03-09🤖 cs.LG

Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol

Este artículo presenta un protocolo de validación basado en perturbaciones para garantizar la fiabilidad de los mapas de saliencia en la predicción de la eficacia del ARNsi, revelando modos de fallo ocultos y proponiendo un regularizador biológico que mejora la confianza en el diseño terapéutico antes de la síntesis.

Zahra Khodagholi, Niloofar Yousefi2026-03-09🤖 cs.LG

Towards Autonomous Mathematics Research

El artículo presenta a Aletheia, un agente de investigación matemática autónomo que, potenciado por modelos avanzados de razonamiento y herramientas especializadas, demuestra capacidades que van desde la resolución de problemas olímpicos hasta la generación de artículos de investigación y la solución de problemas abiertos, marcando hitos significativos en la colaboración humano-IA en matemáticas.

Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang-hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng-Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong2026-03-09🤖 cs.AI

Stochastic Parroting in Temporal Attention -- Regulating the Diagonal Sink

Este artículo identifica y aborda teórica y experimentalmente el problema del "sumidero diagonal" en la atención temporal, demostrando cómo las puntuaciones de atención se concentran en la diagonal y proponiendo métodos de regularización para mitigar este sesgo en modelos espacio-temporales.

Victoria Hankemeier, Malte Schilling2026-03-09🤖 cs.LG

SWE-MiniSandbox: Container-Free Reinforcement Learning for Building Software Engineering Agents

El artículo presenta SWE-MiniSandbox, un método ligero y sin contenedores que utiliza mecanismos a nivel de kernel y técnicas de precaché para reducir drásticamente el uso de disco y el tiempo de preparación de entornos en el entrenamiento de agentes de ingeniería de software mediante aprendizaje por refuerzo, manteniendo al mismo tiempo un rendimiento comparable al de las pipelines basadas en contenedores.

Danlong Yuan, Wei Wu, Zhengren Wang, Xueliang Zhao, Huishuai Zhang, Dongyan Zhao2026-03-09🤖 cs.AI

MiDAS: A Multimodal Data Acquisition System and Dataset for Robot-Assisted Minimally Invasive Surgery

El artículo presenta MiDAS, un sistema de código abierto y agnóstico a la plataforma que permite la adquisición multimodal no invasiva y sincronizada de datos en cirugía mínimamente invasiva asistida por robot, superando las barreras de acceso a la telemetría propietaria mediante la validación en robots Raven-II y da Vinci Xi con conjuntos de datos anotados que incluyen tareas de sutura de reparación de hernias.

Keshara Weerasinghe (MD), Seyed Hamid Reza Roodabeh (MD), Andrew Hawkins (MD), Zhaomeng Zhang, Zachary Schrader, Homa Alemzadeh2026-03-09🤖 cs.LG

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Este estudio presenta AHSIV, un marco de selección de modelos adaptativo que aborda la inestabilidad en la clasificación de pronósticos causada por el horizonte temporal y la variabilidad de la demanda, integrando métricas de error ajustadas y clasificación estructural para optimizar la toma de decisiones operativas y estratégicas en entornos comerciales complejos.

Adolfo González, Víctor Parada2026-03-09🤖 cs.AI

GaiaFlow: Semantic-Guided Diffusion Tuning for Carbon-Frugal Search

GaiaFlow es un marco innovador que utiliza ajuste de difusión guiado semánticamente, dinámicas de Langevin y cuantización adaptativa para lograr una búsqueda neuronal sostenible que equilibra la precisión de recuperación con la eficiencia energética y la reducción de la huella de carbono.

Rong Fu, Jia Yee Tan, Chunlei Meng, Shuo Yin, Xiaowen Ma, Wangyu Wu, Muge Qi, Guangzhen Yao, Zhaolu Kang, Zeli Su, Simon Fong2026-03-09🤖 cs.LG

← Anterior Siguiente →