Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

Este artículo presenta un marco novedoso para la predicción de interacciones en redes biológicas multiplex que, mediante el aprendizaje de representaciones conscientes del contexto, la destilación de conocimiento y el uso de modelos fundacionales, supera a los métodos actuales al lograr una generalización robusta en escenarios de cero disparos para entidades no vistas.

Alana Deng, Sugitha Janarthanan, Yan Sun, Zihao Jing, Pingzhao Hu2026-03-10🤖 cs.LG

Not all tokens are needed(NAT): token efficient reinforcement learning

El artículo presenta NAT, un marco unificado que optimiza el aprendizaje por refuerzo en modelos de lenguaje al actualizar la política utilizando solo un subconjunto de tokens mediante un estimador de gradiente no sesgado, logrando un rendimiento comparable al método completo con una reducción significativa en costos computacionales y uso de memoria.

Hejian Sang, Yuanda Xu, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-10🤖 cs.LG

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

El artículo presenta GraphSkill, un marco de codificación guiado por agentes que mejora el razonamiento sobre grafos complejos mediante una recuperación jerárquica de documentación técnica y un agente de autodepuración que utiliza casos de prueba generados automáticamente, todo ello respaldado por un nuevo dataset de evaluación.

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang Wang2026-03-10🤖 cs.LG

Reward Under Attack: Analyzing the Robustness and Hackability of Process Reward Models

Este artículo demuestra que los Modelos de Recompensa de Proceso (PRM) actuales son vulnerables a ataques adversarios al priorizar la fluidez sobre la lógica real, por lo que propone un marco de diagnóstico de tres niveles y herramientas de código abierto para evaluar y mitigar estas falencias antes de su implementación.

Rishabh Tiwari, Aditya Tomar, Udbhav Bamba, Monishwaran Maheswaran, Heng Yang, Michael W. Mahoney, Kurt Keutzer, Amir Gholami2026-03-10🤖 cs.LG

T-REX: Transformer-Based Category Sequence Generation for Grocery Basket Recommendation

El artículo presenta T-REX, una arquitectura basada en transformadores diseñada para Amazon que mejora las recomendaciones de carritos de compras en línea mediante la generación de secuencias de categorías personalizadas, resolviendo desafíos como patrones repetitivos y dependencias temporales mediante innovaciones en muestreo, codificación posicional y modelado causal.

Soroush Mokhtari, Muhammad Tayyab Asif, Sergiy Zubatiy2026-03-10🤖 cs.LG

Leakage Safe Graph Features for Interpretable Fraud Detection in Temporal Transaction Networks

Este artículo presenta un protocolo de extracción de características de grafos causal y libre de fugas para la detección de fraudes en redes de transacciones temporales, demostrando que, aunque los atributos de las transacciones son el principal predictor, las características estructurales del grafo ofrecen una interpretabilidad complementaria y mejoran el análisis de riesgo en flujos de trabajo de investigación.

Hamideh Khaleghpour, Brett McKinney2026-03-10🤖 cs.LG

HEARTS: Benchmarking LLM Reasoning on Health Time Series

El artículo presenta HEARTS, un nuevo benchmark unificado que evalúa las capacidades de razonamiento jerárquico de los modelos de lenguaje grandes (LLM) sobre series temporales de salud mediante 16 conjuntos de datos y 110 tareas, revelando que estos modelos actuales tienen un rendimiento limitado y dependen de heurísticas simples en comparación con los modelos especializados.

Sirui Li, Shuhan Xiao, Mihir Joshi, Ahmed Metwally, Daniel McDuff, Wei Wang, Yuzhe Yang2026-03-10🤖 cs.LG

Roots Beneath the Cut: Uncovering the Risk of Concept Revival in Pruning-Based Unlearning for Diffusion Models

Este artículo revela que el desprendimiento basado en poda en modelos de difusión es vulnerable a la revivificación de conceptos eliminados mediante un ataque de canal lateral que explota las ubicaciones de los pesos podados, demostrando que este método no es inherentemente seguro y proponiendo estrategias de defensa para ocultar dichas ubicaciones.

Ci Zhang, Zhaojun Ding, Chence Yang, Jun Liu, Xiaoming Zhai, Shaoyi Huang, Beiwen Li, Xiaolong Ma, Jin Lu, Geng Yuan2026-03-10🤖 cs.LG

Quantum Deep Learning: A Comprehensive Review

Esta revisión exhaustiva define y clasifica el aprendizaje profundo cuántico en cuatro paradigmas, analiza sus fundamentos teóricos, arquitecturas y demostraciones experimentales en diversas plataformas de hardware, evalúa críticamente las ventajas cuánticas y los desafíos de escalabilidad, y ofrece una hoja de ruta para su implementación a gran escala.

Yanjun Ji, Zhao-Yun Chen, Marco Roth, David A. Kreplin, Christian Schiffer, Martin King, Oliver Anton, M. Sahnawaz Alam, Markus Krutzik, Dennis Willsch, Ludwig Mathey, Frank K. Wilhelm, Guo-Ping Guo2026-03-10⚛️ quant-ph

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

Este artículo presenta un marco de aprendizaje federado consciente de la confianza que utiliza un mecanismo de puntuación adaptativa para filtrar contribuciones de participantes poco fiables en entornos de sensores médicos distribuidos, mejorando así la estabilidad del entrenamiento y la precisión en la interpretación de las etapas de curación ósea.

Paul Shepherd, Tasos Dagiuklas, Bugra Alkan, Joaquim Bastos, Jonathan Rodriguez2026-03-10🤖 cs.LG