Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Este artículo presenta un marco de olvido selectivo jerárquico de doble estrategia que, mediante actualizaciones de gradiente geométricamente restringidas e intervenciones a nivel de tokens conscientes de conceptos, elimina eficazmente conocimientos médicos específicos de grandes modelos de lenguaje preservando sus competencias fundamentales y garantizando la privacidad con una modificación mínima de parámetros.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

El artículo presenta CostNav, un nuevo benchmark que evalúa la viabilidad económica real de los agentes de IA física para la navegación mediante el análisis de costos y beneficios utilizando datos regulatorios y financieros de la industria, revelando que los métodos actuales, aunque exitosos en tareas simplificadas, no son económicamente viables en escenarios del mundo real.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Este artículo presenta un marco de Aprendizaje por Refuerzo Parcialmente Equivariante basado en MDPs Parcialmente Invariantes que mitiga los errores de estimación causados por la ruptura local de simetrías en entornos reales, logrando así una mayor eficiencia de muestreo y generalización en comparación con los métodos basados en simetrías completas.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

El artículo presenta AlphaQubit 2, un decodificador neuronal escalable y en tiempo real que logra tasas de error lógico cercanas a la óptima para códigos de superficie y de color, superando en velocidad y precisión a los métodos existentes y demostrando viabilidad en aceleradores comerciales.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

El artículo presenta Trio, un marco de generación molecular que integra modelado de lenguaje, aprendizaje por refuerzo y búsqueda en árbol Monte Carlo para lograr un diseño de ligandos dirigido, interpretable y en bucle cerrado que supera a los métodos actuales en afinidad de unión, propiedades farmacológicas y diversidad química.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

El artículo presenta PvP, un marco de aprendizaje contrastivo que aprovecha la complementariedad entre estados propioceptivos y privilegiados para mejorar la eficiencia de datos en el control de robots humanoides, junto con SRL4Humanoid, el primer entorno unificado para evaluar métodos de aprendizaje de representaciones de estado en esta área.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

El artículo presenta el PBT (Pretrained Battery Transformer), un modelo fundacional que utiliza capas de expertos codificados con conocimiento de baterías para predecir universalmente la vida útil de baterías de litio, sodio y zinc con un rendimiento superior al estado del arte, superando los desafíos de escasez y heterogeneidad de datos.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

Saddle-to-Saddle Dynamics Explains A Simplicity Bias Across Neural Network Architectures

Este artículo presenta un marco teórico unificado que explica el sesgo de simplicidad en diversas arquitecturas de redes neuronales como resultado de una dinámica de aprendizaje de tipo "silla a silla", donde el descenso de gradiente evoluciona iterativamente a través de variedades invariantes y puntos de silla, revelando cómo la distribución de los datos y la inicialización de los pesos determinan la progresión hacia soluciones de mayor complejidad.

Yedi Zhang, Andrew Saxe, Peter E. Latham2026-03-12🤖 cs.LG

The Bayesian Geometry of Transformer Attention

Este artículo demuestra que los transformadores pequeños, en entornos controlados denominados "túneles de viento bayesianos", realizan inferencia bayesiana con alta precisión mediante un mecanismo geométrico específico donde las corrientes residuales almacenan creencias y la atención gestiona el enrutamiento, superando así a las arquitecturas MLP y revelando la base geométrica del razonamiento en modelos grandes.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Este artículo demuestra que el entrenamiento por entropía cruzada en los transformadores genera dinámicas de gradiente acopladas que esculpen manifiestos bayesianos de baja dimensión, unificando así la optimización, la geometría interna y el razonamiento probabilístico en contexto mediante un mecanismo de enrutamiento basado en ventajas y actualizaciones de valores ponderadas por responsabilidad.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

El estudio presenta PanSubNet, un marco de aprendizaje profundo interpretable que predice los subtipos moleculares clínicamente relevantes del cáncer de páncreas directamente a partir de histopatología rutinaria (tinción H&E), superando las limitaciones de costo y tiempo de los métodos genómicos tradicionales y ofreciendo una herramienta viable para la estratificación pronóstica y la oncología de precisión.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Over-Searching in Search-Augmented Large Language Models

Este trabajo analiza el problema del "sobre-búsqueda" en modelos de lenguaje grandes aumentados con búsqueda, proponiendo la métrica Tokens por Corrección (TPC) para cuantificar este fenómeno, identificando sus causas y efectos negativos, y presentando estrategias de mitigación junto con el conjunto de datos OverSearchQA para fomentar investigaciones futuras.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Este artículo propone un método innovador para muestrear distribuciones de Boltzmann no normalizadas mediante ecuaciones diferenciales ordinarias de flujo, utilizando una secuencia de muestreadores de Langevin para generar muestras intermedias y estimar robustamente el campo de velocidades, lo que garantiza tasas de convergencia no asintóticas y demuestra alta eficiencia en distribuciones multimodales y tareas de inferencia bayesiana.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat