cs.LG artículos | Gist.Science

Hierarchical Dual-Strategy Unlearning for Biomedical and Healthcare Intelligence Using Imperfect and Privacy-Sensitive Medical Data

Este artículo presenta un marco de olvido selectivo jerárquico de doble estrategia que, mediante actualizaciones de gradiente geométricamente restringidas e intervenciones a nivel de tokens conscientes de conceptos, elimina eficazmente conocimientos médicos específicos de grandes modelos de lenguaje preservando sus competencias fundamentales y garantizando la privacidad con una modificación mínima de parámetros.

Yi Zhang, Chao Zhang, Zijian Li, Tianxiang Xu, Kunyu Zhang, Zhan Gao, Meinuo Li, Xiaohan Zhang, Qichao Qi, Bing Chen2026-03-12🤖 cs.LG

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

El artículo presenta CostNav, un nuevo benchmark que evalúa la viabilidad económica real de los agentes de IA física para la navegación mediante el análisis de costos y beneficios utilizando datos regulatorios y financieros de la industria, revelando que los métodos actuales, aunque exitosos en tareas simplificadas, no son económicamente viables en escenarios del mundo real.

Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee2026-03-12🤖 cs.AI

Partially Equivariant Reinforcement Learning in Symmetry-Breaking Environments

Este artículo presenta un marco de Aprendizaje por Refuerzo Parcialmente Equivariante basado en MDPs Parcialmente Invariantes que mitiga los errores de estimación causados por la ruptura local de simetrías en entornos reales, logrando así una mayor eficiencia de muestreo y generalización en comparación con los métodos basados en simetrías completas.

Junwoo Chang, Minwoo Park, Joohwan Seo, Roberto Horowitz, Jongmin Lee, Jongeun Choi2026-03-12🤖 cs.LG

Cross-embodied Co-design for Dexterous Hands

Este artículo presenta un marco de co-diseño que optimiza simultáneamente la morfología de la mano robótica y las políticas de control para tareas de manipulación hábil, permitiendo un ciclo completo de diseño, entrenamiento, fabricación y despliegue en menos de 24 horas.

Kehlani Fay, Darin Anthony Djapri, Anya Zorin, James Clinton, Ali El Lahib, Hao Su, Michael T. Tolley, Sha Yi, Xiaolong Wang2026-03-12🤖 cs.LG

A scalable and real-time neural decoder for topological quantum codes

El artículo presenta AlphaQubit 2, un decodificador neuronal escalable y en tiempo real que logra tasas de error lógico cercanas a la óptima para códigos de superficie y de color, superando en velocidad y precisión a los métodos existentes y demostrando viabilidad en aceleradores comerciales.

Andrew W. Senior, Thomas Edlich, Francisco J. H. Heras, Lei M. Zhang, Oscar Higgott, James S. Spencer, Taylor Applebaum, Sam Blackwell, Justin Ledford, Akvil\.e Žemgulyt\.e, Augustin Žídek, Noah Shutty, Andrew Cowie, Yin Li, George Holland, Peter Brooks, Charlie Beattie, Michael Newman, Alex Davies, Cody Jones, Sergio Boixo, Hartmut Neven, Pushmeet Kohli, Johannes Bausch2026-03-12⚛️ quant-ph

Toward Closed-loop Molecular Discovery via Language Model, Property Alignment and Strategic Search

El artículo presenta Trio, un marco de generación molecular que integra modelado de lenguaje, aprendizaje por refuerzo y búsqueda en árbol Monte Carlo para lograr un diseño de ligandos dirigido, interpretable y en bucle cerrado que supera a los métodos actuales en afinidad de unión, propiedades farmacológicas y diversidad química.

Junkai Ji, Zhangfan Yang, Dong Xu, Ruibin Bai, Jianqiang Li, Tingjun Hou, Zexuan Zhu2026-03-12🤖 cs.AI

Maximum Risk Minimization with Random Forests

Este trabajo introduce variantes de bosques aleatorios basadas en el principio de minimización del riesgo máximo (MaxRM) para mejorar la generalización fuera de distribución, ofreciendo algoritmos eficientes, demostrando consistencia estadística y garantizando resultados en distribuciones de prueba no vistas.

Francesco Freni, Anya Fries, Linus Kühne, Markus Reichstein, Jonas Peters2026-03-12📊 stat

PvP: Data-Efficient Humanoid Robot Learning with Proprioceptive-Privileged Contrastive Representations

El artículo presenta PvP, un marco de aprendizaje contrastivo que aprovecha la complementariedad entre estados propioceptivos y privilegiados para mejorar la eficiencia de datos en el control de robots humanoides, junto con SRL4Humanoid, el primer entorno unificado para evaluar métodos de aprendizaje de representaciones de estado en esta área.

Mingqi Yuan, Tao Yu, Haolin Song, Bo Li, Xin Jin, Hua Chen, Wenjun Zeng2026-03-12🤖 cs.LG

Pretrained battery transformer (PBT): A foundation model for universal battery life prediction

El artículo presenta el PBT (Pretrained Battery Transformer), un modelo fundacional que utiliza capas de expertos codificados con conocimiento de baterías para predecir universalmente la vida útil de baterías de litio, sodio y zinc con un rendimiento superior al estado del arte, superando los desafíos de escasez y heterogeneidad de datos.

Ruifeng Tan, Weixiang Hong, Jia Li, Jiaqiang Huang, Tong-Yi Zhang2026-03-12🤖 cs.LG

NMIRacle: Multi-modal Generative Molecular Elucidation from IR and NMR Spectra

El artículo presenta NMIRacle, un marco generativo de dos etapas que integra representaciones de fragmentos y codificadores espectrales para predecir estructuras moleculares a partir de datos de IR y RMN con mayor precisión y robustez que los métodos existentes.

Federico Ottomano, Yingzhen Li, Alex M. Ganose2026-03-12🔬 physics

Saddle-to-Saddle Dynamics Explains A Simplicity Bias Across Neural Network Architectures

Este artículo presenta un marco teórico unificado que explica el sesgo de simplicidad en diversas arquitecturas de redes neuronales como resultado de una dinámica de aprendizaje de tipo "silla a silla", donde el descenso de gradiente evoluciona iterativamente a través de variedades invariantes y puntos de silla, revelando cómo la distribución de los datos y la inicialización de los pesos determinan la progresión hacia soluciones de mayor complejidad.

Yedi Zhang, Andrew Saxe, Peter E. Latham2026-03-12🤖 cs.LG

Data relativistic uncertainty framework for low-illumination anime scenery image enhancement

Este trabajo presenta un marco de incertidumbre relativista de datos (DRU) que aborda la escasez de datos y la degradación por baja iluminación en imágenes de paisajes de anime, logrando una mejora perceptual y estética superior a los métodos existentes al cuantificar y aprovechar dinámicamente la incertidumbre de la iluminación.

Yiquan Gao, John See2026-03-12🤖 cs.LG

The Bayesian Geometry of Transformer Attention

Este artículo demuestra que los transformadores pequeños, en entornos controlados denominados "túneles de viento bayesianos", realizan inferencia bayesiana con alta precisión mediante un mecanismo geométrico específico donde las corrientes residuales almacenan creencias y la atención gestiona el enrutamiento, superando así a las arquitecturas MLP y revelando la base geométrica del razonamiento en modelos grandes.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Gradient Dynamics of Attention: How Cross-Entropy Sculpts Bayesian Manifolds

Este artículo demuestra que el entrenamiento por entropía cruzada en los transformadores genera dinámicas de gradiente acopladas que esculpen manifiestos bayesianos de baja dimensión, unificando así la optimización, la geometría interna y el razonamiento probabilístico en contexto mediante un mecanismo de enrutamiento basado en ventajas y actualizaciones de valores ponderadas por responsabilidad.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12📊 stat

Geometric Scaling of Bayesian Inference in LLMs

El estudio demuestra que los modelos de lenguaje modernos preservan una sustrato geométrico de baja dimensión, alineado con la entropía predictiva, que codifica la estructura bayesiana y permite inferencias aproximadas similares a las observadas en entornos sintéticos controlados.

Naman Agarwal, Siddhartha R. Dalal, Vishal Misra2026-03-12🤖 cs.LG

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

El estudio presenta PanSubNet, un marco de aprendizaje profundo interpretable que predice los subtipos moleculares clínicamente relevantes del cáncer de páncreas directamente a partir de histopatología rutinaria (tinción H&E), superando las limitaciones de costo y tiempo de los métodos genómicos tradicionales y ofreciendo una herramienta viable para la estratificación pronóstica y la oncología de precisión.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan Niazi2026-03-12⚡ eess

Over-Searching in Search-Augmented Large Language Models

Este trabajo analiza el problema del "sobre-búsqueda" en modelos de lenguaje grandes aumentados con búsqueda, proponiendo la métrica Tokens por Corrección (TPC) para cuantificar este fenómeno, identificando sus causas y efectos negativos, y presentando estrategias de mitigación junto con el conjunto de datos OverSearchQA para fomentar investigaciones futuras.

Roy Xie, Deepak Gopinath, David Qiu, Dong Lin, Haitian Sun, Saloni Potdar, Bhuwan Dhingra2026-03-12🤖 cs.LG

Sampling via Stochastic Interpolants by Langevin-based Velocity and Initialization Estimation in Flow ODEs

Este artículo propone un método innovador para muestrear distribuciones de Boltzmann no normalizadas mediante ecuaciones diferenciales ordinarias de flujo, utilizando una secuencia de muestreadores de Langevin para generar muestras intermedias y estimar robustamente el campo de velocidades, lo que garantiza tasas de convergencia no asintóticas y demuestra alta eficiencia en distribuciones multimodales y tareas de inferencia bayesiana.

Chenguang Duan, Yuling Jiao, Gabriele Steidl, Christian Wald, Jerry Zhijian Yang, Ruizhe Zhang2026-03-12📊 stat

Error Analysis of Bayesian Inverse Problems with Generative Priors

Este artículo presenta un análisis de error con cotas cuantitativas para problemas inversos bayesianos que utilizan priores generativos entrenados con datos, demostrando que el error en la posterior hereda la tasa de convergencia del prior y validando estos resultados mediante experimentos numéricos en benchmarks y un problema inverso de EDP elíptica.

Bamdad Hosseini, Ziqi Huang2026-03-12📊 stat

Time series forecasting with Hahn Kolmogorov-Arnold networks

El artículo presenta HaKAN, un modelo de pronóstico de series temporales multivariantes basado en redes Kolmogorov-Arnold con funciones de activación aprendibles de polinomios de Hahn, que supera a los métodos actuales al ofrecer una arquitectura ligera, interpretable y capaz de capturar patrones temporales globales y locales.

Md Zahidul Hasan, A. Ben Hamza, Nizar Bouguila2026-03-12📊 stat

← Anterior Siguiente →