cs.LG artículos | Gist.Science

Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation

Este estudio utiliza la interpretabilidad mecánica para demostrar que, aunque la destilación de conocimientos preserva el comportamiento funcional, reorganiza y comprime las circuitos internos de los modelos, lo que resulta en una mayor dependencia de componentes individuales y tiene implicaciones significativas para la robustez y la generalización.

Reilly Haskins, Benjamin Adams2026-03-10🤖 cs.LG

Ready2Unlearn: A Learning-Time Approach for Preparing Models with Future Unlearning Readiness

El artículo presenta Ready2Unlearn, un enfoque de optimización durante el entrenamiento que prepara proactivamente a los modelos de aprendizaje automático para futuras solicitudes de olvido mediante principios de meta-aprendizaje, mejorando así la eficiencia y la integridad del proceso de eliminación de datos.

Hanyu Duan, Yi Yang, Ahmed Abbasi, Kar Yan Tam2026-03-10🤖 cs.LG

EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video

El artículo presenta EgoDex, el conjunto de datos más grande y diverso hasta la fecha de manipulación hábil humana grabada con visión egocéntrica mediante Apple Vision Pro, que incluye 829 horas de video con anotaciones de pose de manos en 3D para 194 tareas cotidianas, con el objetivo de abordar la escasez de datos en el aprendizaje por imitación y fomentar avances en robótica y visión por computadora.

Ryan Hoque, Peide Huang, David J. Yoon, Mouli Sivapurapu, Jian Zhang2026-03-10🤖 cs.LG

FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference

El artículo presenta FreeKV, un marco de co-optimización sin entrenamiento que combina técnicas de recuperación especulativa y corrección de granularidad fina con una arquitectura de sistema híbrida en CPU/GPU para lograr una aceleración de hasta 13 veces en la inferencia de LLMs manteniendo una precisión casi sin pérdidas.

Guangda Liu, Chengwei Li, Zhenyu Ning, Jing Lin, Yiwu Yao, Danning Ke, Minyi Guo, Jieru Zhao2026-03-10🤖 cs.LG

Online Decision-Focused Learning

Este artículo presenta los primeros algoritmos en línea con garantías teóricas de arrepentimiento para el aprendizaje enfocado en la toma de decisiones (DFL) en entornos dinámicos, superando los desafíos de la falta de gradientes y la no convexidad mediante técnicas de regularización y perturbación.

Aymeric Capitaine, Maxime Haddouche, Eric Moulines, Michael I. Jordan, Etienne Boursier, Alain Durmus2026-03-10🤖 cs.LG

Vid2World: Crafting Video Diffusion Models to Interactive World Models

El artículo presenta Vid2World, un enfoque general que transforma modelos de difusión de video preentrenados en modelos de mundo interactivos mediante la causalización de su arquitectura y un mecanismo de guía de acciones, permitiendo así la generación autoregresiva de alta fidelidad para la toma de decisiones en entornos complejos.

Siqiao Huang, Jialong Wu, Qixing Zhou, Shangchen Miao, Mingsheng Long2026-03-10🤖 cs.LG

MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision

El documento presenta MAS-ZERO, un marco de diseño de sistemas multiagente autoevolutivo que, sin supervisión ni conjunto de validación, optimiza dinámicamente la descomposición de problemas y la composición de agentes en tiempo de inferencia, superando significativamente a los enfoques manuales y automáticos existentes en tareas de razonamiento, codificación y búsqueda.

Zixuan Ke, Austin Xu, Yifei Ming, Xuan-Phi Nguyen, Ryan Chin, Caiming Xiong, Shafiq Joty2026-03-10🤖 cs.LG

HDLxGraph: Bridging Large Language Models and HDL Repositories via HDL Graph Databases

El artículo presenta HDLxGraph, un marco innovador que integra la estructura gráfica de los lenguajes de descripción de hardware (HDL) con la generación aumentada por recuperación (RAG) para superar las limitaciones de los métodos actuales en proyectos complejos, complementado con el nuevo conjunto de datos de referencia HDLSearch.

Pingqing Zheng (Katie), Jiayin Qin (Katie), Fuqi Zhang (Katie), Niraj Chitla (Katie), Zishen Wan (Katie), Shang Wu (Katie), Yu Cao (Katie), Caiwen Ding (Katie), Yang (Katie), Zhao2026-03-10🤖 cs.LG

WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos

El artículo presenta WikiDBGraph, una suite de benchmark a gran escala construida a partir de 100.000 bases de datos relacionales reales que revela las limitaciones de los marcos actuales de aprendizaje colaborativo al ignorar los desafíos de gestión de datos en silos fragmentados y no alineados, destacando la necesidad de mejorar las etapas de preprocesamiento para un despliegue práctico.

Zhaomin Wu, Ziyang Wang, Bingsheng He2026-03-10🤖 cs.LG

The Cell Must Go On: Agar.io for Continual Reinforcement Learning

Este artículo presenta AgarCL, una plataforma de investigación basada en el juego Agar.io diseñada para el aprendizaje por refuerzo continuo que, a través de sus dinámicas no episódicas y complejas, revela que los métodos actuales de aprendizaje continuo apenas superan a los algoritmos estándar, indicando que los desafíos van más allá del dilema de estabilidad-plasticidad.

Mohamed A. Mohamed, Kateryna Nekhomiazh, Vedant Vyas, Marcos M. Jose, Andrew Patterson, Marlos C. Machado2026-03-10🤖 cs.LG

X-MethaneWet: A Cross-scale Global Wetland Methane Emission Benchmark Dataset for Advancing Science Discovery with AI

Este trabajo presenta X-MethaneWet, el primer conjunto de datos de referencia global y multiescala que integra simulaciones físicas y observaciones reales para entrenar modelos de aprendizaje profundo y técnicas de aprendizaje por transferencia, con el objetivo de mejorar la precisión en la predicción de emisiones de metano de los humedales y acelerar el descubrimiento científico mediante inteligencia artificial.

Yiming Sun, Shuo Chen, Shengyu Chen, Chonghao Qiu, Licheng Liu, Youmi Oh, Sparkle L. Malone, Gavin McNicol, Qianlai Zhuang, Chris Smith, Yiqun Xie, Xiaowei Jia2026-03-10🤖 cs.LG

Maximum Principle of Optimal Probability Density Control

Este artículo presenta un marco teórico general que establece un principio de máximo y una ecuación de Hamilton-Jacobi-Bellman para el control óptimo de densidades de probabilidad en espacios de dimensión infinita, junto con un algoritmo numérico escalable basado en redes neuronales profundas para resolver problemas de control multiagente a gran escala.

Nathan Gaby, Xiaojing Ye2026-03-10🤖 cs.LG

VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis

El artículo presenta VISTA, un marco innovador y sin entrenamiento que utiliza modelos de lenguaje-visión para predecir precios de acciones combinando representaciones textuales y gráficas, logrando superar significativamente a los métodos tradicionales y basados únicamente en texto.

Tina Khezresmaeilzadeh, Parsa Razmara, Seyedarmin Azizi, Mohammad Erfan Sadeghi, Erfan Baghaei Potraghloo2026-03-10🤖 cs.LG

Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations

Este artículo presenta un nuevo enfoque que mejora la seguridad de los modelos de lenguaje frente a inyecciones de instrucciones al inyectar señales de jerarquía de instrucciones en las representaciones intermedias de la red mediante embebidos entrenables, logrando una reducción significativa en la tasa de éxito de los ataques sin comprometer la utilidad del modelo.

Sanjay Kariyappa, G. Edward Suh2026-03-10🤖 cs.LG

OCN: Effectively Utilizing Higher-Order Common Neighbors for Better Link Prediction

El artículo presenta OCN, un nuevo enfoque de predicción de enlaces que utiliza la ortogonalización y la normalización para eliminar la redundancia y el sobre-alisado en los vecinos comunes de alto orden, logrando un rendimiento superior al de los métodos existentes en diversos benchmarks.

Juntong Wang, Xiyuan Wang, Muhan Zhang2026-03-10🤖 cs.LG

ViTaPEs: Visuotactile Position Encodings for Cross-Modal Alignment in Multimodal Transformers

El artículo presenta ViTaPEs, una arquitectura basada en transformadores que introduce un mecanismo de inyección posicional en dos etapas (local y global) para alinear eficazmente las modalidades visual y táctil, logrando un rendimiento superior en tareas de reconocimiento y generalización cero en escenarios no vistos sin depender de modelos preentrenados.

Fotios Lygerakis, Ozan Özdenizci, Elmar Rückert2026-03-10🤖 cs.LG

LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning

El artículo presenta LoFT, un nuevo método de adaptación de bajo rango que iguala el rendimiento de la fine-tuning completa al proyectar los momentos del optimizador en el mismo subespacio, eliminando así la necesidad de hiperparámetros adicionales y superando a LoRA sin aumentar el coste de inferencia.

Nurbek Tastan, Stefanos Laskaridis, Martin Takac, Karthik Nandakumar, Samuel Horvath2026-03-10🤖 cs.LG

Rethinking Continual Learning with Progressive Neural Collapse

Este artículo presenta ProNC, un marco novedoso de aprendizaje continuo que elimina la necesidad de un marco de referencia fijo global mediante la expansión progresiva de un marco equiangular simplex (ETF) para nuevos tareas, logrando así un rendimiento superior al mitigar el olvido catastrófico con mayor flexibilidad y eficiencia.

Zheng Wang, Wanhao Yu, Li Yang, Sen Lin2026-03-10🤖 cs.LG

Adaptive Correction for Ensuring Conservation Laws in Neural Operators

Este trabajo propone un enfoque de corrección adaptativa plug-and-play que utiliza un operador ligero aprendible para garantizar estrictamente las leyes de conservación en operadores neuronales, mejorando significativamente su precisión, estabilidad y flexibilidad en comparación con los métodos existentes.

Chaoyu Liu, Yangming Li, Zhongying Deng, Chris Budd, Carola-Bibiane Schönlieb2026-03-10🤖 cs.LG

ActivePusher: Active Learning and Planning with Residual Physics for Nonprehensile Manipulation

El artículo presenta ActivePusher, un marco novedoso que combina modelado de física residual y aprendizaje activo basado en incertidumbre para mejorar la eficiencia de los datos y la fiabilidad de la planificación en tareas de manipulación no prensil, como el empuje, tanto en simulación como en entornos reales.

Zhuoyun Zhong, Seyedali Golestaneh, Constantinos Chamzas2026-03-10🤖 cs.LG

← Anterior Siguiente →