cs.LG artículos | Gist.Science

Thin Keys, Full Values: Reducing KV Cache via Low-Dimensional Attention Selection

Este paper propone y valida que la dimensión de las claves en la atención de los transformadores puede reducirse drásticamente mediante selección de baja dimensión y compresión SVD seguida de ajuste fino, logrando un ahorro del 75% en la memoria de caché KV con una pérdida de calidad mínima y permitiendo servir a más usuarios concurrentes.

Hengshuai Yao, Guan Wang2026-03-06💻 cs

Agent Memory Below the Prompt: Persistent Q4 KV Cache for Multi-Agent LLM Inference on Edge Devices

Este trabajo presenta un sistema para inferencia multi-agente en dispositivos de borde que persiste la memoria de atención (KV cache) de cada agente en formato cuantizado a 4 bits en disco, permitiendo su restauración directa y eliminando la necesidad de recomputación, lo que reduce el tiempo hasta el primer token hasta en 136 veces y multiplica por cuatro la cantidad de agentes que caben en la memoria disponible.

Yakov Pyotr Shkolnikov2026-03-06💻 cs

Flowers: A Warp Drive for Neural PDE Solvers

El artículo presenta "Flowers", una arquitectura neuronal eficiente y escalable que resuelve operadores de EDPs utilizando exclusivamente deformaciones espaciales (warps) para capturar interacciones globales sin mecanismos de atención o convolución tradicionales, logrando un rendimiento superior en problemas de flujo y ondas con una fracción de los parámetros y recursos computacionales de los modelos existentes.

Till Muser, Alexandra Spitzer, Matti Lassas + 2 more2026-03-06💻 cs

Uncertainty-Calibrated Spatiotemporal Field Diffusion with Sparse Supervision

El artículo presenta SOLID, un marco de difusión condicionado por máscaras que aprende dinámicas espacio-temporales exclusivamente a partir de observaciones dispersas mediante un objetivo de doble enmascaramiento, logrando reconstrucciones de campos completos con incertidumbre calibrada y sin necesidad de datos densos o pre-imputación.

Kevin Valencia, Xihaier Luo, Shinjae Yoo + 1 more2026-03-06💻 cs

Auction-Based RIS Allocation With DRL: Controlling the Cost-Performance Trade-Off

Este artículo propone un mecanismo de asignación de superficies inteligentes reconfigurables (RIS) basado en subastas y agentes de aprendizaje por refuerzo profundo que optimiza la compensación entre el rendimiento de la red y el costo mediante una estrategia de puja adaptable y controlable.

Martin Mark Zan, Stefan Schwarz2026-03-06💻 cs

ZorBA: Zeroth-order Federated Fine-tuning of LLMs with Heterogeneous Block Activation

El artículo presenta ZorBA, un marco de ajuste fino federado para modelos de lenguaje grandes que utiliza optimización de orden cero y activación heterogénea de bloques para reducir significativamente el uso de memoria VRAM y la sobrecarga de comunicación sin sacrificar la tasa de convergencia.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

ASFL: An Adaptive Model Splitting and Resource Allocation Framework for Split Federated Learning

Este artículo propone ASFL, un marco de aprendizaje federado dividido adaptativo que optimiza la asignación de recursos y la división del modelo en redes inalámbricas para mejorar la velocidad de convergencia y reducir significativamente la latencia y el consumo de energía.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

CogGen: Cognitive-Load-Informed Fully Unsupervised Deep Generative Modeling for Compressively Sampled MRI Reconstruction

El artículo presenta CogGen, un modelo generativo profundo totalmente no supervisado que mejora la reconstrucción de MRI muestreado comprimido mediante un aprendizaje curricular auto-dirigido que gestiona la carga cognitiva al priorizar progresivamente los datos de baja frecuencia y alta relación señal-ruido sobre el ruido y las frecuencias altas.

Qingyong Zhu, Yumin Tan, Xiang Gu + 1 more2026-03-06💻 cs

Explainable Regime Aware Investing

El artículo presenta un marco de inversión explicativo y adaptable a regímenes basado en un modelo oculto de Markov de Wasserstein que, al inferir dinámicamente la complejidad del mercado y preservar la identidad de los regímenes, logra un rendimiento ajustado al riesgo superior y una menor volatilidad en comparación con benchmarks tradicionales y modelos no paramétricos.

Amine Boukardagha2026-03-06💻 cs

AMV-L: Lifecycle-Managed Agent Memory for Tail-Latency Control in Long-Running LLM Systems

El artículo presenta AMV-L, un marco de gestión de memoria para agentes LLM que utiliza puntuaciones de utilidad y niveles de ciclo de vida para controlar la latencia de cola, logrando mejoras significativas en el rendimiento y la estabilidad en comparación con las políticas tradicionales basadas en tiempo o LRU.

Emmanuel Bamidele2026-03-06💻 cs

SkillNet: Create, Evaluate, and Connect AI Skills

SkillNet es una infraestructura abierta que crea, evalúa y conecta habilidades de IA a gran escala mediante una ontología unificada y un repositorio de más de 200.000 habilidades, logrando mejorar significativamente el rendimiento de los agentes al permitirles acumular y transferir conocimientos en lugar de reinventar soluciones.

Yuan Liang, Ruobin Zhong, Haoming Xu + 46 more2026-03-06✓ Author reviewed ⓘ💻 cs

An Explainable Ensemble Framework for Alzheimer's Disease Prediction Using Structured Clinical and Cognitive Data

Esta investigación presenta un marco de aprendizaje ensemblistas explicable que, mediante el uso de técnicas avanzadas de preprocesamiento y algoritmos como XGBoost y Random Forest sobre datos clínicos estructurados, logra una detección precisa y transparente de la enfermedad de Alzheimer para apoyar la toma de decisiones clínicas.

Nishan Mitra2026-03-06💻 cs

MPBMC: Multi-Property Bounded Model Checking with GNN-guided Clustering

Este artículo presenta MPBMC, un enfoque híbrido que utiliza redes neuronales gráficas y estadísticas de diseño para agrupar propiedades de manera funcional y acelerar la verificación formal mediante comprobación de modelos acotada.

Soumik Guha Roy, Sumana Ghosh, Ansuman Banerjee + 2 more2026-03-06💻 cs

On Emergences of Non-Classical Statistical Characteristics in Classical Neural Networks

Este artículo presenta la NCnet, una arquitectura clásica que exhibe comportamientos estadísticos no clásicos análogos a las desigualdades de Bell, demostrando que las correlaciones no locales surgen de la competencia de gradientes entre tareas compartidas y que la métrica $S$ puede servir como indicador de la dinámica de entrenamiento y el rendimiento de generalización.

Hanyu Zhao, Yang Wu, Yuexian Hou2026-03-06⚛️ quant-ph

Induced Numerical Instability: Hidden Costs in Multimodal Large Language Models

Este trabajo identifica y valida una nueva vulnerabilidad en los modelos de lenguaje grandes multimodales, demostrando que optimizar una función de pérdida para inducir inestabilidad numérica genera imágenes que degradan significativamente el rendimiento del modelo con perturbaciones mínimas, revelando un vector de fallo distinto a las perturbaciones adversarias tradicionales.

Wai Tuck Wong, Jun Sun, Arunesh Sinha2026-03-06💻 cs

Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering

Este artículo propone un nuevo paradigma de aprendizaje llamado HARR (Reconstrucción y Representación de Atributos Heterogéneos) que transforma atributos numéricos y categóricos en un espacio homogéneo para aprender una métrica de distancia unificada, mejorando así la precisión y eficiencia del clustering en datos mixtos sin requerir parámetros ni garantías de convergencia.

Yiqun Zhang, Mingjie Zhao, Yizhou Chen + 2 more2026-03-06💻 cs

VSPrefill: Vertical-Slash Sparse Attention with Lightweight Indexing for Long-Context Prefilling

El paper presenta VSPrefill, un mecanismo de atención dispersa con indexación ligera que explota patrones estructurales verticales y diagonales para lograr una complejidad lineal durante la fase de prellenado, logrando una aceleración de 4.95x en contextos de 128k manteniendo el 98.35% de la precisión de la atención completa sin modificar los parámetros del modelo base.

Chen Guanzhong2026-03-06💻 cs

MAD-SmaAt-GNet: A Multimodal Advection-Guided Neural Network for Precipitation Nowcasting

El artículo presenta MAD-SmaAt-GNet, una arquitectura de red neuronal multimodal que mejora la predicción de precipitaciones a corto plazo al combinar un diseño ligero basado en SmaAt-UNet con un codificador adicional para múltiples variables meteorológicas y un componente de advección basado en física, logrando una reducción del 8,9% en el error cuadrático medio frente al modelo base.

Samuel van Wonderen, Siamak Mehrkanoon2026-03-06💻 cs

Understanding the Dynamics of Demonstration Conflict in In-Context Learning

Este estudio revela que los modelos de lenguaje grandes sufren degradación en el aprendizaje en contexto debido a demostraciones corruptas, identificando una estructura computacional de dos fases donde cabezas de atención específicas ("Vulnerability" y "Susceptible") procesan reglas contradictorias, lo que permite mejorar el rendimiento mediante su ablación dirigida.

Difan Jiao, Di Wang, Lijie Hu2026-03-06💻 cs

Act-Observe-Rewrite: Multimodal Coding Agents as In-Context Policy Learners for Robot Manipulation

El marco Act-Observe-Rewrite (AOR) demuestra que un agente multimodal basado en un modelo de lenguaje puede aprender a manipular objetos físicos mediante la síntesis y reescritura iterativa de código de control ejecutable guiado por observaciones visuales, logrando altas tasas de éxito en tareas robóticas sin necesidad de demostraciones, ingeniería de recompensas o actualizaciones de gradiente.

Vaishak Kumar2026-03-06💻 cs

← Anterior Siguiente →