cs.AI artículos | Gist.Science

One Size Does Not Fit All: Token-Wise Adaptive Compression for KV Cache

El artículo presenta DynaKV, un marco de compresión post-entrenamiento que asigna dinámicamente tasas de compresión a nivel de token según su significado semántico, logrando una reducción significativa de la memoria del caché KV sin sacrificar la calidad de generación en modelos de lenguaje grandes.

Liming Lu, Kaixi Qiu, Jiayu Zhou + 6 more2026-03-06💻 cs

Simulating Meaning, Nevermore! Introducing ICR: A Semiotic-Hermeneutic Metric for Evaluating Meaning in LLM Text Summaries

Este artículo propone el marco de evaluación Inductive Conceptual Rating (ICR), una métrica semio-hermenéutica cualitativa que demuestra que, aunque los modelos de lenguaje grandes (LLM) logran alta similitud léxica, a menudo fallan en capturar la precisión semántica y el significado contextual en comparación con los resúmenes humanos.

Natalie Perez, Sreyoshi Bhaduri, Aman Chadha2026-03-06💻 cs

Decorrelating the Future: Joint Frequency Domain Learning for Spatio-temporal Forecasting

El artículo propone FreST Loss, un objetivo de entrenamiento basado en el dominio de la frecuencia conjunta que utiliza la Transformada de Fourier Conjunta para decorrelacionar y capturar eficazmente las complejas dependencias espaciotemporales, mejorando así el rendimiento de los modelos de pronóstico en comparación con los enfoques tradicionales.

Zepu Wang, Bowen Liao, Jeff + 1 more2026-03-06💻 cs

Context-Dependent Affordance Computation in Vision-Language Models

Este estudio demuestra que los modelos de visión y lenguaje exhiben una deriva masiva en el cálculo de las posibilidades de acción (affordances) dependiendo del contexto, lo que sugiere la necesidad de ontologías dinámicas y dependientes de la consulta en lugar de modelos estáticos del mundo.

Murad Farzulla2026-03-06💻 cs

Do Mixed-Vendor Multi-Agent LLMs Improve Clinical Diagnosis?

El estudio demuestra que los sistemas de diagnóstico clínico basados en agentes LLM de múltiples proveedores superan a los de un solo proveedor al combinar sesgos inductivos complementarios, logrando una mayor precisión y recuperación de diagnósticos correctos.

Grace Chang Yuan, Xiaoman Zhang, Sung Eun Kim + 1 more2026-03-06💻 cs

FedEMA-Distill: Exponential Moving Average Guided Knowledge Distillation for Robust Federated Learning

El artículo propone FedEMA-Distill, un método de aprendizaje federado que combina un promedio móvil exponencial del modelo global con la destilación de conocimiento basada en logits para lograr un entrenamiento más robusto, eficiente en comunicación y resistente a ataques adversarios sin requerir cambios en el software de los clientes.

Hamza Reguieg, Mohamed El Kamili, Essaid Sabir2026-03-06💻 cs

Generating Realistic, Protocol-Compliant Maritime Radio Dialogues using Self-Instruct and Low-Rank Adaptation

Este estudio presenta un método de autoinstrucción consciente del cumplimiento normativo, combinado con ajuste fino LoRA y un pipeline de verificación, para generar diálogos de radio marítima sintéticos realistas y conformes al SMCP de la OMI, abordando la escasez de datos de alta calidad necesarios para sistemas de IA en entornos operativos restringidos.

Gürsel Akdeniz, Emin Cagatay Nakilcioglu2026-03-06💻 cs

Delta-Crosscoder: Robust Crosscoder Model Diffing in Narrow Fine-Tuning Regimes

El artículo presenta Delta-Crosscoder, un modelo robusto que supera a las técnicas existentes para identificar y mitigar cambios causales en las representaciones internas de modelos de lenguaje durante ajustes finos estrechos, demostrando su eficacia en diversos organismos y tareas.

Aly Kassem, Thomas Jiralerspong, Negar Rostamzadeh + 1 more2026-03-06💻 cs

Thin Keys, Full Values: Reducing KV Cache via Low-Dimensional Attention Selection

Este paper propone y valida que la dimensión de las claves en la atención de los transformadores puede reducirse drásticamente mediante selección de baja dimensión y compresión SVD seguida de ajuste fino, logrando un ahorro del 75% en la memoria de caché KV con una pérdida de calidad mínima y permitiendo servir a más usuarios concurrentes.

Hengshuai Yao, Guan Wang2026-03-06💻 cs

Agent Memory Below the Prompt: Persistent Q4 KV Cache for Multi-Agent LLM Inference on Edge Devices

Este trabajo presenta un sistema para inferencia multi-agente en dispositivos de borde que persiste la memoria de atención (KV cache) de cada agente en formato cuantizado a 4 bits en disco, permitiendo su restauración directa y eliminando la necesidad de recomputación, lo que reduce el tiempo hasta el primer token hasta en 136 veces y multiplica por cuatro la cantidad de agentes que caben en la memoria disponible.

Yakov Pyotr Shkolnikov2026-03-06💻 cs

What Is Missing: Interpretable Ratings for Large Language Model Outputs

El artículo presenta el sistema de calificación "What Is Missing" (WIM), que transforma la retroalimentación textual sobre lo que falta en una respuesta de un modelo de lenguaje en una puntuación interpretable mediante similitud cosenosa, mejorando así la señal de aprendizaje en comparación con las calificaciones numéricas tradicionales.

Nicholas Stranges, Yimin Yang2026-03-06💻 cs

Uncertainty-Calibrated Spatiotemporal Field Diffusion with Sparse Supervision

El artículo presenta SOLID, un marco de difusión condicionado por máscaras que aprende dinámicas espacio-temporales exclusivamente a partir de observaciones dispersas mediante un objetivo de doble enmascaramiento, logrando reconstrucciones de campos completos con incertidumbre calibrada y sin necesidad de datos densos o pre-imputación.

Kevin Valencia, Xihaier Luo, Shinjae Yoo + 1 more2026-03-06💻 cs

ZorBA: Zeroth-order Federated Fine-tuning of LLMs with Heterogeneous Block Activation

El artículo presenta ZorBA, un marco de ajuste fino federado para modelos de lenguaje grandes que utiliza optimización de orden cero y activación heterogénea de bloques para reducir significativamente el uso de memoria VRAM y la sobrecarga de comunicación sin sacrificar la tasa de convergencia.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

ASFL: An Adaptive Model Splitting and Resource Allocation Framework for Split Federated Learning

Este artículo propone ASFL, un marco de aprendizaje federado dividido adaptativo que optimiza la asignación de recursos y la división del modelo en redes inalámbricas para mejorar la velocidad de convergencia y reducir significativamente la latencia y el consumo de energía.

Chuiyang Meng, Ming Tang, Vincent W. S. Wong2026-03-06💻 cs

CogGen: Cognitive-Load-Informed Fully Unsupervised Deep Generative Modeling for Compressively Sampled MRI Reconstruction

El artículo presenta CogGen, un modelo generativo profundo totalmente no supervisado que mejora la reconstrucción de MRI muestreado comprimido mediante un aprendizaje curricular auto-dirigido que gestiona la carga cognitiva al priorizar progresivamente los datos de baja frecuencia y alta relación señal-ruido sobre el ruido y las frecuencias altas.

Qingyong Zhu, Yumin Tan, Xiang Gu + 1 more2026-03-06💻 cs

A systematic approach to answering the easy problems of consciousness based on an executable cognitive system

Este estudio presenta un enfoque sistemático para abordar los "problemas fáciles" de la conciencia mediante un sistema cognitivo ejecutable basado en la filosofía kantiana, demostrando que capacidades como la discriminación, la atención y el control deliberado pueden derivarse de mecanismos computacionales de aprendizaje, estados emocionales y manipulación de información.

Qi Zhang2026-03-06💻 cs

AMV-L: Lifecycle-Managed Agent Memory for Tail-Latency Control in Long-Running LLM Systems

El artículo presenta AMV-L, un marco de gestión de memoria para agentes LLM que utiliza puntuaciones de utilidad y niveles de ciclo de vida para controlar la latencia de cola, logrando mejoras significativas en el rendimiento y la estabilidad en comparación con las políticas tradicionales basadas en tiempo o LRU.

Emmanuel Bamidele2026-03-06💻 cs

vLLM Semantic Router: Signal Driven Decision Routing for Mixture-of-Modality Models

El artículo presenta vLLM Semantic Router, un marco de enrutamiento impulsado por señales que orquesta características heurísticas y clasificadores neuronales mediante reglas configurables para dirigir dinámicamente las solicitudes a los modelos de mezcla de modalidades más adecuados, garantizando así políticas diferenciadas de costo, privacidad y seguridad en diversos escenarios de despliegue.

Xunzhuo Liu, Huamin Chen, Samzong Lu + 25 more2026-03-06💻 cs

SkillNet: Create, Evaluate, and Connect AI Skills

SkillNet es una infraestructura abierta que crea, evalúa y conecta habilidades de IA a gran escala mediante una ontología unificada y un repositorio de más de 200.000 habilidades, logrando mejorar significativamente el rendimiento de los agentes al permitirles acumular y transferir conocimientos en lugar de reinventar soluciones.

Yuan Liang, Ruobin Zhong, Haoming Xu + 46 more2026-03-06✓ Author reviewed ⓘ💻 cs

An Explainable Ensemble Framework for Alzheimer's Disease Prediction Using Structured Clinical and Cognitive Data

Esta investigación presenta un marco de aprendizaje ensemblistas explicable que, mediante el uso de técnicas avanzadas de preprocesamiento y algoritmos como XGBoost y Random Forest sobre datos clínicos estructurados, logra una detección precisa y transparente de la enfermedad de Alzheimer para apoyar la toma de decisiones clínicas.

Nishan Mitra2026-03-06💻 cs

← Anterior Siguiente →