Information Capacity: Evaluating the Efficiency of Large Language Models via Text Compression

Este artículo introduce la "capacidad de información", una nueva métrica que evalúa la eficiencia de los modelos de lenguaje grandes mediante el rendimiento de compresión de texto en relación con la complejidad computacional y la eficiencia del tokenizador, demostrando su utilidad para predecir el rendimiento, revelar sesgos lingüísticos y guiar el desarrollo futuro de modelos más eficientes.

Cheng Yuan, Jiawei Shao, Xuelong Li2026-03-11💬 cs.CL

Lightweight Time Series Data Valuation on Time Series Foundation Models via In-Context Finetuning

Este artículo presenta LTSV, un método ligero para la valoración de datos en series temporales que aprovecha el ajuste fino en contexto de modelos fundacionales para estimar la contribución de las muestras de manera eficiente y precisa, superando las limitaciones computacionales y de dependencia temporal de los enfoques tradicionales.

Shunyu Wu, Tianyue Li, Yixuan Leng, Jingyi Suo, Jian Lou, Dan Li, See-Kiong Ng2026-03-11🤖 cs.AI

TSFM in-context learning for time-series classification of bearing-health status

Este artículo presenta un método de aprendizaje en contexto basado en modelos fundacionales de series temporales para clasificar el estado de salud de rodamientos en motores de servoprensas sin necesidad de ajuste fino, demostrando su eficacia en diversas condiciones operativas y su potencial para sistemas de mantenimiento como servicio.

Michel Tokic, Slobodan Djukanovic, Anja von Beuningen, Cheng Feng2026-03-11🤖 cs.AI

Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache

Este artículo presenta el módulo de Caché de Diversidad Adaptativa (ADC), una solución plug-and-play y sin entrenamiento que mitiga el sesgo de cola larga en la detección de interacciones humano-objeto mediante la acumulación dinámica de representaciones de características diversas durante la inferencia, mejorando significativamente la detección de categorías raras sin requerir ajuste adicional.

Yuqiu Jiang, Xiaozhen Qiao, Yifan Chen, Ye Zheng, Zhe Sun, Xuelong Li2026-03-11🤖 cs.AI

When Robots Obey the Patch: Universal Transferable Patch Attacks on Vision-Language-Action Models

Este trabajo presenta UPA-RFAS, un marco unificado que genera parches adversarios universales y transferibles capaces de engañar a modelos de Visión-Lenguaje-Acción (VLA) en diversos escenarios, arquitecturas desconocidas y condiciones físicas, exponiendo así una vulnerabilidad crítica en la seguridad de los robots.

Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Qixin Zhang, Bingquan Shen, Alex C. Kot, Xudong Jiang2026-03-11🤖 cs.AI

Multi-Agent Reinforcement Learning with Communication-Constrained Priors

Los autores proponen un marco generalizado de aprendizaje por refuerzo multiagente que utiliza un prior de comunicación restringida y un estimador de información mutua dual para distinguir entre mensajes con y sin pérdidas, desacoplar sus impactos en la toma de decisiones distribuida y cuantificar su efecto en la recompensa global, demostrando así su eficacia en entornos complejos y dinámicos con limitaciones de comunicación.

Guang Yang, Tianpei Yang, Jingwen Qiao, Yanqing Wu, Jing Huo, Xingguo Chen, Yang Gao2026-03-11🤖 cs.AI

Enhancing Retrieval-Augmented Generation with Entity Linking for Educational Platforms

El artículo presenta ELERAG, una arquitectura de generación aumentada por recuperación (RAG) que integra la vinculación de entidades y una estrategia de reordenamiento híbrida para mejorar significativamente la precisión factual en sistemas de preguntas y respuestas educativas en italiano, demostrando su superioridad sobre métodos convencionales en dominios específicos.

Francesco Granata, Francesco Poggi, Misael Mongiovì2026-03-11🤖 cs.AI

EMFusion: Conditional Diffusion Framework for Trustworthy Frequency Selective EMF Forecasting in Wireless Networks

Este artículo presenta EMFusion, un marco de pronóstico probabilístico basado en difusión condicional que utiliza una arquitectura U-Net residual con atención cruzada para realizar pronósticos multivariados selectivos en frecuencia de campos electromagnéticos (EMF) en redes inalámbricas, ofreciendo estimaciones de incertidumbre calibradas y superando significativamente a los modelos existentes en precisión y fiabilidad.

Zijiang Yan, Yixiang Huang, Jianhua Pei, Hina Tabassum, Luca Chiaraviglio2026-03-11🤖 cs.AI

Small Language Models for Efficient Agentic Tool Calling: Outperforming Large Models with Targeted Fine-tuning

Este trabajo demuestra que un modelo de lenguaje pequeño (OPT-350M) finetuneado de manera dirigida supera significativamente a modelos grandes y a otros baselines en la ejecución de llamadas a herramientas, logrando una tasa de éxito del 77,55% en ToolBench y ofreciendo una alternativa rentable y eficiente para la integración de IA generativa en entornos empresariales.

Polaris Jhandi, Owais Kazi, Shreyas Subramanian, Neel Sendas2026-03-11🤖 cs.AI

Reinforcement Learning for Self-Improving Agent with Skill Library

El artículo presenta SAGE, un marco de aprendizaje por refuerzo que mejora la capacidad de auto-mejora de los agentes mediante una biblioteca de habilidades y un mecanismo de despliegue secuencial, logrando en la prueba AppWorld una mayor tasa de finalización de objetivos con menos pasos e interacciones que los enfoques existentes.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

El artículo presenta MCGI, un método de indexación de grafos residente en disco que utiliza la dimensión intrínseca local para adaptar dinámicamente la búsqueda de vecinos más cercanos aproximados a la geometría de los datos, logrando un rendimiento superior y una mayor escalabilidad en conjuntos de datos de miles de millones de elementos en comparación con las soluciones actuales.

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

El paper presenta CRANE, un marco de análisis basado en la relevancia funcional que identifica neuronas específicas de cada idioma en modelos multilingües mediante intervenciones dirigidas, demostrando que estas neuronas son esenciales para el rendimiento en un idioma concreto sin ser exclusivas de él, superando así a los métodos tradicionales basados en la magnitud de activación.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Este trabajo presenta SpaceHMchat, un marco de colaboración humano-IA de código abierto que habilita la gestión de salud integral para sistemas de energía de naves espaciales en la era de las megaconstelaciones, validado mediante una plataforma experimental realista y un nuevo conjunto de datos que demuestra alta precisión en la detección de anomalías, localización de fallos y toma de decisiones de mantenimiento.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

El artículo presenta CLEAR-Mamba, un marco mejorado basado en MedMamba que utiliza una capa de condicionamiento adaptativo (HaC) y un esquema de predicción consciente de la fiabilidad (RaP) para lograr una clasificación precisa, adaptable y confiable de angiografías oftálmicas multimodales (FFA e ICGA), superando a los modelos existentes en generalización y estabilidad.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Este trabajo presenta un sistema automatizado basado en agentes de investigación web potenciados por LLM que genera y resuelve a gran escala preguntas de pronóstico diversas y verificables, superando la calidad de las plataformas humanas y demostrando mejoras en la precisión de los modelos de IA mediante estrategias de descomposición de preguntas.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Este trabajo presenta EigenData, un marco unificado que combina un agente de datos autoevolutivo con aprendizaje por refuerzo basado en verificadores para generar datos sintéticos de alta calidad y entrenar agentes interactivos de uso de herramientas que superan a los modelos de vanguardia en benchmarks complejos sin necesidad de anotación humana costosa.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI