cs.AI artículos | Gist.Science

RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models

El artículo presenta RACER, un método de enrutamiento de modelos de lenguaje grande que aborda el problema de la selección de modelos como un problema de riesgo controlado, generando conjuntos anidados de modelos calibrados para minimizar el error de enrutamiento y mejorar la precisión sin depender de supuestos distribucionales.

Sai Hao, Hao Zeng, Hongxin Wei, Bingyi Jing2026-03-10🤖 cs.LG

Evo: Autoregressive-Diffusion Large Language Models with Evolving Balance

El artículo presenta Evo, un modelo de lenguaje autoregresivo-difusivo que unifica ambos paradigmas en un flujo latente evolutivo para equilibrar dinámicamente la planificación y el refinamiento, logrando un rendimiento de vanguardia en diversas tareas manteniendo una alta velocidad de inferencia.

Junde Wu, Minhao Hu, Jiayuan Zhu, Yuyuan Liu, Tianyi Zhang, Kang Li, Jingkun Chen, Jiazhen Pan, Min Xu, Yueming Jin2026-03-10🤖 cs.LG

Distilling and Adapting: A Topology-Aware Framework for Zero-Shot Interaction Prediction in Multiplex Biological Networks

Este artículo presenta un marco novedoso para la predicción de interacciones en redes biológicas multiplex que, mediante el aprendizaje de representaciones conscientes del contexto, la destilación de conocimiento y el uso de modelos fundacionales, supera a los métodos actuales al lograr una generalización robusta en escenarios de cero disparos para entidades no vistas.

Alana Deng, Sugitha Janarthanan, Yan Sun, Zihao Jing, Pingzhao Hu2026-03-10🤖 cs.LG

Not all tokens are needed(NAT): token efficient reinforcement learning

El artículo presenta NAT, un marco unificado que optimiza el aprendizaje por refuerzo en modelos de lenguaje al actualizar la política utilizando solo un subconjunto de tokens mediante un estimador de gradiente no sesgado, logrando un rendimiento comparable al método completo con una reducción significativa en costos computacionales y uso de memoria.

Hejian Sang, Yuanda Xu, Zhengze Zhou, Ran He, Zhipeng Wang2026-03-10🤖 cs.LG

GraphSkill: Documentation-Guided Hierarchical Retrieval-Augmented Coding for Complex Graph Reasoning

El artículo presenta GraphSkill, un marco de codificación guiado por agentes que mejora el razonamiento sobre grafos complejos mediante una recuperación jerárquica de documentación técnica y un agente de autodepuración que utiliza casos de prueba generados automáticamente, todo ello respaldado por un nuevo dataset de evaluación.

Fali Wang, Chenglin Weng, Xianren Zhang, Siyuan Hong, Hui Liu, Suhang Wang2026-03-10🤖 cs.LG

From ARIMA to Attention: Power Load Forecasting Using Temporal Deep Learning

Este artículo demuestra que el modelo Transformer, basado en mecanismos de atención, supera a los enfoques tradicionales como ARIMA y a otras redes neuronales recurrentes (LSTM y BiLSTM) en la predicción de la carga eléctrica a corto plazo, logrando un error porcentual medio absoluto (MAPE) del 3,8% en datos de PJM.

Suhasnadh Reddy Veluru, Sai Teja Erukude, Viswa Chaitanya Marella2026-03-10🤖 cs.LG

Exploration Space Theory: Formal Foundations for Prerequisite-Aware Location-Based Recommendation

Este artículo presenta la Teoría del Espacio de Exploración (EST), un marco formal basado en retículos que adapta la Teoría del Espacio de Conocimiento para los sistemas de recomendación basados en ubicación, garantizando matemáticamente que las sugerencias respeten las dependencias semánticas y de prerequisitos entre puntos de interés.

Madjid Sadallah2026-03-10🤖 cs.LG

Pavement Missing Condition Data Imputation through Collective Learning-Based Graph Neural Networks

Este artículo presenta un modelo de redes neuronales gráficas basado en aprendizaje colectivo que integra las características de las secciones adyacentes y sus dependencias para imputar eficazmente los datos faltantes en las condiciones del pavimento, superando las limitaciones de los métodos tradicionales.

Ke Yu, Lu Gao2026-03-10🤖 cs.LG

Grouter: Decoupling Routing from Representation for Accelerated MoE Training

El artículo presenta Grouter, un método de enrutamiento preventivo que desacopla la optimización estructural de las actualizaciones de pesos mediante la destilación de estructuras de modelos MoE ya entrenados, logrando acelerar significativamente la convergencia y el rendimiento del entrenamiento.

Yuqi Xu, Rizhen Hu, Zihan Liu, Mou Sun, Kun Yuan2026-03-10🤖 cs.LG

Photons = Tokens: The Physics of AI and the Economics of Knowledge

Este artículo aplica principios físicos y económicos para cuantificar el costo termodinámico de los tokens en la inteligencia artificial, estableciendo un presupuesto finito de preguntas para la humanidad y argumentando que, más allá de los límites energéticos, el desafío fundamental reside en determinar qué preguntas vale la pena formular.

Alec Litowitz, Nick Polson, Vadim Sokolov2026-03-10🔬 physics

SmartBench: Evaluating LLMs in Smart Homes with Anomalous Device States and Behavioral Contexts

El artículo presenta SmartBench, el primer conjunto de datos diseñado para evaluar la capacidad de los grandes modelos de lenguaje (LLM) para detectar estados anómalos en hogares inteligentes, revelando que incluso los modelos más avanzados actuales tienen un rendimiento insuficiente en esta tarea crítica.

Qingsong Zou, Zhi Yan, Zhiyao Xu, Kuofeng Gao, Jingyu Xiao, Yong Jiang2026-03-10🤖 cs.LG

HEARTS: Benchmarking LLM Reasoning on Health Time Series

El artículo presenta HEARTS, un nuevo benchmark unificado que evalúa las capacidades de razonamiento jerárquico de los modelos de lenguaje grandes (LLM) sobre series temporales de salud mediante 16 conjuntos de datos y 110 tareas, revelando que estos modelos actuales tienen un rendimiento limitado y dependen de heurísticas simples en comparación con los modelos especializados.

Sirui Li, Shuhan Xiao, Mihir Joshi, Ahmed Metwally, Daniel McDuff, Wei Wang, Yuzhe Yang2026-03-10🤖 cs.LG

RECAP: Local Hebbian Prototype Learning as a Self-Organizing Readout for Reservoir Dynamics

El artículo presenta RECAP, una estrategia de aprendizaje bioinspirada que combina dinámicas de reservorio no entrenadas con un mecanismo de lectura de prototipos hebbianos autoorganizado para lograr una clasificación robusta de imágenes sin necesidad de retropropagación de errores.

Heng Zhang2026-03-10🤖 cs.LG

SR-TTT: Surprisal-Aware Residual Test-Time Training

El artículo presenta SR-TTT, un enfoque que mejora los modelos de entrenamiento en tiempo de prueba (TTT) al integrar un mecanismo de memoria residual esparsa y controlada por la pérdida para almacenar tokens altamente sorprendentes, resolviendo así las fallas de recuerdo catastróficas en tareas de recuperación exacta mientras se mantiene una eficiencia de memoria O(1).

Swamynathan V P2026-03-10🤖 cs.LG

Trust Aware Federated Learning for Secure Bone Healing Stage Interpretation in e-Health

Este artículo presenta un marco de aprendizaje federado consciente de la confianza que utiliza un mecanismo de puntuación adaptativa para filtrar contribuciones de participantes poco fiables en entornos de sensores médicos distribuidos, mejorando así la estabilidad del entrenamiento y la precisión en la interpretación de las etapas de curación ósea.

Paul Shepherd, Tasos Dagiuklas, Bugra Alkan, Joaquim Bastos, Jonathan Rodriguez2026-03-10🤖 cs.LG

Performance Comparison of IBN orchestration using LLM and SLMs

Este artículo presenta un marco novedoso para la orquestación de redes basadas en intenciones (IBN) en redes 5G y 6G que utiliza una arquitectura multiagente jerárquica con modelos de lenguaje pequeños (SLM) y grandes (LLM), demostrando que, aunque ambos ofrecen una precisión de traducción similar, los SLM mejoran la velocidad de finalización del ciclo de vida de la IBN en un 20%.

Wai Lwin Phone, Brahim El Boudani, Tasos Dagiuklas, Saptarshi Ghosh2026-03-10💻 cs

ObjChangeVR: Object State Change Reasoning from Continuous Egocentric Views in VR Environments

El artículo presenta ObjChangeVR, un marco y un conjunto de datos diseñados para mejorar la detección y el razonamiento sobre cambios de estado de objetos en entornos de realidad virtual desde perspectivas egocéntricas continuas, abordando la falta de benchmarks y las dificultades para detectar cambios sin interacción directa del usuario.

Shiyi Ding, Shaoen Wu, Ying Chen2026-03-10💻 cs

HURRI-GAN: A Novel Approach for Hurricane Bias-Correction Beyond Gauge Stations using Generative Adversarial Networks

El artículo presenta HURRI-GAN, un enfoque innovador basado en redes generativas adversarias que corrige los sesgos de los modelos físicos de simulación de huracanes más allá de las estaciones de medición, permitiendo predicciones precisas en tiempo real con menor costo computacional.

Noujoud Nadera, Hadi Majed, Stefanos Giaremis, Rola El Osta, Clint Dawson, Carola Kaiser, Hartmut Kaiser2026-03-10🤖 cs.LG

Geodesic Gradient Descent: A Generic and Learning-rate-free Optimizer on Objective Function-induced Manifolds

Este artículo presenta el descenso de gradiente geodésico (GGD), un optimizador genérico y libre de tasa de aprendizaje que aproxima la geometría local de la función objetivo mediante esferas n-dimensionales para mantener las trayectorias de actualización en la hipersuperficie, logrando reducciones significativas en el error de prueba en comparación con algoritmos clásicos como Adam.

Liwei Hu, Guangyao Li, Wenyong Wang, Xiaoming Zhang, Yu Xiang2026-03-10🤖 cs.LG

PaLMR: Towards Faithful Visual Reasoning via Multimodal Process Alignment

El marco PaLMR mejora la fiabilidad del razonamiento visual en modelos multimodales alineando tanto el resultado como el proceso de razonamiento mediante una capa de datos perceptiva y un esquema de recompensa jerárquico, logrando así reducir las alucinaciones y alcanzar resultados de vanguardia en benchmarks especializados.

Yantao Li, Qiang Hui, Chenyang Yan, Kanzhi Cheng, Fang Zhao, Chao Tan, Huanling Gao, Jianbing Zhang, Kai Wang, Xinyu Dai, Shiguo Lian2026-03-10💻 cs

← Anterior Siguiente →