Reinforcement Learning for Self-Improving Agent with Skill Library

El artículo presenta SAGE, un marco de aprendizaje por refuerzo que mejora la capacidad de auto-mejora de los agentes mediante una biblioteca de habilidades y un mecanismo de despliegue secuencial, logrando en la prueba AppWorld una mayor tasa de finalización de objetivos con menos pasos e interacciones que los enfoques existentes.

Jiongxiao Wang, Qiaojing Yan, Yawei Wang, Yijun Tian, Soumya Smruti Mishra, Zhichao Xu, Megha Gandhi, Panpan Xu, Lin Lee Cheong2026-03-11🤖 cs.AI

MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search

El artículo presenta MCGI, un método de indexación de grafos residente en disco que utiliza la dimensión intrínseca local para adaptar dinámicamente la búsqueda de vecinos más cercanos aproximados a la geometría de los datos, logrando un rendimiento superior y una mayor escalabilidad en conjuntos de datos de miles de millones de elementos en comparación con las soluciones actuales.

Dongfang Zhao2026-03-11🤖 cs.AI

CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models

El paper presenta CRANE, un marco de análisis basado en la relevancia funcional que identifica neuronas específicas de cada idioma en modelos multilingües mediante intervenciones dirigidas, demostrando que estas neuronas son esenciales para el rendimiento en un idioma concreto sin ser exclusivas de él, superando así a los métodos tradicionales basados en la magnitud de activación.

Yifan Le, Yunliang Li2026-03-11🤖 cs.AI

Empowering All-in-Loop Health Management of Spacecraft Power System in the Mega-Constellation Era via Human-AI Collaboration

Este trabajo presenta SpaceHMchat, un marco de colaboración humano-IA de código abierto que habilita la gestión de salud integral para sistemas de energía de naves espaciales en la era de las megaconstelaciones, validado mediante una plataforma experimental realista y un nuevo conjunto de datos que demuestra alta precisión en la detección de anomalías, localización de fallos y toma de decisiones de mantenimiento.

Yi Di, Zhibin Zhao, Fujin Wang, Xue Liu, Jiafeng Tang, Jiaxin Ren, Zhi Zhai, Xuefeng Chen2026-03-11🤖 cs.AI

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

El artículo presenta CLEAR-Mamba, un marco mejorado basado en MedMamba que utiliza una capa de condicionamiento adaptativo (HaC) y un esquema de predicción consciente de la fiabilidad (RaP) para lograr una clasificación precisa, adaptable y confiable de angiografías oftálmicas multimodales (FFA e ICGA), superando a los modelos existentes en generalización y estabilidad.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

Automating Forecasting Question Generation and Resolution for AI Evaluation

Este trabajo presenta un sistema automatizado basado en agentes de investigación web potenciados por LLM que genera y resuelve a gran escala preguntas de pronóstico diversas y verificables, superando la calidad de las plataformas humanas y demostrando mejoras en la precisión de los modelos de IA mediante estrategias de descomposición de preguntas.

Nikos I. Bosse, Peter Mühlbacher, Jack Wildman, Lawrence Phillips, Dan Schwarz2026-03-11🤖 cs.AI

From Self-Evolving Synthetic Data to Verifiable-Reward RL: Post-Training Multi-turn Interactive Tool-Using Agents

Este trabajo presenta EigenData, un marco unificado que combina un agente de datos autoevolutivo con aprendizaje por refuerzo basado en verificadores para generar datos sintéticos de alta calidad y entrenar agentes interactivos de uso de herramientas que superan a los modelos de vanguardia en benchmarks complejos sin necesidad de anotación humana costosa.

Jiaxuan Gao, Jiaao Chen, Chuyi He, Shusheng Xu, Di Jin, Yi Wu2026-03-11🤖 cs.AI

UAT-LITE: Inference-Time Uncertainty-Aware Attention for Pretrained Transformers

El artículo presenta UAT-LITE, un marco de inferencia que mejora la calibración y la detección de incertidumbre en transformadores preentrenados mediante la inyección de dropout estocástico en los mecanismos de autoatención, logrando una reducción significativa del error de calibración esperado sin modificar los pesos del modelo ni requerir reentrenamiento.

Elias Hossain, Shubhashis Roy Dipta, Subash Neupane, Rajib Rana, Ravid Shwartz-Ziv, Ivan Garibay, Niloofar Yousefi2026-03-11🤖 cs.AI

WebAccessVL: Violation-Aware VLM for Web Accessibility

El artículo presenta WebAccessVL, un modelo de visión y lenguaje que corrige automáticamente las violaciones de accesibilidad en sitios web mediante la síntesis de código HTML condicional a las imágenes y a las descripciones de los errores, logrando una reducción del 96% en las violaciones y mejorando significativamente el diseño visual en comparación con modelos existentes.

Amber Yijia Zheng, Jae Joong Lee, Bedrich Benes, Raymond A. Yeh2026-03-11🤖 cs.AI

Infusion: Shaping Model Behavior by Editing Training Data via Influence Functions

El marco Infusion demuestra que es posible moldear sistemáticamente el comportamiento de modelos de visión y lenguaje mediante pequeñas perturbaciones calculadas con funciones de influencia en una fracción mínima de los datos de entrenamiento, lo que subraya la importancia crítica de la interpretabilidad de dichos datos para la seguridad.

J Rosser, Robert Kirk, Edward Grefenstette, Jakob Foerster, Laura Ruis2026-03-11🤖 cs.AI

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

Este artículo propone un marco de presupuestado de picos consciente de la energía para el aprendizaje continuo en redes neuronales de spiking, que integra replay de experiencia y parámetros neuronales adaptables para optimizar simultáneamente la precisión y la eficiencia energética en sistemas de visión neuromórfica tanto para datos basados en fotogramas como en eventos.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed Mia2026-03-11🤖 cs.AI

Contextuality from Single-State Ontological Models: An Information-Theoretic No-Go Theorem

Este artículo presenta un teorema de imposibilidad de información que demuestra que los modelos ontológicos clásicos que reutilizan un único espacio de estados onticos ineludiblemente incurren en un costo de información contextual, identificando así la contextualidad como una restricción fundamental en las representaciones clásicas que la teoría cuántica evita al relajar dicha suposición.

Song-Ju Kim2026-03-11⚛️ quant-ph

Continual uncertainty learning

Este estudio propone un marco de aprendizaje continuo basado en currículos que descompone problemas de control robusto con múltiples incertidumbres no lineales en tareas secuenciales, integrando un controlador basado en modelos para mejorar la eficiencia y evitar el olvido catastrófico, logrando así una transferencia exitosa de simulación a realidad en un controlador de vibración activa para trenes motrices automotrices.

Heisei Yonezawa, Ansei Yonezawa, Itsuro Kajiwara2026-03-11🤖 cs.AI

ReDON: Recurrent Diffractive Optical Neural Processor with Reconfigurable Self-Modulated Nonlinearity

El artículo presenta ReDON, un nuevo procesador óptico neuronal recurrente que supera las limitaciones de expresividad de las redes ópticas difractivas tradicionales mediante una no linealidad auto-modulada reconfigurable, logrando mejoras significativas en precisión y eficiencia energética sin añadir consumo eléctrico adicional.

Ziang Yin, Qi Jing, Raktim Sarma, Rena Huang, Yu Yao, Jiaqi Gu2026-03-11🔬 physics.optics