Towards Cold-Start Drafting and Continual Refining: A Value-Driven Memory Approach with Application to NPU Kernel Synthesis

El paper presenta EvoKernel, un marco de agentes autoevolutivos que utiliza un enfoque de memoria basado en valores para superar la escasez de datos en la síntesis de kernels para NPUs, logrando mejorar la precisión de los modelos de 11.0% a 83.0% y acelerar el rendimiento mediante un refinamiento continuo.

Yujie Zheng, Zhuo Li, Shengtao Zhang, Hanjing Wang, Junjie Sheng, Jiaqian Wang, Junchi Yan, Weinan Zhang, Ying Wen, Bo Tang, Muning Wen2026-03-12🤖 cs.LG

Semantic Landmark Particle Filter for Robot Localisation in Vineyards

Este artículo presenta un Filtro de Partículas de Hitos Semánticos (SLPF) que integra la detección de troncos y postes con LiDAR 2D y GNSS para resolver el problema de la ambigüedad perceptiva en viñedos, logrando una localización robótica más precisa y robusta que los métodos basados únicamente en geometría o visión.

Rajitha de Silva, Jonathan Cox, James R. Heselden, Marija Popovic, Cesar Cadena, Riccardo Polvara2026-03-12🤖 cs.AI

V0.5V_{0.5}: Generalist Value Model as a Prior for Sparse RL Rollouts

El artículo presenta V0.5V_{0.5}, un modelo de valor generalista que fusiona adaptativamente una estimación previa con promedios empíricos de rollouts dispersos mediante pruebas estadísticas en tiempo real, logrando una reducción significativa de la varianza y un rendimiento superior en tareas de razonamiento matemático en comparación con métodos como GRPO y DAPO.

Yi-Kai Zhang, Yueqing Sun, Hongyan Hao, Qi Gu, Xunliang Cai, De-Chuan Zhan, Han-Jia Ye2026-03-12🤖 cs.LG

GRACE: A Unified 2D Multi-Robot Path Planning Simulator & Benchmark for Grid, Roadmap, And Continuous Environments

El artículo presenta GRACE, un simulador y conjunto de pruebas unificado en 2D que permite comparaciones transparentes y reproducibles entre diferentes niveles de abstracción (cuadrícula, mapa de rutas y continuo) para la planificación de trayectorias multiagente, facilitando así el estudio de las compensaciones entre fidelidad y escalabilidad en la investigación de robots múltiples.

Chuanlong Zang, Anna Mannucci, Isabelle Barz, Philipp Schillinger, Florian Lier, Wolfgang Hönig2026-03-12🤖 cs.AI

An Extreme Multi-label Text Classification (XMTC) Library Dataset: What if we took "Use of Practical AI in Digital Libraries" seriously?

Este trabajo presenta un corpus bilingüe (inglés/alemán) de registros de catálogo anotados con la Integrated Authority File (GND) y una taxonomía procesable por máquinas, diseñado para habilitar la clasificación multietiqueta consciente de la ontología y evaluar sistemas de IA que asistan a los catalogadores en la indexación a escala.

Jennifer D'Souza, Sameer Sadruddin, Maximilian Kähler, Andrea Salfinger, Luca Zaccagna, Francesca Incitti, Lauro Snidaro, Osma Suominen2026-03-12💬 cs.CL

Dynamics-Predictive Sampling for Active RL Finetuning of Large Reasoning Models

Este trabajo propone el Muestreo Predictivo de Dinámicas (DPS), un método que utiliza inferencia bayesiana sobre un modelo oculto de Markov para predecir y seleccionar proactivamente los prompts más informativos durante el ajuste fino con aprendizaje por refuerzo de modelos de razonamiento grandes, reduciendo así significativamente el costo computacional de las simulaciones y acelerando el entrenamiento sin comprometer el rendimiento.

Yixiu Mao, Yun Qu, Qi Wang, Heming Zou, Xiangyang Ji2026-03-12🤖 cs.LG

A Hybrid Knowledge-Grounded Framework for Safety and Traceability in Prescription Verification

El artículo presenta PharmGraph-Auditor, un sistema innovador que combina una Base de Conocimiento Farmacéutico Híbrida (HPKB) con un paradigma de Verificación Basada en Conocimiento (CoV) para transformar a los modelos de lenguaje en motores de razonamiento transparentes y seguros, mejorando así la precisión y la trazabilidad en la verificación de recetas médicas.

Yichi Zhu, Kan Ling, Xu Liu, Hengrun Zhang, Huiqun Yu, Guisheng Fan2026-03-12🤖 cs.AI

LookaheadKV: Fast and Accurate KV Cache Eviction by Glimpsing into the Future without Generation

LookaheadKV es un marco de expulsión de caché KV ligero que, al predecir puntuaciones de importancia futuras mediante módulos eficientes en lugar de generar borradores explícitos, logra una alta precisión y reduce el costo de expulsión hasta 14,5 veces en comparación con métodos anteriores.

Jinwoo Ahn, Ingyu Seong, Akhil Kedia, Junhan Kim, Hyemi Jang, Kangwook Lee, Yongkweon Jeon2026-03-12🤖 cs.LG

Safe RLHF Beyond Expectation: Stochastic Dominance for Universal Spectral Risk Control

Este trabajo presenta RAD, un marco de alineación que reemplaza las restricciones de costo esperado tradicionales por restricciones de dominancia estocástica de primer orden dentro de un marco de transporte óptimo, permitiendo un control universal de medidas de riesgo espectral y mejorando la robustez ante eventos catastróficos y distribuciones fuera de contexto en el Aprendizaje por Refuerzo a partir de Feedback Humano (RLHF).

Yaswanth Chittepu, Ativ Joshi, Rajarshi Bhattacharjee, Scott Niekum2026-03-12🤖 cs.LG

Contact Coverage-Guided Exploration for General-Purpose Dexterous Manipulation

El artículo presenta CCGE, un método de exploración general que guía el aprendizaje por refuerzo en manipulación diestra mediante el conteo y la recompensa de patrones de contacto novedosos entre la mano y el objeto, logrando así una mayor eficiencia de entrenamiento y una transferencia robusta a sistemas robóticos reales.

Zixuan Liu, Ruoyi Qiao, Chenrui Tie, Xuanwei Liu, Yunfan Lou, Chongkai Gao, Zhixuan Xu, Lin Shao2026-03-12🤖 cs.AI

GroundCount: Grounding Vision-Language Models with Object Detection for Mitigating Counting Hallucinations

El artículo presenta GroundCount, un marco que mejora la precisión del conteo en modelos de visión y lenguaje al integrar detección de objetos basada en CNN para mitigar las alucinaciones espaciales, logrando mejoras significativas en la mayoría de las arquitecturas evaluadas mediante una estrategia de anclaje simbólico explícito.

Boyuan Chen, Minghao Shao, Siddharth Garg, Ramesh Karri, Muhammad Shafique2026-03-12🤖 cs.AI

Artificial Intelligence as a Catalyst for Innovation in Software Engineering

Este artículo examina cómo la inteligencia artificial actúa como catalizador de innovación en la ingeniería de software, demostrando mediante una revisión bibliográfica y un estudio empírico que su integración optimiza las prácticas ágiles y automatiza tareas clave para mejorar la calidad, la velocidad y la adaptabilidad ante requisitos cambiantes.

Carlos Alberto Fernández-y-Fernández, Jorge R. Aguilar-Cisneros2026-03-12🤖 cs.AI

RCTs & Human Uplift Studies: Methodological Challenges and Practical Solutions for Frontier AI Evaluation

Este artículo examina los desafíos metodológicos que surgen al aplicar ensayos controlados aleatorios para evaluar el impacto de la IA de vanguardia en el rendimiento humano, identificando tensiones en la validez de los estudios y proponiendo soluciones prácticas basadas en la experiencia de expertos para mejorar la toma de decisiones de alto riesgo.

Patricia Paskov, Kevin Wei, Shen Zhou Hong, Dan Bateyko, Xavier Roberts-Gaal, Carson Ezell, Gailius Praninskas, Valerie Chen, Umang Bhatt, Ella Guest2026-03-12🤖 cs.AI

Does AI See like Art Historians? Interpreting How Vision Language Models Recognize Artistic Style

Esta investigación interdisciplinaria demuestra que los Modelos de Lenguaje Visuales predicen el estilo artístico basándose en conceptos visualmente coherentes y semánticamente significativos que, en un 90% de los casos, son juzgados como relevantes por historiadores del arte, aunque a veces logran aciertos mediante interpretaciones formales de conceptos que estos expertos considerarían irrelevantes.

Marvin Limpijankit, Milad Alshomary, Yassin Oulad Daoud, Amith Ananthram, Tim Trombley, Elias Stengel-Eskin, Mohit Bansal, Noam M. Elcott, Kathleen McKeown2026-03-12🤖 cs.AI

V2M-Zero: Zero-Pair Time-Aligned Video-to-Music Generation

El paper presenta V2M-Zero, un enfoque de generación de música a partir de video sin pares de datos que logra una alineación temporal precisa al extraer y transferir estructuras de cambio temporal independientes dentro de cada modalidad mediante curvas de eventos, superando significativamente a los métodos basados en datos pareados.

Yan-Bo Lin, Jonah Casebeer, Long Mai, Aniruddha Mahapatra, Gedas Bertasius, Nicholas J. Bryan2026-03-12🤖 cs.AI

Neural Field Thermal Tomography: A Differentiable Physics Framework for Non-Destructive Evaluation

El artículo presenta NeFTY, un marco de física diferenciable que reconstruye cuantitativamente propiedades materiales en 3D y localiza defectos subsuperficiales mediante la parametrización de un campo de difusividad continuo optimizado con un solver numérico riguroso, superando las limitaciones de las aproximaciones tradicionales y las redes neuronales informadas por física en escenarios de difusión transitoria.

Tao Zhong, Yixun Hu, Dongzhe Zheng, Aditya Sood, Christine Allen-Blanchette2026-03-12🔬 cond-mat.mtrl-sci